Reversed engineering - data mining @ Spiegel online

Sonstige Beiträge...

Re: Reversed engineering - data mining @ Spiegel online

von Elektroniker » 5. Jan 2017, 17:16

Ich fand den Vortrag bzgl. SPIEGEL jetzt nicht sooo überraschend.

Dass ich anhand von Artikel-Veröffentlichungszeitpunkten die Urlaubszeiten ermitteln kann, nun gut.
Dass ich daraus spekulieren kann, "wer vielleicht mit wem verbandelt ist", ok da geht es ins Intime. Bleibt aber auch nur Spekulation.

Und sonst?
Die bunte Themen-Map, die Artikel-Schlagworte auf eine bunte Landschaft von Themengebieten abbildet ... äh ... wow .. oder?
Simple Analyse, optisch hübsch aufbereitet - mit Standard-Software, die in vielen Bereichen benutzt wird.
Aber was ist an dem erstellten Graphen so "mächtig", wie er es nennt?
Themengebiete einer Zeitschrift anhand der Verschlagwortung hübsch optisch aufbereitet. Wo ist da die Sensation?
Sofern die Verschlagwortung beim SPIEGEL nicht völlig falsch läuft, muss sich ein solches oder sehr ähnliches Bild ergeben. Was soll sich sonst ergeben? Eine Landschaft, bei der das Schlagwort "Merkel" mitten im Themengebiet "It-Girls" verankert ist?

Und bzgl. Kommentarfunktion: Dass die Kommentarfunktionen bei allen Online-Zeitungen immer weiter eingeschränkt werden, weil zunehmend Scheiße gepostet wird und einfach der Moderationsaufwand irgendwann nicht mehr vertretbar ist, ist ja wohl auch nichts Besonderes mehr. Das weiß jeder, der Online-Zeitungen liest, aus Erfahrung.
Dass es da bei bestimmten Themengebieten besonders schlimm ist mit den unsachlichen Hass-Posts, ist jetzt auch keine bahnbrechende Entdeckung. Das hätte ich Dir auch ohne die aufwändige Datenanaylse sagen können.

Der Kriesel ist ein begabter Dozent, er macht das sehr unterhaltsam und eloquent. Er ist auch ein sehr sympathischer Typ.
Aber ich sehe jetzt schlicht nicht den besonders bemerkenswerten Inhalt seines Vortrags.
 
Beiträge: 1394
Registriert: 8. Mai 2015, 18:08
Wohnort: München
Land: Deutschland

Re: Reversed engineering - data mining @ Spiegel online

von Ralf_W » 5. Jan 2017, 17:26

Den Vortrag fand ich klasse! Danke für den Link. Er hat das deutlich und grafisch sehr gut dargestellt, was ich als Bauchgefühl hatte.

Der Vortrag zeigt ja nur einen Anfang auf, er ist bisher noch gar nicht auf eigentliche Inhalte der Artikel eingegangen. Eine Möglichkeit: Welche Artikel beinhalten Tesla, wer schreibt die Artikel, sind die Artikel pro oder contra Tesla geschrieben? Für wen schreibt der Autor noch, wie schreibt er dort? Manuell haben wir das schon gemacht, da wir ja bestimmte Journalisten schon im Forum kennen, so könnte man das automatisiert analysieren.
Zuletzt geändert von Ralf_W am 5. Jan 2017, 18:15, insgesamt 1-mal geändert.
seit 1990 mit eigenem Elektroauto | Tesla S85 schwarz 03/2015 220 Tkm | ZOE R90 ZEN | http://www.elweb.info, Das Informationsnetzwerk für Elektrofahrzeugfahrer
Benutzeravatar
Trusted User
Trusted User
 
Beiträge: 2114
Registriert: 7. Nov 2014, 22:05
Wohnort: DE 70794 Filderstadt
Land: Deutschland

Reversed engineering - data mining @ Spiegel online

von Earlian » 5. Jan 2017, 17:41

@Elektroniker

Du scheinst dich offensichtlich mit dem Thema schon befasst zu haben.

Für diejenigen, wie mich, die bisher BigData, DatenMining, etc. nur angeschnitten haben, ist es gut und verständlich aufbereitet.

Der Aha-Moment ist auch weniger, was er da mit dem Spiegel treibt, sondern was man daraus folgern kann:

Wenn man mit einfachen Daten, wie Autorenkürzel, Rubrik und Zeitstempel, solche Verknüpfungen über die Jahre aufstellen kann, dann kann man sich auch gut vorstellen, was man mit all den Daten, die Menschen öffentlich preisgeben, anstellen kann.

IP-Addresse, Zeitstempel, Browserart, Suchworte (was noch?) geben so ziemlich alle freiwillig ab. Google hat sie.

Von den Facebook und WhatsApp-Nutzern reden lieber erst garnicht.[emoji6]

Ein wenig mehr Vorsicht scheint angebracht und zum Thema Datenschutz und Vorratsdatenspeicherung hat man nun auch einen anderen Blickwinkel, außer "ich hab ja nichts zu verbergen."
Tesla Model 3 LR AWD, AHK, FSD, HW3 ab 07/19 (Model S70 D 06/15-06/19)
1500 km Supercharging bei Bestellung Deines Tesla
Benutzeravatar
Trusted User
Trusted User
 
Beiträge: 2814
Registriert: 19. Apr 2014, 15:42
Land: Deutschland
Fahrzeug: Tesla Model 3

Re: Reversed engineering - data mining @ Spiegel online

von Elektroniker » 5. Jan 2017, 17:46

@Earlian:
Da hast jetzt Du wieder Recht. ;)
Es ist inzwischen sicher kein Witz mehr, wenn man sagt: "Google weiß mehr über Dich als Du selbst."
 
Beiträge: 1394
Registriert: 8. Mai 2015, 18:08
Wohnort: München
Land: Deutschland

Re: Reversed engineering - data mining @ Spiegel online

von Hein_Mück » 5. Jan 2017, 18:58

Earlian hat geschrieben:Für diejenigen, wie mich, die bisher BigData, DatenMining, etc. nur angeschnitten haben, ist es gut und verständlich aufbereitet.

Und genau dieser Punkt ist das entscheidende Bei diesem Betrag. Herr Kriesel hätte als DM-Profi sicherlich 45 Minuten IT-Geschwurbel absondern können. Effekt bei Normalos: Null. Aus meiner Sicht: Ein äußerst zielgruppengerechter Beitrag! Elektroniker kann beim 34C3 gerne zeigen, dass es noch besser geht :D

Bye Thomas
M3 LR AWD | Modell 2020 | midnight silver | AHK | 2020.12.11.2

1.500km Superchargen für "Umme": hier klicken
Benutzeravatar
 
Beiträge: 1094
Registriert: 7. Apr 2016, 08:40
Land: Deutschland
Fahrzeug: Tesla Model 3

Re: Reversed engineering - data mining @ Spiegel online

von elrond » 5. Jan 2017, 19:02

Als beruflich viel mit Statistiken befasster Mensch hätten mich die von ihm verwendeten Verfahren und Vorgehensweisen auch noch mehr interessiert. Aber das war sicherlich der falsche Rahmen dafür.

Er hat mich aber für eigene Datenanalysen auf ein paar nette Ideen gebracht - schon daher hat sich das ganze gelohnt.

Ciao,
Gerhard
Model S 85 D
 
Beiträge: 823
Registriert: 28. Feb 2015, 02:26
Wohnort: Timmendorfer Strand
Land: Deutschland

Re: Reversed engineering - data mining @ Spiegel online

von Elektroniker » 5. Jan 2017, 19:52

Hein Mück hat geschrieben:Und genau dieser Punkt ist das entscheidende Bei diesem Betrag. Herr Kriesel hätte als DM-Profi sicherlich 45 Minuten IT-Geschwurbel absondern können. Effekt bei Normalos: Null. Aus meiner Sicht: Ein äußerst zielgruppengerechter Beitrag! Elektroniker kann beim 34C3 gerne zeigen, dass es noch besser geht :D

Ganz einfach:
Etwas aus den Daten herausziehen, was überraschend ist und den Datenschutz wirklich tangiert. Das wäre dann ein wirkungsvoller Effekt gewesen.
Datenanalyse an sich ist doch heutzutage auch für einen "Normalo" noch keine Schrecksekunde wert.
Einzig die Sache mit den deckungsgleichen Urlauben und der zugehörigen Schlussfolgerung von möglichen Liebschaften ging ein bisschen in diese Richtung.

Er hat dann auch zum Schluss die Leute aufgefordert, ihm Ideen zu senden, was er aus den Daten noch rausziehen soll.
Interessant wäre, ob einige Zuseher da Ideen liefern werden, die dann "illegale" oder sonstwie problematische Analyseergebnisse hervorbringen.
Ihm selbst ist da offensichtlich nichts eingefallen.
Ich vermute aber, die Sammlung von 100.000 SPIEGEL-Artikeln gibt da nichts her in dieser Richtung.

Es ist ja ein Hacker-Kongress, daher erscheint mir ein Vortrag über ganz legale Datenanalyse eher uninteressant - auch für eine Zielgruppe von "Normalos".
Wie gesagt, das mit den vermutlich gemeinsamen Urlauben der Redakteure war das einzige etwas Brisante. Der Rest war schlicht normal business.

Wahrscheinlich war der SPIEGEL das falsche Demonstrationsobjekt, wenn man die Leute für Datenmissbrauch wirklich sensibilisieren will.
 
Beiträge: 1394
Registriert: 8. Mai 2015, 18:08
Wohnort: München
Land: Deutschland

Re: Reversed engineering - data mining @ Spiegel online

von snooper77 » 5. Jan 2017, 20:48

Elektroniker hat geschrieben:Wahrscheinlich war der SPIEGEL das falsche Demonstrationsobjekt, wenn man die Leute für Datenmissbrauch wirklich sensibilisieren will.


Ganz im Gegenteil: Er wollte zeigen, dass mit solch simplen und darüberhinaus sogar noch öffentlichen und online archivierten Daten erschreckend akkurate Rückschlüsse auf eigentlich private Informationen möglich sind. Genau *das* ist das Verblüffende.

Dass man aus Pornoseiten-Leak-Daten und Clinton-E-Mails sensible Informationen extrahieren kann, ist da weit weniger spannend, da naheliegend.
85D silber (blau foliert), 19", bestätigt 18.11.2014, VIN seit 16.02.2015, Produktion 02.04., Transport 08.04., Abholung 09.06.
Benutzeravatar
Moderator
Moderator
 
Beiträge: 6062
Registriert: 21. Mär 2014, 16:26
Wohnort: Zürich
Land: Schweiz

Reversed engineering - data mining @ Spiegel online

von past_petrol » 5. Jan 2017, 21:18

Hi !

Ich arbeite in einer Fa., die die Maschinen / Computer herstellt und herstellen kann, die so etwas rechnen und rechnen können werden bzw. es schon seit vielen Jahren tun. Die Brisanz des Vortrages liegt gerade in der gewählten Datenquelle. Das ist alles völlig belangloser Kram - eine Nachrichtenonlineseite ! Mit den angewandten Techniken ist man von aussen ohne Kenntnis des handenlden Unternehmens in der Lage, ggf. recht gut treffende Informationen zu extrahieren. Z.B. die Teamstrukturen. Was glaubt Ihr, wie lange aktuelle Systeme rechnen mussen, um diese Information bereitzustellen ? Er sprach von einem Datensatz im Bereich von 60 GB HTML Rohdaten - da musste ich sehr schmunzeln. In meiner Welt geht es ab TB los. Wir reden nicht selten über Exa- und Petabyte !!! Es geht bereits um Echtzeitanalysen. Wir kommen in diesen Themenbereichen sehr schnell in ethisch und moralische Regionen, die noch gar nicht so richtig diskutiert worden, aber unser aller Leben sehr stark bestimmen können. Ich habe keinen smart TV und werde mir ums Verrecken keinen digitalen Assistenten von Amazon oder Google in die Hütte stellen, der alles mitbekommt.

Zu aufwendig ? Wer soll das alles rechnen ? Wo soll man das alles speichern ? Was soll man denn mit all diesen Daten ? Pustekuchen ! Das sind alles bereits gelöste Probleme und BigData ist seit vielen Jahren bereits Realität. Früher fehlten nur die richtig coolen Datenquellen - aber jetzt gibt es FaceBook und WhatsApp. An alle, die das immer noch herunterspielen. Ihr glaubt gar nicht, wer alles was mit Euren Daten anstellt !!! Mir dreht sich jeden Tag dreimal der Magen herum, wenn ich sehe, wie bereitwillig Menschen persönliche Informationen preisgeben. Das wird ein grosses gesellschaftliches Problem werden. Anhand von so einer lapidaren Datenquelle einen solchen Vortrag zu machen, war genau richtig ! In der Transferleistung kann man sich vorstellen, was man dann so alles mit relevanten Daten anstellen kann ! David Kriesel ist ein netter und kompetenter Kollege. Aber auch in der IT existiert die dunkle Seite der Macht ! In der Fa. haben wir sehr heisse Diskussionen darüber, was hier richtig sein kann und was nicht. Bei BigData kommt jetzt der kommerzielle Aspekt zum tragen - nicht kommerzielle Institutionen betreiben das schon länger und David hat gezeigt, was möglich ist, wenn man so ein Ding allein duchzieht ! Stellt Euch Institutionen vor, wo 20 oder 30 Davids arbeiten - anders motiviert mit sehr, sehr viel hardware...jedenfalls ist das für mich der Kern dieses sehr liebenswürdig gestalteten Vortrags. Für mich ein unterhaltsamer Fachvortrag - traurigerweise sehr wenig überraschend !
X100D, ab 03/2019
S85D, 03/2015 - 03/2019
ZOE intens Z.E. 40, seit 03/2017
PV 10,494 kWp
KEBA P30-Cluster, Lokales Lastmanagement
digitalStrom
Benutzeravatar
Moderator
Moderator
 
Beiträge: 4595
Registriert: 11. Nov 2014, 11:17
Land: Deutschland

Re: Reversed engineering - data mining @ Spiegel online

von r.wagner » 6. Jan 2017, 09:13

past_petrol hat geschrieben:... jetzt gibt es FaceBook und WhatsApp. An alle, die das immer noch herunterspielen. Ihr glaubt gar nicht, wer alles was mit Euren Daten anstellt !!! Mir dreht sich jeden Tag dreimal der Magen herum, wenn ich sehe, wie bereitwillig Menschen persönliche Informationen preisgeben. Das wird ein grosses gesellschaftliches Problem werden....


Na dann werd doch mal konkreter. Msn hört immer nur, dass die Daten missbraucht werden. Nie von wem oder exakt wozu (außer vielleicht für Zielgruppenanalyse).

Also Butter bei die Fische: wer, was, womit, warum?
bG, Richard
_______________

MS P85D seit 31.3.2015 - blue/pano/air
MX Signature P90DL seit 30.09.2016 - Sig.red/6-seater/fully loaded
Roadster Sport Signature 250 (#239 of 250) seit 30.06.2017 - Brilliant Yellow
M3 AWD LR seit 03.2019 - blue
Benutzeravatar
Trusted User
Trusted User
 
Beiträge: 2088
Registriert: 2. Jan 2015, 13:46
Wohnort: Wolfsgraben, AT
Land: Oesterreich

VorherigeNächste

Wer ist online?
Mitglieder in diesem Forum: Jürgen´s_Black_Pearl, TArZahn und 9 Gäste