Die Technologie hinter den Paradise Papers

Bild: ICIJ

Security
Typography
  • Smaller Small Medium Big Bigger
  • Default Helvetica Segoe Georgia Times

Bei der Datenanalyse der Paradise Papers setzt das International Consortium of Investigative Journalists (ICIJ) erneut auf die Graphdatenbank Neo4j. Das 1,3 Terabyte grosse Datenleak mit rund 13,4 Millionen Dokumenten entlarvt die Steuertricks, Briefkastenfirmen und Steueroasen von Politikern, Konzernen und Superreichen.  

Die Daten stammen von der Anwaltskanzlei Appleby, der Treuhandfirma Asiaciti Trust sowie aus 19 weiteren Steueroasen wie Bermuda und der Isle of Man. In den Dokumenten  tauchen  zahlreiche bekannte Namen auf, darunter enge Mitglieder der Trump-Regierung, Formel-1 Weltmeister Lewis Hamilton sowie Unternehmen wie Apple, Nike, Sixt, Deutsche Post oder Bayer. Das Datenpaket wurde der Süddeutschen Zeitung zugespielt und in Zusammenarbeit mit dem ICIJ und einem globalen Netzwerk an Journalisten ausgewertet.  

Um die Recherche innerhalb der gigantischen und komplexen Datenmenge überhaupt zu ermöglichen, wurden die Rohdaten von einem kleinen Team beim ICIJ in eine Datenbank überführt. Wie bei den Panama Papers nutzten die Journalisten dazu Neo4j, die Graph-Plattform zur Analyse für vernetzte Daten. In Kombination mit der Visualisierungsplattform Linkurious lassen sich die stark verknüpften Daten strukturieren, anschaulich darstellen und analysieren. Die Journalisten konnten so versteckte Zusammenhänge zwischen Personen, Unternehmen und Offshore-Konten aufdecken.

„Bei einem Grossteil der Dokumente handelte es sich um Rohdaten. Diese in einer einzigen Datenbank zu speichern, war für uns zunächst eine Herausforderung“, erklärt Pierre Romera, Chief Technology Officer des ICIJ. „Mit Neo4j und Linkurious konnten unsere Entwickler schliesslich den Datensatz auf eine Weise modellieren, die es den 382 Journalisten ermöglichte, die Daten zu analysieren, Muster zu visualisieren und sich auszutauschen. Es ist erstaunlich, wie intuitiv eine Graphdatenbank dabei ist  – unabhängig von der jeweiligen IT-Erfahrung der Anwender. Das vereinfachte die Analyse und bereitete den Weg für die nun veröffentlichten Berichte.“

Wir verwenden Cookies auf unserer Website. Einige von ihnen sind für den Betrieb der Website von wesentlicher Bedeutung, während andere uns dabei helfen, diese Website und die Benutzererfahrung zu verbessern (Tracking-Cookies). Sie können selbst entscheiden, ob Sie Cookies zulassen möchten oder nicht. Bitte beachten Sie, dass Sie möglicherweise nicht alle Funktionen der Website nutzen können, wenn Sie sie ablehnen.