Hands-on: Coding for Data-Journalism

Open Data Network
Open Data NetworkOpen Data Network
hands-on workshop:
  coding for data-
    journalism
einsteigerfreundliche Software-Tools für
   die Beschaffung und Präsentation
            relevanter Daten
urs@opendata-network.org




http://opendata-network.org/
upcoming:
Open Data Hackday
http://opendata.hackday.net/
17. & 18. April 2010 (morgen! hier!)



Open Democracy Camp
http://tinyurl.com/opend
8. & 9. Mai - Berlin - (new thinking store?)




Daten-Journalismus in der Praxis
heute 17h - Blauer Saal - Lorenz Matzat
3 Beispiele:
Daten mit ruby
aus dem web
scrapen

Werte mit den
Google Chart Tools
visualisieren

Netzwerke mit
Gephi
visualisieren
• dynamische Skriptsprache
• leicht zu erlernen & ausdrucksstark
• http://www.ruby-lang.org/
• sudo apt-get install ruby irb ri rdoc rubygems
• sudo gem install nokogiri (Scraping-Library)
lets roll:




 Demo
tagesschau:




          Text aus einer
            HTML-Seite
             extrahiert 
tagesschau_fuer_nerds.rb




                           Demo
next step:




       HTML                      extrahierter    CSV
http://de.eurosport.yahoo.com
     /fussball/bundesliga/           Text       Tabelle
fussball.rb
fussball.rb




zeilen = Array = [zeile, zeile, zeile, zeile]
Zeile für Zeile
fussball.rb
Ergebnis




       HTML                     extrahierter    CSV
http://de.eurosport.yahoo.com
     /fussball/bundesliga/          Text       Tabelle
Nebeneinkünfte
       Stufe 1 für 1000 bis 3500 Euro,
       Stufe 2 für 3500 bis 7000 Euro,
       Stufe 3 für alles ab 7000 Euro.
       Die Stufen werden je nach Job
       monatlich oder jährlich ausgewiesen.

       Wer unter 1000 Euro im Monat oder
       10.000 Euro im Jahr bleibt, muss nichts
       melden; solche Tätigkeiten werden ohne
       Stufen-Angabe vermerkt
Strategie:
1.
Alle Biografie-URLs
ermitteln

2.
Angaben zu Jobs
auslesen

3.
Tabelle erstellen
1. Alle Biografie-URLs
2a. Name und Partei auslesen
2b. Nebeneinkünfte auslesen
3. Tabelle erstellen
lokale Kopien erstellen
    mit SiteSucker
Nebeneinkünfte




    Demo
Google Chart Tools
        http://chart.apis.google.com/chart?
chs=250x100&chd=t:60,40&cht=p3&chl=Hello|World




<img border="1"
  src="http://chart.apis.google.com/chart?chs=250x100&amp;chd=t: 60,40&amp;cht=p3&amp;chl=Hello|World"
  alt="Yellow pie chart">
Google Chart Tools

        http://chart.apis.google.com/chart?
chs=250x100&chd=t:60,40&cht=p3&chl=Hello|World

Bildgröße    Werte    Chart-Typ      Legende
Beispiele:
Google Visualization API




Javascript auf der Seite statt IMG-src-URL
Hands-on: Coding for Data-Journalism
Gephi
interactive visualization and exploration for graphes
Graph-Input-File (zB. gml)
Creator "ODN workshop"
graph
[
  node
  [
    id 1                  edge
    label "DoingIt Inc"    [
  ]                          source 2
  node                       target 1
  [                        ]
    id 2                   edge
    label "Proxy Inc."     [
  ]                          source 3
                             target 1
                           ]
Gephi




Demo
1 of 30

Recommended

3D in Photoshop by
3D in Photoshop3D in Photoshop
3D in PhotoshopDigicomp Academy AG
455 views4 slides
Comic: Die Neue by
Comic: Die NeueComic: Die Neue
Comic: Die NeueVS zennerstraße 1
737 views12 slides
Spehr Eu Wahl 2009 by
Spehr Eu Wahl 2009Spehr Eu Wahl 2009
Spehr Eu Wahl 2009guest17e2ee
417 views4 slides
Examen profa anairis 2 Yoaltzin Antonio Sevilla San Agustin by
Examen profa anairis 2 Yoaltzin Antonio Sevilla San AgustinExamen profa anairis 2 Yoaltzin Antonio Sevilla San Agustin
Examen profa anairis 2 Yoaltzin Antonio Sevilla San AgustinToño Sevilla S A
260 views5 slides
d7 by
d7d7
d7dioselinn
143 views4 slides
Cuestionario de computacion by
Cuestionario de computacionCuestionario de computacion
Cuestionario de computacionJessika Mondragon
317 views4 slides

More Related Content

Viewers also liked

Visita a bilbao 3 ¦ diversificaci+ôn by
Visita a bilbao  3  ¦ diversificaci+ônVisita a bilbao  3  ¦ diversificaci+ôn
Visita a bilbao 3 ¦ diversificaci+ônVillajunco
288 views24 slides
Open Data Network: Warum eine freie Gesellschaft offene Daten braucht. by
Open Data Network: Warum eine freie Gesellschaft offene Daten braucht.Open Data Network: Warum eine freie Gesellschaft offene Daten braucht.
Open Data Network: Warum eine freie Gesellschaft offene Daten braucht.Open Data Network
1.1K views162 slides
Título del documento by
Título del documentoTítulo del documento
Título del documentoJessika Mondragon
286 views3 slides
Nombre by
NombreNombre
NombreJessika Mondragon
206 views3 slides
¿Qué tan verde es un experimento by
¿Qué tan verde es un experimento¿Qué tan verde es un experimento
¿Qué tan verde es un experimentoangelo26_
596 views9 slides
Introduccion a la programacion by
Introduccion a la programacionIntroduccion a la programacion
Introduccion a la programacionmiguelovalle10
200 views7 slides

Viewers also liked(16)

Visita a bilbao 3 ¦ diversificaci+ôn by Villajunco
Visita a bilbao  3  ¦ diversificaci+ônVisita a bilbao  3  ¦ diversificaci+ôn
Visita a bilbao 3 ¦ diversificaci+ôn
Villajunco288 views
Open Data Network: Warum eine freie Gesellschaft offene Daten braucht. by Open Data Network
Open Data Network: Warum eine freie Gesellschaft offene Daten braucht.Open Data Network: Warum eine freie Gesellschaft offene Daten braucht.
Open Data Network: Warum eine freie Gesellschaft offene Daten braucht.
Open Data Network1.1K views
¿Qué tan verde es un experimento by angelo26_
¿Qué tan verde es un experimento¿Qué tan verde es un experimento
¿Qué tan verde es un experimento
angelo26_596 views
Introduccion a la programacion by miguelovalle10
Introduccion a la programacionIntroduccion a la programacion
Introduccion a la programacion
miguelovalle10200 views
SEPA Informationen aus dem Fundraising Frühstück-BITKOM by Spendino
SEPA Informationen aus dem Fundraising Frühstück-BITKOMSEPA Informationen aus dem Fundraising Frühstück-BITKOM
SEPA Informationen aus dem Fundraising Frühstück-BITKOM
Spendino2.6K views
Trabajo de realidad aumentada by josuevargas123
Trabajo de realidad aumentadaTrabajo de realidad aumentada
Trabajo de realidad aumentada
josuevargas123359 views
Concepcion de las pilas galvanicas by angelo26_
Concepcion de las pilas galvanicasConcepcion de las pilas galvanicas
Concepcion de las pilas galvanicas
angelo26_413 views
A pulir para que brille by Bryan Urra
A pulir para que brilleA pulir para que brille
A pulir para que brille
Bryan Urra383 views
Ejercicio: Cambio conceptual a través del analísis de las propiedades del agu... by angelo26_
Ejercicio: Cambio conceptual a través del analísis de las propiedades del agu...Ejercicio: Cambio conceptual a través del analísis de las propiedades del agu...
Ejercicio: Cambio conceptual a través del analísis de las propiedades del agu...
angelo26_320 views
Banale Musik erzeugt Provinz by derherrgott
Banale Musik erzeugt ProvinzBanale Musik erzeugt Provinz
Banale Musik erzeugt Provinz
derherrgott564 views
Rene Barrientos - Matematicas - Nancy oña by funlapaz
Rene Barrientos - Matematicas - Nancy oña   Rene Barrientos - Matematicas - Nancy oña
Rene Barrientos - Matematicas - Nancy oña
funlapaz447 views
Tabla periodica by angelo26_
Tabla periodicaTabla periodica
Tabla periodica
angelo26_309 views
Irisbond Primma Manual de Usuario by IRISBOND
Irisbond Primma Manual de UsuarioIrisbond Primma Manual de Usuario
Irisbond Primma Manual de Usuario
IRISBOND1.1K views

Similar to Hands-on: Coding for Data-Journalism

App Entwicklung mit Appcelerator Titanium - MTC 2014 by
App Entwicklung mit Appcelerator Titanium - MTC 2014App Entwicklung mit Appcelerator Titanium - MTC 2014
App Entwicklung mit Appcelerator Titanium - MTC 2014Marcel Pociot
934 views52 slides
C/ C++ for Notes & Domino Developers by
C/ C++ for Notes & Domino DevelopersC/ C++ for Notes & Domino Developers
C/ C++ for Notes & Domino DevelopersUlrich Krause
9.9K views100 slides
BASTA! 2017 Jubiläumskonferenz - Warum warten auf die IDE!? by
BASTA! 2017 Jubiläumskonferenz - Warum warten auf die IDE!?BASTA! 2017 Jubiläumskonferenz - Warum warten auf die IDE!?
BASTA! 2017 Jubiläumskonferenz - Warum warten auf die IDE!?Robin Sedlaczek
221 views27 slides
Augmented Reality Workshop by
Augmented Reality WorkshopAugmented Reality Workshop
Augmented Reality Workshopargency
378 views42 slides
ADC Core 2017 - Warum warten auf die IDE? by
ADC Core 2017 - Warum warten auf die IDE?ADC Core 2017 - Warum warten auf die IDE?
ADC Core 2017 - Warum warten auf die IDE?Robin Sedlaczek
354 views23 slides
OKLab Leipzig - 2023 Update by
OKLab Leipzig - 2023 UpdateOKLab Leipzig - 2023 Update
OKLab Leipzig - 2023 Updatejoergreichert
54 views106 slides

Similar to Hands-on: Coding for Data-Journalism(20)

App Entwicklung mit Appcelerator Titanium - MTC 2014 by Marcel Pociot
App Entwicklung mit Appcelerator Titanium - MTC 2014App Entwicklung mit Appcelerator Titanium - MTC 2014
App Entwicklung mit Appcelerator Titanium - MTC 2014
Marcel Pociot934 views
C/ C++ for Notes & Domino Developers by Ulrich Krause
C/ C++ for Notes & Domino DevelopersC/ C++ for Notes & Domino Developers
C/ C++ for Notes & Domino Developers
Ulrich Krause9.9K views
BASTA! 2017 Jubiläumskonferenz - Warum warten auf die IDE!? by Robin Sedlaczek
BASTA! 2017 Jubiläumskonferenz - Warum warten auf die IDE!?BASTA! 2017 Jubiläumskonferenz - Warum warten auf die IDE!?
BASTA! 2017 Jubiläumskonferenz - Warum warten auf die IDE!?
Robin Sedlaczek221 views
Augmented Reality Workshop by argency
Augmented Reality WorkshopAugmented Reality Workshop
Augmented Reality Workshop
argency378 views
ADC Core 2017 - Warum warten auf die IDE? by Robin Sedlaczek
ADC Core 2017 - Warum warten auf die IDE?ADC Core 2017 - Warum warten auf die IDE?
ADC Core 2017 - Warum warten auf die IDE?
Robin Sedlaczek354 views
OKLab Leipzig - 2023 Update by joergreichert
OKLab Leipzig - 2023 UpdateOKLab Leipzig - 2023 Update
OKLab Leipzig - 2023 Update
joergreichert54 views
Hands-on Workshop: API-Dokumentation mit OpenAPI / Swagger in ASP.NET Core by Gregor Biswanger
Hands-on Workshop: API-Dokumentation mit OpenAPI / Swagger in ASP.NET CoreHands-on Workshop: API-Dokumentation mit OpenAPI / Swagger in ASP.NET Core
Hands-on Workshop: API-Dokumentation mit OpenAPI / Swagger in ASP.NET Core
Gregor Biswanger212 views
C / C++ Api for Beginners by Ulrich Krause
C / C++ Api for BeginnersC / C++ Api for Beginners
C / C++ Api for Beginners
Ulrich Krause1.6K views
Top 10 Internet Trends 2006 by Jürg Stuker
Top 10 Internet Trends 2006Top 10 Internet Trends 2006
Top 10 Internet Trends 2006
Jürg Stuker1.3K views
Magdeburger Developer Days 2018 - Warum warten auf die IDE? by Robin Sedlaczek
Magdeburger Developer Days 2018 - Warum warten auf die IDE?Magdeburger Developer Days 2018 - Warum warten auf die IDE?
Magdeburger Developer Days 2018 - Warum warten auf die IDE?
Robin Sedlaczek127 views
HTML5 für Entwickler: Part 1, 2014 by Markus Greve
HTML5 für Entwickler: Part 1, 2014HTML5 für Entwickler: Part 1, 2014
HTML5 für Entwickler: Part 1, 2014
Markus Greve1.3K views
C API for Lotus Notes & Domino by Ulrich Krause
C API for Lotus Notes & DominoC API for Lotus Notes & Domino
C API for Lotus Notes & Domino
Ulrich Krause4.3K views
Best practise 5 anwendungsfälle der google analytics api by e-dialog GmbH
Best practise 5 anwendungsfälle der google analytics apiBest practise 5 anwendungsfälle der google analytics api
Best practise 5 anwendungsfälle der google analytics api
e-dialog GmbH3.7K views
German: Softwareprodukte aus einem Source Code mit Javascript by Ralf Schwoebel
German: Softwareprodukte aus einem Source Code mit JavascriptGerman: Softwareprodukte aus einem Source Code mit Javascript
German: Softwareprodukte aus einem Source Code mit Javascript
Ralf Schwoebel1.1K views
I thought you were my friend! by Mario Heiderich
I thought you were my friend!I thought you were my friend!
I thought you were my friend!
Mario Heiderich1.7K views
YAFOWIL - Webformulare in Python ohne Kopfschmerzen by Jens Klein
YAFOWIL - Webformulare in Python ohne KopfschmerzenYAFOWIL - Webformulare in Python ohne Kopfschmerzen
YAFOWIL - Webformulare in Python ohne Kopfschmerzen
Jens Klein1.8K views

Hands-on: Coding for Data-Journalism

Editor's Notes