SlideShare ist ein Scribd-Unternehmen logo
1 von 35
Downloaden Sie, um offline zu lesen
www.td-berlin.com
SMART DATA WORKSHOP
Neue Datenquellen für die Wirkungsmessung sozialer Projekte?
17. November 2016
Gufeng Zhou, Birte Schaper, Nadja Büttner, Kristina Bongardt
Smart Data Workshop by td Berlin @ labtogether 2016
Agenda
Smart Data Quellen
Gallery Walk
15min pro Datenquelle/Station
+ 10min Kaffeepause
Input zu Smart Data &
Gruppen-Einteilung
Offene Diskussion zum
Ausblick & Reflektion
14:30 – 14:50
14:50 – 16:30
16:30 – 17:00
Smart Data Workshop by td Berlin @ labtogether 2016
SMART DATA!
SMART
DATA!
CRM
DATA
OPEN
DATA
SENSOR
BASED
DATA
ONLINE
TEXT
DATA
WEB
ANALYTIC
DATA
GOOGLE
SEARCH
DATA
Smart Data Workshop by td Berlin @ labtogether 2016
Google Search Data:
Das Messen von Interesse
https://www.google.de/trends/
Regionale
Verteilung
Verwandte
Suchanfragen
Zeitverlauf
Beispiel: Google Trends
Smart Data Workshop by td Berlin @ labtogether 2016
Google Search Data:
Das Messen von Interesse
https://www.google.de/trends/
• Die Analyse von Google Suchdaten gibt
Aufschluss über das Interesse der
Gesellschaft an konkreten Themen,
Personen und Produkten
• Mit Hilfe von Google Trends lässt sich die
Popularität einzelner Begriffe im Zeitablauf
analysieren, was Rückschlüsse auf sich
formierende Trends in der Welt, einem Land
oder einer Region erlaubt
• Dies ermöglicht weitere Analysen wie die
Korrelation des Suchvolumens von Themen
mit anderen Themen (Google correlate) oder
bestimmten Ereignissen
• Diese Korrelationen erlauben Aussagen über
den Effekt von Ereignissen (z.B. Kampagnen,
Veröffentlichungen), sowie die Vorhersage
bestimmter Ereignisse (Beispiel Suche nach
Grippe und tatsächliche Verbreitung)
Smart Data Workshop by td Berlin @ labtogether 2016
Google Search Data: Nach Veröffentlichung der Studie zu
Kinderarmut der BM Stiftung steigen die Suchen zu dem Begriff
https://www.bertelsmann-stiftung.de/de/themen/aktuelle-meldungen/2016/september/kinderarmut-in-
deutschland-waechst-weiter-mit-folgen-fuers-ganze-leben/
12.09.2016, Studie der Bertelsmann Stiftung:
„Kinderarmut in Deutschland wächst weiter –
mit Folgen fürs ganze Leben“
Smart Data Workshop by td Berlin @ labtogether 2016
0
20
40
60
80
100
Nov. 11 Mai. 12 Nov. 12 Mai. 13 Nov. 13 Mai. 14 Nov. 14 Mai. 15 Nov. 15 Mai. 16
HeForShe Gender Equality
Google Search Data: Emma Watsons „HeForShe“ Kampagne
führt zu einer Steigerung der Suchen nach Gender Equality
https://www.google.de/trends/
September 2014
Emma Watson HeForShe Speech at UN March 2015
Emma Watson Live Chat on Facebook
March 2016
HeForShe Art Week Launch
Smart Data Workshop by td Berlin @ labtogether 2016
Google Search Data: Electionland, ein Projekt von ProPublica
und Google zur Messung von Unregelmäßigkeiten am Wahltag
https://projects.propublica.org/electionland/Smart Data Workshop by td Berlin @ labtogether 2016
Online Text Data:
Das Messen von Meinungen
https://trend-sonar.com/
Quellen Art
Zeitverlauf &
Prognose
Alle Artikel zum
Thema
Subthemen
Beispiel: Sonar
Smart Data Workshop by td Berlin @ labtogether 2016
Online Text Data:
Das Messen von Meinungen
• Die Analyse von Online-Gesprächen wie
Nachrichten, Blogs, Foren und Posts in Social
Media Kanälen wie Facebook, Twitter oder YouTube
ermöglicht Einblicke in und Perspektiven von
Bedürfnisse und Meinungen von Personen
• Mit Hilfe von Buzz Listening Tools lässt sich
quantifizieren, wie intensiv (Buzz Volumen) auf
welchen Kanälen über bestimmte Themen und
Aspekte im Zeitverlauf gesprochen wird
• Text AnalyticsTools erlauben zudem die
automatisierte qualitative Analyse von Dokumenten,
also beispielsweise wie positiv oder negativ
(Sentiment) und worüber (z.B. als Textcloud)
gesprochen wird.
• So lassen sich beispielsweise Aussagen darüber
treffen, wie erfolgreich eine Kampagne war, worüber
die Gesellschaft vermehrt diskutiert oder was sie an
bestimmten Themen oder Produkten stört
Smart Data Workshop by td Berlin @ labtogether 2016
Tools
Tool-
Einblicke
Beispielhafte
Datenquellen
news
50%
facebook
19%
forum
14%
twitter
10%
blog
4%
Others
3%
…Känale
Online Text Data: Diskussion über und Probleme mit
Blutspenden analysieren und verstehen
0
500
1000
1500
2000
2500
Buzzvolume Blutspende in Deutschland
April 2015
News: Homosexuelle und Blutspende
Juni 2015
Weltblutspendetag
Juni 2016
Weltblutspendetag
Feb 2016
Zugunglück in Bayern: Aufruf zur Blutspende
Diskussionen nach
…Bundeslandändern
DRK
86%
BRK
10%
Haema
4%
…Organisationen
Stammzell
40%
Blutplasma
33%
Vollblut
17%
Thrombozyten
10%
…Spendenarten
187
314
443
Wo kann man spenden?
Wie oft kann man spenden?
Wer darf spenden?
Top 3 Fragen
https://brandwatch.com/Smart Data Workshop by td Berlin @ labtogether 2016
Online Text Data: Textdaten-Analyse zur Optimierung von
Fundraising
http://www.datakind.org/projects/helping-great-causes-get-funded/
Ausgangslage
• GlobalGiving ist viel mehr als nur eine
Fundraising-Website. Neben der Verwaltung
von Spendengeldern hilft GlobalGiving
Organisationen, die Effizienz ihrer
Fundraising Aktivitäten zu verbessern und
ihre Wirkung zu erhöhen.
Vorgehen
• GlobalGiving untersuchte bisherige
Fundraising-Kampagnen oder Projekte, um
zu ermitteln, welche Faktoren dazu führen,
dass Projekte erfolgreich finanziert werden.
• Sie wollten wissen: Gab es eine Formel für
den Projekterfolg?
Ergebnis
• Durch die Textanalyse der Wörter auf jeder
Projektseite fanden sie Korrelationen
zwischen der Spezifität der Sprache und dem
Projekterfolg.
• Organisationen waren z.B. weniger
erfolgreich, wenn sie generische Worte wie
"Kunst" versus ein konkretes Projekt wie
"eine Fotografie-Ausstellung“ verwendeten.
• Erfolgreiche Projekte erreichten in der Regel
ihre Finanzierungsziele innerhalb der ersten
zwei Monate nach der Entsendung des
Projekts.
Smart Data Workshop by td Berlin @ labtogether 2016
Web Analytics Data:
Das Messen von Online Verhalten
Visits über
die Zeit
Total Visits
Traffic Sources
Verwandte Visits
Beispiel: Similar Web
Smart Data Workshop by td Berlin @ labtogether 2016
Web Analytics Data
Das Messen von Nutzungsverhalten
• Die Analyse von Webseiten- & App-Daten liefert
quantifizierbare Erkenntnisse über die Nutzung
von einer Seite oder App
• Mithilfe von Web Analytics Tools kann die
Performance von verschiedenen KPIs (Key
Performance Indicators) gemessen werden
(Besuche, Absprungrate, Verweildauer,
Registrierungen etc.)
• Typische Fragestellungen sind z.B.: Wie viele
Besucher gab es? Wie lange waren sie auf der
Seite? Was haben sie sich angeschaut? Haben
sie sich registriert/ gespendet/ teilgenommen?
Wie sind sie auf meine Seite gekommen (z.B.
Newsletter, Search, Ads)?
• So können Webseiten und Apps hinsichtlich
Nutzerfreundlichkeit und Erfolgsfaktoren
(z.B. Registrierungen) optimiert werden
Smart Data Workshop by td Berlin @ labtogether 2016
Tools
Tool-Einblicke
Web Analytics Data: Verbesserung des Online Mentorship
Programms von iCouldBe durch die Analyse von Webdaten
http://www.datakind.org/projects/uncovering-the-abcs-of-successful-online-mentoring/
Ausgangslage
• iCouldBe‘s Ziel ist es gefährdete Jugendliche
durch ein Online Mentorship Programm zu
ermutigen, die Schule zu beenden und
Zukunftspläne zu schmieden.
• Seit 15 Jahren misst iCouldBe die
Interaktionsdaten zwischen Mentor und
Mentee auf ihrer Website.
• Frage: Welche Faktoren führen dazu, dass
die Jugendlichen das Mentorship Programm
abschließen und nicht vorzeitig abbrechen?
Vorgehen
• Erarbeitung einer Definition von Erfolg des
Mentorship Programms (3 bearbeite
Lernmodule in 3 Monaten)
• Text-Daten basiertes Vorhersagemodell zur
Identifikation von Erfolgsfaktoren
Ergebnis
• Schnelle und positive Rückmeldung von
Mentoren sowie Sätze wie "I'm here for you“
steigern die Motivation.
• Ein zu langer Text führt zu einer höheren
Abbruchwahrscheinlichkeit.
• Kate Schrauth (Director): “Now we can start
really training mentors on how to be
successful based on more than just
anecdotes.”
Smart Data Workshop by td Berlin @ labtogether 2016
CRM Data:
Das Messen von Engagement relevanter
Stakeholder
INTERAKTION
CRM Database
KOOPERATION
Smart Data Workshop by td Berlin @ labtogether 2016
CRM Data:
Das Messen von Engagement relevanter Stakeholder
• CRM-Datenbanken bieten ein umfassendes
Spektrum von Einblicken zu Nutzer- und
Zielgruppen, deren Verhalten und
Interessen z.B. ihre Geschichte, Ziele,
Präferenzen, Probleme, ihre Zufriedenheit,
Kooperationen
• Die Analyse von Daten wie z.B. Newsletter
Performance, Registrierungen, Interaktionen,
Nutzungsprofile geben Rückschlüsse auf den
erfolgreichen Umgang mit Stakeholdern
• So kann individualisiert auf die Bedürfnisse der
einzelnen Stakeholder eingegangen und eine
zielgruppengerechte Ansprache aller
Stakeholder (z.B. Spender, Teilnehmer/ Nutzer,
Betroffene, Kunden, Kooperationspartner,
Freiwillige) ermöglicht werden
(RE)
AKTIVIERUNG
ANSPRACHE
PERSONALISIERUNG
INTERAKTION
CRM Database
KOOPERATION
Smart Data Workshop by td Berlin @ labtogether 2016
CRM Data:
Den Erfolg von Programmen messbar machen und optimieren
https://blog.dssg-berlin.org/datenanalyse-f%C3%BCr-das-gemeinwohl-e964566cdd99#.m2r4zd4n7
https://www.uschamberfoundation.org/food-data-great-opportunities
Ausgangslage
• DC Central Kitchen bieten neben dem
Kerngeschäft u.a. auch Fortbildungen für
sozial unterpriviligierte Bürger an.
• Das Ziel des DC Central Kitchens
„Culinary Job Training-Programms ist es,
Erwachsene auf die Anforderungen im
Berufsalltag der Lebensmittel-Service-
Industrie vorzubereiten.
Ergebnis
• Durch die Analyse der vorhandenen Daten
über ihre Teilnehmer und deren Historie
konnte aufgedeckt werden, dass
Teilnehmer oft kurz vor Ende des
Trainings aus dem Programm
ausscheiden.
• Daraufhin hat DC Central ein Praktikums-
Programm lanciert, um den Übergang von
der Ausbildung in den Joballtag zu
erleichtern.
• Weitere Analysen zeigten, dass
Teilnehmer mit bestimmten Eigenschaften
mit höherer Wahrscheinlichkeit aufgeben.
• Mit diesem Wissen konnten DC Central
Kitchen proaktiv auf spezielle Teilnehmer
zugehen und sie im Programm halten.
Smart Data Workshop by td Berlin @ labtogether 2016
CRM Data: Risikofaktoren für Obdachlosigkeit erkennen mit
verknüpften CRM Daten
http://www.datakind.org/projects/sharing-data-to-learn-about-homelessness/
Ausgangslage
• St Mungos Broadway, eine Organisation für
Obdachlose, hat eine große Menge an Daten
über ihre Klienten, jedoch wenig Informationen
über diese Personen, bevor sie obdachlos
wurden.
• Daher wollten sie herausfinden mit welcher Art
von Fragen, die Menschen zu Citizens Advice,
einer freie Beratung in allen Zivilthemen,
gehen bevor sie als Obdachlose in ihrem
System landen.
Vorgehen
• Das Verknüpfen beider Datensets zeigte, dass
1500 gemeinsame Klienten bestehen, deren
Daten mithilfe verschiedener Modelle
analysiert werden konnten.
• Mit Gephi wurden bspw. gemeinsame Wege
und das gemeinsame Auftreten von
Problemen analysiert und visualisiert.
Ergebnis
• Data Scientist fanden verschiedene
spannende Erkenntnisse z.B. sind Probleme
mit Arbeitsunfähigkeit 10% häufiger bei
späteren Obdachlosen gefunden worden.
• Zum anderen wurden Modelle erarbeitet, die
den Erfolg von Obdachlosen-Programmen bei
Personen mit bestimmten Merkmalen
hervorsagen sollten.
Smart Data Workshop by td Berlin @ labtogether 2016
Open Data:
Das Analysieren von öffentlichen Daten
Smart Data Workshop by td Berlin @ labtogether 2016
Open Data:
Das Analysieren von öffentlichen Daten
• Open Data bezeichnet die freie Verfügbar- und
Nutzbarkeit von meist öffentlichen Daten
• Auf Regierungsseiten findet man mittlerweile
eine breite Palette von Bevölkerungs-,
Wirtschafts- und Geodaten, die von weltweiten
Klimaentwicklungen über regionale Kriminalitäts-
statistiken bis hin zu Obdachlosenzahlen in
einzelnen Stadtteilen reichen
• Auch wissenschaftliche Datenbanken machen
zunehmend akademische Abhandlungen,
empirische Studien und Patentdatenbanken frei
verfügbar, die mitunter Aufschluss über
technologische Entwicklungen geben können
• Mit Datenanalyse und Algorithmen lassen sich
diese Daten in Zusammenhang bringen und
können so eine wichtige Erkenntnisquelle für
unterschiedlichste Forschungsfragen sein
Smart Data Workshop by td Berlin @ labtogether 2016
Open Data: Effektive, regionale Budget Allokation im Kampf
gegen Kinderarmut auf Basis von offenen Regierungsdaten
http://www.datakind.org/blog/dc-action-for-children-long-term-collaboration-for-long-term-impact/
Ausgangslage
• Kinderarmut ist ein wichtiges Thema. Um es
zu lokalisieren und Ressourcen richtig zu
verteilen, muss man es messen. Allerdings
gibt es hierzu viele verschiedene öffentliche
Datenquellen und Metriken
• Das Ziel des DC KIDS COUNT Data Tools
2.0 ist es eine detaillierte geographische
Übersicht all dieser Variablen zu erhalten, um
eine informierte Entscheidung zu treffen
Ergebnis
• Visualisierung verschiedener Armuts-
Metriken in einer Kartendarstellung
• “What the neighborhood maps showed us
was that the success of far too many DC
children is predetermined by their ZIP Code –
and too many children lack access to
resources needed to thrive.” (HyeSook
Chung, Executive Director of DC Action for
Children)
• “We hope the DC KIDS COUNT Data Tool
2.0 ignites thoughtful conversations during
this budget season to ensure that resources
are both sufficiently, and effectively, allocated
to address the needs of children.” (HyeSook
Chung, Executive Director of DC Action for
Children)
Smart Data Workshop by td Berlin @ labtogether 2016
Open Data: Und wenn es keine verfügbaren Regierungsdaten
gibt? Satellitenbilder zur Identifizierung von Bedürftigen
http://www.datakind.org/blog/using-satellite-images-to-understand-poverty/
http://www.datakind.org/projects/using-the-simple-to-be-radical/
Zielsetzung
• GiveDirectly benötigte Informationen über
Armutsverhältnisse in Kenia, um Bedürftige
besser identifizieren zu können.
• Es gab jedoch keine amtlichen Statistiken.
Vorgehen
• Data Scientists erstellten ein System, das
automatisch den Hausdachtyp (Metall- oder
Strohdach) auf Satellitenbildern erkennt.
• Mithilfe von Machine Learning konnten die
Armutsverhältnisse automatisch geschätzt
werden (Verhältnis Metall- zu Strohdächer).
Ergebnis
• Ansatz für das Automatisieren eines
datengesteuerten Prozesses für die
Ausrichtung von Bargeldtransfers
• Während der Algorithmus für GiveDirectly
nicht genau genug war, zeigt er dennoch
das Potenzial der Verwendung von
Satellitenbildern und Machine Learning,
welches in Entwicklungs- oder humanitärer
Arbeit eingesetzt werden kann.
Smart Data Workshop by td Berlin @ labtogether 2016
Sensor-based Data:
Das Messen von
Offline Verhalten
Smart Data Workshop by td Berlin @ labtogether 2016
Sensor-based Data:
Das Messen von Offline Verhalten
• Smartphones, Wearables, Sensoren und immer
mehr andere vernetzte Produkte ermöglichen
es heute, Aspekte des offline Verhaltens
digital messbar zu machen
• Technologische Innovationen im Bereich
Internet of Things und Quantified Self
(Vermessung des Selbst) zeigen schon heute,
was in Zukunft vernetzt und messbar sein kann
• Das Aufzeichnen und Analysieren von solchen
(Verhalten-)Daten kann auf individueller Ebene
Einblicke in Verhaltensmuster hinsichtlich
Bewegung, Nutzung und Interesse geben
• Zwar können solche Daten einerseits dazu
dienen, Aspekte des menschlichen Lebens zu
optimieren (z.B. Health Apps), ebenso wächst
jedoch die Skepsis hinsichtlich ethischer
Aspekte in einer total vernetzten Gesellschaft
Smart Data Workshop by td Berlin @ labtogether 2016
Sensor-based Data: Ambient Assisted Living – Sensoren statt
Pflegeheime
http://www.zeit.de/2013/02/Pflege-Technologie-Ambient-Assisted-Living/seite-3/
Ausgangslage
• Nicht nur in Deutschland fürchtet man sich vor
den Folgen der demografischen Bombe. Seit
vier Jahren fördert die Europäische Union in 23
Ländern die Arbeit von Ingenieuren und
Informatikern, die sie entschärfen wollen.
Vorgehen
• Im schottischen Bezirk West Lothian ließ die
Bezirksverwaltung zwischen 2002 und 2006
über 2.000 Wohnungen mit Sensoren versehen
– für gerade einmal 2,1 Millionen Pfund.
• Installiert wurde ein einfaches
Hausnotrufsystem, das die Daten von tragbaren
Sturzsensoren, Bewegungs-, Rauch- und
Gasmeldern im Notfall an ein Callcenter funkt.
Dort beantwortet geschultes Personal Fragen
und kontaktiert bei Bedarf Pfleger, Ärzte oder
Angehörige.
Ergebnis
• Die durchschnittliche Aufenthaltsdauer in
Pflegeheimen des Bezirks wurde von 38 auf
unter 10 Monate gesenkt und den Menschen so
mehr Zeit im gewohnten Umfeld ermöglicht.
• Mittlerweile haben über 30.000 Schotten Zugriff
auf telemedizinische Dienstleistungen. Laut
einer Studie des New Haven Research Center
ließen sich in den letzten fünf Jahren eine halbe
Million Krankenhaustage einsparen.
Smart Data Workshop by td Berlin @ labtogether 2016
Sensor-based Data: Impf-Tracking zur Optimierung der Polio-
Bekämpfung in Nigeria
http://www.ehealthafrica.org/polio-program//
Ausgangslage
• Die Projekte von eHealthAfrice (eHA)
optimieren die lokalen, sowie nationalen Polio-
Impfkampagnen in Nigeria durch die
Bereitstellung von Smart Data und
Geoinformationen.
Vorgehen
• Über 12.000 Impfteams wurden mit GPS-
fähigen Android Smartphones ausgestattet,
wodurch mithilfe einer speziellen Tracking-App
die Bewegung der Teams verfolgt werden
konnten.
• eHA entwickelt ein Vaccinator-Tracking-System
(VTS) Dashboard, das die Bewegung der
Impfteams abbildet, Anteile abgedeckter
Siedlungen, sowie verpasste Siedlungen
überwacht.
• Zudem wurden die Daten von schwer zu
erreichenden Siedlungen an WHO und UNICEF
weitergegeben, deren mobile Teams
abgelegene Gemeinden versorgen.
Ergebnis
• Durch die Arbeit von eHA wurden 782 zuvor
undokumentierte Siedlungen identifiziert.
• In Zukunft kann so sichergestellt werden, dass
bei künftigen Impfkampagnen mehr Siedlungen
besucht und behandelt werden .
Smart Data Workshop by td Berlin @ labtogether 2016
Sensor-based Data: Digitale Autobahn – Sensoren messen
Bewegungsdaten
https://www.welt.de/regionales/bayern/article156192950/Digitale-Autobahn-Sensoren-messen-
Bewegungsdaten.html/
Ausgangslage
• Die Teststrecke für selbstfahrende Autos
wird aufgerüstet: An der A9 speichern
Radarsensoren die Bewegungsdaten von
Fahrzeugen.
Vorgehen
• Für die Erprobungsphase liefert Infineon
die Sensor-Chips, die Siemens dann in
Messgeräte einbaut und entlang der
Autobahn installiert.
• Verkehrsdichte, Tempo, Abstand und
andere Bewegungsdaten der Fahrzeuge
werden anonym gemessen
• Alle gesammelten Bewegungsdaten
werden im Internet jedermann offen zur
Verfügung gestellt.
Ergebnis
• App-Entwickler können damit digitale
Anwendungen für das vernetzte oder
autonome Fahren entwickeln um künftig
Unfälle und Staus zu vermeiden.
Smart Data Workshop by td Berlin @ labtogether 2016
Predictive Modeling:
Wirkung messbar
machen
Smart Data Workshop by td Berlin @ labtogether 2016
Predictive Modeling: Wirkung messbar machen
Auf Basis von mathematischen Algorithmen und
modelbasierten Datenanalysieren kann
• die Wirkung von bestimmten Aktivitäten
(Kampagne / Programm) gemessen werden
(häufig auf Basis von Zeitreihendaten und
Grundlage für eine Effektivitätsbetrachtung)
• eine Vorhersage oder Klassifizierung
erstellt werden (welche wiederum als
Frühwarnsystem oder zur besseren
Allokation von Ressourcen genutzt werden
kann)
Die Auswahl der geeigneten Modelle hängt von
der gewählten Fragestellung ab. Beispielhafte
Modellierungsmethoden sind logistische
Regression, neuronale Netze, Random Forest,
Classification und Regression Tree (CART)
Smart Data Workshop by td Berlin @ labtogether 2016
Predictive Modeling: Das Vorhersagen von Hausbränden zur
gezielten Installation von Rauchmeldern
http://www.datakind.org/blog/american-red-cross-and-datakind-team-up-to-prevent-home-fire-deaths-and-injuries
Zielsetzung
• Jedes Jahr werden 25.000 Amerikaner
getötet oder verletzt als Folge von
Hausbränden.
• Das American Red Cross hat im Oktober
2014 die "Home Fire Campaign" ins Leben
gerufen, um solche Verletzungen und
Todesfälle in den USA innerhalb von 5
Jahren um 25% zu reduzieren.
Vorgehen
• Mit Open Data aus dem American
Community Survey und dem American
Housing Survey, sowie Daten aus dem
National Fire Incident Reporting System und
dem Red Cross Home Fire Response, wurde
ein Tool entwickelt, das risikoreiche Bereiche
in Städten in den USA identifiziert.
Ergebnis
• Empfehlungen auf regionaler Ebene, wo das
amerikanische Rote Kreuz seine
Feuermelder-Installationskampagnen
ausrichten sollte.
• Über 400.000 Alarmsysteme in über 175.000
Haushalten installiert, mit Sicherstellung .
dass der Rest der 2.5M Rauchmelder in den
Gemeinden installiert werden, wo sie am
meisten benötigt werden.
http://home-fire-risk.github.io/smoke_alarm_map/
Smart Data Workshop by td Berlin @ labtogether 2016
Predictive Modeling: Das Vorhersagen von Menschenrechts-
verletzungen zur Priorisierung von Ressourcen
1) http://www.datakind.org/projects/predicting-and-preventing-human-rights-abuses
2) https://www.washingtonpost.com/business/on-it/amnesty-international-considers-using-big-data-to-predict-human-rights-
violations/2013/11/22/3f4f1a1e-5388-11e3-a7f0-b790929232e1_story.html
Zielsetzung
• Amnesty International bekämpft
Menschenrechtsverletzungen.
• Die begrenzten Ressourcen müssen
jedoch priorisiert werden, um eine große
Anzahl von Fällen bearbeiten zu können.
Vorgehen
• In Hilfsanfragen, die über das Urgent
Action Network eingingen, konnten Data
Scientists Muster identifizieren.
• Diese Muster deuteten darauf hin, welche
Fälle in der Vergangenheit zu Krisen
eskaliert sind.
Ergebnis
• Anhand der Muster für neu eingehende
Fälle kann nun eine Dringlichkeitsstufe
geschätzt, vorhergesagt und somit
bestimmte Fälle priorisiert werden.
• Das gewonnene Modell kann auch darüber
informieren, welche Gegebenheiten am
stärksten zu einer großen Wirkung
beisteuern.
Smart Data Workshop by td Berlin @ labtogether 2016
Viele der in unserem Workshop vorgestellten Case Studies beziehen sich
auf Projekte von DataKind. DataKind ist ein weltweites Netzwerk, welches Non Profit
Organisationen unentgeltlich bei der Analyse ihrer Daten unterstützt. DataKind‘s Claim:
„Harnessing the power of data science in the service of humanity“
Auch in Deutschland gibt es ähnliche Organisationen und Netzwerke, die pro bono ihre
Datenexpertise anbieten:
Gern stehen auch wir für Projektanfragen zur Verfügung
http://dssg-berlin.org/ http://correlaid.org/ https://datenschule.de/
http://www.datakind.org/
An wen wenden? Für Inspiration und Bearbeitung eigener
Fragestellungen einfach Kontakt aufnehmen
(Kontakte nächste Seite)
Brain, heart & guts.
michael.proksch@td-berlin.com
Joscha Hofferbert
Birte Schaper
birte.schaper@td-berlin.com
Birtes Schwerpunkte sind Customer Insights und Data
Analytics. Sie konzeptioniert Datenstrategien, digitale
Lernkonzepte und Datenvisualisierungen.
Dr. Michael Proksch
Michael ist Senior Data Scientist. Sein Team
betreut Projekte im Bereich Advanced Data
Science für Marketing & Business Analytics.
Team
Kristina Bongardt
kristina.bongardt@td-berlin.com
Kristina betreut Research Projekte mit den
Schwerpunkten Consumer Insights, Trend und
Innovation.
Nadja Büttner
nadja.buettner@td-berlin.com
joscha.hofferbert@td-berlin.com
Gufeng Zhou
gufeng.zhou@td-berlin.com
Nadja erarbeitet Consumer Insights,
Innovations- und digitale Strategien auf Basis von
Datenanalysen und Design Thinking.
Neben seiner Zuständigkeit für R&D-Prozesse
kümmert sich Gufeng um die Themen Web
Analytics, Text Mining und Social Media Analytics.
Joscha’s Schwerpunkt liegt neben Consumer
Relations Management auf Web-Analytics und
datengestützte Consumer Insight Analysen.

Weitere ähnliche Inhalte

Ähnlich wie Smart Data Workshop

Zum Social Media Erfolg mit AMPEL
Zum Social Media Erfolg mit AMPELZum Social Media Erfolg mit AMPEL
Zum Social Media Erfolg mit AMPELStefan Evertz
 
Data Storytelling und Data-driven Content
Data Storytelling und Data-driven ContentData Storytelling und Data-driven Content
Data Storytelling und Data-driven ContentJörg Hoewner
 
Social Media Monitoring & Analyse (Präsentation Infopaq beim 5. Twittwoch Rhe...
Social Media Monitoring & Analyse (Präsentation Infopaq beim 5. Twittwoch Rhe...Social Media Monitoring & Analyse (Präsentation Infopaq beim 5. Twittwoch Rhe...
Social Media Monitoring & Analyse (Präsentation Infopaq beim 5. Twittwoch Rhe...Infopaq Deutschland
 
Wegweiser durch den Social Media Monitoring-Dschungel
Wegweiser durch den Social Media Monitoring-DschungelWegweiser durch den Social Media Monitoring-Dschungel
Wegweiser durch den Social Media Monitoring-DschungelForschungsWeb GmbH
 
Daten-getriebene Kommunikaton, daten-getriebener Content
Daten-getriebene Kommunikaton, daten-getriebener ContentDaten-getriebene Kommunikaton, daten-getriebener Content
Daten-getriebene Kommunikaton, daten-getriebener ContentJörg Hoewner
 
Internet-Suchmaschinen: Aktueller Stand und Entwicklungsperspektiven
Internet-Suchmaschinen: Aktueller Stand und EntwicklungsperspektivenInternet-Suchmaschinen: Aktueller Stand und Entwicklungsperspektiven
Internet-Suchmaschinen: Aktueller Stand und EntwicklungsperspektivenDirk Lewandowski
 
Neue Öffentlichkeiten auf Social-Media-Plattformen: Zur Nutzung von ‚Big Data...
Neue Öffentlichkeiten auf Social-Media-Plattformen: Zur Nutzung von ‚Big Data...Neue Öffentlichkeiten auf Social-Media-Plattformen: Zur Nutzung von ‚Big Data...
Neue Öffentlichkeiten auf Social-Media-Plattformen: Zur Nutzung von ‚Big Data...Axel Bruns
 
Linkbuilding durch skalierbare Strategien und Prozesse
Linkbuilding durch skalierbare Strategien und ProzesseLinkbuilding durch skalierbare Strategien und Prozesse
Linkbuilding durch skalierbare Strategien und ProzesseDominique Seppelt
 
PS Politische Kommunikation und Social Media SS 2012
PS Politische Kommunikation und Social Media SS 2012PS Politische Kommunikation und Social Media SS 2012
PS Politische Kommunikation und Social Media SS 2012davidroethler
 
ISARCAMP: Krusche & Company / Michael Krusche: death of email
ISARCAMP: Krusche & Company / Michael Krusche: death of emailISARCAMP: Krusche & Company / Michael Krusche: death of email
ISARCAMP: Krusche & Company / Michael Krusche: death of emailISARNETZ
 
Web-Monitoring Smarte - Tools zur kostenfreien Web-Analyse
Web-Monitoring Smarte - Tools zur kostenfreien Web-Analyse Web-Monitoring Smarte - Tools zur kostenfreien Web-Analyse
Web-Monitoring Smarte - Tools zur kostenfreien Web-Analyse Sandra Schön (aka Schoen)
 
Google Analytics gezielt zur Optimierung einsetzen / Bessere Daten in Analyti...
Google Analytics gezielt zur Optimierung einsetzen / Bessere Daten in Analyti...Google Analytics gezielt zur Optimierung einsetzen / Bessere Daten in Analyti...
Google Analytics gezielt zur Optimierung einsetzen / Bessere Daten in Analyti...📊 Markus Baersch
 
Big Data - Eine Tour d'Horizon
Big Data - Eine Tour d'HorizonBig Data - Eine Tour d'Horizon
Big Data - Eine Tour d'HorizonBenedikt Köhler
 
Amt 2.0 - Social Media in Behörden - Personal, Prozesse, Redaktionsalltag
Amt 2.0 - Social Media in Behörden - Personal, Prozesse, RedaktionsalltagAmt 2.0 - Social Media in Behörden - Personal, Prozesse, Redaktionsalltag
Amt 2.0 - Social Media in Behörden - Personal, Prozesse, RedaktionsalltagChristiane Germann
 
Web monitoring anbietervergleich 2010
Web monitoring anbietervergleich 2010Web monitoring anbietervergleich 2010
Web monitoring anbietervergleich 2010ulrikehartmann71
 
Social Media Monitoring für Verlage
Social Media Monitoring für Verlage Social Media Monitoring für Verlage
Social Media Monitoring für Verlage Wibke Ladwig
 
Barberini Analytics: Optimierung der Kommunikations- und Marketingstrategie a...
Barberini Analytics: Optimierung der Kommunikations- und Marketingstrategie a...Barberini Analytics: Optimierung der Kommunikations- und Marketingstrategie a...
Barberini Analytics: Optimierung der Kommunikations- und Marketingstrategie a...Christoph Thiede
 
Bitkom Akademie: Prof. Bruysten über Social Media KPI
Bitkom Akademie: Prof. Bruysten über Social Media KPIBitkom Akademie: Prof. Bruysten über Social Media KPI
Bitkom Akademie: Prof. Bruysten über Social Media KPITim Bruysten
 
Cyberforum RoundTable "Social Media Strategie & Planung"
Cyberforum RoundTable "Social Media Strategie & Planung"Cyberforum RoundTable "Social Media Strategie & Planung"
Cyberforum RoundTable "Social Media Strategie & Planung"Rebecca Rutschmann
 

Ähnlich wie Smart Data Workshop (20)

Zum Social Media Erfolg mit AMPEL
Zum Social Media Erfolg mit AMPELZum Social Media Erfolg mit AMPEL
Zum Social Media Erfolg mit AMPEL
 
Data Storytelling und Data-driven Content
Data Storytelling und Data-driven ContentData Storytelling und Data-driven Content
Data Storytelling und Data-driven Content
 
Social Media Monitoring & Analyse (Präsentation Infopaq beim 5. Twittwoch Rhe...
Social Media Monitoring & Analyse (Präsentation Infopaq beim 5. Twittwoch Rhe...Social Media Monitoring & Analyse (Präsentation Infopaq beim 5. Twittwoch Rhe...
Social Media Monitoring & Analyse (Präsentation Infopaq beim 5. Twittwoch Rhe...
 
Netstudien infobroker
Netstudien infobrokerNetstudien infobroker
Netstudien infobroker
 
Wegweiser durch den Social Media Monitoring-Dschungel
Wegweiser durch den Social Media Monitoring-DschungelWegweiser durch den Social Media Monitoring-Dschungel
Wegweiser durch den Social Media Monitoring-Dschungel
 
Daten-getriebene Kommunikaton, daten-getriebener Content
Daten-getriebene Kommunikaton, daten-getriebener ContentDaten-getriebene Kommunikaton, daten-getriebener Content
Daten-getriebene Kommunikaton, daten-getriebener Content
 
Internet-Suchmaschinen: Aktueller Stand und Entwicklungsperspektiven
Internet-Suchmaschinen: Aktueller Stand und EntwicklungsperspektivenInternet-Suchmaschinen: Aktueller Stand und Entwicklungsperspektiven
Internet-Suchmaschinen: Aktueller Stand und Entwicklungsperspektiven
 
Neue Öffentlichkeiten auf Social-Media-Plattformen: Zur Nutzung von ‚Big Data...
Neue Öffentlichkeiten auf Social-Media-Plattformen: Zur Nutzung von ‚Big Data...Neue Öffentlichkeiten auf Social-Media-Plattformen: Zur Nutzung von ‚Big Data...
Neue Öffentlichkeiten auf Social-Media-Plattformen: Zur Nutzung von ‚Big Data...
 
Linkbuilding durch skalierbare Strategien und Prozesse
Linkbuilding durch skalierbare Strategien und ProzesseLinkbuilding durch skalierbare Strategien und Prozesse
Linkbuilding durch skalierbare Strategien und Prozesse
 
PS Politische Kommunikation und Social Media SS 2012
PS Politische Kommunikation und Social Media SS 2012PS Politische Kommunikation und Social Media SS 2012
PS Politische Kommunikation und Social Media SS 2012
 
ISARCAMP: Krusche & Company / Michael Krusche: death of email
ISARCAMP: Krusche & Company / Michael Krusche: death of emailISARCAMP: Krusche & Company / Michael Krusche: death of email
ISARCAMP: Krusche & Company / Michael Krusche: death of email
 
Web-Monitoring Smarte - Tools zur kostenfreien Web-Analyse
Web-Monitoring Smarte - Tools zur kostenfreien Web-Analyse Web-Monitoring Smarte - Tools zur kostenfreien Web-Analyse
Web-Monitoring Smarte - Tools zur kostenfreien Web-Analyse
 
Google Analytics gezielt zur Optimierung einsetzen / Bessere Daten in Analyti...
Google Analytics gezielt zur Optimierung einsetzen / Bessere Daten in Analyti...Google Analytics gezielt zur Optimierung einsetzen / Bessere Daten in Analyti...
Google Analytics gezielt zur Optimierung einsetzen / Bessere Daten in Analyti...
 
Big Data - Eine Tour d'Horizon
Big Data - Eine Tour d'HorizonBig Data - Eine Tour d'Horizon
Big Data - Eine Tour d'Horizon
 
Amt 2.0 - Social Media in Behörden - Personal, Prozesse, Redaktionsalltag
Amt 2.0 - Social Media in Behörden - Personal, Prozesse, RedaktionsalltagAmt 2.0 - Social Media in Behörden - Personal, Prozesse, Redaktionsalltag
Amt 2.0 - Social Media in Behörden - Personal, Prozesse, Redaktionsalltag
 
Web monitoring anbietervergleich 2010
Web monitoring anbietervergleich 2010Web monitoring anbietervergleich 2010
Web monitoring anbietervergleich 2010
 
Social Media Monitoring für Verlage
Social Media Monitoring für Verlage Social Media Monitoring für Verlage
Social Media Monitoring für Verlage
 
Barberini Analytics: Optimierung der Kommunikations- und Marketingstrategie a...
Barberini Analytics: Optimierung der Kommunikations- und Marketingstrategie a...Barberini Analytics: Optimierung der Kommunikations- und Marketingstrategie a...
Barberini Analytics: Optimierung der Kommunikations- und Marketingstrategie a...
 
Bitkom Akademie: Prof. Bruysten über Social Media KPI
Bitkom Akademie: Prof. Bruysten über Social Media KPIBitkom Akademie: Prof. Bruysten über Social Media KPI
Bitkom Akademie: Prof. Bruysten über Social Media KPI
 
Cyberforum RoundTable "Social Media Strategie & Planung"
Cyberforum RoundTable "Social Media Strategie & Planung"Cyberforum RoundTable "Social Media Strategie & Planung"
Cyberforum RoundTable "Social Media Strategie & Planung"
 

Smart Data Workshop

  • 1. www.td-berlin.com SMART DATA WORKSHOP Neue Datenquellen für die Wirkungsmessung sozialer Projekte? 17. November 2016 Gufeng Zhou, Birte Schaper, Nadja Büttner, Kristina Bongardt
  • 2. Smart Data Workshop by td Berlin @ labtogether 2016
  • 3. Agenda Smart Data Quellen Gallery Walk 15min pro Datenquelle/Station + 10min Kaffeepause Input zu Smart Data & Gruppen-Einteilung Offene Diskussion zum Ausblick & Reflektion 14:30 – 14:50 14:50 – 16:30 16:30 – 17:00 Smart Data Workshop by td Berlin @ labtogether 2016
  • 5. Google Search Data: Das Messen von Interesse https://www.google.de/trends/ Regionale Verteilung Verwandte Suchanfragen Zeitverlauf Beispiel: Google Trends Smart Data Workshop by td Berlin @ labtogether 2016
  • 6. Google Search Data: Das Messen von Interesse https://www.google.de/trends/ • Die Analyse von Google Suchdaten gibt Aufschluss über das Interesse der Gesellschaft an konkreten Themen, Personen und Produkten • Mit Hilfe von Google Trends lässt sich die Popularität einzelner Begriffe im Zeitablauf analysieren, was Rückschlüsse auf sich formierende Trends in der Welt, einem Land oder einer Region erlaubt • Dies ermöglicht weitere Analysen wie die Korrelation des Suchvolumens von Themen mit anderen Themen (Google correlate) oder bestimmten Ereignissen • Diese Korrelationen erlauben Aussagen über den Effekt von Ereignissen (z.B. Kampagnen, Veröffentlichungen), sowie die Vorhersage bestimmter Ereignisse (Beispiel Suche nach Grippe und tatsächliche Verbreitung) Smart Data Workshop by td Berlin @ labtogether 2016
  • 7. Google Search Data: Nach Veröffentlichung der Studie zu Kinderarmut der BM Stiftung steigen die Suchen zu dem Begriff https://www.bertelsmann-stiftung.de/de/themen/aktuelle-meldungen/2016/september/kinderarmut-in- deutschland-waechst-weiter-mit-folgen-fuers-ganze-leben/ 12.09.2016, Studie der Bertelsmann Stiftung: „Kinderarmut in Deutschland wächst weiter – mit Folgen fürs ganze Leben“ Smart Data Workshop by td Berlin @ labtogether 2016
  • 8. 0 20 40 60 80 100 Nov. 11 Mai. 12 Nov. 12 Mai. 13 Nov. 13 Mai. 14 Nov. 14 Mai. 15 Nov. 15 Mai. 16 HeForShe Gender Equality Google Search Data: Emma Watsons „HeForShe“ Kampagne führt zu einer Steigerung der Suchen nach Gender Equality https://www.google.de/trends/ September 2014 Emma Watson HeForShe Speech at UN March 2015 Emma Watson Live Chat on Facebook March 2016 HeForShe Art Week Launch Smart Data Workshop by td Berlin @ labtogether 2016
  • 9. Google Search Data: Electionland, ein Projekt von ProPublica und Google zur Messung von Unregelmäßigkeiten am Wahltag https://projects.propublica.org/electionland/Smart Data Workshop by td Berlin @ labtogether 2016
  • 10. Online Text Data: Das Messen von Meinungen https://trend-sonar.com/ Quellen Art Zeitverlauf & Prognose Alle Artikel zum Thema Subthemen Beispiel: Sonar Smart Data Workshop by td Berlin @ labtogether 2016
  • 11. Online Text Data: Das Messen von Meinungen • Die Analyse von Online-Gesprächen wie Nachrichten, Blogs, Foren und Posts in Social Media Kanälen wie Facebook, Twitter oder YouTube ermöglicht Einblicke in und Perspektiven von Bedürfnisse und Meinungen von Personen • Mit Hilfe von Buzz Listening Tools lässt sich quantifizieren, wie intensiv (Buzz Volumen) auf welchen Kanälen über bestimmte Themen und Aspekte im Zeitverlauf gesprochen wird • Text AnalyticsTools erlauben zudem die automatisierte qualitative Analyse von Dokumenten, also beispielsweise wie positiv oder negativ (Sentiment) und worüber (z.B. als Textcloud) gesprochen wird. • So lassen sich beispielsweise Aussagen darüber treffen, wie erfolgreich eine Kampagne war, worüber die Gesellschaft vermehrt diskutiert oder was sie an bestimmten Themen oder Produkten stört Smart Data Workshop by td Berlin @ labtogether 2016 Tools Tool- Einblicke Beispielhafte Datenquellen
  • 12. news 50% facebook 19% forum 14% twitter 10% blog 4% Others 3% …Känale Online Text Data: Diskussion über und Probleme mit Blutspenden analysieren und verstehen 0 500 1000 1500 2000 2500 Buzzvolume Blutspende in Deutschland April 2015 News: Homosexuelle und Blutspende Juni 2015 Weltblutspendetag Juni 2016 Weltblutspendetag Feb 2016 Zugunglück in Bayern: Aufruf zur Blutspende Diskussionen nach …Bundeslandändern DRK 86% BRK 10% Haema 4% …Organisationen Stammzell 40% Blutplasma 33% Vollblut 17% Thrombozyten 10% …Spendenarten 187 314 443 Wo kann man spenden? Wie oft kann man spenden? Wer darf spenden? Top 3 Fragen https://brandwatch.com/Smart Data Workshop by td Berlin @ labtogether 2016
  • 13. Online Text Data: Textdaten-Analyse zur Optimierung von Fundraising http://www.datakind.org/projects/helping-great-causes-get-funded/ Ausgangslage • GlobalGiving ist viel mehr als nur eine Fundraising-Website. Neben der Verwaltung von Spendengeldern hilft GlobalGiving Organisationen, die Effizienz ihrer Fundraising Aktivitäten zu verbessern und ihre Wirkung zu erhöhen. Vorgehen • GlobalGiving untersuchte bisherige Fundraising-Kampagnen oder Projekte, um zu ermitteln, welche Faktoren dazu führen, dass Projekte erfolgreich finanziert werden. • Sie wollten wissen: Gab es eine Formel für den Projekterfolg? Ergebnis • Durch die Textanalyse der Wörter auf jeder Projektseite fanden sie Korrelationen zwischen der Spezifität der Sprache und dem Projekterfolg. • Organisationen waren z.B. weniger erfolgreich, wenn sie generische Worte wie "Kunst" versus ein konkretes Projekt wie "eine Fotografie-Ausstellung“ verwendeten. • Erfolgreiche Projekte erreichten in der Regel ihre Finanzierungsziele innerhalb der ersten zwei Monate nach der Entsendung des Projekts. Smart Data Workshop by td Berlin @ labtogether 2016
  • 14. Web Analytics Data: Das Messen von Online Verhalten Visits über die Zeit Total Visits Traffic Sources Verwandte Visits Beispiel: Similar Web Smart Data Workshop by td Berlin @ labtogether 2016
  • 15. Web Analytics Data Das Messen von Nutzungsverhalten • Die Analyse von Webseiten- & App-Daten liefert quantifizierbare Erkenntnisse über die Nutzung von einer Seite oder App • Mithilfe von Web Analytics Tools kann die Performance von verschiedenen KPIs (Key Performance Indicators) gemessen werden (Besuche, Absprungrate, Verweildauer, Registrierungen etc.) • Typische Fragestellungen sind z.B.: Wie viele Besucher gab es? Wie lange waren sie auf der Seite? Was haben sie sich angeschaut? Haben sie sich registriert/ gespendet/ teilgenommen? Wie sind sie auf meine Seite gekommen (z.B. Newsletter, Search, Ads)? • So können Webseiten und Apps hinsichtlich Nutzerfreundlichkeit und Erfolgsfaktoren (z.B. Registrierungen) optimiert werden Smart Data Workshop by td Berlin @ labtogether 2016 Tools Tool-Einblicke
  • 16. Web Analytics Data: Verbesserung des Online Mentorship Programms von iCouldBe durch die Analyse von Webdaten http://www.datakind.org/projects/uncovering-the-abcs-of-successful-online-mentoring/ Ausgangslage • iCouldBe‘s Ziel ist es gefährdete Jugendliche durch ein Online Mentorship Programm zu ermutigen, die Schule zu beenden und Zukunftspläne zu schmieden. • Seit 15 Jahren misst iCouldBe die Interaktionsdaten zwischen Mentor und Mentee auf ihrer Website. • Frage: Welche Faktoren führen dazu, dass die Jugendlichen das Mentorship Programm abschließen und nicht vorzeitig abbrechen? Vorgehen • Erarbeitung einer Definition von Erfolg des Mentorship Programms (3 bearbeite Lernmodule in 3 Monaten) • Text-Daten basiertes Vorhersagemodell zur Identifikation von Erfolgsfaktoren Ergebnis • Schnelle und positive Rückmeldung von Mentoren sowie Sätze wie "I'm here for you“ steigern die Motivation. • Ein zu langer Text führt zu einer höheren Abbruchwahrscheinlichkeit. • Kate Schrauth (Director): “Now we can start really training mentors on how to be successful based on more than just anecdotes.” Smart Data Workshop by td Berlin @ labtogether 2016
  • 17. CRM Data: Das Messen von Engagement relevanter Stakeholder INTERAKTION CRM Database KOOPERATION Smart Data Workshop by td Berlin @ labtogether 2016
  • 18. CRM Data: Das Messen von Engagement relevanter Stakeholder • CRM-Datenbanken bieten ein umfassendes Spektrum von Einblicken zu Nutzer- und Zielgruppen, deren Verhalten und Interessen z.B. ihre Geschichte, Ziele, Präferenzen, Probleme, ihre Zufriedenheit, Kooperationen • Die Analyse von Daten wie z.B. Newsletter Performance, Registrierungen, Interaktionen, Nutzungsprofile geben Rückschlüsse auf den erfolgreichen Umgang mit Stakeholdern • So kann individualisiert auf die Bedürfnisse der einzelnen Stakeholder eingegangen und eine zielgruppengerechte Ansprache aller Stakeholder (z.B. Spender, Teilnehmer/ Nutzer, Betroffene, Kunden, Kooperationspartner, Freiwillige) ermöglicht werden (RE) AKTIVIERUNG ANSPRACHE PERSONALISIERUNG INTERAKTION CRM Database KOOPERATION Smart Data Workshop by td Berlin @ labtogether 2016
  • 19. CRM Data: Den Erfolg von Programmen messbar machen und optimieren https://blog.dssg-berlin.org/datenanalyse-f%C3%BCr-das-gemeinwohl-e964566cdd99#.m2r4zd4n7 https://www.uschamberfoundation.org/food-data-great-opportunities Ausgangslage • DC Central Kitchen bieten neben dem Kerngeschäft u.a. auch Fortbildungen für sozial unterpriviligierte Bürger an. • Das Ziel des DC Central Kitchens „Culinary Job Training-Programms ist es, Erwachsene auf die Anforderungen im Berufsalltag der Lebensmittel-Service- Industrie vorzubereiten. Ergebnis • Durch die Analyse der vorhandenen Daten über ihre Teilnehmer und deren Historie konnte aufgedeckt werden, dass Teilnehmer oft kurz vor Ende des Trainings aus dem Programm ausscheiden. • Daraufhin hat DC Central ein Praktikums- Programm lanciert, um den Übergang von der Ausbildung in den Joballtag zu erleichtern. • Weitere Analysen zeigten, dass Teilnehmer mit bestimmten Eigenschaften mit höherer Wahrscheinlichkeit aufgeben. • Mit diesem Wissen konnten DC Central Kitchen proaktiv auf spezielle Teilnehmer zugehen und sie im Programm halten. Smart Data Workshop by td Berlin @ labtogether 2016
  • 20. CRM Data: Risikofaktoren für Obdachlosigkeit erkennen mit verknüpften CRM Daten http://www.datakind.org/projects/sharing-data-to-learn-about-homelessness/ Ausgangslage • St Mungos Broadway, eine Organisation für Obdachlose, hat eine große Menge an Daten über ihre Klienten, jedoch wenig Informationen über diese Personen, bevor sie obdachlos wurden. • Daher wollten sie herausfinden mit welcher Art von Fragen, die Menschen zu Citizens Advice, einer freie Beratung in allen Zivilthemen, gehen bevor sie als Obdachlose in ihrem System landen. Vorgehen • Das Verknüpfen beider Datensets zeigte, dass 1500 gemeinsame Klienten bestehen, deren Daten mithilfe verschiedener Modelle analysiert werden konnten. • Mit Gephi wurden bspw. gemeinsame Wege und das gemeinsame Auftreten von Problemen analysiert und visualisiert. Ergebnis • Data Scientist fanden verschiedene spannende Erkenntnisse z.B. sind Probleme mit Arbeitsunfähigkeit 10% häufiger bei späteren Obdachlosen gefunden worden. • Zum anderen wurden Modelle erarbeitet, die den Erfolg von Obdachlosen-Programmen bei Personen mit bestimmten Merkmalen hervorsagen sollten. Smart Data Workshop by td Berlin @ labtogether 2016
  • 21. Open Data: Das Analysieren von öffentlichen Daten Smart Data Workshop by td Berlin @ labtogether 2016
  • 22. Open Data: Das Analysieren von öffentlichen Daten • Open Data bezeichnet die freie Verfügbar- und Nutzbarkeit von meist öffentlichen Daten • Auf Regierungsseiten findet man mittlerweile eine breite Palette von Bevölkerungs-, Wirtschafts- und Geodaten, die von weltweiten Klimaentwicklungen über regionale Kriminalitäts- statistiken bis hin zu Obdachlosenzahlen in einzelnen Stadtteilen reichen • Auch wissenschaftliche Datenbanken machen zunehmend akademische Abhandlungen, empirische Studien und Patentdatenbanken frei verfügbar, die mitunter Aufschluss über technologische Entwicklungen geben können • Mit Datenanalyse und Algorithmen lassen sich diese Daten in Zusammenhang bringen und können so eine wichtige Erkenntnisquelle für unterschiedlichste Forschungsfragen sein Smart Data Workshop by td Berlin @ labtogether 2016
  • 23. Open Data: Effektive, regionale Budget Allokation im Kampf gegen Kinderarmut auf Basis von offenen Regierungsdaten http://www.datakind.org/blog/dc-action-for-children-long-term-collaboration-for-long-term-impact/ Ausgangslage • Kinderarmut ist ein wichtiges Thema. Um es zu lokalisieren und Ressourcen richtig zu verteilen, muss man es messen. Allerdings gibt es hierzu viele verschiedene öffentliche Datenquellen und Metriken • Das Ziel des DC KIDS COUNT Data Tools 2.0 ist es eine detaillierte geographische Übersicht all dieser Variablen zu erhalten, um eine informierte Entscheidung zu treffen Ergebnis • Visualisierung verschiedener Armuts- Metriken in einer Kartendarstellung • “What the neighborhood maps showed us was that the success of far too many DC children is predetermined by their ZIP Code – and too many children lack access to resources needed to thrive.” (HyeSook Chung, Executive Director of DC Action for Children) • “We hope the DC KIDS COUNT Data Tool 2.0 ignites thoughtful conversations during this budget season to ensure that resources are both sufficiently, and effectively, allocated to address the needs of children.” (HyeSook Chung, Executive Director of DC Action for Children) Smart Data Workshop by td Berlin @ labtogether 2016
  • 24. Open Data: Und wenn es keine verfügbaren Regierungsdaten gibt? Satellitenbilder zur Identifizierung von Bedürftigen http://www.datakind.org/blog/using-satellite-images-to-understand-poverty/ http://www.datakind.org/projects/using-the-simple-to-be-radical/ Zielsetzung • GiveDirectly benötigte Informationen über Armutsverhältnisse in Kenia, um Bedürftige besser identifizieren zu können. • Es gab jedoch keine amtlichen Statistiken. Vorgehen • Data Scientists erstellten ein System, das automatisch den Hausdachtyp (Metall- oder Strohdach) auf Satellitenbildern erkennt. • Mithilfe von Machine Learning konnten die Armutsverhältnisse automatisch geschätzt werden (Verhältnis Metall- zu Strohdächer). Ergebnis • Ansatz für das Automatisieren eines datengesteuerten Prozesses für die Ausrichtung von Bargeldtransfers • Während der Algorithmus für GiveDirectly nicht genau genug war, zeigt er dennoch das Potenzial der Verwendung von Satellitenbildern und Machine Learning, welches in Entwicklungs- oder humanitärer Arbeit eingesetzt werden kann. Smart Data Workshop by td Berlin @ labtogether 2016
  • 25. Sensor-based Data: Das Messen von Offline Verhalten Smart Data Workshop by td Berlin @ labtogether 2016
  • 26. Sensor-based Data: Das Messen von Offline Verhalten • Smartphones, Wearables, Sensoren und immer mehr andere vernetzte Produkte ermöglichen es heute, Aspekte des offline Verhaltens digital messbar zu machen • Technologische Innovationen im Bereich Internet of Things und Quantified Self (Vermessung des Selbst) zeigen schon heute, was in Zukunft vernetzt und messbar sein kann • Das Aufzeichnen und Analysieren von solchen (Verhalten-)Daten kann auf individueller Ebene Einblicke in Verhaltensmuster hinsichtlich Bewegung, Nutzung und Interesse geben • Zwar können solche Daten einerseits dazu dienen, Aspekte des menschlichen Lebens zu optimieren (z.B. Health Apps), ebenso wächst jedoch die Skepsis hinsichtlich ethischer Aspekte in einer total vernetzten Gesellschaft Smart Data Workshop by td Berlin @ labtogether 2016
  • 27. Sensor-based Data: Ambient Assisted Living – Sensoren statt Pflegeheime http://www.zeit.de/2013/02/Pflege-Technologie-Ambient-Assisted-Living/seite-3/ Ausgangslage • Nicht nur in Deutschland fürchtet man sich vor den Folgen der demografischen Bombe. Seit vier Jahren fördert die Europäische Union in 23 Ländern die Arbeit von Ingenieuren und Informatikern, die sie entschärfen wollen. Vorgehen • Im schottischen Bezirk West Lothian ließ die Bezirksverwaltung zwischen 2002 und 2006 über 2.000 Wohnungen mit Sensoren versehen – für gerade einmal 2,1 Millionen Pfund. • Installiert wurde ein einfaches Hausnotrufsystem, das die Daten von tragbaren Sturzsensoren, Bewegungs-, Rauch- und Gasmeldern im Notfall an ein Callcenter funkt. Dort beantwortet geschultes Personal Fragen und kontaktiert bei Bedarf Pfleger, Ärzte oder Angehörige. Ergebnis • Die durchschnittliche Aufenthaltsdauer in Pflegeheimen des Bezirks wurde von 38 auf unter 10 Monate gesenkt und den Menschen so mehr Zeit im gewohnten Umfeld ermöglicht. • Mittlerweile haben über 30.000 Schotten Zugriff auf telemedizinische Dienstleistungen. Laut einer Studie des New Haven Research Center ließen sich in den letzten fünf Jahren eine halbe Million Krankenhaustage einsparen. Smart Data Workshop by td Berlin @ labtogether 2016
  • 28. Sensor-based Data: Impf-Tracking zur Optimierung der Polio- Bekämpfung in Nigeria http://www.ehealthafrica.org/polio-program// Ausgangslage • Die Projekte von eHealthAfrice (eHA) optimieren die lokalen, sowie nationalen Polio- Impfkampagnen in Nigeria durch die Bereitstellung von Smart Data und Geoinformationen. Vorgehen • Über 12.000 Impfteams wurden mit GPS- fähigen Android Smartphones ausgestattet, wodurch mithilfe einer speziellen Tracking-App die Bewegung der Teams verfolgt werden konnten. • eHA entwickelt ein Vaccinator-Tracking-System (VTS) Dashboard, das die Bewegung der Impfteams abbildet, Anteile abgedeckter Siedlungen, sowie verpasste Siedlungen überwacht. • Zudem wurden die Daten von schwer zu erreichenden Siedlungen an WHO und UNICEF weitergegeben, deren mobile Teams abgelegene Gemeinden versorgen. Ergebnis • Durch die Arbeit von eHA wurden 782 zuvor undokumentierte Siedlungen identifiziert. • In Zukunft kann so sichergestellt werden, dass bei künftigen Impfkampagnen mehr Siedlungen besucht und behandelt werden . Smart Data Workshop by td Berlin @ labtogether 2016
  • 29. Sensor-based Data: Digitale Autobahn – Sensoren messen Bewegungsdaten https://www.welt.de/regionales/bayern/article156192950/Digitale-Autobahn-Sensoren-messen- Bewegungsdaten.html/ Ausgangslage • Die Teststrecke für selbstfahrende Autos wird aufgerüstet: An der A9 speichern Radarsensoren die Bewegungsdaten von Fahrzeugen. Vorgehen • Für die Erprobungsphase liefert Infineon die Sensor-Chips, die Siemens dann in Messgeräte einbaut und entlang der Autobahn installiert. • Verkehrsdichte, Tempo, Abstand und andere Bewegungsdaten der Fahrzeuge werden anonym gemessen • Alle gesammelten Bewegungsdaten werden im Internet jedermann offen zur Verfügung gestellt. Ergebnis • App-Entwickler können damit digitale Anwendungen für das vernetzte oder autonome Fahren entwickeln um künftig Unfälle und Staus zu vermeiden. Smart Data Workshop by td Berlin @ labtogether 2016
  • 30. Predictive Modeling: Wirkung messbar machen Smart Data Workshop by td Berlin @ labtogether 2016
  • 31. Predictive Modeling: Wirkung messbar machen Auf Basis von mathematischen Algorithmen und modelbasierten Datenanalysieren kann • die Wirkung von bestimmten Aktivitäten (Kampagne / Programm) gemessen werden (häufig auf Basis von Zeitreihendaten und Grundlage für eine Effektivitätsbetrachtung) • eine Vorhersage oder Klassifizierung erstellt werden (welche wiederum als Frühwarnsystem oder zur besseren Allokation von Ressourcen genutzt werden kann) Die Auswahl der geeigneten Modelle hängt von der gewählten Fragestellung ab. Beispielhafte Modellierungsmethoden sind logistische Regression, neuronale Netze, Random Forest, Classification und Regression Tree (CART) Smart Data Workshop by td Berlin @ labtogether 2016
  • 32. Predictive Modeling: Das Vorhersagen von Hausbränden zur gezielten Installation von Rauchmeldern http://www.datakind.org/blog/american-red-cross-and-datakind-team-up-to-prevent-home-fire-deaths-and-injuries Zielsetzung • Jedes Jahr werden 25.000 Amerikaner getötet oder verletzt als Folge von Hausbränden. • Das American Red Cross hat im Oktober 2014 die "Home Fire Campaign" ins Leben gerufen, um solche Verletzungen und Todesfälle in den USA innerhalb von 5 Jahren um 25% zu reduzieren. Vorgehen • Mit Open Data aus dem American Community Survey und dem American Housing Survey, sowie Daten aus dem National Fire Incident Reporting System und dem Red Cross Home Fire Response, wurde ein Tool entwickelt, das risikoreiche Bereiche in Städten in den USA identifiziert. Ergebnis • Empfehlungen auf regionaler Ebene, wo das amerikanische Rote Kreuz seine Feuermelder-Installationskampagnen ausrichten sollte. • Über 400.000 Alarmsysteme in über 175.000 Haushalten installiert, mit Sicherstellung . dass der Rest der 2.5M Rauchmelder in den Gemeinden installiert werden, wo sie am meisten benötigt werden. http://home-fire-risk.github.io/smoke_alarm_map/ Smart Data Workshop by td Berlin @ labtogether 2016
  • 33. Predictive Modeling: Das Vorhersagen von Menschenrechts- verletzungen zur Priorisierung von Ressourcen 1) http://www.datakind.org/projects/predicting-and-preventing-human-rights-abuses 2) https://www.washingtonpost.com/business/on-it/amnesty-international-considers-using-big-data-to-predict-human-rights- violations/2013/11/22/3f4f1a1e-5388-11e3-a7f0-b790929232e1_story.html Zielsetzung • Amnesty International bekämpft Menschenrechtsverletzungen. • Die begrenzten Ressourcen müssen jedoch priorisiert werden, um eine große Anzahl von Fällen bearbeiten zu können. Vorgehen • In Hilfsanfragen, die über das Urgent Action Network eingingen, konnten Data Scientists Muster identifizieren. • Diese Muster deuteten darauf hin, welche Fälle in der Vergangenheit zu Krisen eskaliert sind. Ergebnis • Anhand der Muster für neu eingehende Fälle kann nun eine Dringlichkeitsstufe geschätzt, vorhergesagt und somit bestimmte Fälle priorisiert werden. • Das gewonnene Modell kann auch darüber informieren, welche Gegebenheiten am stärksten zu einer großen Wirkung beisteuern. Smart Data Workshop by td Berlin @ labtogether 2016
  • 34. Viele der in unserem Workshop vorgestellten Case Studies beziehen sich auf Projekte von DataKind. DataKind ist ein weltweites Netzwerk, welches Non Profit Organisationen unentgeltlich bei der Analyse ihrer Daten unterstützt. DataKind‘s Claim: „Harnessing the power of data science in the service of humanity“ Auch in Deutschland gibt es ähnliche Organisationen und Netzwerke, die pro bono ihre Datenexpertise anbieten: Gern stehen auch wir für Projektanfragen zur Verfügung http://dssg-berlin.org/ http://correlaid.org/ https://datenschule.de/ http://www.datakind.org/ An wen wenden? Für Inspiration und Bearbeitung eigener Fragestellungen einfach Kontakt aufnehmen (Kontakte nächste Seite)
  • 35. Brain, heart & guts. michael.proksch@td-berlin.com Joscha Hofferbert Birte Schaper birte.schaper@td-berlin.com Birtes Schwerpunkte sind Customer Insights und Data Analytics. Sie konzeptioniert Datenstrategien, digitale Lernkonzepte und Datenvisualisierungen. Dr. Michael Proksch Michael ist Senior Data Scientist. Sein Team betreut Projekte im Bereich Advanced Data Science für Marketing & Business Analytics. Team Kristina Bongardt kristina.bongardt@td-berlin.com Kristina betreut Research Projekte mit den Schwerpunkten Consumer Insights, Trend und Innovation. Nadja Büttner nadja.buettner@td-berlin.com joscha.hofferbert@td-berlin.com Gufeng Zhou gufeng.zhou@td-berlin.com Nadja erarbeitet Consumer Insights, Innovations- und digitale Strategien auf Basis von Datenanalysen und Design Thinking. Neben seiner Zuständigkeit für R&D-Prozesse kümmert sich Gufeng um die Themen Web Analytics, Text Mining und Social Media Analytics. Joscha’s Schwerpunkt liegt neben Consumer Relations Management auf Web-Analytics und datengestützte Consumer Insight Analysen.