The document discusses using big data and social media to automatically detect news stories. It addresses challenges in obtaining Twitter data through the API, detecting trends in tweets, dealing with related tweets on the same topic expressed in different ways, and visualizing trending topics over time. The goal is to build a system that can forecast news stories for a website. Remaining challenges are discussed, such as handling retweets, integrating reputation scores, and generalizing the approach to other languages and datasets.
The document discusses using big data and social media to automatically detect news stories. It addresses challenges in obtaining Twitter data through the API, detecting trends in tweets, dealing with related tweets on the same topic expressed in different ways, and visualizing trending topics over time. The goal is to build a system that can forecast news stories for a website. Remaining challenges are discussed, such as handling retweets, integrating reputation scores, and generalizing the approach to other languages and datasets.
Jelte de Jongh – Oprichter van LeerUniek
LeerUniek oprichter Jelte de Jongh vertelt hoe hij tijdens zijn studie op MIT (Boston) leerde om het abstracte begrip ‘Big Data’ te vertalen in een heel praktische technologie die basisscholen helpt bij taalontwikkeling van leerlingen. Zijn doel? Gepersonaliseerd leren inzetten om taalachterstanden te helpen voorkomen, waar nog steeds 1 op de 8 Nederlandse 12-jarigen de dupe van is.
Rutger Rienks – Afdelingshoofd Business Intelligence en Kwaliteit bij de Landelijke Politie
Rutger houdt zich bezig met Predictive policing en heeft daar net een boek over geschreven: Predictive Policing – kansen voor een veiligere toekomst. Rutger neemt jullie mee in de mogelijkheden van Predictive Policing en de kansen voor een veiligere toekomst.
Twitter: Sensibiliseren, informeren en activeren in 280 karaktersSofie Verhalle
Presentatie op de Studiedag voor Woordvoerders 2018 in het Vlaams Parlement. Hoe kun je als woordvoerder, als organisatie Twitter optimaal gebruiken? Ik deel drie vuistregels om meer te halen uit het sociaal media netwerk.
Hoever bent u met uw internetstrategie? Steeds meer consumenten oriënteren zich online voor zij naar de winkel gaan. Reviews en ratings zijn online de meest betrouwbare bron voor consumenten. Reviews zorgen ervoor dat u meedoet in online conversaties, waarmee u naamsbekendheid en naamskwaliteit kunt verhogen. Reviews geven u ook de kans interactief met klanten te communiceren op winkelniveau. De presentatie over ‘The word of mouse’ geeft u inzicht in de laatste ontwikkelingen en trends op dit gebied.
Het internet evolueerde de voorbije jaren van eenrichtingsverkeer naar platform waar miljoenen gebruikers hun mening delen en content verspreiden via sociale media.
En laat dat nu net een gegeven zijn waar je als jeugdorganisatie dankbaar gebruik kunt van maken om jouw organisatie of evenement in the picture te plaatsen.
Tijdens deze interactieve lezing maak je kennis met de wondere wereld van online monitoring (wat wordt er over mijn organisatie gezegd?), doelgroepenwerking (hoe stel ik mijn communicatiemix samen in functie van mijn publiek), conversation management (hoe ga ik om met positieve en negatieve feedback). Theorieën worden helder uitgelegd en geïllustreerd met voorbeelden uit de jeugdsector, maar ook uit de bedrijfswereld.
Deze vorming is ideaal voor je vormingsweekend/studiedag (max 3u), maar kan gecombineerd worden met een praktisch luik (+3u). In groepjes werk je zelf een online strategie uit, waarbij je de theorie in de praktijk omzet. Feedback krijg je zowel van de vormingsbegeleider van Mediaraven als van de andere deelnemers.
Inhoud
Hoe werkt digitale communicatie anno 2014?
Hoe krijg je meer fans op Facebook?
Heeft e-mail nog zin?
Moeten we met zijn allen massaal gaan twitteren?
Welke mogelijkheden biedt mobiel internet voor jeugdwerkorganisaties?
Jelte de Jongh – Oprichter van LeerUniek
LeerUniek oprichter Jelte de Jongh vertelt hoe hij tijdens zijn studie op MIT (Boston) leerde om het abstracte begrip ‘Big Data’ te vertalen in een heel praktische technologie die basisscholen helpt bij taalontwikkeling van leerlingen. Zijn doel? Gepersonaliseerd leren inzetten om taalachterstanden te helpen voorkomen, waar nog steeds 1 op de 8 Nederlandse 12-jarigen de dupe van is.
Rutger Rienks – Afdelingshoofd Business Intelligence en Kwaliteit bij de Landelijke Politie
Rutger houdt zich bezig met Predictive policing en heeft daar net een boek over geschreven: Predictive Policing – kansen voor een veiligere toekomst. Rutger neemt jullie mee in de mogelijkheden van Predictive Policing en de kansen voor een veiligere toekomst.
Twitter: Sensibiliseren, informeren en activeren in 280 karaktersSofie Verhalle
Presentatie op de Studiedag voor Woordvoerders 2018 in het Vlaams Parlement. Hoe kun je als woordvoerder, als organisatie Twitter optimaal gebruiken? Ik deel drie vuistregels om meer te halen uit het sociaal media netwerk.
Hoever bent u met uw internetstrategie? Steeds meer consumenten oriënteren zich online voor zij naar de winkel gaan. Reviews en ratings zijn online de meest betrouwbare bron voor consumenten. Reviews zorgen ervoor dat u meedoet in online conversaties, waarmee u naamsbekendheid en naamskwaliteit kunt verhogen. Reviews geven u ook de kans interactief met klanten te communiceren op winkelniveau. De presentatie over ‘The word of mouse’ geeft u inzicht in de laatste ontwikkelingen en trends op dit gebied.
Het internet evolueerde de voorbije jaren van eenrichtingsverkeer naar platform waar miljoenen gebruikers hun mening delen en content verspreiden via sociale media.
En laat dat nu net een gegeven zijn waar je als jeugdorganisatie dankbaar gebruik kunt van maken om jouw organisatie of evenement in the picture te plaatsen.
Tijdens deze interactieve lezing maak je kennis met de wondere wereld van online monitoring (wat wordt er over mijn organisatie gezegd?), doelgroepenwerking (hoe stel ik mijn communicatiemix samen in functie van mijn publiek), conversation management (hoe ga ik om met positieve en negatieve feedback). Theorieën worden helder uitgelegd en geïllustreerd met voorbeelden uit de jeugdsector, maar ook uit de bedrijfswereld.
Deze vorming is ideaal voor je vormingsweekend/studiedag (max 3u), maar kan gecombineerd worden met een praktisch luik (+3u). In groepjes werk je zelf een online strategie uit, waarbij je de theorie in de praktijk omzet. Feedback krijg je zowel van de vormingsbegeleider van Mediaraven als van de andere deelnemers.
Inhoud
Hoe werkt digitale communicatie anno 2014?
Hoe krijg je meer fans op Facebook?
Heeft e-mail nog zin?
Moeten we met zijn allen massaal gaan twitteren?
Welke mogelijkheden biedt mobiel internet voor jeugdwerkorganisaties?
Presentatie Buzzcapture bij HSMAI 23 septemberBuzzcapture
Presentatie van Social Media Analist Jaap van Zessen tijdens het HSMAI event #HSMAILove in Den Haag. Over online reviews, social media monitoring en leadgeneratie.
The document discusses making a smart thermostat using various technologies like Arduino, Raspberry Pi, XBee for wireless communication, AWS for cloud storage and analytics using HBase and Spark. It describes collecting sensor data from the thermostat including 1000 temperature values per second and storing it in HBase on AWS cloud. It then discusses using machine learning algorithms like k-means clustering to analyze past temperature patterns and scenarios to optimize the thermostat's performance over time.
The document discusses data quality in the context of big data. It notes that with big data, the focus is on both structured and unstructured data from internal and external sources used to gain insights in real-time. It emphasizes analyzing data flows rather than just data stocks and allowing business users to conduct their own analyses. The document also outlines some best practices for data governance, including defining rules and policies; profiling, validating, and cleansing data; and using dashboards to monitor data quality.
Using big data allows companies to personalize marketing and increase customer loyalty and spending. Research shows personalization can increase ROI on marketing investments five to eight times and boost sales by 10%. Customers are willing to share personal details if it benefits them through more personalized experiences.
5. Who wants an opinion?
• Companies: product feedback, market analysis, competitor analysis,
customer feedback, automated stock trading, CRM
• Politicians and countries: image makers
• You:
• anyone overwhelmed by the variety on the web:
• too many different voices, too little trustworthiness
• You want to buy a camera
• You want to find medical advice
• You want to go somewhere on a holiday
Based on Ed Hovy, USC, Information Sciences Institute, www.isi.edu/~hovy
6.
7. Sentiment & Stock market
J. Sharma, 7/29 http://www.csee.umbc.edu/2013/07/ms-defense-sentiment-
analysis-on-tweets-and-their-relationship-with-stock-market-trends-j-sharma-729/
17. Opinion is a relation
• Holder usually author or source in the text
• Emotion or judgement
• Target can be anything: people, situations,
products, future, past, systems, ideas
20. Cross-lingual/cultural sentiment
GENERAL-EVALUATION 669
en definitely recommend; strong positive
es recomendariamos sin duda alguna positive
fr recommander chaleureusement strong positive
it consiglio vivamente positive
NOISE 1117
en a lot of noise strong negative
fr énormement de bruit strong negative
it molto rumore negative
nl veel lawaai negative
nl ontzettend veel lawaai strong negative
• 2,486 expressions in hotel reviews
• annotated in 6 languages
• 8 aspect groups (food, clean, price,
behaviour, general evaluation, size, location,
noise, size),
http://opener-fp7project.rhcloud.com
22. Reviewer & reader ratings
• The hotel seems rather outdated. The
breakfast room is just not big enough to
cope with the Sunday-morning crowds.
23. Reviewer & reader ratings
• The hotel seems rather outdated. The
breakfast room is just not big enough to
cope with the Sunday-morning crowds.
• Maks and Vossen (RANLP-2013)
Review
rating
7
Reader
rating
negative
Target= hotel, holiday Target= aspects in the text
9% - 37% sentiment mismatch at document level
24. Its is complex
When?
First interest Buyer Support Upgrade
Who are you?
female, 32, Dutch, educated
mountaineerparent
What aspect?
weightwifi
What sentiment?
criticalangry
25. What is the landscape
behind thumbs up & down?
• World is complex
• We are complex
• Our language is complex
26. Sentiment =
response to a changing world
FuturePast
Hope
Fear
Nostalgic
Frustrated
Speculate
Summarise
27. Die labbekakker is misschien bang dat zij vermoedt
dat zijn baas verwacht dat hij het zeker niet zou
hebben moeten doen.
28. 2009: Vaccinatie 12-jarige meisjes tegen
papillomavirus (HPV)
● Opgenomen in landelijk vaccinatie-programma
ondanks hoge kosten
● Ondersteund door overheid en wetenschap
● Ondermijnd door actieve groepen op Internet:
“Angstige berichten uit Amerika bijvoorbeeld over meisjes die een half uur na inenting
verlamd raakten. In Amerika, dat ruim een jaar geleden begon met het inenten van
tienermeisjes met het vaccin Gardasil, zijn tientallen ernstige ‘bijwerkingen’ gerapporteerd
waarin een verband met de vaccinaties wordt vermoed.”
● Gedeeltelijk mislukt: 60% liet zich inenten, lager dan
verwacht
29. http://www.wanttoknow.nl/nieuws/hpv-vaccin-
gardasil-vernielt-eierstokken-jonge-vrouw/
Hoe naïef kun je zijn als wetenschapper die een vaccin uitvindt tegen
HPV, door bijwerkingen niet in kaart te brengen. Het HPV-vaccin, dat
‘baarmoederhalskanker’ zou bestrijden..? Of is het zo dat dit verhaal
het gevolg is van bewust gemanipuleerde vaccins..? Wij sluiten niets
meer uit, en jij mag het opnieuw weer zeggen. Want noch de
wetenschappers, noch de politieke beleidsmakers schijnen het nog
te weten.. Zij volgen bijna klakkeloos het geratel van de
farmaceutische industrie, die niet voor niks als ‘Big Pharma’ te boek
staat..! Een industrie, die groot is geworden door manipulatief
handelen, heftig politiek lobbywerk, maar ook door falsificaties en
regelrechte juridische fraude..
30. http://www.earth-matters.nl/5/7516/gezondheid/de-
gevaren-van-de-hpv-vaccins-gardasil-en-cervarix-
bijwerkingen-baarmoederhalskanker.html
Gardasil en Cervarix bieden GEEN bescherming voor vrouwen met een HPV-
infectie hebben en verhogen juist de kans op kankercellen met 44,6%! Zie:
vactruth.com / kanker-therapie.nl
Zowel Gardasil en Cervarix bevatten aluminium hydroxide, een neurologisch gif
dat ernstige gevaarlijke bijwerkingen veroorzaakt. Gardasil bevat 0.225 mg
aluminium hydroxide per prik en Cervarix bevat 0.5 mg per prik. Zie:
argusoog.org / proliberty.com
Medische autoriteiten claimen dat Gardasil en Cervarix 'veilig' zijn omdat het
aantal bijwerkingen tijdens de klinische onderzoeken vrijwel gelijk was met de
controle-groep, die een placebo vaccin ontving. Maar in de placebo vaccins zat
ook aluminum hydroxide... Zie:uitdaging.net
HPV-vaccinaties hebben geleid tot beroertes, epilepsie, verlammingen, duizeligheid, flauwvallen, coma, hoofdpijn, slapheid,
chronische vermoeidheid, auto-immuun ziekten, gewrichtspijn, hartproblemen, korte adem, haaruitval, gewichtsverlies, misselijkheid, stemmingswisselingen,
slapeloosheid, huiduitslag, jeuk, zwellingen, zenuwpijn, spierpijn, rugpijn, opgezette lymfeklieren, spraak en oogproblemen, gehoorverlies, trombosis, vergrote
lever, menstruatiepijn, vergrote eileiders, eierstokcysten, onvruchtbaarheid, spontane abortussen, miskramen, geboorteafwijkingen, baarmoederhalskanker en al
meer dan 100 sterfgevallen!
logica?
34. 34
Meningen en perspectieven
• Wat wordt beweerd: bijwerkingen van vaccinatie
• Wie beweert wat?
• Wanneer beweert die persoon dat?
• Is het een bewering in het hier en nu, de toekomst?
• Is de persoon zeker of onzeker?
• Ontkent of bevestigt de persoon het?
• Welke emotie heeft de persoon bij dit gegeven?
• Gaat het om een morele of esthetische waardering?
• Bij wie wordt de verantwoordelijkheid neergelegd?
36. Conclusies
● Het Internet bevat een schat aan informatie verpakt in
taal
● Mensen en taal zijn misleidend en vol booby traps
● Verbazingwekkend hoe makkelijk mensen een
complex beeld vormen van sociale-psychische
perspectief relaties ondanks complexiteit van relaties
en taal
● Om de schat te vinden is geavanceerde
taaltechnologie nodig om betekenissen, feiten en
meningen te ontrafelen
● Broninformatie is essentieel als informatielaag