Este documento trata sobre la unidad 10 de dibujo libremente en el Colegio Nacional Nicolas Esguerra. Se menciona el dibujo a mano alzada y el dibujo inteligente como temas de la unidad, así como los medios artísticos utilizados.
Sami Karhumäki - Data-Driven Business - How Do Companies Do It - Mindtrek 2016Mindtrek
Citynomadi is a platform for creating interactive maps, games, and mobile/web applications using open data. The platform allows embedding maps on websites, supports common open data standards, and has tools for easily gathering and visualizing spatial data. Citynomadi also creates native mobile apps that can access maps offline and indoors, addressing limitations of some existing open data projects. The company aims to improve access to open data through user-friendly tools and standards compliance.
The document discusses surgical refactoring, which aims to minimize risk when refactoring code. It involves carefully diagnosing what the code does before refactoring, adding tests to validate understanding, and refactoring in small, verified steps. Pre-operation steps include understanding the code behavior, adding tests to execute it, and determining expected returns. This helps refactor code safely without introducing unintended bugs.
This document is a resume for Ch. Rama Danteswar Rao. It summarizes his objective to pursue a challenging career, education including an M.Tech in Control Systems from Andhra University and a B.Tech in Electrical and Electronics Engineering. It lists technical proficiencies in languages like C and technologies like MATLAB simulation. It describes an academic main project on grid power control using FACTS technology. It also provides details on co-curricular activities, extracurricular activities, competencies and personal details.
This document provides a summary of the author's culinary adventures throughout Thailand beyond typical tourist destinations. The author is guided by local experts to experience authentic Thai cuisine, including street foods in Bangkok markets and stalls. A highlight is visiting royal agricultural projects in Chiang Mai that support local communities and showcase northern Thai recipes. The guides introduce lesser-known restaurants highlighting regional specialties from Isaan, northern and border regions of Thailand off the beaten path.
Les Merveilleuses is planning a holiday campaign in New York City to expand their brand awareness to American consumers. The campaign will focus on increasing their social media presence on Facebook and Instagram through engaging lifestyle content. They aim to gain 10,000 new followers and increase engagement rates over the Christmas season. A launch party in NYC will feature influencers and bloggers to promote the #IamMarvellous campaign and new e-commerce on Sephora. The expected results are a 15% increase in sales compared to the previous year.
This document provides a playlist of 5 songs from various artists and albums. It includes the song title, artist, and album/soundtrack for each song listed. Specifically, it lists "All These Things That I've Done" by The Killers from their album Direct Hits 2003-2013, "Money (That's Want I Want)" by Barret Strong from the soundtrack to the film Killing Them Softly, "Take Your hands Off It" by Ry Cooder from his album Election Special, "See What a Fool I've Been" by Queen from their album Queen II, and "Fake Your Death" by My Chemical Romance from their album May Death Never Stop You (Deluxe Version).
This document introduces Ruby as an open-source, multi-paradigm programming language created by Yukihiro Matsumoto. Ruby is interpreted, which means code is read and executed by an interpreter rather than being pre-compiled. The document provides instructions for installing Ruby on Windows, Mac OS X, and Linux. It recommends text editors for writing Ruby code and introduces the irb interactive shell for testing code. A simple "Hello, World" program is presented to demonstrate running Ruby code.
Este documento trata sobre la unidad 10 de dibujo libremente en el Colegio Nacional Nicolas Esguerra. Se menciona el dibujo a mano alzada y el dibujo inteligente como temas de la unidad, así como los medios artísticos utilizados.
Sami Karhumäki - Data-Driven Business - How Do Companies Do It - Mindtrek 2016Mindtrek
Citynomadi is a platform for creating interactive maps, games, and mobile/web applications using open data. The platform allows embedding maps on websites, supports common open data standards, and has tools for easily gathering and visualizing spatial data. Citynomadi also creates native mobile apps that can access maps offline and indoors, addressing limitations of some existing open data projects. The company aims to improve access to open data through user-friendly tools and standards compliance.
The document discusses surgical refactoring, which aims to minimize risk when refactoring code. It involves carefully diagnosing what the code does before refactoring, adding tests to validate understanding, and refactoring in small, verified steps. Pre-operation steps include understanding the code behavior, adding tests to execute it, and determining expected returns. This helps refactor code safely without introducing unintended bugs.
This document is a resume for Ch. Rama Danteswar Rao. It summarizes his objective to pursue a challenging career, education including an M.Tech in Control Systems from Andhra University and a B.Tech in Electrical and Electronics Engineering. It lists technical proficiencies in languages like C and technologies like MATLAB simulation. It describes an academic main project on grid power control using FACTS technology. It also provides details on co-curricular activities, extracurricular activities, competencies and personal details.
This document provides a summary of the author's culinary adventures throughout Thailand beyond typical tourist destinations. The author is guided by local experts to experience authentic Thai cuisine, including street foods in Bangkok markets and stalls. A highlight is visiting royal agricultural projects in Chiang Mai that support local communities and showcase northern Thai recipes. The guides introduce lesser-known restaurants highlighting regional specialties from Isaan, northern and border regions of Thailand off the beaten path.
Les Merveilleuses is planning a holiday campaign in New York City to expand their brand awareness to American consumers. The campaign will focus on increasing their social media presence on Facebook and Instagram through engaging lifestyle content. They aim to gain 10,000 new followers and increase engagement rates over the Christmas season. A launch party in NYC will feature influencers and bloggers to promote the #IamMarvellous campaign and new e-commerce on Sephora. The expected results are a 15% increase in sales compared to the previous year.
This document provides a playlist of 5 songs from various artists and albums. It includes the song title, artist, and album/soundtrack for each song listed. Specifically, it lists "All These Things That I've Done" by The Killers from their album Direct Hits 2003-2013, "Money (That's Want I Want)" by Barret Strong from the soundtrack to the film Killing Them Softly, "Take Your hands Off It" by Ry Cooder from his album Election Special, "See What a Fool I've Been" by Queen from their album Queen II, and "Fake Your Death" by My Chemical Romance from their album May Death Never Stop You (Deluxe Version).
This document introduces Ruby as an open-source, multi-paradigm programming language created by Yukihiro Matsumoto. Ruby is interpreted, which means code is read and executed by an interpreter rather than being pre-compiled. The document provides instructions for installing Ruby on Windows, Mac OS X, and Linux. It recommends text editors for writing Ruby code and introduces the irb interactive shell for testing code. A simple "Hello, World" program is presented to demonstrate running Ruby code.
The document summarizes a numerical study of the clamping pressure of an automotive support. The support was 3D scanned and imported into simulation software to apply pressure and analyze stress distributions. The results showed uneven pressure distribution, stress concentrated on the sides, and deformation indicating an inadequate seal. The conclusions recommend redesigning the part for even pressure distribution or using a different fixture method like screws.
Boost your artistic skills? Do you want step into the world of 3D animation and graphics? Well, then this is perfect place to start!
Learn Maya 3D Animation For free
Some interesting case studies of how we helped our clients adopt DevOps. The cases cover various fields within DevOps space: CI/CD, Monitoring, Cloud Migration
- The document discusses re-thinking incident response automation and introduces Neptune.io, an incident response automation platform built for AWS.
- It outlines that incident response today is still mostly manual, taking hours to diagnose issues, and that automation can help reduce resolution times.
- Neptune provides three core pieces for automation - analytics to identify top issues, context gathering from monitoring tools when alerts fire, and running pre-defined remediation runbooks to fix known issues automatically.
Deze presentatie als inleiding in het werken met sociale media in de hulpverlening. De nadruk zit vooral in de hulvperleningsrelatie en de dialoog. Sociale media is het middel om deze twee te faciliteren. sociale media als ontmoeting op het platform van de huidige maatschappij.
Gastcollege e-learning trends avans plus 10 april 2018WilfredRubens.com
Op 10 april 2018 heb ik in het kader van de postbachelor opleiding e-Learning van Avans + een gastcollege verzorgd over e-learning trends en ontwikkelingen.
Een presentatie naar aanleiding van de belangrijkste leerpunten/inzichten over het managementboek van het jaar van Rob van Es: Veranderdiagnose - De onderstroom van het organiseren. Het boek biedt daadwerkelijk handvatten om succesvoller met veranderingen om te gaan in organisaties.
The document summarizes a numerical study of the clamping pressure of an automotive support. The support was 3D scanned and imported into simulation software to apply pressure and analyze stress distributions. The results showed uneven pressure distribution, stress concentrated on the sides, and deformation indicating an inadequate seal. The conclusions recommend redesigning the part for even pressure distribution or using a different fixture method like screws.
Boost your artistic skills? Do you want step into the world of 3D animation and graphics? Well, then this is perfect place to start!
Learn Maya 3D Animation For free
Some interesting case studies of how we helped our clients adopt DevOps. The cases cover various fields within DevOps space: CI/CD, Monitoring, Cloud Migration
- The document discusses re-thinking incident response automation and introduces Neptune.io, an incident response automation platform built for AWS.
- It outlines that incident response today is still mostly manual, taking hours to diagnose issues, and that automation can help reduce resolution times.
- Neptune provides three core pieces for automation - analytics to identify top issues, context gathering from monitoring tools when alerts fire, and running pre-defined remediation runbooks to fix known issues automatically.
Deze presentatie als inleiding in het werken met sociale media in de hulpverlening. De nadruk zit vooral in de hulvperleningsrelatie en de dialoog. Sociale media is het middel om deze twee te faciliteren. sociale media als ontmoeting op het platform van de huidige maatschappij.
Gastcollege e-learning trends avans plus 10 april 2018WilfredRubens.com
Op 10 april 2018 heb ik in het kader van de postbachelor opleiding e-Learning van Avans + een gastcollege verzorgd over e-learning trends en ontwikkelingen.
Een presentatie naar aanleiding van de belangrijkste leerpunten/inzichten over het managementboek van het jaar van Rob van Es: Veranderdiagnose - De onderstroom van het organiseren. Het boek biedt daadwerkelijk handvatten om succesvoller met veranderingen om te gaan in organisaties.
Deze presentatie laat zien hoe patiënten (en burgers en medewerkers) mede-onderzoekers kunnen zijn doorhun ervaringen, observaties en belevenissen te vertellen en te duiden.
De hiervoor toegepaste StoryCycle benadering zorgt ervoor dat patronen en zwakke signalen van verandering zichtbaar worden. Hierdoor ontstaan nieuwe mogelijkheden om sectoren, organisaties en transformaties te besturen.
First support-lecture on research methods presented to students on the master in special needs education. University of Groningen, 11 October 2010 by Dr. Wendy Post and Dr. Ernst Thoutenhoofd (Dutch language).
Fleur Jongepier sluit de onderwijsdagen af met een keynote waarin ze de vaak lastige waardendialogen binnen ICT en onderwijs, in kaart brengt en behapbaar maakt. Met welke waarden en spanningsvelden hebben we (of krijgen we) te maken en hoe kunnen we daarin beter leren navigeren? Ze laat zien hoe onderwijsprofessionals op een waarde(n)volle manier kunnen bijdragen aan het onderwijs van de toekomst.
Een onderzoek dat verricht is om te beschouwen welke trends op marketing gebied relevant zijn voor de ontwikkeling van Identiteitsmarketing. Deze scriptie is geschreven in het kader van het afstuderen aan de academie Marketing International Management aan Saxion Hogescholen.
The document discusses techniques for scaling up automated content analysis projects. It begins by looking back at the workflow and techniques covered in previous sessions, such as developing components separately, writing functions, and making the code robust. It then looks forward by discussing additional techniques that were not covered, such as using Selenium for dynamic web scraping, databases for storing large datasets, word embeddings, and more advanced natural language processing and machine learning models. The document also introduces the INCA project, which aims to scale up content analysis by collecting data in a way that allows for reuse across multiple projects, using a database backend and reusable preprocessing and analysis code. The goal is to make automated content analysis usable with minimal Python knowledge.
This document provides a summary of a meeting on machine learning. It recaps unsupervised and supervised machine learning techniques. Unsupervised techniques discussed include principal component analysis (PCA) and latent Dirichlet allocation (LDA). PCA is used to find how words co-occur in documents. LDA can be implemented in Python using gensim to infer topics in a collection of documents. Supervised machine learning techniques the audience has previously used are regression models. The document concludes by noting models will only use a portion of available data for training and validation.
This document provides an overview of using statistics in Python with Pandas. It discusses general considerations for using Python for statistics rather than exporting data to another program. Useful Python packages for statistics like NumPy, SciPy, statsmodels, and matplotlib are introduced. The document demonstrates how to work with Pandas dataframes, including descriptive statistics, plotting, and linear regression. An upcoming exercise will provide hands-on practice of these skills.
This document discusses last week's coding exercise on data harvesting and storage. It provides step-by-step explanations of code used to extract and analyze data from a JSON file. Examples include printing video titles, calculating average tags per video, determining the most commented on porn category, and finding the most frequently used words. The document also covers APIs, scrapers, file formats like JSON and CSV, and how to store extracted data.
This document provides an introduction to basic Python programming concepts like datatypes, functions, modifying lists and dictionaries, and indentation. It explains that Python uses indentation through spaces or tabs to structure code blocks that are executed repeatedly or under certain conditions. Examples are given for defining functions, appending and merging lists, adding keys to dictionaries, and using indentation with for, if/elif/else, and try/except blocks.
This document outlines an introductory course on big data and automated content analysis. It covers using the Linux command line, writing and running Python code, and announces upcoming meetings. The course will introduce tools like the Linux terminal and Python, explain why they are useful for big data tasks, and provide exercises for students to practice these skills, such as writing simple Python programs. Upcoming meetings are scheduled for weeks 2 and 3 to continue lectures and lab sessions on using Python.
This document provides an overview of a course on Big Data and Automated Content Analysis. It introduces the instructor, Damian Trilling, and a PhD student, Joanna Strycharz. It then discusses definitions of Big Data, implications and criticisms, and whether the techniques used in the course constitute Big Data research. Next, it outlines methods that will be covered, including data collection, analysis techniques, and the programming language Python. Finally, it discusses reasons for building one's own tools rather than using commercial software.
This document summarizes a presentation on unsupervised and supervised machine learning techniques for automated content analysis. It recaps types of automated content analysis, describes unsupervised techniques like principal component analysis (PCA) and latent Dirichlet allocation (LDA), and supervised machine learning techniques like regression. It provides examples of applying these techniques to cluster Facebook messages and predict newspaper reading. The document concludes by noting the presenter will use a portion of labeled data to estimate models and check predictions against the remaining labeled data.
The document discusses web scraping and outlines a step-by-step process for scraping comments from a Dutch website called GeenStijl. It begins with using regular expressions to scrape the comments, but notes that existing parsers can make the process more elegant, especially for complex websites. It then demonstrates using the lxml module and XPath to scrape reviews from another site in a more structured way. The document provides remarks on regular expressions and XPath, and encourages exploring different scraping techniques.
This document provides an overview of a presentation on automated content analysis using regular expressions and natural language processing. The presentation covers topics like bottom-up vs top-down analysis, what regular expressions are and how they can be used in Python, stemming, parsing sentences, and combining techniques like stemming and stopword removal. Examples are given on using regular expressions to count actors in articles and check the number of a document from LexisNexis. The takeaway message is about an upcoming take-home exam and future meetings.
The document discusses different types of analysis for automated content analysis, including sentiment analysis and stopword removal. It covers bag-of-words approaches to sentiment analysis, which involve comparing words in a text to lists of positive and negative words. More advanced approaches are mentioned that take the structure of text into account, such as identifying sentence structure using linguistic concepts.
This document discusses a lecture on data harvesting and storage. It covers APIs, RSS feeds, scraping and crawling as methods for collecting data from various sources. It also discusses storing data in formats like CSV, JSON, and XML. The document provides code examples for working with JSON data and discusses tools for long-term data collection like DMI-TCAT.
This document summarizes a presentation on the basics of Python programming. It introduces fundamental Python concepts like datatypes, functions, methods, and indentation-based code structuring. It also announces an exercise for the attendees to practice these basics and previews upcoming meetings that will involve working with structured datasets in Python.
1) Traditional assumptions about how people consume news through a fixed set of outlets are incorrect in today's fragmented media environment.
2) News consumption involves three layers - media type, individual outlets, and the gateway through which people access the outlet (e.g. website, app, social media).
3) Researchers need to account for this third layer when studying people's news repertoires to fully capture how news flows in the digital age.
This document proposes conceptualizing and measuring news exposure as a network of users and news items. It outlines some common assumptions about news consumption that are outdated, such as people using a fixed set of news outlets. The document then presents a model where news items and users are represented as nodes, and their connections as edges. For example, an edge between a user and news item would indicate the user has read that item. Implementing this model involves collecting data on users, news items, and their connections to build a graph database that can be used to analyze news diffusion and exposure. This network approach is presented as an improved way to measure individual-level exposure to specific news items in today's unbundled media environment.
More from Department of Communication Science, University of Amsterdam (20)
Conceptualizing and measuring news exposure as network of users and news items
NPSO
1. Meer dan sentimentscores: inzichten destilleren
uit een enorme hoeveelheid data
Damian Trilling
d.c.trilling@uva.nl
@damian0604
www.damiantrilling.net
Afdeling Communicatiewetenschap
Universiteit van Amsterdam
Jaarbijeenkomst van het
Nederlandstalig Platform voor Surveyonderzoek (NPSO)
22 September 2015
2. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Wie ben ik?
Damian Trilling
Meer dan sentimentscores Damian Trilling
3. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Wie ben ik?
Damian Trilling
• is Universitair Docent Politieke Communicatie en Journalistiek
aan de Universiteit van Amsterdam
Meer dan sentimentscores Damian Trilling
4. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Wie ben ik?
Damian Trilling
• is Universitair Docent Politieke Communicatie en Journalistiek
aan de Universiteit van Amsterdam
• is ge¨ınteresseerd in de vraag hoe veranderingen in het
medialandschap en technologische innovaties van invloed zijn
op de manier waarop burgers het nieuws volgen
Meer dan sentimentscores Damian Trilling
5. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Wie ben ik?
Damian Trilling
• is Universitair Docent Politieke Communicatie en Journalistiek
aan de Universiteit van Amsterdam
• is ge¨ınteresseerd in de vraag hoe veranderingen in het
medialandschap en technologische innovaties van invloed zijn
op de manier waarop burgers het nieuws volgen
• richt zich vooral op de geautomatiseerde analyse van digitale
data
Meer dan sentimentscores Damian Trilling
6. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Waar ga ik het over hebben?
1 Zegen en vloek: een enorme hoeveelheid data
Zegen en vloek
Verschillende benaderingen: wat wil je weten?
2 Welke methoden zijn er?
Enkele voorbeelden
Een voorlopige indeling
3 Twee studies
Het tweede scherm
Nieuws delen op social media
4 Conclusie
Meer dan sentimentscores Damian Trilling
8. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Zegen en vloek
Waar surveys goed in zijn – en waarin niet
Meer dan sentimentscores Damian Trilling
9. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Zegen en vloek
Waar surveys goed in zijn – en waarin niet
voordelen
• representatief (soms)
• flexibel: jij kunt de vragen bedenken
• data in een gestandardiseerd
formaat: makkelijk te verwerken
• beproefde methode
Meer dan sentimentscores Damian Trilling
10. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Zegen en vloek
Waar surveys goed in zijn – en waarin niet
voordelen
• representatief (soms)
• flexibel: jij kunt de vragen bedenken
• data in een gestandardiseerd
formaat: makkelijk te verwerken
• beproefde methode
nadelen
• je kunt niets te weten komen wat je
niet hebt gevraagd
• je kunt geen daadwerkelijk gedrag
meten
• kosten
• surveymoeheid, validiteit?
• breed ipv diep
• niet geschikt om weinig voorkomend
gedrag, kleine subpopulaties etc. te
onderzoeken
Meer dan sentimentscores Damian Trilling
11. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Zegen en vloek
Waar surveys goed in zijn – en waarin niet
voordelen
• representatief (soms)
• flexibel: jij kunt de vragen bedenken
• data in een gestandardiseerd
formaat: makkelijk te verwerken
• beproefde methode
nadelen
• je kunt niets te weten komen wat je
niet hebt gevraagd
• je kunt geen daadwerkelijk gedrag
meten
• kosten
• surveymoeheid, validiteit?
• breed ipv diep
• niet geschikt om weinig voorkomend
gedrag, kleine subpopulaties etc. te
onderzoeken
“⇒ we moeten iets met Big Data/social/media/. . . ”
Meer dan sentimentscores Damian Trilling
12. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Zegen en vloek
Een aanvulling op (en geen vervanging van)
surveyonderzoek. . .
In plaats van zelf “gecre¨eerde” surveydata data analyseren die door
mensen zelf worden gecre¨eerd
Meer dan sentimentscores Damian Trilling
13. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Zegen en vloek
Een aanvulling op (en geen vervanging van)
surveyonderzoek. . .
In plaats van zelf “gecre¨eerde” surveydata data analyseren die door
mensen zelf worden gecre¨eerd
iedereen laat sporen achter op sociale media etc.
Meer dan sentimentscores Damian Trilling
14. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Zegen en vloek
Een aanvulling op (en geen vervanging van)
surveyonderzoek. . .
In plaats van zelf “gecre¨eerde” surveydata data analyseren die door
mensen zelf worden gecre¨eerd
iedereen laat sporen achter op sociale media etc.
Maar er zijn ook grote datasets die alleen nooit systematisch
geanalyseerd zijn (open data)
Meer dan sentimentscores Damian Trilling
15. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Zegen en vloek
Een aanvulling op (en geen vervanging van)
surveyonderzoek. . .
In plaats van zelf “gecre¨eerde” surveydata data analyseren die door
mensen zelf worden gecre¨eerd
iedereen laat sporen achter op sociale media etc.
Maar er zijn ook grote datasets die alleen nooit systematisch
geanalyseerd zijn (open data)
De grote vraag: Hoe analyseer je het?
Meer dan sentimentscores Damian Trilling
17. Verschillende benaderingen: wat wil je weten?
Stel we hebben 500.000 tweets (of comments, Facebookposts of
productrecensies) over een bepaald onderwerp. . .
18. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Verschillende benaderingen
Je zou natuurlijk. . .
• een steekproef kunnen trekken, deze handmatig coderen en
later “gewoon” statistisch analyseren
• alleen naar de interessantste/het vaakst geretweete/. . . tweets
kunnen kijken en deze kwalitatief analyseren
Meer dan sentimentscores Damian Trilling
19. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Verschillende benaderingen
Maar misschien is het beter om. . .
een methode te hebben die
• gebruik maakt van alle beschikbare informatie
• (hopelijk) diepe(re) of tenminste aanvullende inzichten levert
• maar tegelijkertijd een behapbaar overzicht geeft?
Meer dan sentimentscores Damian Trilling
20. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Enkele voorbeelden
Welke methoden zijn er?
Meer dan sentimentscores Damian Trilling
21. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Enkele voorbeelden
Welke methoden zijn er?
Enkele voorbeelden
Jonkman, J.G.F., Trilling, D., Verhoeven, P., & Vliegenthart, R. (2015, June). Topical
variation in company news: An assessment of the diversity of topics in Dutch
newspaper coverage of media prominent corporations. Paper presented at BledCom,
Bled, Slovenia.
Trilling, D. & Jonkman, J. (2015, June). Packing and unpacking the Bag of Words:
Introducing a toolkit for inductive automated frame analysis. Paper presented at the
World Association for Public Opinion Research Conference, Buenos Aires, Argentinia.
Meer dan sentimentscores Damian Trilling
22. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Enkele voorbeelden
Voorbeeld: aandacht over tijd
Hoe vaak worden bedrijven in het nieuws genoemd?
Methode: turven.
Meer dan sentimentscores Damian Trilling
23. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Enkele voorbeelden
Voorbeeld: Onderwerpen identificeren
Waar gaat economisch nieuws over? (1)
Methode: Topic modelling (Latent Dirichlet Allocation)
Meer dan sentimentscores Damian Trilling
24. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Enkele voorbeelden
Voorbeeld: Onderwerpen identificeren
Waar gaat economisch nieuws over? (2)
Methode: Principal Component Analysis
Meer dan sentimentscores Damian Trilling
25. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Enkele voorbeelden
Voorbeeld: Onderwerpen identificeren
Waar gaat economisch nieuws over? (3)
Methode: Visualisatie van samen genoemde woorden
Meer dan sentimentscores Damian Trilling
27. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Een voorlopige indeling
Ook bij automatische inhoudsanalyse: deductief en
inductief
Meer dan sentimentscores Damian Trilling
28. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Een voorlopige indeling
Ook bij automatische inhoudsanalyse: deductief en
inductief
Deductief
• simpel: turven (zoektermen,
woordenlijsten, . . . )
• geavanceerd: supervised
machine learning
Meer dan sentimentscores Damian Trilling
29. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Een voorlopige indeling
Ook bij automatische inhoudsanalyse: deductief en
inductief
Deductief
• simpel: turven (zoektermen,
woordenlijsten, . . . )
• geavanceerd: supervised
machine learning
Inductief
• woordfrequenties en
co-occurrences
• visualisatie
• principale-
componentenanalyse
(PCA)
• clusteranalyse
• topic modelling, m.n.
latent dirichlet allocation
(LDA)
• . . .
Meer dan sentimentscores Damian Trilling
30. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Een voorlopige indeling
Alles op ´e´en hoop gooien of rekening houden met de
zinsstructuur?
Meer dan sentimentscores Damian Trilling
31. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Een voorlopige indeling
Alles op ´e´en hoop gooien of rekening houden met de
zinsstructuur?
bag of words (BOW)
• simpel
• te simplistisch?
• niet in staat om met
ontkenningen etc. om te
gaan
• maar werkt vaak wel! (goed
genoeg)
Meer dan sentimentscores Damian Trilling
32. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Een voorlopige indeling
Alles op ´e´en hoop gooien of rekening houden met de
zinsstructuur?
bag of words (BOW)
• simpel
• te simplistisch?
• niet in staat om met
ontkenningen etc. om te
gaan
• maar werkt vaak wel! (goed
genoeg)
parsing (= zinnen ontleden)
• krachtige methode die je
dichter bij de betekenis van
een tekst kan brengen
• werkt voor sommige talen
beter dan voor andere
• gaat ervan uit dat mensen
“nette” zinnen schrijven
• en dat is meer dan
problematisch met
social-media-data.
Meer dan sentimentscores Damian Trilling
34. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Het tweede scherm
Het tweede scherm
Welke discussies worden tijdens tv-debatten op het tweede scherm
gevoerd?
Trilling, D. (2015). Two different debates? Investigating the relationship between a
political debate on TV and simultaneous comments on Twitter. Social Science
Computer Review, 33(3), 259–276. doi:10.1177/0894439314537886
Meer dan sentimentscores Damian Trilling
35. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Het tweede scherm
Onderzoeksvragen
In hoeverre komen de uitingen van politici tijdens een tv-debat
terug in online discussies op het tweede scherm?
RQ1 Welke onderwerpen worden benadrukt door de
kandidaten?
RQ2 Welke onderwerpen worden benadrukt door
Twittergebruikers?
RQ3 Met welke onderwerpen worden de kandidaten in
verband gebracht op Twitter?
Meer dan sentimentscores Damian Trilling
36. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Het tweede scherm
Methode
Meer dan sentimentscores Damian Trilling
37. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Het tweede scherm
Methode
Data
• transcript van het
debat
• tweets met hashtag
#tvduell
• N = 120, 557 tweets
van N = 24, 796
gebruikers
• 22-9-2013,
20.30-22.00
Meer dan sentimentscores Damian Trilling
38. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Het tweede scherm
Methode
Data
• transcript van het
debat
• tweets met hashtag
#tvduell
• N = 120, 557 tweets
van N = 24, 796
gebruikers
• 22-9-2013,
20.30-22.00
De analyse
• Een aantal zelfgeschreven Python
scripts:
1 preprocessing (stemming,
stopword removal)
2 woorden tellen
3 log likelihood (corpus
comparison): hoe kenmerkend is
een woord voor een corpus?
4 visualisatie van co-occurrences
Meer dan sentimentscores Damian Trilling
39. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Het tweede scherm
Meest kenmerkende woorden op tv
LL word Frequency Merkel Frequency Steinbr¨uc
27,73 merkel 0 20
19,41 arbeitsplatz [job] 14 0
15,25 steinbruck 11 0
9,70 koalition [coaltion] 7 0
9,70 international 7 0
9,70 gemeinsam [together] 7 0
8,55 griechenland [Greece] 10 1
8,32 investi [investment] 6 0
6,93 uberzeug [belief] 5 0
6,93 okonom [economic] 0 5
Meer dan sentimentscores Damian Trilling
40. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Het tweede scherm
Meest kenmerkende woorden op Twitter
LL word Frequency Merkel Frequency Ste
32443,39 merkel 29672 0
30751,65 steinbrueck 0 17780
1507,08 kett [necklace] 1628 34
1241,14 vertrau [trust] 1240 12
863,84 fdp [a coalition partner] 985 29
775,93 nsa 1809 298
626,49 wikipedia 40 502
574,65 twittert [tweets] 40 469
544,87 koalition [coalition] 864 77
517,99 gold 669 34
Meer dan sentimentscores Damian Trilling
41. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Het tweede scherm
Waarmee worden de politici geassocieerd?
Merkel
• halsketting
• vertrouwen (sarcastisch
bedoeld)
• NSA-schandaal
• coalitiepartijen
Steinbr¨uck
• suggestie om iets op te
zoeken op Wikipedia
• tweets van zijn eigen
account tijdens het debat
Meer dan sentimentscores Damian Trilling
42.
43. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Nieuws delen op social media
Nieuws delen op social media
Welke artikelen op nieuwssites worden het vaakst op social media
gedeeld?
Trilling, D., Tolochko, P., & Burscher, B. (2015, June). Viral news: How to predict
news sharing based on article characteristics. Paper presented at the World
Association for Public Opinion Research Conference, Buenos Aires, Argentinia.
Meer dan sentimentscores Damian Trilling
44. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Nieuws delen op social media
De data
Meer dan sentimentscores Damian Trilling
45. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Nieuws delen op social media
De data
Artikeldata
• januari 2014—augustus 2014
• automatische query van RSS-feeds 1x/uur
• naast opslaan van RSS-data: meteen volledige webpagina
downloaden
• Later: de gedownloade pagina’s parsen (Python) en relevante
informatie extraheren
Meer dan sentimentscores Damian Trilling
46. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Nieuws delen op social media
De data
Artikeldata
• januari 2014—augustus 2014
• automatische query van RSS-feeds 1x/uur
• naast opslaan van RSS-data: meteen volledige webpagina
downloaden
• Later: de gedownloade pagina’s parsen (Python) en relevante
informatie extraheren
Sharing-data
• tijdsverschil van 1 maand of langer
• Facebook, Twitter, Google API-queries (Python) om aantal
shares voor elke URL in de RSS-dataset te achterhalen
Meer dan sentimentscores Damian Trilling
47. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Nieuws delen op social media
Wat kun je eruit halen?
Meer dan sentimentscores Damian Trilling
48. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Nieuws delen op social media
Wat kun je eruit halen?
met parsing, regular expressions etc.
• auteur (ANP? eigen journalist?)
• plaats/land
Meer dan sentimentscores Damian Trilling
49. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Nieuws delen op social media
Wat kun je eruit halen?
met parsing, regular expressions etc.
• auteur (ANP? eigen journalist?)
• plaats/land
met supervised machine learning
• onderwerp (categorie¨en)
• binnenland/buitenland
• human interest (ja/nee)
• conflict (ja/nee)
Meer dan sentimentscores Damian Trilling
50. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Nieuws delen op social media
Wat kun je eruit halen?
Meer dan sentimentscores Damian Trilling
51. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Nieuws delen op social media
Wat kun je eruit halen?
met woordfrequenties
• aandacht voor hetzelfde onderwerp tussen nieuwssites
Meer dan sentimentscores Damian Trilling
52. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Nieuws delen op social media
Wat kun je eruit halen?
met woordfrequenties
• aandacht voor hetzelfde onderwerp tussen nieuwssites
met sentimentanalyse
• positiviteit
• negativiteit
Meer dan sentimentscores Damian Trilling
53. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Nieuws delen op social media
Enkele resultaten
Meer dan sentimentscores Damian Trilling
54. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Nieuws delen op social media
Enkele resultaten
Twitter
• Meeste artikelen <100 shares; maar enkele >4,000
• Geen shares: 10%
• Maar: 73% krijgen ≤ 10 shares
Meer dan sentimentscores Damian Trilling
55. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Nieuws delen op social media
Enkele resultaten
Twitter
• Meeste artikelen <100 shares; maar enkele >4,000
• Geen shares: 10%
• Maar: 73% krijgen ≤ 10 shares
Facebook
• Vergelijkbaar, maar meer spreiding:
• Geen shares: 30%
• Top-3: 48.689, 53,844 en 79,975 interacties
Meer dan sentimentscores Damian Trilling
58. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Conclusie
Computational social science (“Big Data”) -benadering is geen
wondermiddel, maar een nuttige aanvulling.
Je kunt veel meer met de data dan je zou denken.
We moeten interdisciplinair samenwerken (sociale wetenschappen,
informatica, (kwantitatieve) taalkunde)
Meer dan sentimentscores Damian Trilling
59. Boumans, J.W. & Trilling, D. (forthcoming).Time to take stock of the toolkit: An
overview of relevant automated content analysis approaches and techniques for digital
journalism scholars. Digital Journalism.
60. Beschouw de technieken die ik heb laten zien als een
gereedschapskist waaruit je het meest geschikte werktuig voor jouw
onderzoek moet kiezen.
61. Wie ben ik? Zegen en vloek Welke methoden zijn er? Twee studies Conclusie
Vragen?
d.c.trilling@uva.nl
@damian0604
www.damiantrilling.net
Meer dan sentimentscores Damian Trilling