Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
Data- ja
informaatioanalytiikka
5.4.2016
Sosiaalisen median analytiikka
TkT Jari Jussila
Big Data transaktioista interaktioihin
WEB
BIG DATA
Lähde: Yli-Pietilä & Backman 2013; Valli & Ahlgren 2013
ERP
CRM
ostoti...
Sentimenttianalyysi
Sentiment Analysis
Sentimenttianalyysi
PositiivinenNeutraaliNegatiivinen
Esimerkki Twitter keskusteluiden
sentimenttianalyysista
Lähde: NEMO Sentiment & Data analyzer
Sentimentti aikajana
esityksenä
Lähde: NEMO Sentiment & Data analyzer
TOP 10 henkilöä viestien
määrän suhteen
Lähde: NEMO Sentiment & Data analyzer
Mitä hyötyä voisi olla
sentimenttianalyysistä?
Viikkoharjoitus 4:
Tee-se-itse sentimenttianalyysi
•  Vaihtoehtoja sentimenttianalyysin tekemiseen
a)  Analytiikkasovelluk...
Sentimenttianalyysi live
demo
Sentiment Analysis in Tableau
using R
Lähde: https://www.youtube.com/watch?v=YkO6IXacK7s
Sentimenttianalyysia
Tableaussa käyttäen R
•  Asenna seuraavat ohjelmistot:
–  R https://www.r-project.org/
–  Rstudio htt...
Ota kirjastot käyttöön ja käynnistä
R palvelu (run.Rserve)
Yhdistä Tableau ja R (Manage R
Connection)
Luo Tableaussa uusi
laskennallinen kenttä
•  SCRIPT_STR('classify_polarity(.arg1,algorith
m="bayes", verbose=TRUE)[,
4]',A...
Verkostoanalyysi
Social Network Analysis (SNA)
Solmut, yhteydet ja verkostot
Tähti
Ympyrä
Ketju
Maksimaalisen keskittynyt,
kaikki solmut jäsentyvät
yhden keskeisen solmu...
18/6
Verkostojen anatomia
Keskeisempiä käsitteitä
liittyen verkostoanalyysiin
19
KESKEISYYS ARVOSTUS
TÄRKEYS
Lähde: Wasserman & Faust 1994
Keskeisyy...
•  Keskeisyysaste (degree)
•  Kertoo, kuinka monta suoraa yhteyttä toimijalla on muihin
toimijoihin
•  Jos verkostoaineist...
•  Ideana on, että toimija on keskeinen jos se kykenee
nopeasti vuorovaikutukseen muiden kanssa
•  Läheisyys (closeness) o...
•  Välillisyys (betweenness) mittaa, kuinka monen
toimijaparin välisen lyhyimmän polun varrelle toimija
sijoittuu
•  Jos p...
Viikkoharjoitus 3:
Tee-se-itse Twitter verkostoanalyysi
– markkinoinnin näkökulmasta
•  Asenna seuraavat ohjelmistot
– Ana...
Hyödynnetään #ohsiha
oppeja ja työkaluja
Ohjelmallinen sisällönhallinta 2016
Lähde: http://iislab.ee.tut.fi/piiri/groups/ohjelmallinen-sisällönhallinta-2016
Valitse itselle/ryhmälle
mieleinen firma/organisaatio
Muokkaa Python koodia
Spyderillä ja aja se
Avaa gexf (Graph Exchange
XML Format) tiedosto Gephillä
Laske verkostometriikat ja
visualisoi verkosto
Kiitokset
•  Jukka Huhtamäki @jnkka #ohsiha
•  Harri Jalonen @Jalonen #nemohanke
•  Jayesh Gupta @jyshgupta
Upcoming SlideShare
Loading in …5
×

Sosiaalisen median analytiikka

1,511 views

Published on

Sosiaalisen median analytiikka. Osa data- ja informaatioanalytiikka 2016 kurssin toteutusta.

Published in: Education

Sosiaalisen median analytiikka

  1. 1. Data- ja informaatioanalytiikka 5.4.2016 Sosiaalisen median analytiikka TkT Jari Jussila
  2. 2. Big Data transaktioista interaktioihin WEB BIG DATA Lähde: Yli-Pietilä & Backman 2013; Valli & Ahlgren 2013 ERP CRM ostotiedot maksutiedot segmentointi tarjoustiedot asiakaskohtaamiset tukikontaktit weblogit tarjoushistoria A/B testaaminen Dynaaminen hinnoittelu Hakukonemarkkinointi ja optimointi Mainosverkostot Käyttäytymispohjainen kohdentaminen Dynaamiset funnellit Ulkopuolinen demografia Kuvat ja videot Puheen muuttaminen tekstiksi Feedit Anturi/sensoridata Tuote / palvelu logit SMS/MMS Käyttäjien luoma sisältö Mobiilidata Klikkivirran analyysi Sijaintidata Sosiaaliset verkostot Sosiaalinen mediaSentimentti
  3. 3. Sentimenttianalyysi Sentiment Analysis
  4. 4. Sentimenttianalyysi PositiivinenNeutraaliNegatiivinen
  5. 5. Esimerkki Twitter keskusteluiden sentimenttianalyysista Lähde: NEMO Sentiment & Data analyzer
  6. 6. Sentimentti aikajana esityksenä Lähde: NEMO Sentiment & Data analyzer
  7. 7. TOP 10 henkilöä viestien määrän suhteen Lähde: NEMO Sentiment & Data analyzer
  8. 8. Mitä hyötyä voisi olla sentimenttianalyysistä?
  9. 9. Viikkoharjoitus 4: Tee-se-itse sentimenttianalyysi •  Vaihtoehtoja sentimenttianalyysin tekemiseen a)  Analytiikkasovellukset (advanced analytics) •  SAS® Text Miner http://www.sas.com/en_us/software/analytics/text-miner.html •  SPSS Text Analytics for Surveys http://www-03.ibm.com/software/products/fi/spss-text-analytics-surveys •  RapidMiner https://rapidminer.com/solutions/sentiment-analysis/ b)  Sosiaalisen median analytiikkasovellukset •  Hootsuite https://hootsuite.com/products/insights •  Meltwater http://www.meltwater.com/fi/ •  … c)  Sentimenttianalyysisovellukset •  NEMO Sentiment & Data analyzer http://seda.cloudapp.net/ •  SentiStrenght http://sentistrength.wlv.ac.uk/ •  … d)  Ohjelmalliset lähestymistavat •  R Sentiment package https://cran.r-project.org/src/contrib/Archive/sentiment/ •  Python NLTK-trainer http://nltk-trainer.readthedocs.org/en/latest/ •  … 9/6
  10. 10. Sentimenttianalyysi live demo
  11. 11. Sentiment Analysis in Tableau using R Lähde: https://www.youtube.com/watch?v=YkO6IXacK7s
  12. 12. Sentimenttianalyysia Tableaussa käyttäen R •  Asenna seuraavat ohjelmistot: –  R https://www.r-project.org/ –  Rstudio https://www.rstudio.com/ •  ja tarvittavat R-kirjastot –  TM, NLP ja Rserve –  Rstem https://cran.r-project.org/src/contrib/Archive/Rstem/ –  Sentiment https://cran.r-project.org/src/contrib/Archive/ sentiment/
  13. 13. Ota kirjastot käyttöön ja käynnistä R palvelu (run.Rserve)
  14. 14. Yhdistä Tableau ja R (Manage R Connection)
  15. 15. Luo Tableaussa uusi laskennallinen kenttä •  SCRIPT_STR('classify_polarity(.arg1,algorith m="bayes", verbose=TRUE)[, 4]',ATTR([Text])) Lähde: https://boraberan.wordpress.com/2013/12/24/sentiment-analysis-in-tableau-with-r/
  16. 16. Verkostoanalyysi Social Network Analysis (SNA)
  17. 17. Solmut, yhteydet ja verkostot Tähti Ympyrä Ketju Maksimaalisen keskittynyt, kaikki solmut jäsentyvät yhden keskeisen solmun ympärille Keskittyneisyys äärimmäisen vähäinen, solmut kytkeytyvät toisiinsa ilman, että yksikään solmu olisi keskeisempi kuin toinen Löyhempi kuin tähti, mutta keskittyneempi kuin ympyrä 0 1 1 1 1 1 1 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 1 1 0 1 0 0 0 0 0 1 0 1 0 0 0 0 0 0 1 0 1 0 0 0 0 0 1 0 1 1 0 0 0 0 1 0 0 1 1 0 0 0 0 1 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 1 0 0
  18. 18. 18/6 Verkostojen anatomia
  19. 19. Keskeisempiä käsitteitä liittyen verkostoanalyysiin 19 KESKEISYYS ARVOSTUS TÄRKEYS Lähde: Wasserman & Faust 1994 Keskeisyysaste Läheisyys Degree Prestige Proximity Prestige Välillisyys Informaation keskeisyys Status or Rank Prestige
  20. 20. •  Keskeisyysaste (degree) •  Kertoo, kuinka monta suoraa yhteyttä toimijalla on muihin toimijoihin •  Jos verkostoaineisto on suunnattu, voidaan laskea erikseen lähettäjäkeskeisyys (outdegree) ja vastaanottajakeskeisyys (indegree) •  Keskeisyysastetta läheinen indeksi on ego tiheys (ego density) (Burt 1982, Knoke & Kuklinski 1982). Ego tiheys on suhdeluku toimijan suorista yhteyksistä kaikkiin mahdollisiin yhteyksiin suuntaamattomissa verkostoissa. 20 Keskeisyysaste (asteluku) Lähde: Wasserman & Faust 1994
  21. 21. •  Ideana on, että toimija on keskeinen jos se kykenee nopeasti vuorovaikutukseen muiden kanssa •  Läheisyys (closeness) on toimijan lyhyimpien polkujen summa kaikkiin verkoston muihin toimijoihin •  dij on lyhyimmän polun pituus i:n ja j:n välillä •  Huomaa tulkinnassa, että pieni arvo tarkoittaa keskeistä pistettä ∑= = n ij iji dc Läheisyys Lähde: Wasserman & Faust 1994
  22. 22. •  Välillisyys (betweenness) mittaa, kuinka monen toimijaparin välisen lyhyimmän polun varrelle toimija sijoittuu •  Jos piste sijaitsee useiden muiden pisteiden välillä, se pystyy säätelemään esim. tiedon kulkua näiden välillä (portinvartijat) •  Piste voi olla (lokaalisti) hyvin epäkeskeinen, mutta sen välillisyys voi silti olla hyvin suuri 22 Välillisyys Lähde: Wasserman & Faust 1994
  23. 23. Viikkoharjoitus 3: Tee-se-itse Twitter verkostoanalyysi – markkinoinnin näkökulmasta •  Asenna seuraavat ohjelmistot – Anaconda Python 2.7 https://www.continuum.io/downloads – Gephi https://gephi.org/ •  Kerää data – Tätä varten tarvii luoda Twitter sovellus (App) https://apps.twitter.com/ – Nouda twiitit käyttäen seuraavaa skriptiä https://github.com/jukkahuhtamaki/pcm-demo/ tree/master/twitter-api
  24. 24. Hyödynnetään #ohsiha oppeja ja työkaluja
  25. 25. Ohjelmallinen sisällönhallinta 2016 Lähde: http://iislab.ee.tut.fi/piiri/groups/ohjelmallinen-sisällönhallinta-2016
  26. 26. Valitse itselle/ryhmälle mieleinen firma/organisaatio
  27. 27. Muokkaa Python koodia Spyderillä ja aja se
  28. 28. Avaa gexf (Graph Exchange XML Format) tiedosto Gephillä
  29. 29. Laske verkostometriikat ja visualisoi verkosto
  30. 30. Kiitokset •  Jukka Huhtamäki @jnkka #ohsiha •  Harri Jalonen @Jalonen #nemohanke •  Jayesh Gupta @jyshgupta

×