SlideShare a Scribd company logo
1 of 27
Download to read offline
Universālas metodes
     Twitter datu analīzei


Autors: Matīss Rikters
Vadītājs: Dr. dat. Uldis Bojārs
Darba mērķis
• Izpētīt, kā tiek analizēti un kā vēl varētu
  analizēt Twitter ziņu datus
• Atrastās metodes apkopot un pielietot
  universāla Twitter datu analīzes rīka
  izstrādē
Problēmas apraksts
• Twitter ir vērtīgs datu avots
• Nav viegli pieejama un ērti lietojama veida,
  kā reālā laikā vākt un analizēt tvītus
Sociālais tīmeklis
Twitter

 Viens no populārākajiem sociālajiem tīkliem

                                                   Plašas API iespējas



Mikroblogošanas tīkls


                                               Milzīgs skaits lietotāju un satura


      Īsas, koncentrētas ziņas
Darba uzdevumi
• Salīdzināt esošos Twitter analīzes rīkus
• Izstrādāt pilotprojektu
• Apkopot atrastās un izdomātās metodes
  Twitter ziņu apstrādei
• Izstrādāt universālu Twitter datu
  analīzes rīku
Twitter datu analīzes rīku
             salīdzinājums
•   Cena
•   Vide
•   Vai ir atvērtā pirmkoda risinājums
•   Vai ievāc reālā laika datus
•   Vai ir iespēja eksportēt datus
•   Analīzes metodes
•   Tipiskais pielietojums
•   Priekšrocības
•   Trūkumi
Twitter datu analīzes rīki
The Archivist
Kritērijs                      Vērtība
Cena                           Bezmaksas
Vide                           Pieejama gan tīmekļa programmas versija, gan Windows versija.

Atvērtā pirmkoda risinājums    Nē

Spēja vākt reālā laika datus   Nē

Iespēja eksportēt datus        Jā (tikai Windows versijā)
Analīzes metodes                   Windows versijā grafiski attēlo ziņu skaitu laika gaitā un aktīvākos lietotājus.
                                   Tīmekļa versijā ziņas izanalizē plašāk, tajā skaitā arī nedaudz no paša ziņas teksta.
                                   Arhīvu iespējams saglabāt kā XML vai teksta failu.



Tipiskais pielietojums         Statistikas izpēte
Priekšrocības                      Dažu sekunžu laikā uzkrāj un izanalizē pēdējā laika tvītus par ievadītajiem
                                    atslēgvārdiem.
                                   Attēlo rezultātus sešos (tīmekļa versijā) vai divos (Windows versijā) pārskatāmos
                                    grafikos.

Trūkumi                            Windows versijā attēlo ļoti maz rezultātus.
                                   Tīmekļa versija analizē samērā maz no ziņas teksta – tikai populārākos vārdus.
                                    Windows versija vispār neanalizē pašu tekstu.
The Archivist
Row Feeder
Kritērijs                      Vērtība
Cena                           Pamata versija pieejama bez maksas, PRO versija - sākot no $35 mēnesī.

Vide                           Tīmekļa programmatūra
Atvērtā pirmkoda risinājums    Nē

Spēja vākt reālā laika datus   Jā

Iespēja eksportēt datus        Jā

Analīzes metodes                   Tvītu skaita laika gaitā attēlošana.
                                   Sarunu analīze starp tvītotjiem.
                                   Atrašanās vietas analīze.
                                   Vairāku atslēgvārdu salīdzināšana.
                                   Ietekmes analīze (ar datiem no Klout)
Tipiskais pielietojums         Statistikas izpēte / Biznesa izpēte

Priekšrocības                      Piedāvā atskaites saglabāt kā Excel dokumentus.
                                   Bezmaksas ievācamo tvītu skaitu iespējams papildināt, piesaistot citus
                                    lietotājus.
Trūkumi                            Bezmaksas versijā ļauj ievākt tikai 500 ziņas mēnesī un tikai pēc viena
                                    atslēgvārda.
                                   Atskaites pieejamas tikai Excel dokumentu formā un nekā citādi.
Row Feeder
Pilotprojekts
TwitĒdiens - www.twitediens.tk
TwitĒdiens
Twitter ziņu apstrādes process
• Datu vākšana
• Datu priekšapstrāde
• Twitter ziņas analīze
Datu vākšana
• Twitter API
  – Streaming API
  – Search API
  – Rest API
Datu priekšapstrāde
•   Teksta attīrīšana
•   Morfoloģiskā analīze
•   Tokenizācija
•   Twitter ziņas temata noteikšana
Twitter ziņas analīze
•   Metadati
•   Vārdi un kolokācijas
•   Atslēgvārdu efektivitāte
•   Emotikoni
Universāls Twitter datu analīzes rīks

GitHub – http://ej.uz/riks-github
Testēšanai – www.twitediens.tk/tool
Universāls Twitter datu analīzes rīks
                              Datu vākšana

           Ar Streaming API          Datu bāzes ielāde no faila


                          Datu priekšapstrāde
                            Teksta attīrīšana

                          Teksta tokenizācija



                               Datu analīze
         Atrašanās vietas                       Pieminētie lietotāji

                                     WWW saites

                      Birkas
                                                  Kalendārs
             Statistika
        Emotikoni                        TOP lietotāji
Universāls Twitter datu analīzes rīks
Universāls Twitter datu analīzes rīks
Kritērijs                      Vērtība
Cena                           Bezmaksas
Vide                           Tīmekļa programmatūra
Atvērtā pirmkoda risinājums    Jā

Spēja vākt reālā laika datus   Jā

Analīzes metodes                   Attēlo tvītu skaita izmaiņu laika gaitā
Tipiskais pielietojums         Statistikas izpēte / Biznesa izpēte
Priekšrocības                      Piedāvā eksportēt ievāktos datus uz .csv
                                    dokumentu.
                                   Piedāvā diezgan plašu skatījumu uz datiem.


Trūkumi                            Pie milzīgiem datu apjomiem patērē daudz
                                    servera resursu.
Secinājumi
• Sasniegts darba sākumā izvirzītais mērķis
• Apskatīts sociālais tīmeklis un izpētīts
  sociālais tīkls Twitter
• Apgūtas Twitter datu analīzes iespējas,
  salīdzinot dažādus rīkus un izstrādājot
  pilotprojektu
• Izveidots universāls Twitter datu
  analīzes rīks
Paldies par uzmanību!
        Tvītojiet daudz, lai ir ko analizēt ;)




www.twitediens.tk           http://ej.uz/riks-github
TweetReach
Kritērijs                      Vērtība
Cena                           Pamata versija pieejama bez maksas, PRO versija sākot no $84 mēnesī

Vide                           Tīmekļa programmatūra
Atvērtā pirmkoda risinājums    Nē

Spēja vākt reālā laika datus   Jā (PRO versijā)

Iespēja eksportēt datus        Jā

Analīzes metodes                   Uzskaita iespējamo ziņas ekspozīciju skaitu, kā arī lietotājus ar lielāko
                                    ietekmi par tēmu, visvairāk pārpublicētās ziņas
                                   Attēlo tvītu skaita izmaiņu laika gaitā
Tipiskais pielietojums         Statistikas izpēte / Biznesa izpēte

Priekšrocības                      Piedāvā atskaites saglabāt kā Excel vai PDF dokumentus.
                                   Par nelielu samaksu piedāvā arī bezmaksas (ne PRO) lietotājiem
                                    saglabāt pilna izmēra atskaiti – līdz 1500 ziņām.

Trūkumi                            Bezmaksas versijā apskata tikai 50 jaunākās ziņas.
                                   Lai vāktu reālā laika datus, arī jāmaksā.
ThinkUp
Kritērijs                      Vērtība
Cena                           Bezmaksas
Vide                           Tīmekļa programmatūra
Atvērtā pirmkoda risinājums    Jā

Spēja vākt reālā laika datus   Nē
Iespēja eksportēt datus        Jā
Analīzes metodes                   Analizē lietotāja aktivitāti sociālajos tīklos un attēlo to
                                    grafikos.
                                   Spēj attēlot citu lietotāju atbildes uz ziņām kartē.
                                   Ļauj meklēt tvītos un eksportēt tos kā .csv failu.
Tipiskais pielietojums         Personīgā konta pārskats
Priekšrocības                      Sākuma skatā jeb darbvirsmā (Dashboard) ērti pārskatāmas
                                    svarīgākās pēdējā laika aktivitātes.
                                   Spēj analizēt ne vien Twitter, bet arī Facebook un Google+.
Trūkumi                            Analizē tikai autentificētā lietotāja datus.
                                   Twitter ziņas tekstu sīkāk neanalizē, vienīgi atpazīst, kuras
IBM BigSheets
Kritērijs                      Vērtība
Cena                           Pamata versija pieejama bez maksas
Vide                           Tīmekļa programmatūra (nepieciešama vai nu Red Hat Enterprise Linux vai
                               SUSE Linux Enterprise Server servera operētājsistēma)

Atvērtā pirmkoda risinājums    Nē

Spēja vākt reālā laika datus   Jā

Iespēja eksportēt datus        Jā

Analīzes metodes                   Piedāvā pievienot spraudņus, kas spēj analizēt valodu, tajā skaitā –
                                    sentimentu.
                                   Kopā ar IBM Many Eyes vai kādu citu spraudni izveido datiem dažādas
                                    vizualizācijas, kā, piemēram, birku mākoni.
Tipiskais pielietojums         Biznesa izpēte

Priekšrocības                      Kopā ar spraudņiem ļoti plašas un spēcīgas iespējas.
                                   Spēj tikt galā ar ļoti lieliem datu daudzumiem.
                                   Spēj ložņāt arī pa tīmekļa lapām vai ielādēt analizējamos datus no datora.

Trūkumi                            Diezgan sarežģīti uzstādīt.
                                   Samērā neērta lietošana - ar datiem jādarbojas kā ar izklājlapām.

More Related Content

Similar to Universālas metodes twitter datu analīzei

Interneta un sociālo mediju iespējas mūsdienīgam mācību procesam
Interneta un sociālo mediju  iespējas mūsdienīgam mācību procesam Interneta un sociālo mediju  iespējas mūsdienīgam mācību procesam
Interneta un sociālo mediju iespējas mūsdienīgam mācību procesam Nākotnesskola.lv
 
Mājas lapas analītika, rentabilitāte un jaunākajām konversijas tendences - Mā...
Mājas lapas analītika, rentabilitāte un jaunākajām konversijas tendences - Mā...Mājas lapas analītika, rentabilitāte un jaunākajām konversijas tendences - Mā...
Mājas lapas analītika, rentabilitāte un jaunākajām konversijas tendences - Mā...Interneta Mārketinga Asociācija
 
Atvērtā pirmkoda programmatūra mazos un vidējos uzņēmumos
Atvērtā pirmkoda programmatūra mazos un vidējos uzņēmumosAtvērtā pirmkoda programmatūra mazos un vidējos uzņēmumos
Atvērtā pirmkoda programmatūra mazos un vidējos uzņēmumosOzols Grupa, Ltd
 
Agile lu-01.03.2011 linda-vituma-public
Agile lu-01.03.2011 linda-vituma-publicAgile lu-01.03.2011 linda-vituma-public
Agile lu-01.03.2011 linda-vituma-publicLinda Vituma
 
LETA digitalizācijas pakalpojumi
LETA digitalizācijas pakalpojumiLETA digitalizācijas pakalpojumi
LETA digitalizācijas pakalpojumiAgency_LETA
 
Programmatūras un aparatūras platformas prototips mašīntulkošanas integrēšana...
Programmatūras un aparatūras platformas prototips mašīntulkošanas integrēšana...Programmatūras un aparatūras platformas prototips mašīntulkošanas integrēšana...
Programmatūras un aparatūras platformas prototips mašīntulkošanas integrēšana...Ekonomikas ministrija
 
ACTO 12_06_2012
ACTO 12_06_2012ACTO 12_06_2012
ACTO 12_06_2012ebuc
 
CaaS Industry Day 2016
CaaS Industry Day 2016CaaS Industry Day 2016
CaaS Industry Day 2016Jānis Grabis
 
Web Science - 1. lekcija
Web Science - 1. lekcijaWeb Science - 1. lekcija
Web Science - 1. lekcijaUldis Bojars
 
Windows 8
Windows 8Windows 8
Windows 8ebuc
 
CaaS Industry Day 2016
CaaS Industry Day 2016CaaS Industry Day 2016
CaaS Industry Day 2016Jānis Grabis
 
IT infrastruktūras & licenču risinājumi skolām
IT infrastruktūras & licenču risinājumi skolāmIT infrastruktūras & licenču risinājumi skolām
IT infrastruktūras & licenču risinājumi skolāmebuc
 
Web Science 29.09.2011
Web Science 29.09.2011Web Science 29.09.2011
Web Science 29.09.2011Uldis Bojars
 
Office 365 priekšrocības
Office 365 priekšrocībasOffice 365 priekšrocības
Office 365 priekšrocībasElvaBaltic
 
BA_27.02.2013_Bootsrap
BA_27.02.2013_BootsrapBA_27.02.2013_Bootsrap
BA_27.02.2013_BootsrapKsenija Lāce
 
Programmatūras licencēšana. Iespējas un izaicinājumi. SIA DPA
Programmatūras licencēšana. Iespējas un izaicinājumi. SIA DPAProgrammatūras licencēšana. Iespējas un izaicinājumi. SIA DPA
Programmatūras licencēšana. Iespējas un izaicinājumi. SIA DPAebuc
 

Similar to Universālas metodes twitter datu analīzei (20)

Interneta un sociālo mediju iespējas mūsdienīgam mācību procesam
Interneta un sociālo mediju  iespējas mūsdienīgam mācību procesam Interneta un sociālo mediju  iespējas mūsdienīgam mācību procesam
Interneta un sociālo mediju iespējas mūsdienīgam mācību procesam
 
Mājas lapas analītika, rentabilitāte un jaunākajām konversijas tendences - Mā...
Mājas lapas analītika, rentabilitāte un jaunākajām konversijas tendences - Mā...Mājas lapas analītika, rentabilitāte un jaunākajām konversijas tendences - Mā...
Mājas lapas analītika, rentabilitāte un jaunākajām konversijas tendences - Mā...
 
Atvērtā pirmkoda programmatūra mazos un vidējos uzņēmumos
Atvērtā pirmkoda programmatūra mazos un vidējos uzņēmumosAtvērtā pirmkoda programmatūra mazos un vidējos uzņēmumos
Atvērtā pirmkoda programmatūra mazos un vidējos uzņēmumos
 
Agile lu-01.03.2011 linda-vituma-public
Agile lu-01.03.2011 linda-vituma-publicAgile lu-01.03.2011 linda-vituma-public
Agile lu-01.03.2011 linda-vituma-public
 
LETA digitalizācijas pakalpojumi
LETA digitalizācijas pakalpojumiLETA digitalizācijas pakalpojumi
LETA digitalizācijas pakalpojumi
 
Digitālo prasmju apmācību iespējas 1. vebinārs
Digitālo prasmju apmācību iespējas 1. vebinārsDigitālo prasmju apmācību iespējas 1. vebinārs
Digitālo prasmju apmācību iespējas 1. vebinārs
 
Programmatūras un aparatūras platformas prototips mašīntulkošanas integrēšana...
Programmatūras un aparatūras platformas prototips mašīntulkošanas integrēšana...Programmatūras un aparatūras platformas prototips mašīntulkošanas integrēšana...
Programmatūras un aparatūras platformas prototips mašīntulkošanas integrēšana...
 
Universālas metodes twitter datu analīzei
Universālas metodes twitter datu analīzeiUniversālas metodes twitter datu analīzei
Universālas metodes twitter datu analīzei
 
ACTO 12_06_2012
ACTO 12_06_2012ACTO 12_06_2012
ACTO 12_06_2012
 
CaaS Industry Day 2016
CaaS Industry Day 2016CaaS Industry Day 2016
CaaS Industry Day 2016
 
Netwrix auditor
Netwrix auditorNetwrix auditor
Netwrix auditor
 
Web Science - 1. lekcija
Web Science - 1. lekcijaWeb Science - 1. lekcija
Web Science - 1. lekcija
 
Office 365
Office 365Office 365
Office 365
 
Windows 8
Windows 8Windows 8
Windows 8
 
CaaS Industry Day 2016
CaaS Industry Day 2016CaaS Industry Day 2016
CaaS Industry Day 2016
 
IT infrastruktūras & licenču risinājumi skolām
IT infrastruktūras & licenču risinājumi skolāmIT infrastruktūras & licenču risinājumi skolām
IT infrastruktūras & licenču risinājumi skolām
 
Web Science 29.09.2011
Web Science 29.09.2011Web Science 29.09.2011
Web Science 29.09.2011
 
Office 365 priekšrocības
Office 365 priekšrocībasOffice 365 priekšrocības
Office 365 priekšrocības
 
BA_27.02.2013_Bootsrap
BA_27.02.2013_BootsrapBA_27.02.2013_Bootsrap
BA_27.02.2013_Bootsrap
 
Programmatūras licencēšana. Iespējas un izaicinājumi. SIA DPA
Programmatūras licencēšana. Iespējas un izaicinājumi. SIA DPAProgrammatūras licencēšana. Iespējas un izaicinājumi. SIA DPA
Programmatūras licencēšana. Iespējas un izaicinājumi. SIA DPA
 

More from Matīss ‎‎‎‎‎‎‎  

Hybrid Machine Translation by Combining Multiple Machine Translation Systems
Hybrid Machine Translation by Combining Multiple Machine Translation SystemsHybrid Machine Translation by Combining Multiple Machine Translation Systems
Hybrid Machine Translation by Combining Multiple Machine Translation SystemsMatīss ‎‎‎‎‎‎‎  
 
Effective online learning implementation for statistical machine translation
Effective online learning implementation for statistical machine translationEffective online learning implementation for statistical machine translation
Effective online learning implementation for statistical machine translationMatīss ‎‎‎‎‎‎‎  
 
Hybrid machine translation by combining multiple machine translation systems
Hybrid machine translation by combining multiple machine translation systemsHybrid machine translation by combining multiple machine translation systems
Hybrid machine translation by combining multiple machine translation systemsMatīss ‎‎‎‎‎‎‎  
 

More from Matīss ‎‎‎‎‎‎‎   (20)

日本のお風呂
日本のお風呂日本のお風呂
日本のお風呂
 
Thrifty Food Tweets on a Rainy Day
Thrifty Food Tweets on a Rainy DayThrifty Food Tweets on a Rainy Day
Thrifty Food Tweets on a Rainy Day
 
私の趣味
私の趣味私の趣味
私の趣味
 
How Masterly Are People at Playing with Their Vocabulary?
How Masterly Are People at Playing with Their Vocabulary?How Masterly Are People at Playing with Their Vocabulary?
How Masterly Are People at Playing with Their Vocabulary?
 
私の町リガ
私の町リガ私の町リガ
私の町リガ
 
大学への交通手段
大学への交通手段大学への交通手段
大学への交通手段
 
小学生に 携帯電話
小学生に 携帯電話小学生に 携帯電話
小学生に 携帯電話
 
Tracing multisensory food experience on twitter
Tracing multisensory food experience on twitterTracing multisensory food experience on twitter
Tracing multisensory food experience on twitter
 
ラトビア大学
ラトビア大学ラトビア大学
ラトビア大学
 
私の趣味
私の趣味私の趣味
私の趣味
 
富士山りょこう
富士山りょこう富士山りょこう
富士山りょこう
 
Tips and Tools for NMT
Tips and Tools for NMTTips and Tools for NMT
Tips and Tools for NMT
 
Hybrid Machine Translation by Combining Multiple Machine Translation Systems
Hybrid Machine Translation by Combining Multiple Machine Translation SystemsHybrid Machine Translation by Combining Multiple Machine Translation Systems
Hybrid Machine Translation by Combining Multiple Machine Translation Systems
 
The Impact of Corpora Qulality on Neural Machine Translation
The Impact of Corpora Qulality on Neural Machine TranslationThe Impact of Corpora Qulality on Neural Machine Translation
The Impact of Corpora Qulality on Neural Machine Translation
 
Advancing Estonian Machine Translation
Advancing Estonian Machine TranslationAdvancing Estonian Machine Translation
Advancing Estonian Machine Translation
 
Debugging neural machine translations
Debugging neural machine translationsDebugging neural machine translations
Debugging neural machine translations
 
Effective online learning implementation for statistical machine translation
Effective online learning implementation for statistical machine translationEffective online learning implementation for statistical machine translation
Effective online learning implementation for statistical machine translation
 
Neirontulkojumu atkļūdošana
Neirontulkojumu atkļūdošanaNeirontulkojumu atkļūdošana
Neirontulkojumu atkļūdošana
 
Hybrid machine translation by combining multiple machine translation systems
Hybrid machine translation by combining multiple machine translation systemsHybrid machine translation by combining multiple machine translation systems
Hybrid machine translation by combining multiple machine translation systems
 
Paying attention to MWEs in NMT
Paying attention to MWEs in NMTPaying attention to MWEs in NMT
Paying attention to MWEs in NMT
 

Universālas metodes twitter datu analīzei

  • 1. Universālas metodes Twitter datu analīzei Autors: Matīss Rikters Vadītājs: Dr. dat. Uldis Bojārs
  • 2. Darba mērķis • Izpētīt, kā tiek analizēti un kā vēl varētu analizēt Twitter ziņu datus • Atrastās metodes apkopot un pielietot universāla Twitter datu analīzes rīka izstrādē
  • 3. Problēmas apraksts • Twitter ir vērtīgs datu avots • Nav viegli pieejama un ērti lietojama veida, kā reālā laikā vākt un analizēt tvītus
  • 5. Twitter Viens no populārākajiem sociālajiem tīkliem Plašas API iespējas Mikroblogošanas tīkls Milzīgs skaits lietotāju un satura Īsas, koncentrētas ziņas
  • 6. Darba uzdevumi • Salīdzināt esošos Twitter analīzes rīkus • Izstrādāt pilotprojektu • Apkopot atrastās un izdomātās metodes Twitter ziņu apstrādei • Izstrādāt universālu Twitter datu analīzes rīku
  • 7. Twitter datu analīzes rīku salīdzinājums • Cena • Vide • Vai ir atvērtā pirmkoda risinājums • Vai ievāc reālā laika datus • Vai ir iespēja eksportēt datus • Analīzes metodes • Tipiskais pielietojums • Priekšrocības • Trūkumi
  • 9. The Archivist Kritērijs Vērtība Cena Bezmaksas Vide Pieejama gan tīmekļa programmas versija, gan Windows versija. Atvērtā pirmkoda risinājums Nē Spēja vākt reālā laika datus Nē Iespēja eksportēt datus Jā (tikai Windows versijā) Analīzes metodes  Windows versijā grafiski attēlo ziņu skaitu laika gaitā un aktīvākos lietotājus.  Tīmekļa versijā ziņas izanalizē plašāk, tajā skaitā arī nedaudz no paša ziņas teksta.  Arhīvu iespējams saglabāt kā XML vai teksta failu. Tipiskais pielietojums Statistikas izpēte Priekšrocības  Dažu sekunžu laikā uzkrāj un izanalizē pēdējā laika tvītus par ievadītajiem atslēgvārdiem.  Attēlo rezultātus sešos (tīmekļa versijā) vai divos (Windows versijā) pārskatāmos grafikos. Trūkumi  Windows versijā attēlo ļoti maz rezultātus.  Tīmekļa versija analizē samērā maz no ziņas teksta – tikai populārākos vārdus. Windows versija vispār neanalizē pašu tekstu.
  • 11. Row Feeder Kritērijs Vērtība Cena Pamata versija pieejama bez maksas, PRO versija - sākot no $35 mēnesī. Vide Tīmekļa programmatūra Atvērtā pirmkoda risinājums Nē Spēja vākt reālā laika datus Jā Iespēja eksportēt datus Jā Analīzes metodes  Tvītu skaita laika gaitā attēlošana.  Sarunu analīze starp tvītotjiem.  Atrašanās vietas analīze.  Vairāku atslēgvārdu salīdzināšana.  Ietekmes analīze (ar datiem no Klout) Tipiskais pielietojums Statistikas izpēte / Biznesa izpēte Priekšrocības  Piedāvā atskaites saglabāt kā Excel dokumentus.  Bezmaksas ievācamo tvītu skaitu iespējams papildināt, piesaistot citus lietotājus. Trūkumi  Bezmaksas versijā ļauj ievākt tikai 500 ziņas mēnesī un tikai pēc viena atslēgvārda.  Atskaites pieejamas tikai Excel dokumentu formā un nekā citādi.
  • 15. Twitter ziņu apstrādes process • Datu vākšana • Datu priekšapstrāde • Twitter ziņas analīze
  • 16. Datu vākšana • Twitter API – Streaming API – Search API – Rest API
  • 17. Datu priekšapstrāde • Teksta attīrīšana • Morfoloģiskā analīze • Tokenizācija • Twitter ziņas temata noteikšana
  • 18. Twitter ziņas analīze • Metadati • Vārdi un kolokācijas • Atslēgvārdu efektivitāte • Emotikoni
  • 19. Universāls Twitter datu analīzes rīks GitHub – http://ej.uz/riks-github Testēšanai – www.twitediens.tk/tool
  • 20. Universāls Twitter datu analīzes rīks Datu vākšana Ar Streaming API Datu bāzes ielāde no faila Datu priekšapstrāde Teksta attīrīšana Teksta tokenizācija Datu analīze Atrašanās vietas Pieminētie lietotāji WWW saites Birkas Kalendārs Statistika Emotikoni TOP lietotāji
  • 21. Universāls Twitter datu analīzes rīks
  • 22. Universāls Twitter datu analīzes rīks Kritērijs Vērtība Cena Bezmaksas Vide Tīmekļa programmatūra Atvērtā pirmkoda risinājums Jā Spēja vākt reālā laika datus Jā Analīzes metodes  Attēlo tvītu skaita izmaiņu laika gaitā Tipiskais pielietojums Statistikas izpēte / Biznesa izpēte Priekšrocības  Piedāvā eksportēt ievāktos datus uz .csv dokumentu.  Piedāvā diezgan plašu skatījumu uz datiem. Trūkumi  Pie milzīgiem datu apjomiem patērē daudz servera resursu.
  • 23. Secinājumi • Sasniegts darba sākumā izvirzītais mērķis • Apskatīts sociālais tīmeklis un izpētīts sociālais tīkls Twitter • Apgūtas Twitter datu analīzes iespējas, salīdzinot dažādus rīkus un izstrādājot pilotprojektu • Izveidots universāls Twitter datu analīzes rīks
  • 24. Paldies par uzmanību! Tvītojiet daudz, lai ir ko analizēt ;) www.twitediens.tk http://ej.uz/riks-github
  • 25. TweetReach Kritērijs Vērtība Cena Pamata versija pieejama bez maksas, PRO versija sākot no $84 mēnesī Vide Tīmekļa programmatūra Atvērtā pirmkoda risinājums Nē Spēja vākt reālā laika datus Jā (PRO versijā) Iespēja eksportēt datus Jā Analīzes metodes  Uzskaita iespējamo ziņas ekspozīciju skaitu, kā arī lietotājus ar lielāko ietekmi par tēmu, visvairāk pārpublicētās ziņas  Attēlo tvītu skaita izmaiņu laika gaitā Tipiskais pielietojums Statistikas izpēte / Biznesa izpēte Priekšrocības  Piedāvā atskaites saglabāt kā Excel vai PDF dokumentus.  Par nelielu samaksu piedāvā arī bezmaksas (ne PRO) lietotājiem saglabāt pilna izmēra atskaiti – līdz 1500 ziņām. Trūkumi  Bezmaksas versijā apskata tikai 50 jaunākās ziņas.  Lai vāktu reālā laika datus, arī jāmaksā.
  • 26. ThinkUp Kritērijs Vērtība Cena Bezmaksas Vide Tīmekļa programmatūra Atvērtā pirmkoda risinājums Jā Spēja vākt reālā laika datus Nē Iespēja eksportēt datus Jā Analīzes metodes  Analizē lietotāja aktivitāti sociālajos tīklos un attēlo to grafikos.  Spēj attēlot citu lietotāju atbildes uz ziņām kartē.  Ļauj meklēt tvītos un eksportēt tos kā .csv failu. Tipiskais pielietojums Personīgā konta pārskats Priekšrocības  Sākuma skatā jeb darbvirsmā (Dashboard) ērti pārskatāmas svarīgākās pēdējā laika aktivitātes.  Spēj analizēt ne vien Twitter, bet arī Facebook un Google+. Trūkumi  Analizē tikai autentificētā lietotāja datus.  Twitter ziņas tekstu sīkāk neanalizē, vienīgi atpazīst, kuras
  • 27. IBM BigSheets Kritērijs Vērtība Cena Pamata versija pieejama bez maksas Vide Tīmekļa programmatūra (nepieciešama vai nu Red Hat Enterprise Linux vai SUSE Linux Enterprise Server servera operētājsistēma) Atvērtā pirmkoda risinājums Nē Spēja vākt reālā laika datus Jā Iespēja eksportēt datus Jā Analīzes metodes  Piedāvā pievienot spraudņus, kas spēj analizēt valodu, tajā skaitā – sentimentu.  Kopā ar IBM Many Eyes vai kādu citu spraudni izveido datiem dažādas vizualizācijas, kā, piemēram, birku mākoni. Tipiskais pielietojums Biznesa izpēte Priekšrocības  Kopā ar spraudņiem ļoti plašas un spēcīgas iespējas.  Spēj tikt galā ar ļoti lieliem datu daudzumiem.  Spēj ložņāt arī pa tīmekļa lapām vai ielādēt analizējamos datus no datora. Trūkumi  Diezgan sarežģīti uzstādīt.  Samērā neērta lietošana - ar datiem jādarbojas kā ar izklājlapām.