Your SlideShare is downloading. ×
  • Like
¿El tamaño importa? Medir e investigar en la blogosfera
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×

Now you can save presentations on your phone or tablet

Available for both IPhone and Android

Text the download link to your phone

Standard text messaging rates apply

¿El tamaño importa? Medir e investigar en la blogosfera

  • 2,389 views
Published

Algunos temas sobre los que me gustaría trabajar o hemos trabajado

Algunos temas sobre los que me gustaría trabajar o hemos trabajado

Published in Technology
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
No Downloads

Views

Total Views
2,389
On SlideShare
0
From Embeds
0
Number of Embeds
1

Actions

Shares
Downloads
69
Comments
0
Likes
2

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. ¿El tama˜o importa? Medir e investigar en la n blogosfera F. Tricas (Depto Inform´tica e Ing. de Sistemas, U. Zaragoza) a Juan J. Merelo ( U. Granada, Spain) V´ ıctor R. Ruiz, (Blogalia y +) 9 de mayo de 2007
  • 2. Agenda Algunas definiciones Trabajos interesantes ¿Qu´ sabemos hacer? e Conclusiones, futuro
  • 3. Sobre los hombros de gigantes Beatriz Prieto, Alberto Prieto, Gustavo Romero-L´pez, Pedro o Castillo Valdivieso (U. Granada) Jose L. Orihuela (U. Navarra) Guillermo L´pez (U. Valencia) o Jos´ Carpio Ca˜adas (U. Huelva) e n
  • 4. ¿A qui´n le interesa? e HP Information Dynamics Lab http://www.hpl.hp.com/research/idl/results.html Microsoft. Social Computing Group http://research.microsoft.com/scg/ Google. Hypertext and the Web http://labs.google.com/papers.html IBM. http://www.almaden.ibm.com/cs/projects/web/
  • 5. ¿Qu´ es una bit´cora (o blog, o weblog)? e a
  • 6. ¿Por qu´? e Compartir conocimiento, informaci´n o Opinar, diarios personales Relaciones p´blicas u ‘Periodismo’ Notas, pensamientos, ideas, ... Literatura Pol´ ıtica B´squeda de almas gemelas u Porque si
  • 7. Algunas herramientas interesantes RSS (y otros...) Buscadores espec´ ıficos Edici´n extremadamente simple o Incluso API’s espec´ ıficas Trackback
  • 8. La blogosfera hispana ¡Algo complejo! Muchos pa´ ıses Varias lenguas (4 oficiales, y adem´s en otros, claro ingl´s, a e franc´s, holand´s, ...) e e tambi´n biling¨es y triling¨es e u u Por si acaso ... http://oreneta.com/baldie/blog ¡Podemos discutirlo!
  • 9. Tools Blog´metro (http://blogometro.blogalia.com/) o A crawler, each day a ranking of fresh links Open source, written in Python, PostgresSQL http://sourceforge.net/projects/blogometro Data from November, 15, 2002 Some purging
  • 10. N´mero de bit´coras en sitios populares u a Alojamiento Blog´metro o Estimaci´n o Publicado msn.com 65493 300000 2000000(+) blogia.com 31178 34277 (*) ya.com 19807 500000 n.d. diariogratis.com 6052 90000 n.d. blogspot.com 5940 90000 n.d. acelblog.com 4481 4600 (*) bitacoras.com 3215 50000 32800 (*) zonalibre.org 2419 n.d. lamevaweb.info 1702 n.d. barrapunto.com 1571 1633 (*) zoomblog.com 1271 4000 (*) barcelonablogs.com 1271 n.d. lacoctelera.com 1148 8000(+) Principio de 2006 El tama˜o de la blogosfera: medidas y herramientas. n Fernando Tricas, Juan Juli´n Merelo-Guerv´s, V´ a o ıctor R. Ruiz
  • 11. Din´mica de la informaci´n a o Din´mica a Blog Epidemic Analyzer (inter´s sostenido, ascenso-pico-descenso, e ‘efecto’ Slashdot, otros sitios caida lenta). http://www.hpl.hp.com/research/idl/projects/blogs/
  • 12. ¿Tenemos algo en com´n? u http://anjo.blogs.com/metis/2004/10/sigmund on the 2.html
  • 13. ¿Tenemos algo en com´n? (II) u Tercer debate: Kerry: minimum wage (8 mentions), health insurance (6 mentions), and social security (6 mentions) Bush: my opponent (7), four years (6), and best way (5) http://overstated.net/04/10/14-the-final-presidential-debate
  • 14. Information diffusion Chibi (verde, pico), Microsoft (azul, charla y picos), Alzheimer (rojo, charla) http://theory.csail.mit.edu/∼dln/papers/blogs/idib.pdf Information Difussion Through Blogspace Daniel Gruhl, R. Guba, David Liben-Novell, Andrew Tomkins
  • 15. Information diffusion (II) Microsoft (tratando de quitar los picos) http://theory.csail.mit.edu/∼dln/papers/blogs/idib.pdf
  • 16. Con herramientas externas http://blogpulse.com/trend
  • 17. Con herramientas externas http://technorati.com/
  • 18. Algunos intentos . . . http://fernand0.blogalia.com/historias/12671
  • 19. Podemos buscar cosas http://lavidadelosmemes.bloxus.com/historias/1048
  • 20. Hay gente buscando . . . http://www.hpl.hp.com/research/idl/people/eytan/moblog/ Usage Patterns for Cameraphone Driven Moblogs Eytan Adar (Mayo 2004)
  • 21. Medir influencia http://fernand0.blogalia.com/historias/12049
  • 22. Un d´ da para mucho ıa Primero, el enlace a la historia de Arcadi Espada. http://www.arcadi.espasa.com/000287.html D´ 1 ıa eCuaderno v.2.0: 11S y 11M http://www.ecuaderno.com/archives/000400.php Barcepundit http://barcepundit.blogspot.com/2004/09/un-da-da-para-mucho.html Mangas Verdes Morbicidad y arrepentimiento http://www.proyectoisla.com/mangasverdes/index.php?p=186
  • 23. Un d´ da para mucho (II) ıa D´ 2 ıa http://www.escolar.net/ http://www.sdelavega.tk/ Elastico.net: Anuncios sin palabras http://www.elastico.net/archives/001294.html http://www.diariodeunjabali.com/ Isopixel http://www.isopixel.net/archives/001982.html Sonia Blanco http://www.filmica.com/sonia blanco/archivos/ 000657.html Puedoprometeryprometo.com http://www.puedoprometeryprometo.com/2004 09 01 archivo.html#109536146956858137
  • 24. Un d´ da para mucho (III) ıa D´ 2 (cont.) ıa Anotaciones de un periodista raro: El Pa´ pide perd´n por una campa˜a ıs o n de publicidad y los gur´s hacen el rid´ u ıculo http://gbareno.blogspot.com/2004/09/el-pas-pide-perdn-por-una-campaa-de.html http://www.abordaje.net/ As´ no son las cosas: Fuera de control ı http://asinosonlascosas.blogspot.com/2004/09/fuera-de-control.html ...
  • 25. Qu´ pasaba en internet? e Visitas
  • 26. Qu´ pasaba en internet? e Enlaces
  • 27. Qu´ pasaba en internet? e Enlaces desde la blogosfera Medios digitales, transmisi´n de informaci´n y formaci´n del espacio p´blico: o o o u comunicaci´n de masas y comunicaci´n en red ante el 11M o o Garc´ ıa. Guillermo L´pez Garc´ Juan Juli´n Merelo Guerv´s, Fernando Tricas o ıa, a o
  • 28. Pero . . . http://www.plasticbag.org/archives/2003/05/discussion and citation in the blogosphere.shtml
  • 29. O sea, esto http://www-idl.hpl.hp.com/blogstuff/ http://www.blogpulse.com/showcase.html
  • 30. Memespread project http://www.arbesman.net/meme.php
  • 31. Adem´s . . . a http://hammeroftruth.com/2004/03/08/how-news-travels-on-the-internet/
  • 32. Y en el desarrollo de programas? Algunas ideas Personas M´dulos o Bibliotecas Trozos de c´digo (‘snippets’) o Seguridad!
  • 33. Implantaci´n o http://www.openssh.com/usage/graphs.html
  • 34. Y en el desarrollo de programas? R Ferenc, I Siket, T Gyim´thy. ‘Extracting facts from Open Source o Software’ LCOM (Lack of Cohesion on Methods): n´mero de parejas de u funciones miembro sin variables compartidas, menos el n´mero u de parejas de funciones miembro con variables compartidas. Hip´tesis: Clases con poca cohesi´n sugieren dise˜o o o n inapropiado. R Ferenc, I Siket, T Gyim´thy. ‘Extracting facts from Open Source o Software’ CBO (Coupling Between Object classes): una clase est´ acoplada a otra si usa sus funciones y o variables. a Hip´tesis: Clases muy acopladas son mas propensas a los o fallos
  • 35. Comunidades
  • 36. Comunidades
  • 37. Comunidades http://www.cibersociedad.net/congres2004/grups/fitxacom publica2.php?grup=43&id=625&idioma=es Visualizaci´n de la evoluci´n de una red social generada por weblogs o o Juan Juli´n Merelo / Fernando Tricas Garc´ / Beatriz Prieto a ıa
  • 38. Me interesa . . . ? Word based systems (Google, Yahoo, Altavista, . . . ) don’t work well because of lack of semantics and speed. Specialized tools (Technorati, PubSub, BlogPulse, . . . ) solve the speed problem, but not the others (tags can help) Link based tools help but not every people links to the same sites, even being interested in the same things.
  • 39. We had some data. . . First Spanish webloggers and blog readers poll. (‘I Encuesta a webloggers y lectores de blogs’ http://tintachina.com/archivo/cat i encuesta webloggers.php) Gemma Ferreres, Antonio Cambronero Self–administered May, 31, June, 18 2004 1662 replied (1125 bloggers, 537 readers) Some interesting findings Questions about blog reading
  • 40. We had some data. . . First Spanish webloggers and blog readers poll. (‘I Encuesta a webloggers y lectores de blogs’ http://tintachina.com/archivo/cat i encuesta webloggers.php) Gemma Ferreres, Antonio Cambronero Self–administered May, 31, June, 18 2004 1662 replied (1125 bloggers, 537 readers) Some interesting findings Questions about blog reading There was a second edition, 2005 (almost doubled participation)
  • 41. Data mining to the rescue Process of extraction of knowledge from huge amounts of data [DataMining, Concepts and Techniques] In this case, extraction of association rules: Recommendation of weblogs from sets of weblogs read by users.
  • 42. Association rules I Composed of: Antecedent → Consecuent CD Burner → Blank CDs
  • 43. Association rules I Composed of: Antecedent → Consecuent CD Burner → Blank CDs A Priori algorithm. Developed by Agrawal to analyze user purchase intentions in supermarkets (market basket analysis). From a database of supermarket baskets, or ‘itemsets’, a set of association rules that predict purchase patterns can be extracted If you buy a computer, you’ll want a subscription to a computer mag(other did it before you)
  • 44. Some work . . . Data cleaning (noise, inconsistent data, . . . ) Data integration (combination of several sources) Data selection (more relevant ones) Data transformation (adequate format) Data minig (pattern extraction) Pattern evaluation (Obtaining the interesting rules) Knowledge representation
  • 45. Consejo
  • 46. Conclusiones Queremos medir la propagaci´n de la informaci´n o o ¿Qu´ es interesante? e ¿Por d´nde viaja? o Y la ‘materia oscura’ Con dibujos, m´s bonito a Y mas cosas . . .
  • 47. Conclusiones Queremos medir la propagaci´n de la informaci´n o o ¿Qu´ es interesante? e ¿Por d´nde viaja? o Y la ‘materia oscura’ Con dibujos, m´s bonito a Y mas cosas . . . Pero . . . No todo el mundo est´ en internet a Y no todos los que est´n participan a
  • 48. El futuro Mejorar la ara˜a n Difundir los resultados Rellenar los ‘huecos’ Otras medidas (palabras, frases, ...) Otros mundos ...
  • 49. Por si acaso ... Tenemos... Ancho de banda Ideas Entusiasmo Necesitamos... Memoria, hw M´s ideas a Gente ¡Gracias!