4. 10 años de Web 2.0
• 1999 Blogger
• 2000 Explota la burbuja .com, phpBB
• 2001 Wikipedia, Chris Anderson relanza Wired
• 2003 MySpace, Google compra Blogger
• 2004 Primera conferencia Web 2.0, Gmail,
Facebook
• 2005 Artículo de Tim O’Reilly, Google Maps,
Digg, YouTube, Ubuntu,Yahoo compra Flickr y Delicious
• 2006 Google Reader, Google compra YouTube
• 2007 Twitter, FriendFeed, iPhone
• 2008 Cloud computing, Google Chrome, Google Friend Connect
• 2009 Google Wave
4
5. Principios web 2.0
• La web como plataforma
• Los usuarios añaden valor
• El poder de los enlaces
• Servicios, no productos
• Experiencias de usuario ricas
• Aficionados vs. profesionales
What is Web 2.0 (Tim O’Reilly, 2005)
5
6. Lego Mindstorms
• Nace en 1998 (RIS)
• Producto especializado: Lego
Technics, ladrillo NXT, sensores,
lenguaje de programación visual
• Nuevo impulso a partir de 2006:
Mindstorms NTX y NTX 2.0
(2009)
6
7. Prosumers
Comunidades de aficionados
en Internet
• Otros lenguajes: Java, C, C++, ...
• Fotos, vídeos, blogs
• Instrucciones para construir robots
• Tiendas, libros
Lego apoya la comunidad
• Páginas oficiales: NXTLog
• Permite el hacking del ladrillo y
sensores
• Comienza a permitir sensores y
actuadores de terceras partes
The NXT Step 7
8. Prosumers
Comunidades de aficionados
en Internet
• Otros lenguajes: Java, C, C++, ...
• Fotos, vídeos, blogs
• Instrucciones para construir robots
• Tiendas, libros
Lego apoya la comunidad
• Páginas oficiales: NXTLog
• Permite el hacking del ladrillo y
sensores
• Comienza a permitir sensores y
actuadores de terceras partes
The NXT Step 7
9. Aficionados vs. profesionales
“Tenemos numerosos ejemplos que demuestran que los
aficionados pueden sobrepasar a los profesionales, cuando
tienen el sistema adecuado que canalice sus
esfuerzos. La Wikipedia es el más famoso.”
Paul Graham, Web 2.0, noviembre 2005
8
11. ¿Inteligencia Colectiva?
• Inteligencia - Palabra de ‘marketing’ bastante gastada
• Colectiva - En el sentido de las redes sociales y de los
prosumers, donde los individuos generan contenidos y los
comparten
• Inteligencia Colectiva se usa a veces como nuevo término para
indicar un paso más allá de la Web 2.0
• Crowdsourcing, wisdom of crowds, peer production
10
15. Google Trends
• 2004: Center for Collective Intelligence
en el MIT, Libro ‘The wisdom of crowds’
• 2006 Libro de T. Segaran ‘Programming
Collective Intelligence’
• 2008 Libro de S. Alag ‘Collective
Intelligence in Action’
14
16. ¿Campo de investigación?
• Campo muy disperso e inmaduro
• Distintas temáticas
• Equipos de robots,
swarm intelligence
• Sociología, construcción
colaborativa de opinones, gobernabilidad de grupos
• Psicología
• Política
• ...
15
17. Y sin embargo existe
YouTube Dipity Delicious Mozilla
Google News
Rating iTunes Menéame Partigi
Google Search Digg Wikipedia
Rating Amazon Jinni
Reddit Linux
Twitter Search
GoodReads
Whatthetrend Debian
Tweetmygaming Flickr
16
18. Pero no aparece espontáneamente
• Si proporcionamos una herramienta colaborativa a un grupo
para que interactúen, normalmente tenemos un fracaso
• Ejemplo: proyectos fallidos de uso de wikis educativas
• El modelo de innovación colaborativo sólo tiene éxito
cuando está diseñado a una tarea precisa y cuando podemos
atraer con algún incentivo a los colaboradores más efectivos
The crowd is wise (when it’s focused), NY Times, julio 2009
17
19. Enfoque práctico de la IC
• Los sistemas que usan la IC son aquellos en los que los
usuarios crean valor: a mayor número de usuarios, mejor
funciona el sistema
• ¿Qué elementos son los que mejoran la coordinación de los
usuarios?
• Principios, patrones y prácticas
C. Crumlish, Designing Social Interfaces, Ed. O’Reilly, 2009
18
20. Algunos principios
• Principios estadísticos
• El estimador menos sesgado es la media
• Principios metodológicos
• Nada está terminado
• Principios sociales
• Visión común
• Transparencia
• Principios tecnológicos
• Ítems referenciable
• APIs
19
21. El experimento del bote de caramelos
• ¿Cuántos caramelos hay en el
bote?
• Ejemplo de un problema de
decisión
• Se dice que la mejor solución es
la media de las respuestas de los
individuos del grupo
• La probabilidad de acertar es
mejor si elegimos esta media que
si escogemos la respuesta de
algún individuo del grupo
20
25. Principios metodológicos
• Nada está terminado
• Seguro que va a haber que hacer cambios en el servicio:
definir un proceso de desarrollo que gestione ese cambio
• Ejemplo: Google Book Catalog
Ed Felten, Finding and Fixing Errors in
Google’s Book Catalogue, Sept. 2009
24
26. Principios sociales
• Visión común
• La comunidad define unos objetivos consensuados
• O, al menos, tiene claro en qué dirección moverse y si se
mejora o se empeora el producto
• Ejemplo: Wikipedia, Linux
• Transparencia
• Las actuaciones son transparentes y la comunidad aprende
de ello
• Facilita el consenso y la toma de decisiones
25
27. La importancia de las URLs
• Los enlaces son la base de
Google y del PageRank
• Lo que está oculto no puede
formar parte de la
conversación
26
28. APIs y mashups
• Los datos son tan importantes como las URLs
• La web como una plataforma programable
• APIs de los servicios: Twitter, Google Maps, Delicious
• Es posible añadir valor y proporcionar nuevos servicios
• Ejemplo: Whatthetrend
27
30. Historia
• Jimmy Wales fundó Nupedia en marzo de
2000, como una enciclopedia gratuita editada
por expertos contratados y pagados
• Junto con Larry Sanger constituyeron la
Wikipedia alrededor de este primer grupo en
enero de 2001
• El primer año terminó con 20.000 artículos y
18 idiomas
• Fork en 2002: Enciclopedia Libre Universal en
Español
29
31. Evolución de artículos y usuarios
• Crecimiento exponencial
• más contenido lleva a más tráfico
• lo que lleva a más ediciones
• lo que lleva a más tráfico
• Modelo logístico
• un máximo en el número de artículos
• al final el crecimiento es cero
• en el momento central, el crecimiento es máximo (agosto de 2006
con 60.000 artículos nuevos al mes)
[Modeling Wikipedia’s Growth] 30
32. Evolución de artículos y usuarios
• Crecimiento exponencial
• más contenido lleva a más tráfico
• lo que lleva a más ediciones
• lo que lleva a más tráfico
• Modelo logístico
• un máximo en el número de artículos
• al final el crecimiento es cero
• en el momento central, el crecimiento es máximo (agosto de 2006
con 60.000 artículos nuevos al mes)
[Modeling Wikipedia’s Growth] 30
33. Evolución de artículos y usuarios
• Crecimiento exponencial
• más contenido lleva a más tráfico
• lo que lleva a más ediciones
• lo que lleva a más tráfico
• Modelo logístico
• un máximo en el número de artículos
• al final el crecimiento es cero
• en el momento central, el crecimiento es máximo (agosto de 2006
con 60.000 artículos nuevos al mes)
[Modeling Wikipedia’s Growth] 30
34. Evolución de artículos y usuarios
• Crecimiento exponencial
• más contenido lleva a más tráfico
• lo que lleva a más ediciones
• lo que lleva a más tráfico
• Modelo logístico
• un máximo en el número de artículos
• al final el crecimiento es cero
• en el momento central, el crecimiento es máximo (agosto de 2006
con 60.000 artículos nuevos al mes)
[Modeling Wikipedia’s Growth] 30
35. El trabajo del 5%
Long Tail of user parcipation in Wikipedia
31
36. Tipos de usuario
Permisos Características
Tipo Usuario
en.wikipedia es.wikipedia
Editar artículos (excepto protegidos),
Anónimo marcar borrado
Pueden crear artículos
Crear artículos, editar artículos semi-
Autoconfirmado protegidos, votar en ciertas elecciones
Igual que inglés
Administrador Elegidos por la comunidad, acceso a
Igual que inglés
(Bibliotecario) herramientas, borrar artículos, bloqueos
Eliminar permisos de administrador, Todos los administradores son
Burócrata bloqueos, revocar y aprobar ‘bots’ burócratas (votación: 41/16)
Comisión de resolución Arbitrar en los conflictos entre los
No existe (votación: 48/10)
de conflictos bibliotecarios
[Tipos de usuarios] 32
37. Políticas de la Wikipedia
• En su origen
• Punto de vista neutral
• Verificabilidad
• No investigación original
• Hoy: 28 políticas oficiales y 35 semi-políticas
• Resumen en “los cinco pilares”
• Wikipedia es una enciclopedia
• Wikipedia tiene un punto de vista neutral
• El contenido de la Wikipedia es libre y gratuito
• Wikipedia tiene un código de conducta
• No hay normas firmes en la Wikipedia
[WP:P] [Categoría:Wikipedia:Políticas]
33
38. Política de borrado
• El borrado de artículos siempre es fuente de debate
• Colección de reglas que lo justifican: “la Wikipedia NO es”
• Borrado rápido: procedimiento sencillo {{destruir|motivo}}.
Cualquiera puede hacerlo y un bibliotecario lo confirma.
• Propuesta de borrado: etiqueta cuya permanecia después de 7
días determina el borrado del artículo {{subst:Propb|
motivo}}
• Borrado mediante argumentación: procedimiento complejo que
obliga a actualizar dos o tres páginas y abre una consulta de
14 días a la comunidad. Cualquiera puede solicitarlo
(incluyendo usuarios anónimos).
[WP:PB] [WP:NOES]
34
39. Demo
• Vamos a hacer una demostración rápida de la política de
borrado
• Intentamos crear un artículo en la wikipedia inglesa y en la
española
• Miramos las listas de cambios recientes:
• Nuevas páginas
• Páginas a borrar
35
40. La Wikipedia NO es
• La Wikipedia no es un diccionario
• La Wikipedia no es un medio de publicación de ideas originales
• La Wikipedia no es una tribuna (soapbox)
• La Wikipedia no es un repositorio de enlaces, imágenes o
películas
• La Wikipedia no es un blog, ni un proveedor de espacio en web,
ni una red social, ni un sitio para memoriales
• La Wikipedia no es un manual, un libro de texto o una revista
científica
• La Wikipedia no es una colección indiscriminada de información
36
41. Coordinación y colaboración
• Toda la comunicación se basa en páginas específicas de la Wiki y en
un sistema de alertas sobre páginas. Algunas páginas de interés:
• Café de la wikipedia
• Tablón de anuncios de los bibliotecarios
• Votaciones
• Páginas especiales
• Vandalismo en curso
• Sistema que hace complicada la comunicación entre usuarios
Cada wikipedista cuenta con una página de discusión en la que puede recibir mensajes de otros
wikipedistas. Si alguien te deja un mensaje en tu página de discusión, verás que en la parte
superior de cada página te aparecerá un recuadro que dice: «Tienes nuevos mensajes», con un
enlace hacia tu página de discusión. Puedes responder de dos maneras. Una es escribir tu
mensaje en la página de discusión de la persona a la que estás respondiendo. La otra forma es
escribir la respuesta en tu propia página de discusión, debajo de su comentario (usando los dos
puntos a modo de sangría). Las dos son comunes en Wikipedia; pero, recuerda que si respondes
en tu propia página de discusión, al otro usuario no le aparecerá la nota de mensajes nuevos y
quizás no lea tu respuesta.
37
42. MediaWiki
• Software que da soporte a la Wikipedia
• Open source, cualquiera puede
instalarlo en un servidor
• Linux, Web Server, PHP + MySQL
• Extensiones, skins
• Muchas otras plataformas de Wikis; MediaWiki es de las más
antiguas (2003)
38
43. Aplicación a la Wikipedia
• Problema principal: ¿cómo hacer que los cambios sean
aprobados por la comunidad?
• Método clásico: la comunidad vigila con las herramientas que
le da Wikimedia
• ¿Nuevo método?
"The new feature, long advocated by the site's founder Jimmy Wales,
eliminates [that restriction of blocking pages] by allowing anyone to
edit these pages, even without logging in.The secret to being able to do
this is that the new feature creates a queue where tens of thousands
of longtime users of the site can approve these changes - changes that
were previously completely forbidden."
Jimmy Wales (Haffington Post, Sept 2009)
39
45. Historia
• Movimiento hacker (1980)
• Linus Torvalds escribe en 1991 el núcleo de
un sistema Unix libre que llama Linux . Se
basa en la idea de Minix, y con la aspiración
de ser el núcleo del proyecto GNU (creado
en 1984 por Richard Stallman),
• En octubre de 1991 Linus pone el código
fuente a disposición de la comunidad
• Entre 2001 y 2004, tras 15 versiones de
desarrollo, se lanza la versión 1.0 de Linux
• Hoy contribuyen al proyecto desarrolladores
de más de 20 compañías, incluyendo Google,
Oracle, Intel e IBM
41
46. Historia
• Movimiento hacker (1980)
• Linus Torvalds escribe en 1991 el núcleo de
un sistema Unix libre que llama Linux . Se
basa en la idea de Minix, y con la aspiración
de ser el núcleo del proyecto GNU (creado
en 1984 por Richard Stallman),
• En octubre de 1991 Linus pone el código
fuente a disposición de la comunidad
• Entre 2001 y 2004, tras 15 versiones de
desarrollo, se lanza la versión 1.0 de Linux
• Hoy contribuyen al proyecto desarrolladores
de más de 20 compañías, incluyendo Google,
Oracle, Intel e IBM
41
47. Historia
• Movimiento hacker (1980)
• Linus Torvalds escribe en 1991 el núcleo de
un sistema Unix libre que llama Linux . Se
basa en la idea de Minix, y con la aspiración
de ser el núcleo del proyecto GNU (creado
en 1984 por Richard Stallman),
• En octubre de 1991 Linus pone el código
fuente a disposición de la comunidad
• Entre 2001 y 2004, tras 15 versiones de
desarrollo, se lanza la versión 1.0 de Linux
• Hoy contribuyen al proyecto desarrolladores
de más de 20 compañías, incluyendo Google,
Oracle, Intel e IBM
41
54. Patches y control de versiones
• Patch: propuesta de cambio introducido en un determinado
fichero (líneas a borrar, a añadir y a modificar)
• El funcionamiento se basa en los comandos diff y patch de
Unix (Demo)
• Hasta 2002, el control de versiones era manual, basándose
en scripts.
• En 2002 se comenzó a utilizar un sistema propietario,
BitKepper. En 2005, Linus Torvalds desarrolló el sistema Git,
que es el que se utiliza actualmente.
44
56. Ejemplo de cambio firmado
http://www.kernel.org/pub/linux/kernel/v2.6/
46
57. Versiones
• Versión estable y versión desarrollo
• Cada cambio introducido puede
introducir nuevos errores, que deben
ser pulidos, de ahí la idea de las dos
ramas. La rama ‘estable’ no incorpora
nuevas funcionalidades, sólo patches que
arreglan errores.Versión 2.4: estable,
versión 2.5: desarrollo.
• Cambia en 2.6
• Distintas ramas de desarrollo
• Nuevo release cada 2/3 meses
47
58. Características comunes Open Source y
Wikipedia
• Un dictador benevolente, el creador del proyecto
• Un conjunto de usuarios avanzados o fundadores que
determinan el ethos del projecto
• Comunidad abierta a nuevos usuarios
• Colaboración distribuida geográficamente, asíncrona y en red
• Transparencia en las decisiones
• Colaboración, mejora iterativa de las políticas, creación de
consensos
• Mecanismos para la historia institucional
• Sistema político híbrido basado en la meritocracia
Analysis of open source principles in diverse
collaborative communities (First Monday, Jun 2006)
48
60. Aplicaciones AA
• La disciplina del aprendizaje automático (machine learning) ha
desarrallo una gran cantidad de teorías, técnicas y algoritmos
de enorme utilidad
• Ejemplos de problemas:
• Clasificación supervisada y no supervisada
• Clustering
• Optimización de funciones
• Vecino más cercano
50
61. Selección de información
• Infinitas fuentes que producen noticias, información, noticias,
comentarios, ...
• Un problema perfecto para la inteligencia colectiva: usuarios-
recolectores y usuarios-consumidores de información
www.lamejornaranja.com
51
62. Sitios de promoción de ideas
• Solución 1 (centralizada): los recolectores cuelgan las ideas (o
noticias, o URLs) en un sitio y los consumidores consensuan
las más interesantes para la comunidad
• Ejemplos: meneame, reddit, digg, slashdot
• Enfoques:
• Limitar el número de votos por usuario: UserVoice,
Kindling
• Asignar una importancia o relevancia a ciertos
consumidores en base a algún algoritmo especial; sus votos
cuentan más que el resto
52
63. Centradas en la identidad
• Solución 2 (distribuida): los recolectores se identifican y algún
servicio permite que los consumidores seleccionen qué
recolectores les interesan
• Ejemplo: Twitter, delicious, blogger
• Un mismo usuario tiene el papel de consumidor y recolector
• Las relaciones son públicas,
creándose una compleja red de
conexiones que puede ser
estudiada con algoritmos
avanzados de grafos
53
64. Representación y métrica
• Para utilizar las técnicas del AA es necesario representar los
datos como puntos en un espacio n-dimensional
• Métrica: distancia entre dos puntos del espacio
• Ejemplo: ¿Cómo de parecidos son dos textos?
• Dimensiones: palabras
• Coordenada en cada dimensión:
número de veces que aparece
cada palabra en el texto
54
65. Ejemplo
“Marte” “Cohete” “Programación” “Java” “Perdidos”
Post 1 5 2 0 0 1
Post 2 0 0 3 4 0
Post 3 0 0 4 1 3
...
55
67. Grafos
• La naturaleza referencial de la web
permite construir grafos de enlaces
• Algoritmos y técnicas basadas en
grafos
• PageRank
• Caminos aleatorios
• Análisis espectral
• Para encontrar
• Páginas con más autoridad
• Anuncios relacionados con
búsquedas
• Clusters de páginas relacionadas
57
68. Nuevas herramientas
• Nuevas herramientas proporcionan nuevos datos
• Twitter: frases, hora del día en la que se dice la frase
Jeff Clark, Temporal Correlation for Words in Tweets
58
69. La web semántica
• La idea de la web semántica es simple en
teoría, aunque muy complicada en la
práctica: unir un conjunto de tecnologías
con las que sea posible enlazar distintos
recursos web y conceptos,
interconectando la información y los
datos de la forma en que HTML y HTTP
lo ha hecho en Internet.
• Tim Berners-Lee: “Linked Data is the
Semantic Web done right”
• Tecnologías: XML, Resource Description
Framework (RDF), SPARQL
59
71. Dos modelos
• Hemos revisado dos modelos de inteligencia colectiva:
colaborativa y automática
• Modelos complementarios
• Distintas técnicas y métodos en cada uno de ellos
• Conjunto de principios comunes
• Transparencia
• Referencia
• Apertura
61
72. El futuro de la IC
El futuro social
• Educar en los principios de participación, colaboración y transparencia
• El fenómeno de la larga cola y la especialización será cada vez más relevante
El futuro tecnológico
• HTML5 y GoogleWave van a suponer una revolución
• Se introducirán técnicas y métodos avanzados de filtrado se introducirán en
proyectos como la Wikipedia
El futuro científico
• Cada vez más información disponible en tiempo real (blogs, twitters, tags,
imágenes, ...) y cada vez más enlazada
• Un enorme data set para que se prueben los distintos enfoques y técnicas
de machine learning
62
73. Referencias
Phoebe Ayers, Charles Matthews & Ben Yates, “How Wikipedia Works”, No Startch Press,
2008
Jill Coffin: “Analysis of open source principles in diverse collaborative communities”, First
Monday, vol 11, n. 6, June 2006
John Corbet: “How to participate in the Linux Community”, The Linux Foundation
Developer Network
Andrew Lih, “The Wikipedia revolution”, Hyperion, 2009
Tim O’Reilly: “What is Web 2.0”
Toby Segaran: Programming Collective Intelligence, O'Reilly, 2007
Toby Segaran, y otros : Programming the Semantic Web, O’Reilly, 2009
Don Tappscott & Anthony Williams : “Wikinomics: how mass collaboration changes
everything”, Portfolio, 2006
Varios autores, Critical Perspectives on Web 2.0, First Monday, March 2008
63