Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Mariluz Congosto (2019). Social network analysis: una herramienta para desenmascarar falsedades en Twitter

44 views

Published on

Se describen los patrones de comportamiento en el uso y la interacción con las redes sociales (Twitter, en especial), destacó la tendencia actual a consumir y distribuir los mensajes con los que estamos de acuerdo e hizo referencia a los problemas de Twitter derivados de la existencia de prácticas deshonestas (bots, perfiles y seguidores falsos, etc.). Posteriormente, detalló los programas informáticos que utiliza para descargar los datos de Twitter y visualizar las relaciones que existen entre los usuarios y lo acompañó de varios ejemplos que muestran los flujos de mensajes y algunas anomalías que le sirven para detectar los perfiles artificiales.

Published in: Internet
  • Be the first to comment

  • Be the first to like this

Mariluz Congosto (2019). Social network analysis: una herramienta para desenmascarar falsedades en Twitter

  1. 1. Social Network Analysis: una herramienta para desenmascarar falsedades en Twitter Mariluz Congosto (@congosto) 11/04/2019
  2. 2. Los españoles y los mundos virtuales Fuente: CIS, POSTELECTORAL ELECCIONES GENERALES 2016 VARIABLES SOCIODEMOGRÁFICAS http://datos.cis.es/pdf/Es3145sd_A.pdf Sobre el 67,8% que accedió a Internet en los últimos tres meses 91,2 87,7 80 68,3 55,3 46,8 51,9 38 23,3 17,1 15,2 10,6 54,5 29,9 17,3 10,3 7,1 5,10 20 40 60 80 100 18-24 25-34 35-44 45-54 55-64 65 o más Usuarios según edad Facebook Twitter Instagram Ninguna Otras_redes_sociales LinkedIn 11/042019
  3. 3. Entorno de Twitter: Penetración social Fuente: CIS, POSTELECTORAL ELECCIONES GENERALES 2016 VARIABLES SOCIODEMOGRÁFICAS http://datos.cis.es/pdf/Es3145sd_A.pdf Sobre el 67,8% que accedió a Internet en los últimos tres meses 2016 91,2 87,7 80 68,3 55,3 46,851,9 38 23,3 17,1 15,2 10,6 0 10 20 30 40 50 60 70 80 90 100 18-24 25-34 35-44 45-54 55-64 65 o más Usuarios según edad Facebook Twitter 11/042019 26,1%
  4. 4. Twitter vs. Facebook 11/042019
  5. 5. Twitter de lo local a lo global 5 #HT RT TT TV Prensa 11/042019
  6. 6. Entorno de Twitter Los mensajes son públicos Sus usuarios son más sensibles a los temas sociales que en otros medios on-line (Bernal 2013) Es un medio utilizado para la política Es una fuente para conocer la opinión pública (Congosto 2014) 11/042019
  7. 7. PROPAGACIONES 11/042019
  8. 8. Conexiones 11/042019
  9. 9. = cámaras de eco 11/042019
  10. 10. Revelan estructuras internas de partido 10 Panel t-hoarder del 38 congreso del PSOE (2012) 38º congreso del PSOE 11/042019
  11. 11. Cómo participamos en las elecciones 27S-2015 Catalanas http://t-hoarder.com/27S/11/042019
  12. 12. La reacción ante las campañas https://twitter.com/congosto/status/921305942930722816 11/042019
  13. 13. Campañas de mujeres Campaña para denunciar agresiones sexuales #cuéntalo 41,57% 16,93%, 41,50% ? 11/042019
  14. 14. RUIDO EN LA RED 11/042019
  15. 15. Del bot 1.0 al bot 2.0 • Del bot automático que tuiteaba en horario continuo y a ráfagas sin disimular su automatismo, al bot que simula ser una persona (perfiles falsos, cyborgs o Sybils ) • La comercialización de servicios de “perfiles falsos” tras los que hay personas, lo que dificulta su detección. Hay dinero para innovar y mutar 11/042019
  16. 16. El negocio de los falsos perfiles https://www.nytimes.com/interactive/2018/01/27/technology/social-media-bots.html 11/042019
  17. 17. Manipulación 11/042019 Propagación Crispación Trollsbots
  18. 18. No es un fenómeno nuevo 11/042019
  19. 19. Metodología Ferrara 11/042019
  20. 20. Metodología Ferrara 11/042019
  21. 21. Investigaciones 11/042019 https://botometer.iuni.iu.edu/#!/
  22. 22. METODOLOGÍA DE ANÁLISIS 11/042019 1 1. DATOS 3 VISUALIZAR 2 PROCESADO
  23. 23. DATOS Y PROCESADO 11/042019
  24. 24. Máquina Virtual Los datos están compartidos con la máquina anfitrión Contraseña: cambiala https://www.dropbox.com/s/j0p26bmgmct3vll/como_instalar_VM_taller_datos_twitter.pdf?dl=0 11/042019
  25. 25. Entorno de trabajo Webscraping https://github.com/congosto/GetOldTweets-python Carpeta compartida 11/042019
  26. 26. Abrir script y usar opciones La carpeta que hemos creado 11/042019
  27. 27. Entorno de trabajo API https://github.com/congosto/t-hoarder_kit Carpeta compartida 11/042019
  28. 28. Datos de contexto App para acceder -> taller_datos.key Usuario: cada uno el suyo Experimento: directorio donde se dejarán los datos Se introduce al principio y todos las peticiones utilizarán ese contexto 11/042019
  29. 29. Abrir script y usar opciones API 11/042019
  30. 30. Crear un token de usuario para autentificar Copiar Pegar copiar 11/042019
  31. 31. Información de usuarios • Abrir el editor pluma • Escribir la lista de usuarios, uno por línea • Guardarlo en el directorio del experimento • Ponerle al fichero extensión txt 11/042019
  32. 32. Obtener tuits mediante consulta 11/042019
  33. 33. Obtener tuits en tiempo real 11/042019
  34. 34. Obtener relaciones Con teoría de grafos, que modela: • Individuos como nodos • Relaciones como aristas Un grafo es una abstracción que representa una red, donde: • Un conjunto de nodos o vértices está conectado mediante aristas o enlaces 11/042019
  35. 35. Obtener relaciones Relaciones declaradas A BA sigue a B A es seguido por B A y B se siguen mutuamente Relaciones dinámicas A retuitea a B A es retuiteado por B A y B se retuitean mutuamente A B A B A B A B A B 11/042019
  36. 36. Obtener relaciones declaradas 11/042019
  37. 37. Obtener relaciones dinámicas 11/042019
  38. 38. Limitaciones de la API La frecuencia importa: el efecto meseta API streaming http://t-hoarder.com/7DElDebateDecisivo/ #7DEldebateDecisivo API REST 11/042019
  39. 39. Limitaciones El tiempo importa Ahora Streaming API REST API (search) REST API (3500 últimos tuits) Genip Histórico 1 semana 11/042019
  40. 40. VISUALIZACIÓN 11/042019
  41. 41. Herramientas 11/042019
  42. 42. Tableau Public: Timelines y distribución de variables Uso Personalización Orientado a publicación en Web Pero válido para publicaciones estáticas 11/042019
  43. 43. Componentes de Tableau Public 11/042019 Menú Gráfica Tipos De gráficaDatos Ajustes Filtros Similar a las tablas dinámicas de Excel, pero mejor visualización
  44. 44. Funcionamiento de Tableau Public Datos Arrastrar 11/042019
  45. 45. Graficas de Tableau Public Tipos de gráfica Gráfica Seleccionar 11/042019
  46. 46. Personalización de Tableau Public Arrastrar 11/042019
  47. 47. Gephi: análisis de grafos 11/042019 - Calcula los parámetros globales de la red y de los nodos - Permite filtrar nodos o conexiones - Calcula la modularidad (comunidades) - Da forma con distintos layouts - Modela los nodos en tamaño y color según unos atributos - Renderiza el grafo generando salida en pdf, png y svg
  48. 48. Entrada de datos a Gephi 11/042019
  49. 49. Formato gdf nodedef>name VARCHAR,label VARCHAR, Attrb1,VARCHAR, Attb2 VARCHAR… s1,name_node_1, Attrib1, Attrib2,… s2, name_node_2, Attrib1, Attrib2,… s3, name_node_3, Attrib1, Attrib2,… edgedef>node1 VARCHAR,node2 VARCHAR, Attrb1,VARCHAR, Attb2 VARCHAR… s1,s2,attrb1,attrib2,.. s2,s3,attrb1,attrib2 s3,s2,attrb1,attrib2 s3,s1,attrb1,attrib2 11/042019
  50. 50. Interfaz gráfica Apariencia: (tamaño y color) forma Cálculo de red y filtrado Zona de trabajo 11/042019
  51. 51. Abrimos con gephi el grafo 11/042019
  52. 52. Nos muestra los nodos y enlaces que tiene 11/042019
  53. 53. Filtramos la componente Gigante 11/042019 Quitamos nodos no conectados
  54. 54. Calculamos parámetros de red 11/042019 Modularidad, grado con pesos
  55. 55. Damos color por modularidad 11/042019
  56. 56. Damos tamaño por grado de entrada con pesos 11/042019
  57. 57. Damos forma con un algoritmo de pesos 11/042019 Force-Altas, ajustando las fuerzas de atracción y repulsión
  58. 58. Aplicamos “no overlap” 11/042019 Evitar que se solapen los nodos
  59. 59. Ponemos los parámetros de pre- visualización 11/042019 Borde del nodo Poner etiquetas y dimensionar tamaño de letras Poner color de los arcos
  60. 60. Visualizamos el grafo 11/042019
  61. 61. Salvamos los datos de red 11/042019
  62. 62. Salvamos el grafo 11/042019
  63. 63. CASOS DE ESTUDIO 11/042019
  64. 64. Falso perfil @anonymus_ES 11/042019 https://twitter.com/congosto/status/1057694234201837568
  65. 65. Falso perfil @anonymus_ES 11/042019
  66. 66. Falso perfil @duplamaria 11/042019
  67. 67. Falso perfil @duplamaria 11/042019
  68. 68. Falso perfil @duplamaria 11/042019
  69. 69. Falso perfil @duplamaria 11/042019 https://twitter.com/congosto/status/1106589757759520770
  70. 70. El bulo de #CurroDuermeEnCasa 11/042019 https://twitter.com/congosto/status/1077973674618171393
  71. 71. El bulo de #CurroDuermeEnCasa 11/042019
  72. 72. Propagación de un bulo xenófobo 11/042019 https://twitter.com/congosto/status/1075109938421252096
  73. 73. Propagación de un bulo xenófobo 11/042019
  74. 74. Resumen 11/042019 1. Las redes sociales son una fuente imperfecta pero continua de información 2. Podemos estudiar la propagación tanto desde el punto de vista temporal como de red 3. Las relaciones nos definen mejor que los contenidos. Somos endogámicos y difundimos lo que estamos de acuerdo. Con el análisis de red se pueden clasificar a los perfiles con bastante precisión 4. El ruido en Twitter está creciendo y sofisticándose. Esto perturba el estudio de las propagaciones, pero también es posible determinar patrones que lo identifiquen mediante el análisis de red
  75. 75. Gracias por vuestra atención 11/042019 Contacto: http://twitter.com/congosto http://www.linkedin.com/in/congosto Experimentos: Barriblog.com T-hoarder.com http://www.slideshare.net/mlcm https://github.com/congosto

×