1) O documento discute métodos de coleta de dados em redes sociais, incluindo conceitos teóricos sobre análise de redes e sistemas midiáticos híbridos.
2) São apresentadas ferramentas como Facepager e Graph API do Facebook que podem ser usadas para coletar dados relacionais em plataformas de mídia social.
3) O texto discute técnicas de amostragem em métodos digitais como amostras por atores, por grafos e manualmente, e fornece etapas para mapeamento
2. COLETA DE
nas mídias sociais
instrutor
•Doutorando pelo PPGCOM/UFF;
• Estuda comunicação política em rede;
• Sócio-diretor da Vértice Inteligência;
• Pesquisador do laboratório de mídia e democracia
(LAMIDE/UFF), orientado por Afonso de Albuquerque;
• Publica textos no blog www.marceloalves.org
3. N = 532 fan-pages
A = 8.654 arestas
Rede antipetista na
eleição de 2014
4.
5.
6.
7. COLETA DE
nas mídias sociais
c
Quais objetos ou
temas de
pesquisa dos
alunos para
coleta de dados?
8. COLETA DE
nas mídias sociais
O que você vai aprender
•O básico da concepção teórica da análise de redes;
• Processos de coletas de dados relacionais;
• Leitura da documentação da Graph API do Facebook
• Métodos de construções de queries;
• Funcionamento e prática com Facepager;
• Extrair dados das pesquisas dos alunos;
• Tratamento e manipulação de dados relacionais;
• Importar dados no Gephi.
10. COLETA DE
nas mídias sociais
Lógicasdacomunicaçãopolíticaemmassaeemrede-KlingereSvensson(2014)
11. COLETA DE
nas mídias sociais
Lógicasdacomunicaçãopolíticaemmassaeemrede-KlingereSvensson(2014)
• Lógicas de rede não estão tomando o lugar da lógica de
massa;
• As plataformas de mídias sociais seguem outras regras do
jogo;
• A mídia de massa e o conteúdo jornalístico continuam sendo
uma das principais fontes de informação;
• As duas lógicas não são estáticas, mas estão em evolução
12. COLETA DE
nas mídias sociais
Sistemasmidiáticoshíbridos–Chadwick(2013)
• “O sistema midiático híbrido é baseado em conflito e cooperaçãoentre lógicas novas e antigas; mas
também possui considerável grau de interdependênciaentre estas lógicas” (Chadwick, 2013, p. 207)
• Convergência midiática – ambos os sistemas estão entrelaçados
• Partidos, imprensa e movimentos sociais tradicionais estão se adaptando às lógicas de rede
“Conteúdo nas plataformas de mídias sociais nem sempre é gerado pelo usuário, mas frequentemente
envolve referências aos meios de massa. A mídia tradicional também busca aprender distribuições
virais como uma base de um novo modelo de negócios. Usuários de mídia diversificaram suas dietas
noticiosas e começam a navegar em sistemas midiáticos híbridos. No entanto, a sobreposição não
torna as lógicas midiáticas indistinguíveis, porque são modus operandi muitos distintos. É tarefa dos
estudos empíricos distinguir e medir as lógicas de massa e de rede em casos específicos” (Klinger e
Svensson, 2014, p. 12).
13. COLETA DE
nas mídias sociais
Repertóriosdigitaisemredesehibridismoorganizacional(Chadwick,2007)
Duas tendências paralelas
1) Organizações políticas tradicionais estão adotando e modificando seletivamente características de
movimentos sociais;
Quatro repertórios principais: (a) mobilizando formas online de ação dos cidadãos; (b) articulando
ligações entre diferentes grupos; fundindo discurso políticos e subculturais e (d) aproveitando-se de
redes sedimentárias.
“Há sinais crescentes de que organizações tradicionais, mais hierárquicas, menos inovadoras –
como grupos de interesse e partidos – estão começando a se adaptar e adotar repertórios digitais em
rede” (Chadwick, 2007, p. 286)
2) Novas formas organizacionais que só podem existir na internet estão surgindo.
“Organizações ainda mais radicais estão surgindo, como o MoveOn, que mistura repertórios ou
rapidamente troca de um conjunto de ações para outras. Quando se trata de ação coletiva
potencializada pela internet, a imitação é parte da inovação. O conceito que melhor da conta deste
resultado é a hibridez organizacional”
14. COLETA DE
nas mídias sociais
Ociclodeinformaçãopolítica–Chadwick(2011)
Ciclo noticioso = período do dia previsível no qual se produzem as notícias, o tempo para selecionar,
apurar, escrever, editar, compilar e apresentar material jornalístico.
• Fenômeno explorado pelos autores de sociologia do jornalismo e da comunicação sobre os ciclos
produtivos das redações e a noticiabilidade
• Construção da notícia é um processo rigidamente controlado e envolve negociações entre a elite
política e midiática
Ciclo de informação política = bricolagem entre lógicas de massa e de rede na produção de informação
política.
• Maior número e maior diversidade de atores
• Estruturas temporais mais rápidas e complexas
• Inclui participantes que tangenciam as elites políticas e midiáticas
• Diversificação das fontes de informação
•Deslocamento do jornalismo, ou do jornalismo liberal, como balizador da produção de informação.
15. COLETA DE
nas mídias sociais
Oquetemosatéaqui?
• Uma série de mudanças tecnológicas, sociais e organizacionais na comunicação política.
• As elites perdem a exclusividade do acesso e do controle de meios de criação de
informação.
• Diversos repertórios de expressão política surgem para além das burocracias partidárias e
jornalísticas.
• Tudo isso está em permanente movimento e relacionamento.
A delimitação dos corpus de pesquisa em meios de massa é bastante simples. As notícias
publicadas no jornal X ou as peças publicitárias televisivas durante o período eleitoral. O objeto
é a cobertura da imprensa ou propagandas políticas oficiais.
Frequentemente, os estudos mais recentes escolhem um ator e dedicam-se apenas a ele, por
exemplo, a produção da Mídia Ninja. Porém, essa abordagem perde as dinâmicas relacionais
criadas em torno daquele agente e todas as negociações com os demais envolvidos.
16. COLETA DE
nas mídias sociais
c
Contudo, num ambiente midiático
híbrido, com surgimento de blogs,
lideranças de opinião nativas digitais
e uma infinidade de outros
fenômenos,
Como delimitar o corpus de
pesquisa?
17. COLETA DE
nas mídias sociais
Esferapúblicaemrede(Benkleretal.2013,p.04)–conceitoprovisório
• A esfera pública em rede é uma arena alternativa para o discurso e debate público,
uma arena que é menos dominada pelas grandes organizações midiáticas, menos
sujeita ao controle do governo e mais aberta a participação ampla.
• A esfera pública em rede é manifesta como um ecossistema complexo de canais de
comunicação que coletivamente oferecem um ambiente que conduz a expressão
política e a criação de diversas formas organizacionais.
• Uma série de estudos já evidenciou que elites políticas e midiáticas continuam
dominando o centro das esferas públicas em rede (Soon e Cho, 2011; Asserhofer e
Maireder, 2012; Kocks, 2016 . No entanto, aceitam a abertura para ações de
indivíduos não organizados.
18. COLETA DE
nas mídias sociais
Oquesãoredessociais?(WASSERMAN eFAUST,1994)
• A diferença fundamental entre análise de redes e análise estatística é a inclusão de
conceitos e de informações sobre os relacionamentos entre as unidades de análise do
estudo.
• Em vez de focar nos atributos das unidades individualmente, estuda as
características como emergentes do processo de relacionamento social.
• O conceito de redes enfatiza que cada indivíduo tem ligações com outros
indivíduos;
• As Redes Sociais referem-se a um conjunto de atores e as relações entre eles;
• Modelar a estrutura e buscar compreender sua influência no grupo
19. COLETA DE
nas mídias sociais
Componentesbásicosdaanálisederedes
cator
claços
cclusters
crede
Componente individual
Ligações entre atores
Subconjuntos identificados pela densidade
Totalidade de atores e ligações da amostra
20. COLETA DE
nas mídias sociais
c
O que são dados relacionais?
Duas informações distintas
Atributos dos atores
Arestas de saída e chegada
21. COLETA DE
nas mídias sociais
Métodosdigitais–RichardRogers(2004)
• A web como fonte de dados;
• Virada computacional nas
ciências sociais;
• Rastros gerados
espontaneamente
• Análises de hiperlinks
• Blogosferas políticas
• Repercussão no Twitter
• Comunidades no Facebook
22. COLETA DE
nas mídias sociais
Doistipos deredesnainternet(recuero,2009)
• Redes associativas ou de filiação – possuem ligações mais
estáveis, duradouras. Gera o efeito de filiação a um grupo.
Exemplo: seguir páginas e fazer amizades;
• Redes emergentes – são compostas por ligações
circunstanciais, criadas a partir de ações comunicativas ad
hoc. Exemplo: menções, retuítes, compartilhamentos.
23.
24.
25. COLETA DE
nas mídias sociais
c
O que são APIs?
Application
programming
interface
26. COLETA DE
nas mídias sociais
Políticasdecessãodedadosdafacebookgraphapi
• As políticas de cessão de dados de cada plataforma são
documentadas nas APIs;
• APIs são tanto documentos técnicos, quanto reflexos das diretrizes
empresariais de fornecimento de dados;
• APIs são modificadas frequentemente, de acordo com as necessidades
e interesses mercadológicos das organizações;
• As documentações mostram quais requisições são possíveis (queries),
em qual volume (rate limit) e com quais parâmetros.
29. COLETA DE
nas mídias sociais
Comoconstruirumaquery?Orientaçãoaid
• {id} + fields = {campos}
• Retorno em Javascript Object Notation (JSON)
• JSON é exibido na tela e convertido para tabulação
• Construindo query no navegador
• https://graph.facebook.com/v2.6/ + id / {requisição}
?access_token= {token de acesso}
https://graph.facebook.com/v2.6/dilmarousseff/likes?access_token=EAACEdEose0cBAErGN0ycFbkfEzlhW8o0whxulUmELq3y0bZBVh0sxbNUtUvddk
uF0vQmoz9zlUln9QG9oRypH75VEEI2HI39HlsN6rYA9vZCXWYvaVTkPRN585mUqS07AeCW9HHVOvo5wIiGDgfTtu8jNioAof51U4v1n5YQYZBr0tChVs
QiblwFj6KOhkZD
34. COLETA DE
nas mídias sociais
Técnicasdeamostragememmétodosdigitais(rieder,2012)
• População – volume completo de usuários e publicações de uma determinada plataforma.
Geralmente, é adquirido a partir da compra do banco de dados da empresa. Estudo utilizando
dados populacionais= (Freelon et al., 2016);
• Amostra aleatória: forma mais utilizada para garantir representatividade dos dados digitais. No
entanto, como não se sabe a população, há uma série de problemas derivados;
• Amostra por tópicos: queries por palavras-chave e hashtags. É o método mais comum no Twitter.
Todavia, não funciona no Facebook desde a descontinuidade da Graph API 1.0 em 2015.
• Amostrar por marcações: compilada a partir de marcadores geográficos ou linguísticos oferecidos
pela API.
• Amostra por atores: seleciona determinados canais para coleta de dados. Frequentemente
utilizado para estudo de campanhas eleitorais, focando nos candidatos ou partidos.
• Amostra por grafos: Examina relações entre uma série de agentes e faz seleções baseado no
resultado. Minha dissertação e tese.
• Amostra manual: utilizada para projetos qualitaitivos, geralmente são amostras de conveniência.
35. COLETA DE
nas mídias sociais
AdaptandoosmétodosparacoletarelacionalnoFacebook(cf.BRUNSEBURGESS,2014)
• A API do Facebook não permite a coleta de dados por palavras-chave ou por hashtags.
Método mais utilizado no Twitter, esta é uma das principais razões porque o Facebook é
plataforma pouco utilizada em pesquisas de métodos digitais.
• No entanto, o Facebook é a plataforma mais utilizada pela elite político-midiática e pelos
cidadãos comuns. Não estudar o Facebook é ignorar a ferramenta de mídias sociais que
concentra maior público.
• Assim, surge a questão, como realizar desenhos de pesquisa especificamente para o
Facebook?
• A estratégia mais comum é focar em poucos atores, como as fan-pages de candidatos
durante períodos eleitorais. Embora viável do ponto de vista metodológico, essa opção
ignora todas as dinâmicas relacionais que acontecem em torno daqueles candidatos.
• É isso que pretendo captar com meus projetos.
• Para tanto, aposto no método de amostragem por grafos e bola de neve.
36.
37. COLETA DE
nas mídias sociais
Facepager-TillKeylingejakobjunger
• Ferramenta desenvolvida para a dissertação;
• Código aberto;
• Programando em Python 2.7;
• Introduz boa parte dos conceitos de data mining, como query, data
munging, data storage, log de processos...
• É uma interface para se comunicar com a API e fazer o trabalho
pesado;
• Alto grau de liberdade para os usuários operarem as requisições;
• Funciona com Facebook e Twitter;
39. COLETA DE
nas mídias sociais
Etapasdomapeamentodefan-pages(BRUNS,2007; ADAMetal.,2015)
• Lista de nós-sementes;
• Nós-sementes devem ser temáticos e homogêneos.
• Bola de neve – crawling com 1 ou 2 graus de profundidade;
• Limpeza do resultado;
• Manipulação de dados – lista de nós e arestas;
• Importação no Gephi;
• Categorização dos atores
Como montar uma lista de sementes?
40. COLETA DE
nas mídias sociais
Afunçãosearch
Notação: /search ? type= {user, page, event, group, place} & q=
{palavra+chave} & fields=
search?type=page&q=dilma+rousseff&fields=id,name,link,description,
category
Fazer testes de acordo com as pesquisas dos alunos
41. COLETA DE
nas mídias sociais
Afunçãouserlike
Notação: id ? fields = likes {aninhamento de parâmetros}
dilmarousseff?fields=likes{name, category, id, link, about}
Fazer testes de acordo com as pesquisas dos alunos
42.
43.
44. COLETA DE
nas mídias sociais
Documentaçãodasfan-pages
Query
<user>/likes?fields=name,username,about,talking_about_count,fan_co
unt,category,link,bio,description,emails,location,new_like_count,start_inf
o,website,id JSON keys
name
id
username
category
about
bio
description
fan_count
talking_about_count
emails.0
website
link
location.city
location.state
location.longitude
location.latitude
46. COLETA DE
nas mídias sociais
TRATAMENTODEDADOS
Filtros para limpeza de logs;
Preparação das listas de nós e arestas
Arestas
Funçao PROC (=PROC(B684;$A$3:$A$506;$E$3:$E$506)
Criar source e target
Nós – Eliminar duplicatas
47.
48. COLETA DE
nas mídias sociais
Mesolevel-aDocumentaçãodaspublicações
Query
comments.limit(1).summary(true),likes.limit(1).summary(true),picture,sto
ry,from,to,description,source,link,created_time,message,type,id,status_t
ype,name,story_tags,caption, reactions.limit(1).summary(true), shares
name
from.name
from.category
from.id
to.data.*.id
to.data.*.name
story_tags
sharedposts.data
posts.data
story
link
caption
message_tags
message
status_type
type
shares.count
created_time
updated_time
reactions.summary.total_count
likes.summary.total_count
comments.summary.total_count
shares.count
49. COLETA DE
nas mídias sociais
Fluxodecomuinicaçãoentreaspáginas
Endpoints
Links – referentes aos links compartilhados nas publicações. Só
registrando quando a postagem é de tipo LINK;
Caption – referente ao domónio do link;
Message_tags – perfis marcados na mensagem (similar a @mention);
Status_type – identificar compartilhamentos e links;
Story_tags – fluxo de compartilhamento
To – Perfis mencionados
With_tags – Com quem estou.
58. COLETA DE
nas mídias sociais
Referências
ADAM, Silke et al. Identifying and Analyzing Hyperlink Issue Networks, In: VOWE ,Gerhard, HENN, Philipp.
Political Communication in the Online World (Orgs), Routledge: New York, London, p. 233-247, 2015.
ALVES, Marcelo. Coleta de dados nas mídias sociais. In: SILVA, Tarcízio; STABILE, Max (orgs.), Monitoramento e
Pesquisa em Mídias Sociais: metodologias, aplicações e inovações, Uva Limão, 2016.
BENKLER, Yochai. Political Freedom part 2: Emergence of the networked public sphere. The Wealth of
Networks: How Social Production Transforms Markets and Freedom, 2006.
BRUNS, Axel. Methodologies for mapping the political blogosphere: An exploration using the IssueCrawler
research tool. First Monday, v. 12, n. 5, 2007.
CHADWICK, Andrew. Digital network repertoires and organizational hybridity. Political Communication, v. 24, n.
3, p. 283-301, 2007.
CHADWICK, Andrew. The political information cycle in a hybrid news system: The British prime minister and the
“Bullygate” affair. The International Journal of Press/Politics, v. 16, n. 1, p. 3-29, 2011.
CHADWICK, Andrew. The hybrid media system: Politics and power. Oxford University Press, 2013.
FREELON, Deen; MCILWAIN, Charlton D.; CLARK, Meredith D. Beyond the hashtags:# Ferguson,#
Blacklivesmatter, and the online struggle for offline justice. 2016.
KLINGER, Ulrike; SVENSSON, Jakob. The emergence of network media logic in political communication: A
theoretical approach. New media & society, v. 17, n. 8, p. 1241-1257, 2015.
RECUERO, Raquel. Redes sociais na internet. Sulina, 2009.
RIEDER, Bernhard. The refraction chamber: Twitter as sphere and network. First Monday, v. 17, n. 11, 2012.
ROGERS, Richard. Information politics on the Web. MIT Press, 2004.
WASSERMAN, Stanley; FAUST, Katherine. Social network analysis: Methods and applications. Cambridge
university press, 1994.