SlideShare une entreprise Scribd logo
1  sur  26
Présentation du thème :
Application d’analyses des Tweets
Présenté par :
MRINI Youssef
BOUHILA Bilal
Plan
• Introduction
• Technologies utilisées
• Bibliothèques utilisées
• Présentation de l’application
• Difficultés
• Démo
Introduction
• Les réseaux sociaux constituent l'un des principaux
motifs de l'utilisation du modèle des données
volumineuses.
• Les API publiques fournies par des sites comme
Twitter représentent une source de données utile pour
l'analyse et la compréhension des tendances populaires
à travers une approche fondée sur l’analyse lexicale qui
consiste à déduire l’émotion dégagée par une phrase
via une analyse sémantique des mots.
Technologies utilisées
Les technologies utilisées pour concevoir notre application se
décompose en trois partie:
• Twitter : Source de données
• MongoDb : Base de données NoSQL pour le stockage
• Python : Langage de programmation
Technologies utilisées
Twitter
• 310 millions d’utilisateurs actifs
• 120 millions de visiteurs uniques sur Twitter,com
• 500 millions de tweets sont envoyés chaque jour.
• 300 milliards de tweets ont été envoyés depuis le 21 mars 2006
• 1 million de sites intègrent des tweets.
Technologies utilisées
MongoDb
• Système de base de données dans la mouvance NoSQL orienté
documents
• MongodDb permet de manipuler des objets structurés au format Bson (
Json binaire) sans schéma prédéterminé
• Les données prennent la forme de documents enregistrés eux même dans
des collections
• MongoDb associe aux données des attributs placés à la demande en
temps réel et exploitables ensuite par des requetes
• MongoDb permet la baisse des coûts et de l'augmentation de la puissance
du matériel pour permettre des développements plus simples et plus
rapides.
Technologies utilisées
Python
• Python s’impose comme un des langages outils pour la data
science. Sa rigueur et sa capacité à s’intégrer à des infrastructures
techniques robustes en font un choix de prédilection pour les big
data.
Bibliothèques utilisées
Tweepy
Bibliothèque Python qui permet d’utiliser une API Twitter pour
streamer les tweets
Bibliothèques utilisées
PyMongo
Bibliothèque Python qui permet d’utiliser une base de données
MongoDb
Bibliothèques utilisées
NLTK
Bibliothèque python open source qui fait le traitement du langage
naturel.
Bibliothèques utilisées
Pandas
Bibliothèque Python fournissant des structures de données rapides, flexibles et
expressifs conçus pour rendre le travail avec les données simple et intuitive
Exemple
Bibliothèques utilisées
Folium
Bibliothèque Python qui permet de générer des cartes
Bibliothèques utilisées
Matplotlib
Bibliothèque Python qui permet de tracer des courbes
Bibliothèques utilisées
Json
Bibliothèque Python qui permet de manipuler les fichiers Json
Bibliothèques utilisées
PyQt
Bibliothèque Python qui permet de créer des interfaces graphiques
Présentation de l’application
Notre application permet d’analyser les Tweets afin d’en extraire ces informations:
• Les Hashtags les plus utilisés
• Les statistiques des sentiments concernant les Tweets.
• Les mots les plus fréquents
• Les meilleurs et les pires Tweets
• La géolocalisation des tweets sur une carte
Présentation de l’application
Findhash.py
bestTweet.py
All Tweets: recherche dans toute la
base de données
Présentation de l’application
Findhash.py
bestTweet.py
Choose Word: recherche le mot
entré dans la barre de recherche
dans toute la base de données
Choose Word se base sur
rechercheparmot.py pour ne filtrer
que les tweets ou sont cités le mot
recherché
Présentation de l’application
word_freq_final.py permet de mettre
en valeur les mots les plus
fréquemment utilisés en éliminant
les StopWords et les caractères
spéciaux
Présentation de l’application
Stats.py permet de donner des
statistiques portant sur le sentiment
des Tweets traités
Présentation de l’application
Map_v1.py permet de cartographier
les tweets sur une carte
Présentation de l’application
Map_v3.py permet de cartographier
les tweets avec leur sentiment sur la
carte
Difficultés
MongoDb combiné avec Tweepy requiert énormément de ressources pour
l’écriture des données streamer en temps réel sur la base de données,
ajoutons à cela la latence du traitement,
Nous avons du utilisé une machine Virtuelle sur Azure
Difficultés
• Tweepy est une API Python open source qui bug énormément, il
faut régulièrement changé les tokens en créant à chaque fois une
application sur le compte dev Twitter
Démo
Merci pour votre attention

Contenu connexe

Tendances

Scalability
ScalabilityScalability
Scalability
felho
 

Tendances (20)

Cours HBase et Base de Données Orientées Colonnes (HBase, Column Oriented Dat...
Cours HBase et Base de Données Orientées Colonnes (HBase, Column Oriented Dat...Cours HBase et Base de Données Orientées Colonnes (HBase, Column Oriented Dat...
Cours HBase et Base de Données Orientées Colonnes (HBase, Column Oriented Dat...
 
BigData_Chp5: Putting it all together
BigData_Chp5: Putting it all togetherBigData_Chp5: Putting it all together
BigData_Chp5: Putting it all together
 
Quand utiliser MongoDB … Et quand vous en passer…
Quand utiliser MongoDB	… Et quand vous en passer…Quand utiliser MongoDB	… Et quand vous en passer…
Quand utiliser MongoDB … Et quand vous en passer…
 
BigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataBigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big Data
 
Web services SOAP et REST
Web services  SOAP et RESTWeb services  SOAP et REST
Web services SOAP et REST
 
Technology as a means for compliance - GRC206 - AWS re:Inforce 2019
Technology as a means for compliance - GRC206 - AWS re:Inforce 2019 Technology as a means for compliance - GRC206 - AWS re:Inforce 2019
Technology as a means for compliance - GRC206 - AWS re:Inforce 2019
 
Les BD NoSQL
Les BD NoSQLLes BD NoSQL
Les BD NoSQL
 
BigData_TP2: Design Patterns dans Hadoop
BigData_TP2: Design Patterns dans HadoopBigData_TP2: Design Patterns dans Hadoop
BigData_TP2: Design Patterns dans Hadoop
 
Présentation DEVOPS.pptx
Présentation DEVOPS.pptxPrésentation DEVOPS.pptx
Présentation DEVOPS.pptx
 
Scalability
ScalabilityScalability
Scalability
 
YOW London - Considering Migrating a Monolith to Microservices? A Dark Energy...
YOW London - Considering Migrating a Monolith to Microservices? A Dark Energy...YOW London - Considering Migrating a Monolith to Microservices? A Dark Energy...
YOW London - Considering Migrating a Monolith to Microservices? A Dark Energy...
 
Bases de données réparties
Bases de données répartiesBases de données réparties
Bases de données réparties
 
eServices-Chp5: Microservices et API Management
eServices-Chp5: Microservices et API ManagementeServices-Chp5: Microservices et API Management
eServices-Chp5: Microservices et API Management
 
Database/ Bases de données
Database/ Bases de donnéesDatabase/ Bases de données
Database/ Bases de données
 
AWS 기반의 마이크로 서비스 아키텍쳐 구현 방안 :: 김필중 :: AWS Summit Seoul 20
AWS 기반의 마이크로 서비스 아키텍쳐 구현 방안 :: 김필중 :: AWS Summit Seoul 20AWS 기반의 마이크로 서비스 아키텍쳐 구현 방안 :: 김필중 :: AWS Summit Seoul 20
AWS 기반의 마이크로 서비스 아키텍쳐 구현 방안 :: 김필중 :: AWS Summit Seoul 20
 
Optimising Cost and Efficiency on AWS
Optimising Cost and Efficiency on AWSOptimising Cost and Efficiency on AWS
Optimising Cost and Efficiency on AWS
 
Soap, wsdl et uddi
Soap, wsdl et uddiSoap, wsdl et uddi
Soap, wsdl et uddi
 
Decompose your monolith: strategies for migrating to microservices (Tide)
Decompose your monolith: strategies for migrating to microservices (Tide)Decompose your monolith: strategies for migrating to microservices (Tide)
Decompose your monolith: strategies for migrating to microservices (Tide)
 
MongoDB 101
MongoDB 101MongoDB 101
MongoDB 101
 
TP1 Big Data - MapReduce
TP1 Big Data - MapReduceTP1 Big Data - MapReduce
TP1 Big Data - MapReduce
 

En vedette

Parse The Web Using Python+Beautiful Soup
Parse The Web Using Python+Beautiful SoupParse The Web Using Python+Beautiful Soup
Parse The Web Using Python+Beautiful Soup
Jim Chang
 

En vedette (10)

S3 cassandra or outer space? dumping time series data using spark
S3 cassandra or outer space? dumping time series data using sparkS3 cassandra or outer space? dumping time series data using spark
S3 cassandra or outer space? dumping time series data using spark
 
Python beautiful soup - bs4
Python beautiful soup - bs4Python beautiful soup - bs4
Python beautiful soup - bs4
 
Parse The Web Using Python+Beautiful Soup
Parse The Web Using Python+Beautiful SoupParse The Web Using Python+Beautiful Soup
Parse The Web Using Python+Beautiful Soup
 
Scraping the web with python
Scraping the web with pythonScraping the web with python
Scraping the web with python
 
Apache Kafka - Scalable Message-Processing and more !
Apache Kafka - Scalable Message-Processing and more !Apache Kafka - Scalable Message-Processing and more !
Apache Kafka - Scalable Message-Processing and more !
 
Flume vs. kafka
Flume vs. kafkaFlume vs. kafka
Flume vs. kafka
 
Python in the Hadoop Ecosystem (Rock Health presentation)
Python in the Hadoop Ecosystem (Rock Health presentation)Python in the Hadoop Ecosystem (Rock Health presentation)
Python in the Hadoop Ecosystem (Rock Health presentation)
 
Apache Flume
Apache FlumeApache Flume
Apache Flume
 
Apache Kafka, Un système distribué de messagerie hautement performant
Apache Kafka, Un système distribué de messagerie hautement performantApache Kafka, Un système distribué de messagerie hautement performant
Apache Kafka, Un système distribué de messagerie hautement performant
 
Beautiful soup
Beautiful soupBeautiful soup
Beautiful soup
 

Similaire à Application d'analyses des Tweets

La recherche d'information sur internet
La recherche  d'information sur internetLa recherche  d'information sur internet
La recherche d'information sur internet
Ahmed Mesellem
 
Moteurs de recherche : sortir de Google
Moteurs de recherche : sortir de GoogleMoteurs de recherche : sortir de Google
Moteurs de recherche : sortir de Google
Aref Jdey
 

Similaire à Application d'analyses des Tweets (20)

formation_veille.pdf
formation_veille.pdfformation_veille.pdf
formation_veille.pdf
 
Tendances et innovation des outils de recherche
Tendances et innovation des outils de recherche Tendances et innovation des outils de recherche
Tendances et innovation des outils de recherche
 
La recherche sur Internet: devenez un super chercheur
La recherche sur Internet: devenez un super chercheurLa recherche sur Internet: devenez un super chercheur
La recherche sur Internet: devenez un super chercheur
 
La recherche d\'information sur internet
La recherche d\'information sur internetLa recherche d\'information sur internet
La recherche d\'information sur internet
 
L’internet des sciences humaines et sociales. Recherches - Perspectives
L’internet des sciences humaines et sociales. Recherches - Perspectives L’internet des sciences humaines et sociales. Recherches - Perspectives
L’internet des sciences humaines et sociales. Recherches - Perspectives
 
Utc data publica1
Utc data publica1Utc data publica1
Utc data publica1
 
Outils de veille informationnelle - Hiver 2017
Outils de veille informationnelle - Hiver 2017Outils de veille informationnelle - Hiver 2017
Outils de veille informationnelle - Hiver 2017
 
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
 
La recherche d'information sur internet
La recherche  d'information sur internetLa recherche  d'information sur internet
La recherche d'information sur internet
 
Atelier de veille informationnelle pour bacc. + 2e cycle - automne 2016
Atelier de veille informationnelle pour bacc. + 2e cycle - automne 2016Atelier de veille informationnelle pour bacc. + 2e cycle - automne 2016
Atelier de veille informationnelle pour bacc. + 2e cycle - automne 2016
 
Boostez votre recherche SharePoint grâce aux Microsoft Cognitive Services!
Boostez votre recherche SharePoint grâce aux Microsoft Cognitive Services!Boostez votre recherche SharePoint grâce aux Microsoft Cognitive Services!
Boostez votre recherche SharePoint grâce aux Microsoft Cognitive Services!
 
Offre Search
Offre SearchOffre Search
Offre Search
 
Outils de recherche du web hors Google
Outils de recherche du web hors GoogleOutils de recherche du web hors Google
Outils de recherche du web hors Google
 
Plateforme opendata ouverte par In Cité Solution
Plateforme opendata ouverte par In Cité SolutionPlateforme opendata ouverte par In Cité Solution
Plateforme opendata ouverte par In Cité Solution
 
Tic recherche-scientifique
Tic recherche-scientifiqueTic recherche-scientifique
Tic recherche-scientifique
 
Transfert de connaissances et web 2.0
Transfert de connaissances et web 2.0Transfert de connaissances et web 2.0
Transfert de connaissances et web 2.0
 
Introduction à la BIG DATA et l'Intelligence Artificielle
Introduction à la BIG DATA et l'Intelligence ArtificielleIntroduction à la BIG DATA et l'Intelligence Artificielle
Introduction à la BIG DATA et l'Intelligence Artificielle
 
Moteurs de recherche : sortir de Google
Moteurs de recherche : sortir de GoogleMoteurs de recherche : sortir de Google
Moteurs de recherche : sortir de Google
 
IODS : Retour d’expériences au sein du Center for Data Science
IODS : Retour d’expériences au sein du Center for Data ScienceIODS : Retour d’expériences au sein du Center for Data Science
IODS : Retour d’expériences au sein du Center for Data Science
 
Jabes 2011 - Session plénière 17 mai "OCLC - orientations stratégiques"
Jabes 2011 - Session plénière 17 mai "OCLC - orientations stratégiques"Jabes 2011 - Session plénière 17 mai "OCLC - orientations stratégiques"
Jabes 2011 - Session plénière 17 mai "OCLC - orientations stratégiques"
 

Plus de Ibn Tofail University (10)

Système de recommandations de films
Système de recommandations de filmsSystème de recommandations de films
Système de recommandations de films
 
Dossier Sponsoring
Dossier Sponsoring Dossier Sponsoring
Dossier Sponsoring
 
Big data
Big dataBig data
Big data
 
Apache giraph
Apache giraphApache giraph
Apache giraph
 
Implémentation des principaux algorithmes de chiffrements en Java
Implémentation des principaux algorithmes de chiffrements en JavaImplémentation des principaux algorithmes de chiffrements en Java
Implémentation des principaux algorithmes de chiffrements en Java
 
Introducing project spartan
Introducing project spartanIntroducing project spartan
Introducing project spartan
 
Imagine cup maroc 2015
Imagine cup maroc 2015Imagine cup maroc 2015
Imagine cup maroc 2015
 
Youth spark Morocco
Youth spark MoroccoYouth spark Morocco
Youth spark Morocco
 
Reglement enactus fsk
Reglement enactus fskReglement enactus fsk
Reglement enactus fsk
 
Dossier de sponsoring SIFE FSK
Dossier de sponsoring SIFE FSKDossier de sponsoring SIFE FSK
Dossier de sponsoring SIFE FSK
 

Dernier

Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxCopie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
ikospam0
 
Bilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfBilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdf
AmgdoulHatim
 

Dernier (16)

L application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptxL application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptx
 
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANKRAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
 
Apolonia, Apolonia.pptx Film documentaire
Apolonia, Apolonia.pptx         Film documentaireApolonia, Apolonia.pptx         Film documentaire
Apolonia, Apolonia.pptx Film documentaire
 
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projetFormation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
 
Echos libraries Burkina Faso newsletter 2024
Echos libraries Burkina Faso newsletter 2024Echos libraries Burkina Faso newsletter 2024
Echos libraries Burkina Faso newsletter 2024
 
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxCopie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
 
Neuvaine de la Pentecôte avec des textes de saint Jean Eudes
Neuvaine de la Pentecôte avec des textes de saint Jean EudesNeuvaine de la Pentecôte avec des textes de saint Jean Eudes
Neuvaine de la Pentecôte avec des textes de saint Jean Eudes
 
Bilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfBilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdf
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
 
python-Cours Officiel POO Python-m103.pdf
python-Cours Officiel POO Python-m103.pdfpython-Cours Officiel POO Python-m103.pdf
python-Cours Officiel POO Python-m103.pdf
 
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptxIntégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptx
 
L'expression du but : fiche et exercices niveau C1 FLE
L'expression du but : fiche et exercices  niveau C1 FLEL'expression du but : fiche et exercices  niveau C1 FLE
L'expression du but : fiche et exercices niveau C1 FLE
 
Cours Généralités sur les systèmes informatiques
Cours Généralités sur les systèmes informatiquesCours Généralités sur les systèmes informatiques
Cours Généralités sur les systèmes informatiques
 
Télécommunication et transport .pdfcours
Télécommunication et transport .pdfcoursTélécommunication et transport .pdfcours
Télécommunication et transport .pdfcours
 
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
 
les_infections_a_streptocoques.pptkioljhk
les_infections_a_streptocoques.pptkioljhkles_infections_a_streptocoques.pptkioljhk
les_infections_a_streptocoques.pptkioljhk
 

Application d'analyses des Tweets