SlideShare a Scribd company logo
1 of 26
WEB INVISIBLE 
ET DEEP WEB 
Cours de recherche d’information avancée 
Antoine PY et Baptiste Buisson
• Introduction sur le Web Invisible 
• Les 4 niveaux d’invisibilité 
• Les serveurs classiques 
• L’évolution 
• L’utilité 
• Les outils pour explorer ce monde caché 
• Comment naviguer sur le web de façon anonyme 
Antoine PY et Baptiste Buisson 
2 
Sommaire
Qu’est ce que le Web Invisible? 
C’est l’ensemble des pages internet non-indexées par les 
moteurs de recherche traditionnels 
DEEP WEB WEB PROFOND WEB CACHE WEB INVISIBLE 
Antoine PY et Baptiste Buisson 
3 
Introduction
Antoine PY et Baptiste Buisson 
4 
Introduction 
Un Web caché…
• The Opaque Web 
Pages susceptibles d’être indexées mais qui ne le sont pas. 
The opaque Web : nearly visible web 
Pourquoi? 
- Création de nouvelles pages (pas de détection du robot 
« spider ») 
- Limitation du moteur sur le nombre de page d’un site 
- La page possède peu de backlinks 
Antoine PY et Baptiste Buisson 
5 
Le Web Invisible 
Les 4 niveaux d’invisibilités
• The Opaque Web 
• The Private Web 
Pages exclues volontairement par les Webmasters 
Web invisible: la partie immergé de l’Iceberg 
Antoine PY et Baptiste Buisson 
6 
Le Web Invisible 
Les 4 niveaux d’invisibilités
• The OpaqueWeb 
• The Private Web 
• The Proprietary Web 
- Identification nécessaire (l’indexage par le robot est bloqué) 
Web invisible: la partie immergé de l’Iceberg 
Antoine PY et Baptiste Buisson 
7 
Le Web Invisible 
Les 4 niveaux d’invisibilités
• The Opaque Web 
• The Private Web 
• The Proprietary Web 
• The Truly Invisible web 
Toute indexation est impossible en raison des formats 
inconnus, de la structure ou de la taille hors norme des informations. 
Les pages générées dynamiquement ne peuvent également pas 
être gérées par les moteurs de recherche. 
Les banques de données: une partie intégrante du Web 
Antoine PY et Baptiste Buisson 
8 
Le Web Invisible 
Les 4 niveaux d’invisibilités
Une requête consomme autant qu’une ampoule pendant 1h 
Antoine PY et Baptiste Buisson 
9 
Les serveurs classiques 
Historique: 
• Les banques de données sont apparues en 1960. 
Objectif: Une volonté d’améliorer l’efficacité du web. 
• Depuis 1970 des serveurs sont crées par plusieurs 
sociétés privées.
Contenu plus qualifié, plus précis, plus vérifié et plus vaste 
Antoine PY et Baptiste Buisson 
10 
Des informations structurées et validées 
• Les bases de données hébergent une information structurée et 
variée. 
- Références avec résumé et indexation d’articles… 
- Brevets américains, européens… 
- Références avec indexation de brevets 
- Textes intégrals de milliers de titres de presse 
- Informations marketing
Contenu plus qualifié, plus précis, plus vérifié et plus vaste 
Antoine PY et Baptiste Buisson 
11 
Des ressources difficiles d’accès 
• Les bases de données sont plus difficiles d’accès que 
celle du web visible 
- Accès réservé aux abonnées 
- Accès Payant 
- Connaissance des langages
En 2000: la taille du web invisible croissait plus vite que le 
web visible. Ceci n’est plus d’actualité. Pourquoi? 
• L’indexation de nouveaux formats de fichier 
Fichier .pdf (document de qualité): publications scientifiques et 
universitaires, rapports de chercheurs… 
Fichier .doc, .xls, .ppt, .rtf, .ps 
• Les partenariats avec des éditeurs de banques de données 
Pages dynamiques 
Accord signé entre l’Inst-Cnrs (17 millions de bibliographie) 
avec Google 
La croissance de la taille du Web invisible s’atténue de plus en plus 
Antoine PY et Baptiste Buisson 
12 
L’évolution
• Trouver des documents supplémentaires 
• Informations plus pertinentes 
• Elargir son champ de recherche 
Taille web visible: 167 téraoctets 
Tailles web invisible: 91 000 téraoctet 
Antoine PY et Baptiste Buisson 
13 
Utilité des recherches dans le deep web
Les informations à trouver: 
- Revues éléctroniques 
- Livres électroniques 
- Catalogues en ligne 
- Des articles 
Le web invisible est 544 fois plus grand que le web visible 
Antoine PY et Baptiste Buisson 
14 
Les outils 
Le fonctionnement: 
- Recherche par catégorie 
- Possibilité de modifier sa recherche: options de recherche
Les informations à trouver: 
- Ressources pertinentes sur 
beaucoups de sujets 
Antoine PY et Baptiste Buisson 
15 
Les outils 
Le fonctionnement: 
- Recherche par catégorie et par mots-clés
Les informations à trouver: 
- Ressources pertinentes sur 
beaucoups de sujets 
Antoine PY et Baptiste Buisson 
16 
Le fonctionnement: 
- Recherche par catégorie 
Les outils
Les informations à trouver: 
- Sujets académiques 
- Dictatitiels sur des techniques 
efficaces de recherche 
d’internet 
Antoine PY et Baptiste Buisson 
17 
Les outils 
Le fonctionnement: 
- Recherche par mots-clés ou par sujet
Les informations à trouver: 
- Encyclopédies 
- Atlas 
- Bibliographie 
Antoine PY et Baptiste Buisson 
18 
Le fonctionnement: 
- Recherche par mots-clés 
Les outils
Moteurs de recherche pour étudiants 
Trouver du contenu sur l’ingénierie, 
les mathématiques et l’informatique 
Types d’information: 
- Nouvelles sur l’industrie 
- Offres d’emploi 
- Rapports techniques 
- Sites web pertinents 
Antoine PY et Baptiste Buisson 
19 
Le fonctionnement: 
- Recherche par mots-clés 
Les outils
Antoine PY et Baptiste Buisson 
20 
Les outils 
Méta-moteur 
- Nombreuses possibilités de personnalisation et de 
paramétrage 
- Trouver les informations les plus récentes
• DeepWeb ≠ DarkWeb ≠ Darknet 
DarkWeb: le côté « malsain » du DeepWeb 
Darknets: réseaux privés virtuels, souvent de petites tailles 
et dans le but d’échanger des fichiers, 
The internet behind the internet 
Antoine PY et Baptiste Buisson 
21 
Le DarkWeb
Plusieurs Outils existent: 
• TOR (The Onion Router) 
• Base-search.net 
• D’autres moteurs de recherche spécialisés 
The internet behind the internet 
Antoine PY et Baptiste Buisson 
22 
Comment y accéder? 
Avec Google Chrome Avec TOR
The internet behind the internet 
Antoine PY et Baptiste Buisson 
23 
Les Outils
The internet behind the internet 
Antoine PY et Baptiste Buisson 
24 
Les Outils
• Béatrice Foenix-Riou : « Recherche éveillé sur Internet: mode d’emploi » 
• « Web profond ». Encyclopédie en ligne. Wikipédia, s. d. http://fr.wikipedia.org/wiki/Web_profond 
• « Cinq moteurs de recherche pour explorer le darknet ». Site d’information sur les nouvelles technologies. Parlons Geek, s. d. 
http://www.parlonsgeek.com/cinq-moteurs-de-recherche-pour-explorer/. 
• « Clearing Up Confusion – Deep Web vs. Dark Web », 27 mars 2014. 
http://www.brightplanet.com/2014/03/clearing-confusion-deep-web-vs-dark-web/ 
• « Deep Web, Dark Web, les parties immergées d’Internet | Panoptinet », s. d. 
http://www.panoptinet.com/cybersecurite-decryptee/deep-web-dark-web-les-parties-immergees-dinternet/ 
• Dejonckheere, Eric. « AYA.io - Recherche dans le Web profond ». Blog. AYA.io, 22 juin 2013. http://aya.io/blog/deep-web-search/. 
• « La recherche d’Informations sur le Web », s. d. http://c.asselin.free.fr/french/invisible_web.htm. 
• « MemoAV_WebInvisible - Memo_WebInvisible.pdf ». 
http://bibliotheque.unice.fr/services-et-formations/aide-et-formation/documents/Memo_WebInvisible.pdf. 
• « Rechercher l’information - Les informations du web invisible ». http://www.c2imes.org/MODULES/B2/co/I_E_partieB.html. 
• Digimind, Découvrir et exploiter le web invisible pour la veille stratégique: http://www.esi.ac.ma/Dossiers/20140126070100.pdf 
Antoine PY et Baptiste Buisson 
25 
Bibliographie
Merci pour votre attention 
Antoine PY et Baptiste Buisson 
26

More Related Content

What's hot

Initiation au e-commerce !
Initiation au e-commerce !Initiation au e-commerce !
Initiation au e-commerce !Samuel Robert
 
SNA - Gephi - Twitter Streaming Importer (2020)
SNA - Gephi - Twitter Streaming Importer (2020)SNA - Gephi - Twitter Streaming Importer (2020)
SNA - Gephi - Twitter Streaming Importer (2020)Groupe EEIE
 
Internet des objets
Internet des objetsInternet des objets
Internet des objetsKarima GHALI
 
La Recherche d'information sur Internet
La Recherche d'information sur InternetLa Recherche d'information sur Internet
La Recherche d'information sur InternetSandrine Michel
 
La Transformation digitale : Histoire
La Transformation digitale : HistoireLa Transformation digitale : Histoire
La Transformation digitale : HistoireYoussef Belhaj HMC
 
Veille technologique informatique
Veille technologique informatiqueVeille technologique informatique
Veille technologique informatiqueDamien Luciani
 
Rapport de stage développement informatique
Rapport de stage développement informatique Rapport de stage développement informatique
Rapport de stage développement informatique MehdiOuqas
 
communiquer-reseaux-sociaux.pptx
communiquer-reseaux-sociaux.pptxcommuniquer-reseaux-sociaux.pptx
communiquer-reseaux-sociaux.pptxolivier
 
Plan Stratégie Marketing digitale
Plan Stratégie Marketing digitalePlan Stratégie Marketing digitale
Plan Stratégie Marketing digitaleCharly Loukakou
 
Les avantages et inconvénients d'internet chez les jeunes
Les avantages et inconvénients d'internet chez les jeunesLes avantages et inconvénients d'internet chez les jeunes
Les avantages et inconvénients d'internet chez les jeunesBantu Hub
 
communication et bibliothèque : le plan de communication
communication et bibliothèque : le plan de communicationcommunication et bibliothèque : le plan de communication
communication et bibliothèque : le plan de communicationKnitandb b
 
Présentation des TIC dans la communication
Présentation des TIC dans la communication Présentation des TIC dans la communication
Présentation des TIC dans la communication dihiaselma
 
Histoire d’internet et du web : d’Arpanet au web sémantique
Histoire d’internet et du web : d’Arpanet au web sémantiqueHistoire d’internet et du web : d’Arpanet au web sémantique
Histoire d’internet et du web : d’Arpanet au web sémantiqueURFIST de Rennes
 
Personal Branding : Découvrez votre marque personnelle
Personal Branding : Découvrez votre marque personnellePersonal Branding : Découvrez votre marque personnelle
Personal Branding : Découvrez votre marque personnelleBernard MARTINEZ
 
Mémoire sur les chatbots
Mémoire sur les chatbotsMémoire sur les chatbots
Mémoire sur les chatbotsJustine Doret
 
[SINS] Présentation de Nagios
[SINS] Présentation de Nagios[SINS] Présentation de Nagios
[SINS] Présentation de Nagiosjeyg
 
Culture digitale
Culture digitaleCulture digitale
Culture digitaleBabacar LO
 

What's hot (20)

Initiation au e-commerce !
Initiation au e-commerce !Initiation au e-commerce !
Initiation au e-commerce !
 
SNA - Gephi - Twitter Streaming Importer (2020)
SNA - Gephi - Twitter Streaming Importer (2020)SNA - Gephi - Twitter Streaming Importer (2020)
SNA - Gephi - Twitter Streaming Importer (2020)
 
Internet des Objets
Internet des ObjetsInternet des Objets
Internet des Objets
 
Internet des objets
Internet des objetsInternet des objets
Internet des objets
 
La Recherche d'information sur Internet
La Recherche d'information sur InternetLa Recherche d'information sur Internet
La Recherche d'information sur Internet
 
La Transformation digitale : Histoire
La Transformation digitale : HistoireLa Transformation digitale : Histoire
La Transformation digitale : Histoire
 
Veille technologique informatique
Veille technologique informatiqueVeille technologique informatique
Veille technologique informatique
 
Rapport de stage développement informatique
Rapport de stage développement informatique Rapport de stage développement informatique
Rapport de stage développement informatique
 
Formation e-commerce
Formation e-commerceFormation e-commerce
Formation e-commerce
 
communiquer-reseaux-sociaux.pptx
communiquer-reseaux-sociaux.pptxcommuniquer-reseaux-sociaux.pptx
communiquer-reseaux-sociaux.pptx
 
Plan Stratégie Marketing digitale
Plan Stratégie Marketing digitalePlan Stratégie Marketing digitale
Plan Stratégie Marketing digitale
 
Les avantages et inconvénients d'internet chez les jeunes
Les avantages et inconvénients d'internet chez les jeunesLes avantages et inconvénients d'internet chez les jeunes
Les avantages et inconvénients d'internet chez les jeunes
 
communication et bibliothèque : le plan de communication
communication et bibliothèque : le plan de communicationcommunication et bibliothèque : le plan de communication
communication et bibliothèque : le plan de communication
 
Présentation des TIC dans la communication
Présentation des TIC dans la communication Présentation des TIC dans la communication
Présentation des TIC dans la communication
 
Internet Of Things
Internet Of Things Internet Of Things
Internet Of Things
 
Histoire d’internet et du web : d’Arpanet au web sémantique
Histoire d’internet et du web : d’Arpanet au web sémantiqueHistoire d’internet et du web : d’Arpanet au web sémantique
Histoire d’internet et du web : d’Arpanet au web sémantique
 
Personal Branding : Découvrez votre marque personnelle
Personal Branding : Découvrez votre marque personnellePersonal Branding : Découvrez votre marque personnelle
Personal Branding : Découvrez votre marque personnelle
 
Mémoire sur les chatbots
Mémoire sur les chatbotsMémoire sur les chatbots
Mémoire sur les chatbots
 
[SINS] Présentation de Nagios
[SINS] Présentation de Nagios[SINS] Présentation de Nagios
[SINS] Présentation de Nagios
 
Culture digitale
Culture digitaleCulture digitale
Culture digitale
 

Viewers also liked

Les outils de recherche et veille sur le web
Les outils de recherche et veille sur le webLes outils de recherche et veille sur le web
Les outils de recherche et veille sur le webechangeurba
 
Présentation du Web Invisible
Présentation du Web InvisiblePrésentation du Web Invisible
Présentation du Web InvisibleIANTE Réunion
 
AG CITC - Présentation "Internet des objets: Quels défis pour l'avenir?" ¨Par...
AG CITC - Présentation "Internet des objets: Quels défis pour l'avenir?" ¨Par...AG CITC - Présentation "Internet des objets: Quels défis pour l'avenir?" ¨Par...
AG CITC - Présentation "Internet des objets: Quels défis pour l'avenir?" ¨Par...CITC-EuraRFID
 
Presentation FrenchWeb Day IoT
Presentation FrenchWeb Day IoTPresentation FrenchWeb Day IoT
Presentation FrenchWeb Day IoTFrenchWeb.fr
 
Oliviere iot grenoble May2015
Oliviere iot grenoble May2015Oliviere iot grenoble May2015
Oliviere iot grenoble May2015Olivier Ezratty
 
Valtech - Internet of Things & Big Data : un mariage de raison
Valtech - Internet of Things & Big Data : un mariage de raisonValtech - Internet of Things & Big Data : un mariage de raison
Valtech - Internet of Things & Big Data : un mariage de raisonValtech
 
Conférence Internet des objets IoT M2M - CCI Bordeaux - 02 04 2015 - Introduc...
Conférence Internet des objets IoT M2M - CCI Bordeaux - 02 04 2015 - Introduc...Conférence Internet des objets IoT M2M - CCI Bordeaux - 02 04 2015 - Introduc...
Conférence Internet des objets IoT M2M - CCI Bordeaux - 02 04 2015 - Introduc...polenumerique33
 
Internet des objets (IoT)
Internet des objets (IoT)Internet des objets (IoT)
Internet des objets (IoT)bruno-dambrun
 

Viewers also liked (9)

Les outils de recherche et veille sur le web
Les outils de recherche et veille sur le webLes outils de recherche et veille sur le web
Les outils de recherche et veille sur le web
 
Présentation du Web Invisible
Présentation du Web InvisiblePrésentation du Web Invisible
Présentation du Web Invisible
 
AG CITC - Présentation "Internet des objets: Quels défis pour l'avenir?" ¨Par...
AG CITC - Présentation "Internet des objets: Quels défis pour l'avenir?" ¨Par...AG CITC - Présentation "Internet des objets: Quels défis pour l'avenir?" ¨Par...
AG CITC - Présentation "Internet des objets: Quels défis pour l'avenir?" ¨Par...
 
Presentation FrenchWeb Day IoT
Presentation FrenchWeb Day IoTPresentation FrenchWeb Day IoT
Presentation FrenchWeb Day IoT
 
Oliviere iot grenoble May2015
Oliviere iot grenoble May2015Oliviere iot grenoble May2015
Oliviere iot grenoble May2015
 
Valtech - Internet of Things & Big Data : un mariage de raison
Valtech - Internet of Things & Big Data : un mariage de raisonValtech - Internet of Things & Big Data : un mariage de raison
Valtech - Internet of Things & Big Data : un mariage de raison
 
Conférence Internet des objets IoT M2M - CCI Bordeaux - 02 04 2015 - Introduc...
Conférence Internet des objets IoT M2M - CCI Bordeaux - 02 04 2015 - Introduc...Conférence Internet des objets IoT M2M - CCI Bordeaux - 02 04 2015 - Introduc...
Conférence Internet des objets IoT M2M - CCI Bordeaux - 02 04 2015 - Introduc...
 
Internet des objets (IoT)
Internet des objets (IoT)Internet des objets (IoT)
Internet des objets (IoT)
 
Présentation des IoT
Présentation des IoTPrésentation des IoT
Présentation des IoT
 

Similar to Web Invisible et Deep Web

De la veille au partage
De la veille au partageDe la veille au partage
De la veille au partageTerheck
 
Tendances et innovation des outils de recherche
Tendances et innovation des outils de recherche Tendances et innovation des outils de recherche
Tendances et innovation des outils de recherche ei4idi
 
Sites internet de services d'archives : comment faire connaître son site ?
Sites internet de services d'archives : comment faire connaître son site ?Sites internet de services d'archives : comment faire connaître son site ?
Sites internet de services d'archives : comment faire connaître son site ?Julie Scheffer
 
Veille2012 avec-copies-ecran-120416110404-phpapp01
Veille2012 avec-copies-ecran-120416110404-phpapp01Veille2012 avec-copies-ecran-120416110404-phpapp01
Veille2012 avec-copies-ecran-120416110404-phpapp01Claude Martin
 
Rechercher de l'information sur le web
Rechercher de l'information sur le webRechercher de l'information sur le web
Rechercher de l'information sur le webIsabelle Motte
 
2015 01 08_presentation-culture-web
2015 01 08_presentation-culture-web2015 01 08_presentation-culture-web
2015 01 08_presentation-culture-webkattass mourad
 
Portail Bibliothèque du Finistère BDF29
Portail Bibliothèque du Finistère BDF29Portail Bibliothèque du Finistère BDF29
Portail Bibliothèque du Finistère BDF29Association Bibop
 
P6 Digimind Christophe Asselin
P6   Digimind   Christophe AsselinP6   Digimind   Christophe Asselin
P6 Digimind Christophe AsselinEtesTIC2007
 
Formation ESFF 2013 Internet Jacques Loigerot
Formation ESFF 2013 Internet Jacques LoigerotFormation ESFF 2013 Internet Jacques Loigerot
Formation ESFF 2013 Internet Jacques LoigerotJacques Loigerot
 
La Place Des Services En Ligne En Bibliotheque
La Place Des Services En Ligne En BibliothequeLa Place Des Services En Ligne En Bibliotheque
La Place Des Services En Ligne En BibliothequeDujol Lionel
 
Intelligence du _web_semantique_1_2014
Intelligence du _web_semantique_1_2014Intelligence du _web_semantique_1_2014
Intelligence du _web_semantique_1_2014Serge Garlatti
 
Jabes 2007 - OCLC : projets de développement et de recherche
Jabes 2007 - OCLC : projets de développement et de rechercheJabes 2007 - OCLC : projets de développement et de recherche
Jabes 2007 - OCLC : projets de développement et de rechercheABES
 
Reseaux sociaux professionnels- Curation de contenu - Scoop.it, Storify, Pape...
Reseaux sociaux professionnels- Curation de contenu - Scoop.it, Storify, Pape...Reseaux sociaux professionnels- Curation de contenu - Scoop.it, Storify, Pape...
Reseaux sociaux professionnels- Curation de contenu - Scoop.it, Storify, Pape...Alban Jarry
 
Le Web 2.0 pour les pharmaciens
Le Web 2.0 pour les pharmaciensLe Web 2.0 pour les pharmaciens
Le Web 2.0 pour les pharmaciensADIPh
 
WebCSTI Rencontres OCIM 2009
WebCSTI Rencontres OCIM 2009WebCSTI Rencontres OCIM 2009
WebCSTI Rencontres OCIM 2009Sébastien
 
Accompagner avec le numerique - Intervention JNE ACOP-F Albi 2016
Accompagner avec le numerique - Intervention JNE ACOP-F Albi 2016Accompagner avec le numerique - Intervention JNE ACOP-F Albi 2016
Accompagner avec le numerique - Intervention JNE ACOP-F Albi 2016jfcastell
 

Similar to Web Invisible et Deep Web (20)

De la veille au partage
De la veille au partageDe la veille au partage
De la veille au partage
 
Tendances et innovation des outils de recherche
Tendances et innovation des outils de recherche Tendances et innovation des outils de recherche
Tendances et innovation des outils de recherche
 
Sites internet de services d'archives : comment faire connaître son site ?
Sites internet de services d'archives : comment faire connaître son site ?Sites internet de services d'archives : comment faire connaître son site ?
Sites internet de services d'archives : comment faire connaître son site ?
 
Web invisible
Web invisibleWeb invisible
Web invisible
 
Veille2012 avec-copies-ecran-120416110404-phpapp01
Veille2012 avec-copies-ecran-120416110404-phpapp01Veille2012 avec-copies-ecran-120416110404-phpapp01
Veille2012 avec-copies-ecran-120416110404-phpapp01
 
Rechercher de l'information sur le web
Rechercher de l'information sur le webRechercher de l'information sur le web
Rechercher de l'information sur le web
 
2015 01 08_presentation-culture-web
2015 01 08_presentation-culture-web2015 01 08_presentation-culture-web
2015 01 08_presentation-culture-web
 
Portail Bibliothèque du Finistère BDF29
Portail Bibliothèque du Finistère BDF29Portail Bibliothèque du Finistère BDF29
Portail Bibliothèque du Finistère BDF29
 
JEBibop
JEBibopJEBibop
JEBibop
 
P6 Digimind Christophe Asselin
P6   Digimind   Christophe AsselinP6   Digimind   Christophe Asselin
P6 Digimind Christophe Asselin
 
Formation ESFF 2013 Internet Jacques Loigerot
Formation ESFF 2013 Internet Jacques LoigerotFormation ESFF 2013 Internet Jacques Loigerot
Formation ESFF 2013 Internet Jacques Loigerot
 
La Place Des Services En Ligne En Bibliotheque
La Place Des Services En Ligne En BibliothequeLa Place Des Services En Ligne En Bibliotheque
La Place Des Services En Ligne En Bibliotheque
 
Intelligence du _web_semantique_1_2014
Intelligence du _web_semantique_1_2014Intelligence du _web_semantique_1_2014
Intelligence du _web_semantique_1_2014
 
Enquête sur les usagers distants du site de la Bpi
Enquête sur les usagers distants du site de la BpiEnquête sur les usagers distants du site de la Bpi
Enquête sur les usagers distants du site de la Bpi
 
Jabes 2007 - OCLC : projets de développement et de recherche
Jabes 2007 - OCLC : projets de développement et de rechercheJabes 2007 - OCLC : projets de développement et de recherche
Jabes 2007 - OCLC : projets de développement et de recherche
 
Reseaux sociaux professionnels- Curation de contenu - Scoop.it, Storify, Pape...
Reseaux sociaux professionnels- Curation de contenu - Scoop.it, Storify, Pape...Reseaux sociaux professionnels- Curation de contenu - Scoop.it, Storify, Pape...
Reseaux sociaux professionnels- Curation de contenu - Scoop.it, Storify, Pape...
 
Le Web 2.0 pour les pharmaciens
Le Web 2.0 pour les pharmaciensLe Web 2.0 pour les pharmaciens
Le Web 2.0 pour les pharmaciens
 
WebCSTI Rencontres OCIM 2009
WebCSTI Rencontres OCIM 2009WebCSTI Rencontres OCIM 2009
WebCSTI Rencontres OCIM 2009
 
Referencement moteur de-recherche
Referencement moteur de-rechercheReferencement moteur de-recherche
Referencement moteur de-recherche
 
Accompagner avec le numerique - Intervention JNE ACOP-F Albi 2016
Accompagner avec le numerique - Intervention JNE ACOP-F Albi 2016Accompagner avec le numerique - Intervention JNE ACOP-F Albi 2016
Accompagner avec le numerique - Intervention JNE ACOP-F Albi 2016
 

More from ei4idi

Taxonomie et folksonomie
Taxonomie et folksonomieTaxonomie et folksonomie
Taxonomie et folksonomieei4idi
 
Les outils de curation
Les outils de curationLes outils de curation
Les outils de curationei4idi
 
Vérifier l’information
Vérifier l’informationVérifier l’information
Vérifier l’informationei4idi
 
Bookmarking social
Bookmarking socialBookmarking social
Bookmarking socialei4idi
 
TROUVER & EXPLOITER L’INFORMATION SCIENTIFIQUE ET TECHNIQUE
TROUVER & EXPLOITER L’INFORMATION SCIENTIFIQUE ET TECHNIQUETROUVER & EXPLOITER L’INFORMATION SCIENTIFIQUE ET TECHNIQUE
TROUVER & EXPLOITER L’INFORMATION SCIENTIFIQUE ET TECHNIQUEei4idi
 

More from ei4idi (6)

Taxonomie et folksonomie
Taxonomie et folksonomieTaxonomie et folksonomie
Taxonomie et folksonomie
 
Les outils de curation
Les outils de curationLes outils de curation
Les outils de curation
 
Cm3
Cm3Cm3
Cm3
 
Vérifier l’information
Vérifier l’informationVérifier l’information
Vérifier l’information
 
Bookmarking social
Bookmarking socialBookmarking social
Bookmarking social
 
TROUVER & EXPLOITER L’INFORMATION SCIENTIFIQUE ET TECHNIQUE
TROUVER & EXPLOITER L’INFORMATION SCIENTIFIQUE ET TECHNIQUETROUVER & EXPLOITER L’INFORMATION SCIENTIFIQUE ET TECHNIQUE
TROUVER & EXPLOITER L’INFORMATION SCIENTIFIQUE ET TECHNIQUE
 

Web Invisible et Deep Web

  • 1. WEB INVISIBLE ET DEEP WEB Cours de recherche d’information avancée Antoine PY et Baptiste Buisson
  • 2. • Introduction sur le Web Invisible • Les 4 niveaux d’invisibilité • Les serveurs classiques • L’évolution • L’utilité • Les outils pour explorer ce monde caché • Comment naviguer sur le web de façon anonyme Antoine PY et Baptiste Buisson 2 Sommaire
  • 3. Qu’est ce que le Web Invisible? C’est l’ensemble des pages internet non-indexées par les moteurs de recherche traditionnels DEEP WEB WEB PROFOND WEB CACHE WEB INVISIBLE Antoine PY et Baptiste Buisson 3 Introduction
  • 4. Antoine PY et Baptiste Buisson 4 Introduction Un Web caché…
  • 5. • The Opaque Web Pages susceptibles d’être indexées mais qui ne le sont pas. The opaque Web : nearly visible web Pourquoi? - Création de nouvelles pages (pas de détection du robot « spider ») - Limitation du moteur sur le nombre de page d’un site - La page possède peu de backlinks Antoine PY et Baptiste Buisson 5 Le Web Invisible Les 4 niveaux d’invisibilités
  • 6. • The Opaque Web • The Private Web Pages exclues volontairement par les Webmasters Web invisible: la partie immergé de l’Iceberg Antoine PY et Baptiste Buisson 6 Le Web Invisible Les 4 niveaux d’invisibilités
  • 7. • The OpaqueWeb • The Private Web • The Proprietary Web - Identification nécessaire (l’indexage par le robot est bloqué) Web invisible: la partie immergé de l’Iceberg Antoine PY et Baptiste Buisson 7 Le Web Invisible Les 4 niveaux d’invisibilités
  • 8. • The Opaque Web • The Private Web • The Proprietary Web • The Truly Invisible web Toute indexation est impossible en raison des formats inconnus, de la structure ou de la taille hors norme des informations. Les pages générées dynamiquement ne peuvent également pas être gérées par les moteurs de recherche. Les banques de données: une partie intégrante du Web Antoine PY et Baptiste Buisson 8 Le Web Invisible Les 4 niveaux d’invisibilités
  • 9. Une requête consomme autant qu’une ampoule pendant 1h Antoine PY et Baptiste Buisson 9 Les serveurs classiques Historique: • Les banques de données sont apparues en 1960. Objectif: Une volonté d’améliorer l’efficacité du web. • Depuis 1970 des serveurs sont crées par plusieurs sociétés privées.
  • 10. Contenu plus qualifié, plus précis, plus vérifié et plus vaste Antoine PY et Baptiste Buisson 10 Des informations structurées et validées • Les bases de données hébergent une information structurée et variée. - Références avec résumé et indexation d’articles… - Brevets américains, européens… - Références avec indexation de brevets - Textes intégrals de milliers de titres de presse - Informations marketing
  • 11. Contenu plus qualifié, plus précis, plus vérifié et plus vaste Antoine PY et Baptiste Buisson 11 Des ressources difficiles d’accès • Les bases de données sont plus difficiles d’accès que celle du web visible - Accès réservé aux abonnées - Accès Payant - Connaissance des langages
  • 12. En 2000: la taille du web invisible croissait plus vite que le web visible. Ceci n’est plus d’actualité. Pourquoi? • L’indexation de nouveaux formats de fichier Fichier .pdf (document de qualité): publications scientifiques et universitaires, rapports de chercheurs… Fichier .doc, .xls, .ppt, .rtf, .ps • Les partenariats avec des éditeurs de banques de données Pages dynamiques Accord signé entre l’Inst-Cnrs (17 millions de bibliographie) avec Google La croissance de la taille du Web invisible s’atténue de plus en plus Antoine PY et Baptiste Buisson 12 L’évolution
  • 13. • Trouver des documents supplémentaires • Informations plus pertinentes • Elargir son champ de recherche Taille web visible: 167 téraoctets Tailles web invisible: 91 000 téraoctet Antoine PY et Baptiste Buisson 13 Utilité des recherches dans le deep web
  • 14. Les informations à trouver: - Revues éléctroniques - Livres électroniques - Catalogues en ligne - Des articles Le web invisible est 544 fois plus grand que le web visible Antoine PY et Baptiste Buisson 14 Les outils Le fonctionnement: - Recherche par catégorie - Possibilité de modifier sa recherche: options de recherche
  • 15. Les informations à trouver: - Ressources pertinentes sur beaucoups de sujets Antoine PY et Baptiste Buisson 15 Les outils Le fonctionnement: - Recherche par catégorie et par mots-clés
  • 16. Les informations à trouver: - Ressources pertinentes sur beaucoups de sujets Antoine PY et Baptiste Buisson 16 Le fonctionnement: - Recherche par catégorie Les outils
  • 17. Les informations à trouver: - Sujets académiques - Dictatitiels sur des techniques efficaces de recherche d’internet Antoine PY et Baptiste Buisson 17 Les outils Le fonctionnement: - Recherche par mots-clés ou par sujet
  • 18. Les informations à trouver: - Encyclopédies - Atlas - Bibliographie Antoine PY et Baptiste Buisson 18 Le fonctionnement: - Recherche par mots-clés Les outils
  • 19. Moteurs de recherche pour étudiants Trouver du contenu sur l’ingénierie, les mathématiques et l’informatique Types d’information: - Nouvelles sur l’industrie - Offres d’emploi - Rapports techniques - Sites web pertinents Antoine PY et Baptiste Buisson 19 Le fonctionnement: - Recherche par mots-clés Les outils
  • 20. Antoine PY et Baptiste Buisson 20 Les outils Méta-moteur - Nombreuses possibilités de personnalisation et de paramétrage - Trouver les informations les plus récentes
  • 21. • DeepWeb ≠ DarkWeb ≠ Darknet DarkWeb: le côté « malsain » du DeepWeb Darknets: réseaux privés virtuels, souvent de petites tailles et dans le but d’échanger des fichiers, The internet behind the internet Antoine PY et Baptiste Buisson 21 Le DarkWeb
  • 22. Plusieurs Outils existent: • TOR (The Onion Router) • Base-search.net • D’autres moteurs de recherche spécialisés The internet behind the internet Antoine PY et Baptiste Buisson 22 Comment y accéder? Avec Google Chrome Avec TOR
  • 23. The internet behind the internet Antoine PY et Baptiste Buisson 23 Les Outils
  • 24. The internet behind the internet Antoine PY et Baptiste Buisson 24 Les Outils
  • 25. • Béatrice Foenix-Riou : « Recherche éveillé sur Internet: mode d’emploi » • « Web profond ». Encyclopédie en ligne. Wikipédia, s. d. http://fr.wikipedia.org/wiki/Web_profond • « Cinq moteurs de recherche pour explorer le darknet ». Site d’information sur les nouvelles technologies. Parlons Geek, s. d. http://www.parlonsgeek.com/cinq-moteurs-de-recherche-pour-explorer/. • « Clearing Up Confusion – Deep Web vs. Dark Web », 27 mars 2014. http://www.brightplanet.com/2014/03/clearing-confusion-deep-web-vs-dark-web/ • « Deep Web, Dark Web, les parties immergées d’Internet | Panoptinet », s. d. http://www.panoptinet.com/cybersecurite-decryptee/deep-web-dark-web-les-parties-immergees-dinternet/ • Dejonckheere, Eric. « AYA.io - Recherche dans le Web profond ». Blog. AYA.io, 22 juin 2013. http://aya.io/blog/deep-web-search/. • « La recherche d’Informations sur le Web », s. d. http://c.asselin.free.fr/french/invisible_web.htm. • « MemoAV_WebInvisible - Memo_WebInvisible.pdf ». http://bibliotheque.unice.fr/services-et-formations/aide-et-formation/documents/Memo_WebInvisible.pdf. • « Rechercher l’information - Les informations du web invisible ». http://www.c2imes.org/MODULES/B2/co/I_E_partieB.html. • Digimind, Découvrir et exploiter le web invisible pour la veille stratégique: http://www.esi.ac.ma/Dossiers/20140126070100.pdf Antoine PY et Baptiste Buisson 25 Bibliographie
  • 26. Merci pour votre attention Antoine PY et Baptiste Buisson 26