• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
Recherche d'informations sur internet
 

Recherche d'informations sur internet

on

  • 74,924 views

Support de la formation "Recherche d'informations sur internet (perfectionnement) : méthodologie et outils disponibles" organisée par l’URFIST de Paris en 06/2014. ...

Support de la formation "Recherche d'informations sur internet (perfectionnement) : méthodologie et outils disponibles" organisée par l’URFIST de Paris en 06/2014.
Carte de la présentation orale : http://www.mindmeister.com/fr/162751003.

Statistics

Views

Total Views
74,924
Views on SlideShare
40,710
Embed Views
34,214

Actions

Likes
47
Downloads
1,678
Comments
11

75 Embeds 34,214

http://urfist.enc.sorbonne.fr 16804
http://www.scoop.it 6017
http://www.netpublic.fr 5249
http://www.demainlaveille.fr 2093
http://moodle.univ-angers.fr 618
http://cursus.edu 535
http://internetaccompagne.blogspot.fr 484
http://moodle2.vn.refer.org 362
http://www.pedagogie.ac-nantes.fr 296
http://foad.hautetfort.com 291
http://giry.enc.sorbonne.fr 191
http://peps.univ-angers.fr 116
http://prodocelec.jimdo.com 89
http://durdelafeuille.tumblr.com 87
http://jadlat.tumblr.com 86
http://www.a-brest.net 78
http://195.220.134.244 75
http://www.pearltrees.com 72
http://www.netvibes.com 62
http://urfistience 61
http://feeds2.feedburner.com 57
http://lycee-marie-curie.ac-reunion.fr 54
http://2180762581.nvmodules.netvibes.com 50
http://giry2.enc.sorbonne.fr 45
http://www.netemploi.fr 36
http://www1.ifi.auf.org 28
http://0160112k.esidoc.fr 26
https://twitter.com 25
http://www.lycee-pablo-picasso.fr 18
http://134.157.89.3 17
http://www9.jimdo.com 14
http://0250033a.esidoc.fr 14
http://voyelle.tumblr.com 13
http://www.twylah.com 12
http://www-ig-opensocial.googleusercontent.com 10
http://www.bibliotheques.cergypontoise.fr 10
https://hootsuite.scoop.it 10
http://missiontice.ac-besancon.fr 8
http://51y6tx.widget.uwa.netvibes.com 8
http://web.archive.org 7
http://feeds.feedburner.com 7
http://www.diigo.com 6
http://127.0.0.1 5
http://translate.googleusercontent.com 5
http://bibliotheque.enpc.fr 5
http://safe.tumblr.com 4
http://2227437836.nvmodules.netvibes.com 4
https://si0.twimg.com 4
http://195.220.134.233 4
http://51y92m.widget.uwa.netvibes.com 3
More...

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

CC Attribution License

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel

110 of 11 previous next Post a comment

  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
  • [MISE A JOUR] : support du 30/11/2013 mis à jour le 04/04/2014
    Are you sure you want to
    Your message goes here
    Processing…
  • Merci beaucoup pour cette présentation.
    Are you sure you want to
    Your message goes here
    Processing…
  • [MISE A JOUR] : support du 10/04/2013 mis à jour le 30/11/2013
    Are you sure you want to
    Your message goes here
    Processing…
  • [MISE A JOUR] Nouvelle édition corrigée et augmentée du support au 10/04/2013
    Are you sure you want to
    Your message goes here
    Processing…
  • un support d'une très grande qualité
    Are you sure you want to
    Your message goes here
    Processing…

110 of 11 previous next

Post Comment
Edit your comment

    Recherche d'informations sur internet Recherche d'informations sur internet Presentation Transcript

    • Recherche d’informations sur Internet (perfectionnement) méthodologie et outils disponibles A. Bouchard
    • Pour commencer
    • Principes Moteurs de recherche Sites internet Bases de données bibliographiques Autres bases de données textuelles Images et multimédia Web social Actualités et temps réel Quelques outils complémentaires Veille automatisée Exercices de synthèse Bibliographie
    • Principes
    • Internet ? web ? • internet • réseau de réseaux • fin des années 1960 • protocole TCP/IP • applications et services divers : courrier électronique (mail), messagerie instantanée (IM), forums de discussion, transfert de fichiers (FTP), pair à pair (P2P), web (www)… • données • utilisateurs : 2,4 MM. dans le monde (Internet World Stats) • langues : 56,1 % du contenu en anglais, 3,9 % en français (W3Techs)
    • Internet ? web ? • Web • World Wide Web • milieu des années 1990 • ensemble de pages HTML (textes, images, liens…) avec une URL et accessibles avec le protocole HTTP • web visible / web invisible • web invisible ou web profond : partie du web non indexée et qui ne peut être trouvée par les moteurs de recherche (pages protégées par un mot de passe, générées dynamiquement à la suite d’une requête…) • taille • 920 M. de sites (Netcraft, 03/2014), 30 x 1012 pages individuelles (Google, 03/2013) • web indexé: au moins 13,2 milliards de pages (Worldwidewebsize, 03/2013) • taille du web identifié (URL connues) ? web général ?
    • Les âges du web ConceptArtmultimédia,2010
    • Méthodologie • DEBUSQUER l’information Différents outils Esprit critique Bookmark organisé URL significative Syntaxe de recherche Questions préalables Utilisation réfléchie Evaluation Règles à respecter Eduscol. Rechercher sur internet
    • Méthodologie • définir le sujet (mots-clés)  une stratégie de recherche  des critères d’évaluation : crédibilité, qualité et pertinence Questions préalables Prendre du temps au départ pour en gagner par la suite... Ne pas se lancer tout de suite dans la requête. Se poser des questions : - Au minimum : Qu'est-ce que je cherche exactement ? Le web est-il le moyen le plus rapide ? - Pour aller plus loin : Qui (profil du demandeur) ? Quoi (nature de l’information) ? Où (limites géographiques, lieux ressources) ? Quand ? Pourquoi (objectifs) ? Comment (outils, (outils, méthodologie, stratégie) ? Eduscol. Rechercher sur internet
    • Méthodologie • dictionnaires : abréviations, synonymes, hiérarchies, associations • généralistes • Dictionnaires Larousse : http://www.larousse.fr/dictionnaires 21 dictionnaires de langue (français et bilingues) • Trésor de la langue française (TLF) : http://atilf.atilf.fr/tlf.htm • FranceTerme : http://www.culture.fr/franceterme à noter : vocabulaires spécialisés : http://www.culture.fr/Ressources/FranceTerme/Librairie • Grand dictionnaire terminologique (GDT) : http://gdt.oqlf.gouv.qc.ca/ dictionnaire québécois, propose également une traduction en anglais • Dictionnaire électronique des synonymes (DES) : http://www.crisco.unicaen.fr/des/ • dictionnaires multilingues • WordReference : http://www.wordreference.com/fr/ intérêt des forums • OneLook : http://www.onelook.com/ • Lexilogos : http://www.lexilogos.com • Acronym Finder : http://www.acronymfinder.com/
    • Méthodologie • thésaurus bibliothéconomiques abréviations, synonymes, hiérarchies, associations • RAMEAU : http://catalogue.bnf.fr Autorités > RAMEAU > Choisir un critère : Nom commun RAMEAU thésaurus utilisé par la majorité des bibliothèques françaises et notamment le catalogue de la BnF et dans le SUDOC • MOTBIS : http://www.cndp.fr/motbis/ thésaurus utilisé dans les CDI de l’enseignement secondaire, les IUFM… • Library of Congress Authorities : http://authorities.loc.gov/ équivalent de RAMEAU pour la bibliothèque nationale des Etats-Unis • MeSH : http://www.ncbi.nlm.nih.gov/mesh thésaurus utilisé pour indexer les articles dans PubMed (médecine) ! différences entre l’anglais et l’américain : Ex. : fiber /fibre, flavor /flavour, sulfur /sulphur… Bartoc (Basel Register of Thesauri, Ontolgies and Classifications) : http://bartoc.org/ répertoire de vocabulaires contrôlés (thesauri, ontologies…) 600 ressources, 65 langues +
    • Méthodologie • dictionnaires multilingues • scientifiques • TermSciences : http://www.termsciences.fr/ portail terminologique multidisciplinaire (CNRS, INIST, INRIA…) termes français, anglais, espagnols, allemands arbre des concepts • AGROVOC : http://aims.fao.org/standards/agrovoc FAO + 32 000 concepts, 22 langues : nourriture, agriculture, environnement… • Atlas sémantiques du CNRS : http://dico.isc.cnrs.fr/dico_html/fr/index.html • Eurovoc : http://eurovoc.europa.eu/ thésaurus multilingue et multidisciplinaire de l’Union européenne (27 langues) • Exemplar : http://springerexemplar.com/index.aspx Springer terminologie scientifique (« words in context ») • Lexique Techniques de l’ingénieur : http://www.techniques- ingenieur.fr/lexique.html sur inscription - secteurs industriels majeurs 4 langues, schémas et figures • Thésaurus de l’UNESCO : http://databases.unesco.org/thesfr/ termes français, anglais, espagnols, russes : éducation, culture…
    • Méthodologie • suggestions des moteurs de recherche • moteurs de recherche ExaleadGoogle
    • Méthodologie via F. Flamerie
    • Méthodologie • connaître les outils Différents outils Il n’y a pas que Google ! - bien comprendre les différences entre moteurs, métamoteurs et annuaires, - distinguer les outils généralistes et les outils spécialisés, - repérer les sites portails utiles pour vos recherches les plus fréquentes, - essayer et comparer des outils de types différents, et d'autres du même type, - lire l'aide en ligne, l'imprimer, mieux encore, faire sa propre fiche, - mieux vaut maîtriser 1 ou 2 outils que sous-utiliser un grand nombre. Eduscol. Rechercher sur internet Utilisation réfléchie En fonction des réponses apportées, utiliser de façon réfléchie - l(es) outil(s) adapté(s), avec au besoin des filtres pays/langues - de bons mots clés avec une syntaxe correcte (en saisissant bien la requête) Syntaxe de recherche Se familiariser avec la syntaxe - les principes d'interrogation des bases de données (opérateurs booléens et de proximité, signes + et -, troncature...), - la syntaxe de saisie spécifique à chaque outil (recherche simple et recherche avancée).
    • Méthodologie • syntaxe de recherche • opérateurs booléens AND, OR, AND NOT/BUT NOT/ NOT/- , plus rarement ET/OU/SAUF parenthèses : ex. : [Versailles (parc OR jardin)] • syntaxe ordre des mots mots vides : ex. : [travail enfants Chine] pour trouver des documents sur le travail des enfants en Chine guillemets pour expression exacte : ex. : [« base de données »] ! aux abréviations : ex. : limites de [« George Bush »] : distinction George W. Bush / George H. W. Bush ? troncature : ex. : [jardin*] pour jardinage, jardiner, jardinier… • orthographe casse +mot et –mot pour indiquer ou soustraire un terme exact, ex. [+De Wilde], [+marché] (pour exclure « marche ») accents et signes diacritiques (notamment pour outils non francophones) pluriels : ex. : [« textiles techniques »] et [« textile technique »] • proximité • syntaxe de saisie • recherche simple et avancée • filtres avant ou après la saisie de la requête  variable selon les outils
    • Méthodologie • analyser les résultats Esprit critique Tout au long de la recherche : faire preuve d’esprit critique, prendre du recul... Est-ce fiable ? S’agit-il d’un fait réel ? d’une idée reçue ? d'une rumeur ? S'agit-il d’une opinion ? Quels autres points de vue sur le sujet ? Est-ce bien ce que je cherche ? Ma méthode de recherche est-elle adaptée ? Eduscol. Rechercher sur internet Evaluation Evaluer - l'information (fiabilité, intérêt) - l’intérêt du site (richesse du contenu) et son ergonomie (clarté, navigation dans le site), site), - les résultats (performance des outils, pertinence de la requête), Adopter au besoin une nouvelle stratégie (élargir ou restreindre la requête). Conserver éventuellement la requête (termes et opérateurs utilisés) dans le bookmark. URL significative L’URL donne des informations importantes. - Décrypter la structure des adresses url pour identifier la nature du site, - Modifier une adresse url pour accéder à une page web.
    • Méthodologie • exploiter les résultats Bookmark organisé Un bookmark bien organisé facilite les recherches et permet de retrouver les retrouver les informations. - Avoir le réflexe (marque-pages sur Mozilla, favoris sur Internet Explorer, Explorer, signets sur Netscape), - Identifier ses sources pour bien structurer le bookmark, - Constituer des dossiers en fonction de ses centres d'intérêt et les actualiser, actualiser, - Constituer un dossier spécifique à l'occasion d'une recherche. Eduscol. Rechercher sur internet Règles à respecter Respecter les règles - respecter la nétiquette mais aussi naviguer en internaute averti, - respecter le droit d'auteur, citer la source d'un document et ses références.
    • Méthodologie • « Keep wading to a minimum : Size of the search tool does not matter » « Si vous n’avez pas trouvé ce que vous cherchez dans les 20 à 50 premiers sites, abandonnez et n’allez pas plus loin. Soit reformulez votre recherche soit essayez un autre outil de recherche […]. Aucun moteur de recherche n’est le meilleur. Une recherche complexe nécessite des outils de recherche nombreux. Le nombre de sites appropriés est plus important que le nombre de sites recherchés. » (D. Vidmar. Tips to Effective Internet Searching)
    • Moteurs de recherche
    • Moteurs de recherche Documents diversité des documents et des formats : - pages web - sites - documents (texte, images…) Recherche RECHERCHE PAR MOTS-CLES (texte intégral, titre, URL…) spécifique à chaque outil présence généralement d’une recherche avancée avec des possibilités de recherches complexes (requêtes construites) existence possible de tris et de filtres, d’une aide Périmètre généralement web visible peu d’interrogations du web invisible existence de moteurs généralistes et spécialisés mais indexation et présentation des résultats automatiques difficile de trouver des documents originaux et peu connus Outils moteurs de recherche généralistes métamoteurs moteurs de recherche spécialisés (scientifiques notamment) ou « verticaux » (thématiques) + / - ! pas d’exhaustivité + pour informations, données factuelles (dates, adresses…) ou questions générales ! présence de publicités et validité des sources non vérifiée évolution vers une prise en compte du langage naturel et une reconnaissance des termes
    • Etat des lieux d’après AT Internet, 05/2014 Monde France Google 88,5% Bing 4.4% Yahoo! 3.5% autres! 3,6% Parts de marché des moteurs de recherche dans le monde d’après StatCounter, 05/2014 Google 92,5% Bing 2,8% Yahoo! 2,6% autres 2,1% Parts de marché des moteurs de recherche en France
    • Moteurs et métamoteurs de recherche • Comment fonctionne un moteur de recherche ? Link2city.com† ! chaque moteur a sa propre couverture du web, ses propres index, algorithmes et fonctionnalités cf. Thumbshots Ranking
    • Moteurs de recherche • fonctionnalités générales possibles • combinaison des différents opérateurs • filtres de recherche - titres des pages ! aux accents - nom de domaine ou site + fonctionnalités plus avancées que moteur de recherche sur le site ! seulement sur les pages indexées par le moteur - URL des pages ! pas d’accent - type de fichier - date (Google, Exalead) ! date de publication (1e indexation des pages) et pas toujours date de rédaction de la page • « backlinks » d’une page ou d’un site • suggestions de recherches associées • formulaires de recherche avancée - ne permettent pas des combinaisons très poussées • préférences de recherche (langue, résultats, sécurité)
    • Google Google • révolutionnaire en 1998 mode de recherche (AND par défaut) simplicité de l’interface (one box) – recherche simple • données chiffres inconnus (30-40 MM. de pages indexées ?) ne concerne qu’une partie du web 100 milliards de requêtes par mois • recherche avancée • classement des résultats algorithme tenu secret prenant en compte plusieurs éléments : - ordre des mots dans la requête - fréquence et place des mots - fraîcheur de l’information - PageRank (notoriété d’une page grâce aux liens)  pages connues et non les plus pertinentes dans les premiers résultats  prise en compte des nouveaux sites pas encore populaires ? ! tendance de plus en plus fréquente de Google (cf. aide) à : • suggérer des corrections orthographiques et d’autres orthographes (ex. sing./plur.) • personnaliser la recherche en utilisant les données de l’utilisateur (notamment localisation et compte Google)  se déconnecter de tout service Google (Gmail, Google+, YouTube…) quand on cherche sur Google  nettoyer son historique Google (http://history.google.com/) et son navigateur (historique, cookies…)  utiliser des services qui anonymisent la recherche (ex. : https://www.startpage.com/, http://duckduckgo.com/?t) • inclure des synonymes des mots cherchés (recherches considérées comme similaires) • chercher sur la racine d’un mot (inclusion du pluriel quand on cherche un singulier, etc.) • exclure certains termes recherchés Cf. How search works
    • fonctionnalitésderecherche opérateurs booléens AND:touslesmots(généralementimplicite):ex.[jardinjardinage] OR:aumoinsundesmots:ex.[jardinORjardinage] *:joker:ex.[«le«*deSisyphe»]pourlemytheoulesupplicedeSisyphe(opérateurdeproximité) -mot:motexclu critères de recherche avancée «mot»:motexact,sanssynonymenivarianteorthographique:ex.[Mickael«Jacson»]pourexclure Jackson « »:expressionexacte:ex.[«réchauffementclimatique»] intext::pourforcerGoogleàprendre encompteletermesanslelaisserdecôté intitle:pourunmotouuneexpressionentreguillemetsdansletitredelapageet allintitle:pour plusieursmots inurl:pourunmotouuneexpressionentreguillemetsdansl’URLetallinurl:pourplusieursmots site: :siteoudomaine:ex.[site:google.fr],[site:.edu] filetype: :typedefichier:ex.[filetype:ppt] chiffre..chiffre(+unitédemesureaubesoin):fourchettedechiffres:ex.[MichelPlatini1970..1980] autres fonctionnalités troncature:impliciteetaléatoire proximité:AROUND(n) maisaléatoire résultats filtres variablesselonletypededocument recherché(web,images…):pays,région,langue,date, localisation,réutilisation +motàmot:chaîneexactedecaractères:ex.[littératuretibétaine]nedonneranilittératuresnitibétain rech. associées enbasdelapagederésultats autres fonctionnalités cache, sites similaires enfacedechaquerésultat, encliquantsurlepetittriangle auboutdel’URL related::sitessimilaires vocabulaire define::définition(nefonctionneplusbien?) préférences filtreSafeSearch résultatsparpage blocagedesrésultatsindésirables historiqueweb indexation d’un site Google Voir également : Aide sur Google
    • Moteurs de recherche • moteurs multilingues • Bing : http://www.bing.com/ Microsoft - moins de critères de recherche avancée et de filtres que Google • Yahoo! : http://search.yahoo.com/ technologie : Bing - moins de critères de recherche avancée et de filtres que Google • Yandex : http://www.yandex.com moteur de recherche russe, avec une version anglophone - moins de critères de recherche avancée et de filtres que Google à suivre cependant • Ask : http://www.ask.com/?o=312 ancien moteur de recherche AskJeeves + indication de related searches et de related questions (en langage naturel) • Blekko : http://blekko.com/ moteur de recherche participatif souhaite présenter des résultats fiables à partir de sites de qualité et sans spam déclare respecter les droits de recherche (algorithmes ouverts…) + slashtags (fonctionnalité permettant notamment de sélectionner des sites jugés pertinents et de limiter les résultats à ces sites)
    • Moteurs de recherche • moteurs territoriaux et nationaux • Search Engine Colossus : http://searchenginecolossus.com/ moteur de recherche de moteurs de recherche (317 pays et territoires) • Search Engines of the World : http://www.searchenginesoftheworld.com/
    • Moteurs de recherche • moteurs francophones • Exalead : http://www.exalead.com/search/ Dassault Systèmes, plus de 16 MM. de pages indexées moteur ciblant plus les professionnels que Google (grand public) + opérateurs (notamment) - OPT : terme dont la présence est optionnelle - NEXT et NEAR : opérateurs de proximité (NEAR/n pour le nombre max. entre les deux termes) - soundslike: recherche phonétique - spellslike: orthographe approchée + filtres par termes associés que l’on peut rajouter à la requête (clic) ou exclure (shift + clic) + troncature par * + outils d’affinage • Qwant : Qwant : http://www.qwant.com/ moteur de recherche français, ouvert en 2013 présentation en 5 colonnes (images, web, actualités, live, social, shopping + « Qnowledge graph ») - pas de recherche avancée, tris… sources ? (Bing, Amazon, Wikipedia) • Voila : http://www.voila.fr/ Orange +/- par défaut : indexation du web francophone, notamment domaines .org, .com, .net, mais nombreux sites commerciaux dans les résultats
    • Métamoteurs de recherche Métamoteurs de recherche • outils interrogeant simultanément plusieurs outils de recherche • peuvent retraiter les résultats de façon structurée • peuvent disposer de fonctionnalités propres • permettent d’élargir la recherche • mais : • recherche sur des critères a minima communs aux outils interrogés • ne disposent pas de leur propre index  de bons outils pour commencer une recherche (mots-clés, informations) ! aucun outil n’indexe la totalité du web
    • Métamoteurs de recherche • Ixquick : https://eu.ixquick.com/ (https://www.startpage.com/ aux EU) + confidentialité des recherches (pas d’enregistrement des adresses IP ni des cookies) + indication par une étoile des sites figurant parmi les dix meilleures réponses d’un des moteurs interrogés + recherche en 18 langues, avec des moteurs de recherche locaux et internationaux site associé Startpage.com permet d’interroger anonymement Google - pas de liste des moteurs interrogés • PolyMeta : http://www.polymeta.com/ + clustering des résultats + possibilité de choisir les sources interrogées (dont Google, Bing et Exalead) + filtre sur web, actualités, vidéos, images, blogs • Info.com : http://info.com/ + recherche sur Google, Bing, Yahoo et Yandex • Harvester42 : http://harvester42.fzk.de + interroge une quarantaine de bases de données, notamment du web invisible : moteurs de recherche (Bing et Exalead), moteurs de recherche scientifiques (Google scholar), bibliothèque numérique (Google Books), outils 2.0 (Delicious, citeulike)… + ne retraite pas les résultats et conserve les fonctionnalités des bases initiales • Twingine.no : http://www.twingine.no/ interroge et présente simultanément Bing et DuckDuckGo, sans fusionner les résultats + accès aux fonctionnalités des deux moteurs à la fois
    • Moteurs de recherche scientifiques Moteurs de recherche scientifiques • spécialisés dans la littérature scientifique et académique • privilégient les sources d’information des chercheurs (articles, congrès, brevets…) • destinés à la communauté universitaire et scientifique • gratuits • parmi leurs fonctionnalités, peuvent proposer l’exportation de références bibliographiques et l’analyse bibliométrique
    • Moteurs de recherche scientifiques M.-L. Malingre et A. Serres
    • Moteurs de recherche scientifiques • Google scholar : http://scholar.google.fr/ 2004, métamoteur articles scientifiques approuvés ou non par des comités de lecture (plupart des journaux en ligne, en accord avec les éditeurs), thèses, citations… prend également en compte les sites internet des auteurs et des laboratoires + « autres articles » + versions (différentes versions, avec mise en avant de la version en accès libre) - couverture pas connue précisément (journaux, disciplines, mises à jour)  exhaustivité et fraîcheur de la recherche ? - premiers résultats : souvent articles très cités (popularité cf. PageRank)  place des nouveaux articles encore peu cités ? - indexation automatique (auteurs, date, mots-clés) - accès au texte intégral pas systématique  voir avec les bibliothèques et les laboratoires pour les abonnements - nombre de citations peu fiable, cf. l’exemple de Ike Antkare (C. Labbe)  ne peut servir d’indicateur  un outil moins efficace que les bases de données payantes ? (H. Basset) recherche avancée
    • Moteurs de recherche scientifiques • Isidore : http://www.rechercheisidore.fr/ TGE Adonis – CNRS acronyme pour Intégration de services, Interconnexion de DOnnées de la Recherche et de l’Enseignement métamoteur de données francophones en SHS prioritairement en libre accès (bases de données, fonds numérisés, carnets de recherche, actualités…, notamment HAL, Revues.org, Calenda et Hypotheses.org) plus important projet d’open data scientifique en France 3,2 M. de ressources et 93 collections de 2 300 sources différentes, classées selon plusieurs référentiels scientifiques (dont RAMEAU) + filtres (périodes historiques, disciplines…) ! formulaire de recherche avancée : passer par une page de résultats
    • Moteurs de recherche scientifiques • Microsoft academic search : http://academic.research.microsoft.com/ 2009 ; 45 M. de références ? accès par domaine, puis auteurs, publications, sources, mots-clés, organisations + graphiques de tendances (citations, réseaux et généalogies, tendances d’un domaine…) • WorldWideScience : http://worldwidescience.org/ 2007, réalisé par un consortium de 17 organismes de l’IST + portail mondial scientifique multilingue (recherche fédérée et technologie de traduction) 80 bases de données et portails de 70 pays + nombreux filtres, y compris un filtre visuel • Science.gov : http://www.science.gov/ portail des ressources officielles scientifiques américaines (annuaire et moteur de recherche) 55 bases de données, 2 100 sites, 200 M. de pages + nombreux filtres, y compris un filtre visuel • ScienceResearch : http://scienceresearch.com/scienceresearch/ métamoteur (portails comme Science.gov, WorldWideScience et autres sources comme PubMed…) + clusterisation des résultats • FreeFullPDF : http://www.freefullpdf.com/ 80 M. de publications scientifiques en PDF (articles, brevets, posters, thèses), 15 000 sources - limité aux 100 premières réponses (Google CSE) pour des moteurs de recherche disciplinaires, cf. M.-L. Malingre et A. Serres. Connaître les moteurs de recherche de l’information scientifique… (2012)
    • Evolutions des moteurs de recherche • périmètre • personnalisation de la recherche • insertion de réseaux sociaux dans la recherche (temps réel et géolocalisation) mais un appauvrissement du web ? (E. Pariser) • exclusion des résultats les plus populaires (100 à 1 M. de sites) : Million Short (sites récents ou sans référenceur) • recherches • tags • recherches non textuelles : images, sons… • recherche dans les contenus non textuels ex. : Voxalead : http://voxaleadnews.labs.exalead.com/ • outils • extensions des navigateurs (moteurs de recherche, fonctionnalités) • marché du mobile
    • Evolutions des moteurs de recherche • présentation des résultats • mashups ex. : MuMa (The Music Mashup) d’Exalead : http://muma.labs.exalead.com/ • visualisation des données - graphiques de tendances : ex. : Microsoft academic search : http://academic.research.microsoft.com/DomainTrend - représentations visuelles : ex. : Spezify.com : http://spezify.com/, ManagedQ : http://managedq.com/ - cartographie : ex. : Kartoo † ; TouchGraph : http://www.touchgraph.com/seo, Constellation : http://constellations.labs.exalead.com - réseaux : ex. : Microsoft academic search : http://academic.research.microsoft.com/ • technologie • géolocalisation • recherche sémantique : langage naturel, entités nommées, réponse aux questions ex. : DuckDuckgo : http://duckduckgo.com/?t (désambiguïsation) ex. : WolframAlpha :http://www.wolframAlpha.com (données factuelles) ex. : évolution de Google (Knowledge Graph)
    • Sites internet
    • Sites internet Documents sites et portails internet (y compris catalogues en lignes, revues en lignes, corpus, bases de données) plus rarement sections ou pages de site, dossiers internet Recherche RECHERCHE THEMATIQUE alphabétique/arborescente/moteurs de recherche portant généralement sur les notices descriptives et non sur les sites sélectionnés « sourcing » (identification de sources) Périmètre information sélectionnée, organisée et hiérarchisée : identification de sites spécialisés ou localisés dans un pays donné (validée voire commentée : répertoires) généralistes thématiques et spécialisés Outils annuaires généralistes répertoires sélectifs (signets) outils thématiques pages de liens +/- + identification d’une liste de sites (domaines, pays…) ! mises à jour ? ! liens commerciaux
    • Annuaires généralistes • international • Dmoz (open directory project) : http://www.dmoz.org/ modèle open source 4,2 M. de sites, 1 M. de catégories, 90 000 rédacteurs bénévoles, multilingue France : 230 000 sites, 20 000 catégories : www.dmoz.org/World/Français/ • Yahoo! Directory : http://dir.yahoo.com/ 5 MM. de pages ?, dont France : 19 200 sites (http://dir.yahoo.com/Regional/Countries/France/) soumission payante  orientation commerciale ? • Virtual Library (Vlib) : http://vlib.org/ premier répertoire du web (1991), association à but non lucratif • Best of the web (BOTW) : http://botw.org/ soumission partiellement payante + indication de blogs et forums • Infomine : http://infomine.ucr.edu/ + ressources éducatives • France • Les annuaires : http://www.lesannuaires.com/ + annuaires régionaux et des pays d’Europe + repérage d’outils spécialisés
    • Répertoires de signets • France • Signets de la BnF : http://signets.bnf.fr/accueil.html 7 300 sites, 16 000 liens, 1 150 rubriques classement selon le classement des salles de lecture du site François-Mitterrand accès alphabétique, thématique , moteur de recherche, nouveautés • Signets des universités : http://www.signets-universites.fr/ partenariat CERIMES/ABES, catalogue collectif alimenté par les bibliothèques de l’enseignement supérieur, notamment par des CADIST 3 200 signets accès thématique par établissement, moteur de recherche, indication du niveau et de la catégorie du site - ne reprend pas les signets de toutes les bibliothèques de l’enseignement supérieur à compléter notamment par - BIU Santé (santé) - BIU Cujas (droit) • Signets de la France contemporaine (BPI) : http://www.bpi.fr/fr/professionnels/collections_et_services2/signets_de_la_fran ce_contemporaine.html
    • Répertoires de signets • international - universités • Intute : http://www.intute.ac.uk/ 123 000 ressources, 60 établissements contributeurs guides interactifs d’autoformation (Virtual Training Suite) ! arrêté en juillet 2011 • Academicinfo : http://www.academicinfo.net/subject-guides 25 000 ressources nombreuses ressources sur les Etats-Unis, mais pas exclusivement • quelques répertoires thématiques • Annuaire environnement, écologie et nature : http://www.environnement-annuaire.net/ 1 600 ressources, 125 catégories • Annuaire 1000 sites utiles pour l’entreprise : http://www.lyon.cci.fr/site/cms/18735/Recherche-d-informations-sur-Internet? par la CCI de Lyon
    • Informations sur les sites • informations factuelles • Alexa : http://www.alexa.com/topsites Amazon classement des sites selon leur traffic rank (usagers + pages vues) : top 500 mondial et par pays, catégories • SimilarWeb : http://www.similarweb.com • bases « Whois » ! mise à jour des données • registres : organismes gérant les noms de domaines • AFNIC (Association française pour le nommage internet en coopération) : http://www.afnic.fr/ registre des noms de domaines .fr et .re (La Réunion) (Whois) • interfaces de recherche • WHOIS : http://whois.domaintools.com/ base de noms de domaines
    • Informations sur les sites • date de publication d’un site / d’une page web [B. Foenix-Riou, 2012] • bases « Whois » (cf. supra) • « archives du web » (cf. infra) • recherche par date des moteurs : date de publication estimée / d’indexation par les robots ! recouper les différentes informations • historique • Internet Archive – Wayback Machine : http://archive.org/web/web.php Internet Archive (organisme à but non lucratif) « archives du web » archivage de 364 MM. de pages web visibles depuis 1996, plus de 420 M. de sites recherche uniquement par l’URL permet de retrouver des pages supprimées ex. : site de la bibliothèque Mazarine ! liens brisés, images supprimées et délai d’archivage - peu intéressant pour les données du web 2.0 • Google : pages en cache sur la liste de résultats instantané de la page telle qu’elle était affichée lors de l’indexation par Google - peut permettre de résoudre une erreur 404 (page not found)
    • Informations sur les sites • sites similaires • Google : related:url ou « pages similaires » de la liste de résultats ( à côté du lien vert) ! attention construire sur le modèle : [related:google.fr] visible également via l’outil TouchGraph : http://www.touchgraph.com/seo (10 premiers sites similaires) • SimilarSites : http://www.similarsites.com/ • SimilarSiteSearch : http://www.similarsitesearch.com/ • identifier des pages de liens • intérêt des pages de liens (liens / bookmarks / signets) et des portails (portails / annuaires / répertoires) avec une requête de type : intitle:, inurl: ex. [« réchauffement climatique » intitle:liens OR intitle:sites OR inurl:liens OR inurl:sites] permet de trouver des pages contenant soit « liens » soit « sites » dans le titre de la page ou l’URL et portant sur le « réchauffement climatique » • liens entrants et sortants • [aléatoire selon les moteurs] link:url : liste des pages web qui proposent un lien vers une URL ! attention pour Google, construire sur le modèle : [link:google.fr ] • outils spécifiques webmasters : Bing webmaster tools, Google Analytics
    • Bases de données bibliographiques
    • Bases de données bibliographiques Documen ts références bibliographiques de livres, périodiques, articles, rapports, congrès, thèses… informations sur un auteur, un directeur de thèse informations sur les travaux d’un établissement, laboratoire… réseaux de co-auteurs éléments de bibliométrie (localisation et/ou accès au texte intégral) Recherch e recherche par mots-clés, parfois par index spécifique à chaque outil présence généralement d’une recherche avancée et de filtres (a priori et/ou a posteriori) Périmètre disciplinaire pluridisciplinaire littérature blanche (édition commerciale : livres, revues, bases de données…) littérature grise (édition non commerciale : thèses, mémoires, rapports, articles non publiés…) Outils catalogues de bibliothèques (ressources possédées par un/des organismes documentaires) bibliothèques numériques bases de données bibliographiques (signalement de l’information produite, indépendamment de son lieu de conservation ; souvent dépouillement d’articles) + / - + recherche documentaire (références de documents ou documents eux-mêmes) ! pas d’exhaustivité ! mises à jour ? penser également aux catalogues d’éditeurs et aux sites commerciaux (comme avec ou sans accès au texte intégral
    • Catalogues de bibliothèques • France • SUDOC : www.sudoc.abes.fr ABES catalogue collectif des bibliothèques et centres de documentations de l’enseignement supérieur et de la recherche 10 M. de références + localisation - pas d’exhaustivité des établissements concernés • BnF catalogue général : http://catalogue.bnf.fr BnF catalogue général de la BnF, à compléter par d’autres catalogues pour certains documents spécialisés 10 M. de références bibliographiques + dépôt légal français - catalogage parfois plus tardif et moins de langues étrangères que SUDOC • CCFr : http://ccfr.bnf.fr BnF + fonds anciens des bibliothèques françaises rétroconverties - peu de critères de recherche, lenteurs ! : pas/peu de dépouillement de périodiques (autres outils) indexation aléatoire (périodes, type de documents…) ressources numériques peu prises en compte (autres outils)
    • Catalogues de bibliothèques • international • WorldCat : http://www.worldcat.org/ OCLC + plus grand catalogue mondial (2 MM. de références) (y compris SUDOC, BnF…) - références avant tout anglo-saxonnes + localisation des documents • KVK : http://www.ubka.uni-karlsruhe.de/kvk.html + et - métamoteur (WorldCat, catalogues collectifs et/ou de bibliothèques nationales français, anglais, espagnols, allemands, italiens…) : peu de critères de recherche + possibilité de choisir les moteurs interrogés • Library of Congress : http://catalog.loc.gov/ ! : pas/peu de dépouillement de périodiques (autres outils) indexation aléatoire (périodes, type de documents…) ressources numériques peu prises en compte (autres outils)
    • Catalogues de bibliothèques et archives • archives et manuscrits • Calames : http://www.calames.abes.fr/pub/ BU, établissements de recherche, sociétés savantes • CCFR manuscrits : http://ccfr.bnf.fr/portailccfr/jsp/index.jsp CGM (catalogue général des manuscrits), BnF archives et manuscrits et PALME (manuscrits littéraires français du XXe s.) • voir également les rubriques archives et manuscrits des signets de la BnF et Portail européen des archives : http://www.archivesportaleurope.net/ ! : catalogues non exhaustifs
    • Bases de données bibliographiques • pluridisciplinaires • ScienceDirect : http://www.sciencedirect.com/ Elsevier, 12 M. d’articles peer-reviewed, 2 200 journaux et 26 000 livres - mono-éditeur • JSTOR : http://www.jstor.org/ archives de revues de sciences humaines et sociales 1 M. de références, 1 000 revues principalement en anglais • Refdoc : http://www.refdoc.fr/ INIST, 53 M. de références mention de la version en libre accès : encore très rare • Ingenta : http://www.ingentaconnect.com/ 5,9 M. de références, 12 000 publications • EZB (Elektronische Zeitschriftenbibliothek) : http://rzblx1.uni- regensburg.de/ezeit/about.phtml?bibid=AAAAA&colors=7&lang=en répertoire de revues électroniques en ligne, 75 000 titres (accès libre ou non) • Q-Sensei Scholar : http://scholar.qsensei.com/ 40 M. de références (bases de données bibliographiques et archives ouvertes : Ingenta, PubMed…) ! : pas/peu de références de documents autres qu’articles accès au texte intégral pas systématique et souvent payant  voir avec les bibliothèques et les laboratoires
    • Portails de revues • bases en accès libre • Persée : http://www.persee.fr programme de numérisation des archives de revues savantes françaises en sciences humaines et sociales (revues scientifiques, publications et séries) 157 collections (+ 51 en traitement) , 182 000 articles en texte intégral participe à la plateforme canadienne Erudit : http://www.erudit.org/revue/ + nombreux filtres sur la page de résultats dont illustrations diffusables, documents en accès libre… • Revues.org : http://www.revues.org/ fédération de revues en sciences humaines et sociales 391 revues, 12 collections de livres • base en accès restreint • Cairn : http://www.cairn.info/ plateforme de publications de revues en langue française accès possible par discipline 385 revues, mais également magazines, ouvrages collectifs et encyclopédies et ouvrages de références ! quelle complémentarité entre les programmes ? à consulter : Mirabel : http://www.reseau-mirabel.info/ réservoir d’informations sur les revues (dont accès au texte intégral), mais pas
    • Bibliothèques numériques • France • Gallica : http://gallica.bnf.fr/ réalisée par la BnF mais rassemble des collections de différentes autres bibliothèques (bibliothèques, centres de recherche : BIUM, BIU Cujas, CNAM, INHA…) et des partenaires commerciaux 3 M. documents (textes, images, presse…) accès par thèmes - présence de documents accessibles sous conditions - interrogation du texte intégral pas possible pour l’ensemble des fonds • Numes : http://www.numes.fr [ne fonctionne pas au 1er/04/2014] inventaire des corpus numérisés et des projets de numérisation des établissements et organismes du Ministère de l’enseignement supérieur et de la recherche 190 corpus • Europe • Europeana : http://www.europeana.eu./portal/ projet européen réunissant des institutions européennes ! : ouvrages en texte intégral = essentiellement libres de droit
    • Bibliothèques numériques • Google books (Google livres) : http://books.google.fr/ projet de numérisation et d’OCRisation de Google, dont « programme partenaires » et « projet bibliothèque » 20 M. d’ouvrages scannés (03/2012) interrogation plein texte + recherche avancée - surreprésentation des ouvrages anglo-saxons - pour les ressources académiques, voir Google scholar (deux programmes de mise en ligne différents) ! : accès au texte intégral partiel (aperçu), voire inexistant
    • Bibliothèques numériques • World Digital Library / Bibliothèque numérique mondiale : http://www.wdl.org/fr/ projet porté par l’UNESCO navigation par lieu, période, thème, type d’élément et institution • Archive.org : https://archive.org/details/texts 6 M. de documents à compléter par le projet Open Library : http://openlibrary.org/ projet de créer une page web pour chaque livre publié dans le monde 1 M. de livres gratuits • Project Gutenberg : http://www.gutenberg.org/ plus ancien projet de numérisation (e-books gratuits) 45 000 ouvrages (! libres de droit aux Etats-Unis) + plusieurs formats de téléchargement • HathiTrust : http://www.hathitrust.org/ bibliothèque numérique de bibliothèques universitaires américaines (90 partenaires) 5,8 M. de livres dont 3,7 M. dans le domaine public (50 % en anglais) et 290 000 titres de périodiques à compléter par la catégorie « Bibliothèques numériques » des signets de la BnF et par liste Wikipedia
    • Parutions et critiques • JournalTOCs (Journal Tables of Contents): http://www.journaltocs.ac.uk/ Heriot-Watt University d’Edimbourg plus grande collection de tables de matières de revues scientifiques 24 100 revues, dont 7 600 en open access alertes lors des nouveaux numéros • Sign@l : http://doc.sciencespo-lyon.fr/Signal/ service de la documentation deSciencesPo Lyon signalement des contenus de 281 périodiques en sciences humaines et sociales • Parutions.com : http://parutions.com/ site animé par un collectif de chercheurs, de journalistes classement par discipline comptes rendus • Nonfiction.com : http://www.nonfiction.fr/ site animé par un collectif de chercheurs, de journalistes classement par discipline comptes rendus • Recensio.net : http://www.recensio.net/front-page-fr plateforme de recensions d’ouvrages pour la recherche historique européenne • voir également les sites internet des éditeurs et les sites commerciaux (comme Amazon, FNAC, Le choix des libraires…)
    • Autres bases de données
    • Autres bases de données textuelles Documents données factuelles et/ou bibliographiques tout type de documents, dont articles scientifiques, pré et post- publications, littérature grise… calendriers et offres d’emploi Recherche spécifique à chaque outil présence généralement d’une recherche avancée Périmètre disciplinaire pluridisciplinaire littérature blanche (édition commerciale : livres, revues, bases de données…) littérature grise (édition non commerciale : thèses, mémoires, rapports, articles non publiés…) Outils moteurs de recherche spécialisés moissonneurs OAI plateformes de dépôt et publication (archives ouvertes) + / - mise en ligne et accessibilité parfois dès la publication et/ou la soumission à des éditeurs
    • Open access et archives ouvertes 20 % des articles publiés / an : libre accès (H. Dillaerts) • 8 % : revues scientifiques électroniques en accès libre (gold open access) publication d’articles dans des journaux à comités de lecture immédiatement et librement accessibles, sans restriction d’utilisation, c’est-à-dire sans barrière financière, légale ou technique • 12 % : archives ouvertes (1,5 M. d’articles ?) – open archives archives ouvertes : réservoirs de dépôt et de publications créés par des réseaux de chercheurs ou des institutions pour favoriser l’auto-archivage (sans contrôle) (green open access) • + 2 000 réservoirs dans le monde (France : 65) • types de documents : pre-prints et prépublications (manuscrits soumis pour publication) post-prints ou postpublications (manuscrits révisés par les pairs et acceptés pour publication, mais avant leur mise en page) littérature grise (thèses et HDR, colloques, manuscrits non publiés ailleurs…) ! : de plus en plus de chercheurs déposent leurs productions non pas sur des plateformes d’archives ouvertes mais sur leurs profils de réseaux sociaux (Academia, ResearchGate…)
    • Archives ouvertes • réservoirs d’archives ouvertes (disciplinaires et thématiques) • arXiv : http://arxiv.org/ première archive ouverte (1991) Cornell University, physique, mathématiques, informatique, statistiques 930 000 « e-prints » • CogPrints : http://cogprints.org/ notamment psychologie, neurosciences, linguistique • e-Lis (E-prints in Library and Information Science) : http://eprints.rclis.org/ sciences de l’information et des bibliothèques 14 000 documents • PMC (PubMed Central) : http://www.ncbi.nlm.nih.gov/pmc/ biomédical et sciences de la vie 3 M. d’articles (notamment postpublications) • RePEc (Research Papers in Economics) : http://repec.org/ sciences économiques – se veut exhaustif (collecte d’autres archives ouvertes) 1,4 M. de documents, 79 pays • OpenAIRE (Open Access Infrastructure for Research in Europe) : http://www.openaire.eu/fr projet européen de dépôt de résultats de recherche financées par l’Union européenne
    • Open access et archives ouvertes • international • pluridisciplinaires (moissonneurs OAI) • OIAster : http://oaister.worldcat.org/ premier moissonneur OAI université du Michigan et OCLC, accessible dans WorldCat 25 M. de références, 1 100 participants (archives ouvertes essentiellement) n’indexe pas le texte intégral • BASE (Bielefeld Academic Search Engine) : http://www.base-search.net/ bibliothèque de l’université de Bielefeld 60,3 M. de documents (75 % accessibles en texte intégral), 2 900 sources + intègre une recherche « synonymes multilingues » • DRIVER (Digital Repository Infrastructure Vision for European Research) : http://www.driver-repository.eu/ projet européen de métamoteur – l’une des bases du projet européen OpenAIRE 3,9 M. de références, 295 réservoirs, 38 pays • Open Science Directory : http://www.opensciencedirectory.net/ EBSCO, + 13 000 journaux • CORE (COnnecting REpositories) : http://core.kmi.open.ac.uk/search 18,2 M. de références • JURN : http://www.jurn.org/ indexe + 4 800 revues en open access (arts et humanités)
    • Open access et archives ouvertes • répertoires (et moteurs de recherche personnalisés) • OpenDOAR (Directory of Open Access Repositories) : http://www.opendoar.org/ université de Nottingham annuaire de réservoirs d’archives ouvertes (+ 2 500 références) moteur de recherche sur leur contenu (Google CSE, n’affiche que les 100 premières réponses) • ROAR (Registry of Open Access Repositories) : http://roar.eprints.org/ université de Southampton mêmes principes qu’OpenDOAR : répertoire et moteur de recherche sur leur contenu (Google CSE, n’affiche que les 100 premières réponses) • Ranking web of repositories : http://repositories.webometrics.info/en • DOAJ (Directory of Open Access Journals) : http://www.doaj.org/ université de Lünd répertoire de journaux en open access et en texte intégral, 10 000 journaux dont 5 600 interrogeables au niveau de l’article, 1,6 M. d’articles • DOAB (Directory of Open Access Books) : http://www.doabooks.org/ OAPen Foundation répertoire de livres en open access, 1 900 livres peer-reviewed, 61 éditeurs • ROAD (Registry of Open Access scholarly Resources) : http://road.issn.org/ centre ISSN et UNESCO ressources librement accessibles comportant un ISSN (revues, collections, actes de conférences…) encore en version bêta (7 000 ressources)
    • Archives ouvertes • France • HAL (Hyperarticles en ligne) : http://hal.archives-ouvertes.fr/ CCSD-CNRS, pluridisciplinaire composée de plusieurs portails (génériques, thématiques, institutionnels) : 280 000 documents en texte intégral, de niveau recherche pre-prints, articles, thèses, HDR, communications… autres plateformes institutionnelles : Archimer (Ifremer) : http://archimer.ifremer.fr/ Horizon (IRD) : http://horizon.documentation.ird.fr OATAO (Open archive Toulouse archive ouverte) : http://oatao.univ- toulouse.fr/
    • Thèses • France • thèses en préparation voire soutenues • Theses.fr : http://www.theses.fr/ application STEP (Signalement des Thèses En Préparation, qui succède au Fichier central des thèses de Nanterre) doit signaler l’ensemble des thèses de doctorat soutenues en France depuis 1985, y compris des thèses de la CGE (confédération des Grandes Écoles, après la fermeture de Thesa en 2013) 331 000 thèses (dont 261 000 thèses soutenues, 69 000 en préparation et 31 000 thèses accessibles en ligne) ! informations parfois incomplètes et pas toujours à jour à compléter notamment par TEL (http://tel.archives-ouvertes.fr/ ) pour des thèses en texte intégral qui ne seraient pas concernées par l’application STAR (Signalement des Thèses électroniques, Archivage et Recherche) • thèses soutenues • à regarder en priorité : SUDOC (version de soutenance) : http://www.sudoc.abes.fr • à compléter éventuellement par BIUS (santé) : http://www2.biusante.parisdescartes.fr/theses/theses_rech.htm IFE (ex-INRP, éducation et formation) : http://ife.ens-lyon.fr/vst/Recherches/AccueilTheses.php ANRT : http://www.diffusiontheses.fr/anrt-catalogue-theses-doctorat.html ! : HDR : dépôt facultatif ; signalement non exhaustif
    • Thèses • France • texte intégral • TEL (Thèses En Ligne) : http://tel.archives-ouvertes.fr/ CCSD archive ouverte d’auto-archivage par les auteurs (sous-partie de HAL) et de dépôt par les établissements des thèses déposées au format électronique (application STAR) 38 000 thèses et HDR peut compléter Theses.fr pour trouver des thèses en texte intégral ! : voir également le site et /ou les archives ouvertes de l’établissement de soutenance ou de sa bibliothèque notamment Pastel (ParisTech) : http://pastel.archives-ouvertes.fr/ Petale (Lorraine) : http://petale.univ-lorraine.fr/index.html cf. « Trouver des thèses françaises en texte intégral » (ABES) • DUMAS (Dépôt universitaire de mémoires après soutenance) : http://dumas.ccsd.cnrs.fr/ dépôt par l’auteur dépôt par l’établissement de soutenance
    • Thèses • international Par pays : voir « Thèses étrangères » (BnF) texte intégral • DART-Europe E-theses Portal : http://www.dart-europe.eu/basic-search.php 28 pays européens, 555 universités, 480 000 thèses (dont TEL) • OATD (Open Access Theses and Dissertations) : http://oatd.org/ moissonneur de thèses et de mémoires (universités et institutions de recherche) + 2 M. de références indexées • NDLTD (Networked Digital Library of Theses and Dissertations) : http://www.ndltd.org/ (adresse du moteur : www.vtls.com/ndltd) 100 établissements, 3,2 M. de références de documents (en open access ou non) - pas toujours très performant (lien à la source…) • par pays : voir « Trouver des thèses étrangères en texte intégral » (ABES) • la base de données ProQuest Theses and Dissertations (PQDT) est payante  voir avec les bibliothèques et les laboratoires
    • Comptes rendus de colloques • littérature grise (non publiée) • plateformes de dépôt d’archives ouvertes HAL : http://hal.archives-ouvertes.fr/ recherche avancée : conférences invitées, communications avec ou sans actes… • web social (blogs, réseaux sociaux académiques…) • publication • bases de données bibliographiques
    • Littérature grise • littérature grise « Tout document dactylographié ou imprimé, produit à l’intention d’un public restreint, en dehors des circuits commerciaux de l’édition et de la diffusion et en marge des dispositifs de contrôle bibliographiques » (AFNOR) • GreySource : http://www.greynet.org/greysourceindex.html sélection de ressources en littérature grise classification par thèmes • Open Grey Repository : http://www.opengrey.eu SIGLE (système pour l’information en littérature grise en Europe) : base de données multidisciplinaire européenne, gérée et maintenue par l’INIST-CNRS signale les ressources des grands centres européens d’information et de fourniture de documents accès à 890 000 références bibliographiques produites en Europe • Lara : http://lara.inist.fr/ accès au texte intégral des rapports scientifiques et techniques français
    • Données et statistiques • institutions • INSEE : http://www.insee.fr/fr/ sites statistiques français, européens et internationaux • EUROSTAT : http://epp.eurostat.ec.europa.eu/portal/page/portal/eurostat/home/ site de la Commission européenne • UNdata : http://data.un.org/ site de l’ONU (UNICEF, UNESCO…) • Data.gouv.fr : http://www.data.gouv.fr/ plateforme française d’ouverture des données publiques (open data) • Data portal : http://open-data.europa.eu/open-data/ site de l’open data de la Commission européenne • moteurs de recherche et répertoires • FindTheData : http://www.findthedata.org/ métamoteur de comparaison de données sources primaires (bases de données gouvernementales, universitaires…) accès possible par thématique • Zanran : http://www.zanran.com/q/ moteur de données et statistiques (PDF, Excel, HTML) recherche uniquement en anglais + copies de pages internet et documents qui ont pu être supprimés depuis • Knoema : http://knoema.com/ cartes, infographies, données… accès par mots, catégories, mots-clés • RechStat : http://www.kyxar.fr/~jalac/ répertoire des sites des institutions fournissant des statistiques officielles mondiales accès par moteur, pays et thème
    • Brevets, marques… • moteurs de recherche • Google search patents : http://www.google.fr/webhp?tbm=pts • sites spécialisés • INPI : http://www.inpi.fr/fr/services-et-prestations/bases-de-donnees- gratuites.html marques, brevets, dessins et modèles, jurisprudence • OEB (Office européen des brevets) : Esp@cenet : http://www.epo.org/searching/free/espacenet.html 80 M. de documents, 1836  • USPTO (US Patent and Trademark Office) : http://www.uspto.gov/ patents, trademarks
    • Presse en ligne • presse francophone • Le moteur (Orange) : http://www.lemoteur.fr/?bhv=web_fr - sources limitées • Giga Presse : http://www.giga-presse.com/ 674 journaux francophones 10 000 journaux internationaux • Guide Presse : http://www.press-directory.com/ annuaire francophone de la presse en ligne notamment presse quotidienne et hebdomadaire régionale • Newspaper Map : http://newspapermap.com/ annuaire, accessible via une carte • presse internationale • Online Newspapers.com : http://www.onlinenewspapers.com/ annuaire de journaux en ligne ; possibilité d’interroger par pays, catégorie • Paperboy : http://www.thepaperboy.com/ 12 000 journaux en ligne possibilité de voir les unes • Planète Presse : http://www.courrierinternational.com/sources_overview annuaire de journaux en ligne ; possibilité d’interroger par pays, région, périodicité
    • Type de documents • généralistes penser en premier lieu aux filtres de recherche sur certains moteurs de recherche généralistes : Google (filetype: ) • PDF • PDFgeni : http://www.pdfgeni.com/ • e-books • ebibli.fr : http://www.ebibli.fr/ recherche d’e-books gratuits (Google recherche personnalisée) • cartes heuristiques • BiggerPlate : http://www.biggerplate.com/ • voir également les galeries des plateformes de logiciels : Mindmeister, Mindomo, Xmind…
    • Information circulante • forums et listes de discussion • Google groups : https://groups.google.com/forum/?fromgroups#!overview archive des groupes de discussion Usenet et d’autres forums depuis 1981 recherche dans le texte (1 MM. de messages) • 1001 forums : http://www.1001forums.fr/ annuaire (19 900 forums, 4 200 catégories pour la version française) • BoardReader : http://boardreader.com/ moteur de recherche graphiques de tendances • Omgili : http://omgili.com/ moteur de recherche américain : 100 000 forums, listes de discussions, listes de diffusions • listes de diffusion • CataList : http://www.lsoft.com/lists/listref.html catalogue des listes LISTSERV, 58 000 listes publiques + recherche par pays, par nombre d’inscrits… • JISCMail – National Academic Mailing List Service : http://www.jiscmail.ac.uk/ annuaire et moteur de recherche de listes anglophones, 8 000 listes
    • Web invisible • bases de données • Dadi : http://dadi.univ-lyon1.fr/ répertoire de bases de données gratuites disponibles sur internet ! dernière mise à jour : juillet 2012 • CompletePlanet : http://www.completeplanet.com répertoire de plus de 70 000 bases de données et moteurs de recherche spécialisés ! © : 2000-2010
    • Calendriers et offres d’emplois • calendriers • Calenda : http://calenda.revues.org/ plus important calendrier scientifique francophone en sciences humaines et sociales 25 000 événements • Lanyrd : http://lanyrd.com/ répertoire mondial de conférences voir également les réseaux sociaux académiques par exemple • ResearchGate : http://www.researchgate.net/ plus grande base de données d’emplois scientifiques et plus gros agenda dans le monde ? • IamResearcher : http://www.iamresearcher.com/ 25 800 événements
    • Images et multimédia
    • Images et multimédia Documents images son podcasts vidéos (colloques, conférences…) et screencasts graphiques Recherche recherche par mots-clés recherche par images recherche textuelle Périmètre documents du domaine public et libres de droits documents sous droit Outils recherches avancées des moteurs de recherche moteurs de recherche spécialisés plateformes de dépôt et publication +/- + moteurs spécifiques - peu de recherches non textuelles
    • Moteurs de recherche d’images • généralistes • Google images : http://www.google.fr/imghp?hl=fr&tab=wi + recherche inversée par image • Bing images : http://www.bing.com/?scope=images&FORM=Z9LH • Yahoo! images : http://images.search.yahoo.com/images;_ylt=A0oG7nlVwJdPkTMADFCl87UF?ei=UTF- 8&fr2=tab-web&p= • Exalead images : http://www.exalead.com/search/image/  proposent généralement les mêmes filtres : taille, couleur, style, contenu (visage…) • spécialisés • Everystockphoto : http://www.everystockphoto.com/ + recherche avancée, avec licence • voir également les moteurs de recherche de plateformes de dépôt et publication : Flickr (Yahoo!), Picasa (Google), Fotopedia (encyclopédie collaborative), Pixabay (nombreuses images en CC0), deviantART, Fotolia, Alamy…
    • Moteurs de recherche d’images • spécialisés • Culture.fr : moteur Collections : http://www.culture.fr/Ressources/Moteur-Collections métamoteur du patrimoine culturel français numérisé 1 900 collections numérisées et productions multimédia associées, 660 institutions (Gallica, Musées nationaux, Direction des archives de France…) tous sujets, tous types de documents 5 M. de documents, 4 M. d’images à noter : Joconde (collections des musées de France), Mérimée (architecture et patrimoine) et Histoire des arts patrimoine numérique : http://www.numerique.culture.fr/pub-fr/index.html • Michael - Multilingual Inventory of Cultural Heritage in Europe : http://www.michael-culture.org/ portail européen multilingue • Medihal : http://medihal.archives-ouvertes.fr/ archive ouverte de photographies et d’images scientifiques 15 300 documents
    • La recherche par image • la recherche par image • Google images : http://www.google.fr/imghp?hl=fr&tab=wi • TinEye : http://www.tineye.com recherche des pages où l’image est utilisée sur le web • PicsLikeThat : http://www.picslikethat.com/ images Fotolia, recherche par similarité • la recherche par couleur • MulticolorEngine (TinEye) : http://labs.tineye.com/multicolr (images Flickr en CC) • Chromatik (Exalead) : http://chromatik.labs.exalead.com/ (référence des images ?) Ex. d’intérêt pour la recherche : Netsources, n°97
    • Moteurs de recherche de cartes • généralistes • Google maps : http://maps.goog le.com/ • Bing maps : http://www.bing.com/maps/ • Yahoo! maps : http://maps.yahoo.com/  proposent généralement les mêmes fonctionnalités : cartes, images aériennes et satellites, voire streetview • spécialisés • Géoportail : http://www.geoportail.gouv.fr/accueil IGN et BRGM portail des territoires et des citoyens qui a pour but de « faciliter l’accès à l’information géographique de référence » + cartes thématiques
    • La recherche de sons • podcasts • Digital Podcast : http://www.digitalpodcast.com/ répertoire : 24 800 podcasts en 97 catégories • sons • FindSounds : http://www.findsounds.com/ moteur de recherche d’effets sonores (animaux, instruments de musique, TV et cinéma…) • Freesound : http://www.freesound.org moteur de recherche d’effets sonores • Soundcloud : http://soundcloud.com/ plateforme de partage avec moteur de recherche • Midomi : http://www.midomi.com/ recherche de musique + recherche textuelle et recherche vocale • Music Smasher : http://www.musicsmasher.net métamoteur de recherche de chansons • Muma (The Music Mashup) : http://muma.labs.exalead.com/ mashups de musique (chansons, albums et artistes) + recherche par mots-clés, accord, date
    • Moteurs de recherche de vidéos • généralistes • Google vidéos : http://www.google.fr/videohp?hl=fr • Bing vidéos : http://www.bing.com/?scope=video&FORM=Z9LH2 possibilité de visionner les vidéos dès la page de résultats • Yahoo! vidéo : http://video.search.yahoo.com/video;_ylt=A0oG7lT8wZdPxTUAhZel87 UF?ei=UTF-8&fr2=tab-web&p= • Exalead vidéos : http://www.exalead.com/search/video/  proposent généralement les mêmes filtres : durée, date, résolution, source • voir également les moteurs de recherche de plateformes de dépôt et publication : YouTube (Google), Dailymotion, Vimeo…
    • Moteurs de recherche de vidéos • spécialisés • AOL video (anciennement Truveo) : http://on.aol.com/ • Blinkx : http://www.blinkx.com/ interroge également sur le contenu sonore par reconnaissance automatique  proposent généralement des catégories et des indications de tendances • Voxalead (Exalead) : http://voxaleadnews.labs.exalead.com/ + reconnaissance automatique de texte • thématiques • IMDb (Internet Movie Database) : http://www.imdb.com/ plus importante base sur le cinéma 900 000 titres • INA : http://www.ina.fr/ recherche vidéo, audio, publicités accès disciplinaire • EUscreen : http://www.euscreen.eu/ projet européen (20 pays), lié à Europeana accès par moteur, sujet, genre, langue et fournisseur
    • Plateformes multimédia • universitaires et académiques • UNT Universités numériques thématiques [Open CourseWare France]: http://www.universites-numeriques.fr/ocw/index.html ressources pédagogiques rassemblées par domaines et disciplines (sciences fondamentales, santé et sport, sciences humaines et sociales, environnement et développement durable, lettres et langues, droit économie-gestion, sciences de l’ingénieur et technologie) - grande disparité de contenus selon les domaines • CERIMES (Centre de ressources et d’information sur les multimédias pour l’enseignement supérieur) : http://www.cerimes.fr/ plusieurs sites dont CanalU, vidéothèque numérique de l’enseignement supérieur (conférences, cours) et Canalc2 (colloques…) • YouTube : dont YouTube EDU : http://www.youtube.com/education chaînes d’établissements ou d’événements (ex. : TEDTalks) • Dailymotion : chaînes d’établissements ou d’événements (ex. : Les Ernest de l’ENS) • Khan Academy : https://www.khanacademy.org/ classement thématique • voir également les sites des établissements
    • Web social
    • Web social Documents 1° informations outils 2.0 (blogs, wikis) références bibliographiques sites et pages internet documents multimédia articles supports d’interventions offres d’emploi actualités (colloques, recensions…) 2° personnes individus : professionnels, experts, veilleurs… groupes d’intérêts et de discussions Recherche peu d’indexation dans les moteurs de recherche « classiques » comme Google outils spécifiques modalités variables selon les outils sérendipité Périmètre web visible et partie du web invisible web 2.0 / social / collaboratif Outils moteurs de recherche généralistes annuaires plateformes de bookmarking plateformes de partage moteurs de recherche sociale +/- + pour des documents originaux et peu connus (signaux faibles) : complément aux bases de données professionnelles [C. Tisserand-Barthole, 2012] et aux moteurs de recherche « traditionnels » + pour des personnes ressources dont activité peut être suivie - pas d’outil unique spécifique à tout le web social / web 2.0 - information non validée
    • Wikis Wikis 1995 : mode de publication rapide (« wiki » = rapide) • présentation architecture et contenu modifiables structuration en rubriques reliées par des liens hypertexte présence d’un historique Ex. de fonctionnement : Wikipedia
    • Wikis recherche de wikis • Qwika moteur de recherche 1 200 wikis, 22 M. d’articles en 12 langues (notamment les différentes Wikipedia) • WikiIndex • Liste Wikipedia voir également les listes des hébergeurs, comme Sites MediaWiki , Wikia le cas Wikipedia • Exalead Wikipedia : http://www.exalead.com/search/wikipedia/ recherche dans six Wikipedia (fr, en, de, es, it, nl) avec la technologie Exalead
    • Blogs Blogs mi-1990’s : mode de publication rapide (blog = web + log) • présentation architecture et contenu modifiables structuration en billets (présentation ante-chronologique) et catégories liens permanents possibilité de commentaires • chiffres 2011 160 millions de blogs dans le monde (France : 15 M.) ? 1,5- 2 millions de billets/j. ? • cas particulier du blogging scientifique carnets de recherche et d’expérimentations Ex. de fonctionnement : URFISTInfo
    • Blogs • recherche de blogs • annuaires • Top Blogs Ebuzzing (ex-Wikio) : http://labs.ebuzzing.fr/top-blogs classement de blogs : disponible en .fr, .com., .uk, .de, .es, .it, avec des catégories variables 2 M. de sources informations sur le blog : thématiques, billets remarquables, statistiques • EatonWeb : http://portal.eatonweb.com/ annuaire de blogs + metrics : overall, strength et momentum • voir également les signets de bibliothèques • voir également les annuaires et répertoires (BOTW) • blogrolls des blogs • voir également les plateformes de blogs, comme OverBlog
    • Blogs • moteurs de recherche sur les blogs • Google recherche de blogs : http://www.google.fr/blogsearch se veut exhaustif à la condition que les blogs proposent un flux (RSS ou Atom) recherche dans le texte - ne ramène pas que des blogs • Icerocket blogs : http://www.icerocket.com/ + critères de recherches avancées supplémentaires (titre du billet, auteur, tag) • Researchblogging : http://researchblogging.org/ agrégateur de billets de blogs académiques, disposant d’un moteur de recherche plutôt anglophone et sciences et techniques + recherche sur un moteur de recherche avec une équation de type inurl:blog OR intitle:blog
    • La folksonomie indexation automatique… ou indexation humaine • tags : mot-clé sous forme d’étiquette Ex. nuage de tags de DiigoEx. tags du texte brut de l’article « Web 2.0 » de Wikipédia, par Wordle Ex. nuage de tags des sujets dans l’OPAC de l’Ecole nationale des Chartes
    • La folksonomie • intérêt des tags : visibilité de concepts qui ne sont pas encore entrés dans le domaine bibliothéconomique indexation par la Library of Congress Library Thing
    • Bookmarking Plateformes de « social bookmarking » • outils de stockage et de gestion de contenus numériques URL, références bibliographiques, images, texte… • présentation de chaque élément titre ou références bibliographiques (tags) • outil de mise en commun et de réseautage groupes, abonnements à des comptes... Ex. de fonctionnement : Diigo intérêt de ces plateformes pour la recherche : Diigo : top 10 des outils de recherche (CNET, 2006)
    • Bookmarking • bibliothèques et avis • LibraryThing : http://www.librarything.com/ majoritairement anglo-saxon 1,7 M. membres ; 80 M. de livres catalogués ; 95 M. de tags • Babelio : http://www.babelio.com/ majoritairement francophone • bookmarks • généralistes • Delicious : http://www.delicious.com/ plateforme de favoris internet accès au moteur de recherche par la rubrique Help • Diigo : https://www.diigo.com/ plateforme de favoris internet formulaire de recherche avancée : champs, opérateurs • Pearltrees : http://www.pearltrees.com plateforme de favoris internet - nécessité de passer par un Pearltree pour accéder au moteur de recherche et à la fonction « découverte » (exemple) possibilité d’interroger via Google avec une requête site:pearltrees.com + fonctionnalité « pearltrees voisins » pour d’autres Pearltrees similaires
    • Bookmarking • références bibliographiques • Bibsonomy : http://www.bibsonomy.org/ + bookmarks et références bibliographiques • citeulike : http://www.citeulike.org 7,6 M. de références critères de recherche avancée (titre, revue, auteur, numéros internationaux, tags, utilisateur…) • Mendeley : http://www.mendeley.com/ Elsevier 2,6 M. de membres, 260 000 groupes, 486 M. de références (2013) est également un véritable gestionnaire de références bibliographiques formulaire de recherche avancée (critères : titre, auteur, résumé, MeSH, type de document, date, disciplines) • Zotero : http://www.zotero.org/ est avant tout un gestionnaire de références bibliographiques local (installation sur l’ordinateur) - peu de possibilités de recherche (via formulaire : utilisateur, groupe, support ; forum : sujet, commentaire et utilisateur ; utilisateurs par discipline)
    • Plateformes de contenu • généralistes • Slideshare : http://www.slideshare.net/ LinkedIn 16 M. de comptes (2013) essentiellement des présentations (supports de formations et d’interventions…) vu par un maître de conférences (O. Ertzscheid) - moteur de recherche peu satisfaisant, tris et filtres a posteriori • Scribd : http://www.scribd.com/ • Calameo : http://www.calameo.com/ • Issuu : http://issuu.com/ • scientifiques • Figshare : http://figshare.com/ partage de données, de résultats négatifs et de schémas • myExperiment : http://www.myexperiment.org/ partage de schémas de workflows, 7 500 membres, 300 groupes, 2 500 workflows • SciVee : http://www.scivee.tv/ vidéos et podcasts scientifiques, synchronisés avec des documents
    • Outils de curation • Scoop.it : http://www.scoop.it/ plateforme de curation de ressources (veille thématique)  diffusion de la veille  suivi de l’actualité d’un domaine • Netvibes : http://www.netvibes.com tableaux de bord personnalisés (thématiques…)  sélection de sites (signets)  agrégateur de flux RSS (outil de veille) • Storify : http://storify.com/ plateforme de curation (dossiers éditorialisés) + support URFIST Rennes
    • Microblogging Vanksen.Twitter:présentationcomplètedel’essentiel
    • Microblogging • Twitter : http://twitter.com/ 241 M. de comptes mensuels actifs (11e site mondial, 9 langues) réseau d’information en temps réel (cf. pratique du live-tweet - LT) vu par un maître de conférences (O. Ertzscheid) : filtre humain et non algorithmes d’un moteur tweets : messages limités à 140 caractères (d’où syntaxe et vocabulaire spécifique : @, RT, tinyurl...) utilisation du # (hashtag) pour ajouter des mots-clés recherche simple : https://twitter.com/search-home et recherche avancée : https://twitter.com/search-advanced (mots, personnes, lieux, autre avec croisements possibles) - exhaustivité des résultats ? • autres moteurs pour Twitter • Topsy : http://topsy.com archives de Twitter depuis 2006, y compris des tweets supprimés recherche avancée : http://topsy.com/advanced-search et filtres + recherche de liens partagés, tweets, photos, vidéos, experts, tendances avec filtres + classement des tweets en fonction des RT (retweets) + alertes • Trendsmap : http://trendsmap.com/ carte de tendances temps réel géolocalisées
    • Réseaux sociaux Réseaux sociaux • social networking (« service de réseautage social en ligne ») : liens bilatéraux ou via des groupes • réseaux d’affinités, de pratiques et / ou d’intérêts • proposent notamment des espaces de discussions/forums, offres d’emploi, manifestations voire plateformes de dépôt de documents + possible indexation dès les premières pages des moteurs de recherche généralistes (Google) ! recherche parfois possible seulement après inscription  essayer cependant une recherche de type site: sur un moteur comme Google ! résultats de la recherche pouvant varier selon la taille du réseau et les abonnements souscrits
    • Réseaux sociaux • généralistes • Facebook : http://www.facebook.com/ 1,15 MM. de comptes (2e site mondial, 80 langues), +3,5 MM. de contenus partagés/sem. à l’origine de 20% de l’ensemble des pages web consultées aux États-Unis • Google+ : https://plus.google.com/ 250 M. de comptes • professionnels • LinkedIn : http://www.linkedin.com/ 300 M. de comptes (9e site mondial, 10 langues) à prédominance anglophone ! résultats de recherche variables selon la taille du réseau et l’abonnement souscrit [M. Guibert, 2012] • Viadeo : http://www.viadeo.com/ 55 M. de comptes (6 langues) à prédominance francophone, mais en perte de vitesse
    • Réseaux sociaux • académiques • ResearchGate : http://www.researchgate.net/ 4 M. de comptes réseau à prédominance scientifique moteur de recherche sémantique interne portant sur plus de 45 millions d’articles (dont Pubmed, ArXiv, IEEE et CiteSeer) • Academia : http://academia.edu/ + 10 M. de comptes, 2,7 M. d’articles centré sur le partage de papiers de recherche (open science) • IamResearcher : http://www.iamresearcher.com/ 10,2 M. de publications, 17 000 établissements • BiomedExperts : http://www.biomedexperts.com/ 463 000 comptes et 1,8 M. de profils pré-remplis spécialisé en sciences de la vie visualisation de réseaux de co-auteurs (via Elsevier)
    • Moteurs de recherche sociale • Moteurs portant sur le web 2.0 (réseaux sociaux, microblogging…) et la présence en ligne en général • peuvent interroger le web invisible • moteurs de personnes • Pipl : http://pipl.com • WebMii : http://www.webmii.com • Yasni : http://www.yasni.com ! penser à utiliser également : - les moteurs de recherche (ex. avec une recherche de type [fédération OR association] pour trouver un groupe d’expert) - des annuaires généralisés ou non (ex. Indexa pour les entreprises françaises)
    • Moteurs de recherche sociale • moteurs du web 2.0 ! pas de moteur de recherche unique et résultats généralement peu pertinents (exhaustivité ?, classement ?., services concernés..) ! les moteurs de recherche généralistes indexent peu/mal le contenu des réseaux sociaux • Social mention : http://socialmention.com métamoteur : plus de 80 sources (blogs, microblogging, bookmarking, multimédia…) recherche avancée : http://socialmention.com/advanced_search et filtres + possibilité de choisir les sources concernées + flux RSS et alertes + nombreuses analyses (trends, top users, top hashtags…) - lent (interrogation en temps réel) et non exhaustif • Hshtags : http://hshtags.com moteur de recherche de hashtags (mots-clés marqués par #) sur différents réseaux (Twitter, Facebook…) - encore en version bêta : non exhaustif - critères de classement ?
    • Actualités et temps réel
    • Actualités et temps réel Documents actualités et informations (presse, dépêches, communiqués…) tendances (trends, buzz) événements dont colloques Recherche pas d’indexation en temps réel par les moteurs de recherche « classiques » comme Google spécifique à chaque outil présence généralement d’une recherche avancée possibilité de recherches géolocalisées Périmètre généralistes thématiques Outils annuaires, répertoires… outils de recherche sur les médias d’actualités agrégateurs et bases de données de presse moteurs de recherche en temps réel réseaux sociaux (Twitter…) +/- + possibilité de fonctionnalités supplémentaires (visualisations, répartitions thématiques, alertes…) ! mises à jour ? (vrai temps réel ?) ! classement des résultats ? ! informations pas (encore) toujours validées
    • Actualités • moteurs de recherche généralistes • Google Google web puis filtre par date (notamment moins d’une heure) Google Actualités : http://news.google.fr + recherche avancée dont filtres par date d’ajout dans Google actualités (depuis une heure, période personnalisée…), source + différentes éditions nationales (+ 72 éditions, 30 langues, 55 000 sources) + possibilités de personnalisations • Bing Bing actualités : http://www.bing.com/news • Yahoo! Yahoo ! actualités France : http://fr.news.yahoo.com/ : agences de presse et journaux dont pure-players • moteurs de recherche spécialisés • Pickanews : http://www.pickanews.com + 50 000 sources médias (presse imprimée, web, radio et TV) européennes
    • Temps réel • Eufeeds : http://www.eufeeds.eu/fr agrégateur mondial de plus de 1 000 journaux, mis à jour toutes les 20 minutes • NewsBrief : http://emm.newsbrief.eu/NewsBrief/clusteredition/fr/latest.html agrégateur de journaux européens, mis à jour toutes les 10 minutes + 4 000 sites, 1 600 portails, 43 langues graphique de tendances, détection d’événements, clusterisation à compléter par NewsExplorer : http://emm.newsexplorer.eu/NewsExplorer/home/fr/latest.html (un des autres portails Europe Media Monitor du Joint Research Center de la Commission europenne) • NewsMap : http://newsmap.jp/ agrégateur mondial visualisation graphique des résultats (thématiques en couleurs) • Silobreaker : http://news.silobreaker.com/ agrégateur mondial et analyse de l’information (lieux, réseaux, tendances…) • WebPlanete news : http://news.webplanete.net/ 867 sources d’informations francophones grandes thématiques + ces outils proposent souvent des fonctionnalités supplémentaires (graphiques, thématiques, etc.) voir également du côté du web social à compléter par M.-L. Malingre et A. Serres. Plus de 80 outils… et
    • Tendances • tendances • Google tendances de recherches : interroge le volume de recherches de mots-clés sur Google depuis 2004 - http://www.google.com/trends/ : recherches du moment - http://www.google.com/trends/explore#q : possibilité de choisir un ou plusieurs termes pour voir/comparer leur évolution + recherche par pays, période, catégories
    • Quelques outils complémentaires
    • Appel à la communauté • « Ask a librarian » Pour commencer : métamoteur de différents services de questions/réponses : sqrpro.fr • Rue des facs : http://www.ruedesfacs.fr/ 25 établissements documentaires d’Ile-de-France ; accès par discipline destiné en priorité aux étudiants et aux enseignants-chercheurs archives de questions déjà posées : http://ruedesfacs.hypotheses.org/ • SINDBAD : http://www.bnf.fr/fr/collections_et_services/poser_une_question_a_bibliothecaire/s.sindbad_votre_question.html service de la BnF archives des réponses • BiblioSésame : http://www.bibliosesame.org réseau d’une vingtaine de bibliothèques publiques, lancé par la BPI réponses archivées • Guichet du savoir : http://www.guichetdusavoir.org/ service de la bibliothèque municipale de Lyon • forums et listes de discussion • Ex. : Ask community : http://www.ask.com/answers/browse/home?qsrc=360 • réseaux sociaux • Ex. : Quora : http://www.quora.com/
    • Les droits • ! question des droits d’auteur • les licences Creative Commons • CC search : http://search.creativecommons.org/ recherche sur Google, Flickr, YouTube… ; vérifier cependant pour chaque «LicenceCreativeComons».Wikipédia.18/03/2012
    • La navigation • navigation : adresse IP, historique, cookies • historique • Google autocomplete : prend en compte les pages indexées, mais aussi le lieu, l’historique de recherche, l’activité d’autres usagers et Google +  se déconnecter, détruire l’historique et les personnalisations : aide • voir également les options du navigateur (historique, cache) • naviguer anonymement limites : plus de suggestions orthographiques ou en fonction de l’historique de navigation • DuckDuckGo : http://duckduckgo.com/?t • Ixquick : https://eu.ixquick.com/ pas d’enregistrement des adresses IP et des cookies d’identification possibilité de visiter des sites tiers via Ixquick + dossier Comment ça marche, 15/08/2011
    • Les extensions de navigateur • insertion du moteur de recherche dans la barre du navigateur • analyse de la recherche • Search cloudlet : nuage de tags sur la page de résultats • Better search • Clear Forest Gnosis : repérage d’entités nommées • Fast search by Surf Canyon : réorganisation des résultats • capture de pages • ScrapBook, Screengrab • gestion des favoris en ligne • Delicious • Diigo • Zotero • sécurité • AdBlockPlus : stop pub • Better Privacy : suppression des cookies • Disconnet , DoNoTrackMe : navigation anonyme • WOT : évaluation des sites Ex. Christophe Deschamps
    • Moteurs personnalisables • traduction • Google traduction : http://translate.google.fr/ • moteurs de recherche personnalisables • Google recherche personnalisée : http://www.google.com/cse/ • Eurekster Swicki : http://www.eurekster.com
    • Veille automatisée
    • Outils de veille • newsletters et lettres d’informations • Ezine Directory : http://www.ezine-dir.com/ répertoire de newsletters • voir également sur les sites concernés (sites, blogs…) • alertes • Google alertes : http://www.google.com/alerts?hl=fr paramétrage de la fréquence et du volume d’envoi et des sources possibilité de s’abonner à des alertes en plusieurs langues avec un compte Google : possibilité de recevoir les alertes via RSS - nombreux dysfonctionnements • voir également sur les ressources concernées (bases de données, catalogues…) • agents de surveillance : modification de pages… • extensions de navigateurs : ex. : Update scanner • outils internet : généralistes : ex. : Diphur : https://diphur.com/intro... • services professionnels : ex. : WebSite Watcher : http://www.website-watcher.fr/, KB Crawl : http://www.kbcrawl.net/… • outils pour les médias sociaux : Bringr : http://www.bringr.net/, Mention : https://fr.mention.net/
    • Les flux RSS
    • Les flux RSS • suivi de l’actualité • veille nouvelles publications bases de données bibliographiques Ex. Gallica Ex. citeulike Ex. Le Figaro Ex. le blog de B. Foenix-Riou Ex. Cairn
    • Exercices de synthèse
    • Bibliographie
    • Pour commencer Marie-France Andral. Recherche documentaire et recherche d’information. URFIST de Bordeaux, 2013. [en ligne]. Disponible sur : http://weburfist.univ-bordeaux.fr/wp-content/uploads/2013/02/2013.02.18-Recherche-doc-info2.pdf. Béatrice Foenix-Riou. Recherche éveillée sur internet : mode d’emploi. 12/2011. 40 p. [en ligne]. Disponible sur : http://fr.slideshare.net/bfoenix/recherche-eveille-bfr. ---. Recherche éveillée sur Internet : mode d'emploi : outils et méthodes pour explorer le Web, Web visible, Web invisible, Web social, Web temps réel . Paris : Lavoisier : Bases publications, DL 2011. 367 p. Marie-Laure Malingre et Alexandre Serres. Plus de 80 outils spécialisés pour différentes recherches sur le web. [en ligne]. Disponible sur : http://www.sites.univ-rennes2.fr/urfist/ressources/des-outils-specialises-pour-divers-types-de-recherches- sur-le-web. ---. Quels outils pour quelles recherches ? Panorama des outils de recherche du web. URFIST de Rennes, 13 /03/2012. Présentation, 88 f. [en ligne]. Disponible sur : http://www.slideshare.net/UrfistRennes/quels-outils-pour-quelles-recherches- panorama-des-outils-du-web. Véronique Mesguich et Armelle Thomas. Net recherche 2009 : le guide pratique pour mieux trouver l'information utile et surveiller le web. Préface d’Olivier Andrieu. 3e éd. refondue et mise à jour. Paris : ADBS éd., DL 2009. 320 p. (« Sciences et techniques de l’information ») et nouvelle édition : Net recherche 2013. Surveiller le web et trouver l’information utile. Préface d’Olivier Andrieu. 5e éd. refondue et mise à jour. Paris-Bruxelles : ADBS éd.-De Boeck, 2013. 263 p. (« Information et stratégie »). Université européenne de Bretagne. Form@doct. Formation à distance en information documentation pour les doctorants. [en ligne]. Disponible sur : http://guides-formadoct.ueb.eu/. Bibliographie
    • Pour aller plus loin Généralités Manuel Durand-Barthez. Recherche d’information en sciences exactes et appliquées. 2014. Présentation. 47 f. [en ligne]. Disponible sur : http://fr.slideshare.net/mdbarthez/phys-k. Christophe Boudry. Recherche d’informations sur internet. 07/01/2011. Présentation, 62 f. Hans Dillaerts. « L’information scientifique et technique en libre accès : recherche et veille ». My Science Work. 05/09/2011. [en ligne]. Disponible sur : http://blog.mysciencework.com/2011/09/05/linformation-scientifique-et-technique-en-libre-acces-recherche-et- veille.html. Frédérique Flamerie. Recherche d’information bibliographique. UPMC. 2013. Présentation. 43 f. [en ligne]. Disponible sur : http://www.slideshare.net/BUPMCformD/doctorat-sciences-recherche-dinformation-mthode-sources-et-outils. Internet World Stats. Usage and population statistics. [en ligne]. Disponible sur : http://www.internetworldstats.com/stats.htm. Marie-Laure Malingre et Alexandre Serres. Outils de recherche et de veille sur l'actualité (news, médias sociaux...). URFIST Rennes, 18/03/2014. [en ligne]. Disponible sur : http://www.sites.univ-rennes2.fr/urfist/blog/2014/03/support-du-stage-outils-de-recherche-et- de-veille-sur-lactualite. Hervé Le Men. Recherche d’information pour sa thèse à l’UBP et sur internet. 04/2011. Présentation. 46 f. [en ligne]. Disponible sur : http://www.slideshare.net/hervelemen/recherche-info-theseubo-7711630. Véronique Mesguich. Formation de formateurs « C2I métiers de l’ingénieur ». URFIST Paris. 07/2011. Présentation. 88 f. « Usages of content languages for websites ». W3Techs. [en ligne]. Disponible sur : http://w3techs.com/technologies/overview/content_language/all. Méthodologie Eduscol. Rechercher sur internet : méthodologie et outils. [en ligne]. Disponible sur : http://eduscol.education.fr/dossier/competences/rechercher. Victorine Porte. Méthodologie et astuces de recherche sur internet. 2010. [en ligne]. 31 p. Disponible sur : http://www.slideshare.net/vporte/guide-rechercheenligne. URFIST de Paris. CERISE. Conseils aux étudiants en recherche d’informations efficace. [en ligne]. Disponible sur : http://giry.enc.sorbonne.fr/cerise/. Dale Vidmar. « Tips to Effective Internet Searching ». Hannon Library. 2012. [en ligne]. Disponible sur : http://hanlib.sou.edu/searchtools/searchtips.html. Bibliographie
    • Moteurs de recherche Hervé Basset. « Une veille professionnelle avec Google ????!!!!! ». Intelligence scientifique et veille. 03/01/2012. [en ligne]. Disponible sur : http://intelligencescientifique.wordpress.com/2012/01/03/une-veille-professionnelle-avec-google/. Aline Bouchard. Evolutions des moteurs de recherche sur internet. Présentation, 10/2013. 159 p. [en ligne]. Disponible sur : http://fr.slideshare.net/URFISTParis/evolution-des-moteurs-de-recherche-sur-internet. Olivier Ertzscheid. « (My) state of search 2012 ». Affordance.info. 27/11/2012. [en ligne]. Disponible sur : http://affordance.typepad.com/mon_weblog/2012/11/my-state-of-search-2012.htm Béatrice Foenix-Riou. Google : trucs et astuces pour les professionnels de l’infodoc. 01/2013. 35 p. [en ligne]. Disponible sur : http://fr.slideshare.net/bfoenix/bfrabd-2013-google-trucs-et-astuces-pour-les-professionnels-de-linfodoc-16028591. --. Recherher sur internet : y a-t-il une vie sans Google ? Présentation, 10/12/2013. 60 p. [en ligne]. Disponible sur : http://fr.slideshare.net/bfoenix/recherches-sur-internet-y-atil-une-vie-sans-google-bfr-consultants. ---. « Retrouver des informations grâce aux images ». Netsources, n°97, 03-04/2012. p. 1-3. Hackcollege. Get more out of Google. Tips & tricks for students conducting online research. 23/11/2011. [en ligne]. Disponible sur : http://www.hackcollege.com/blog/2011/11/23/infographic-get-more-out-of-google.html. « List of search engines». Wikipedia. [en ligne]. Disponible sur : http://en.wikipedia.org/wiki/List_of_search_engines. Cyril Labbe. « Ike Antkare one of the great stars in the scientitic firmament ». Les rapports de recherche du LIG. 09/2008. 16 p. Disponible sur : http://rr.liglab.fr/research_report/RR-LIG-008.pdf. Marie-Laure Malingre et Alexandre Serres. Connaître les moteurs de recherche de l’information scientifique. URFIST Rennes, 04/2012. Présentation, 60 f. [en ligne]. Disponible sur : http://www.slideshare.net/UrfistRennes/les-moteurs-de-recherche-scientifique. StatCounter Global Stats. [en ligne]. Disponible sur : http://gs.statcounter.com/#search_engine-ww-monthly-201103-201203. « Surfer anonymement ». Comment ça marche. 15/08/2011. [en ligne]. Disponible sur : http://www.commentcamarche.net/faq/5351-surfer- anonymement. Carole Tisserand-Barthole. « Veille et recherche scientifique 2.0 : au-delà des ressources classiques ». Bases, n°206, 09/2012. p. 1-6. Aurélie Vathonne. « Repérer les retombées presse d’une exposition grâce aux images ». Netsources, n°97, 03-04/2012. p. 4-5. Autres BnF. Les signets de la Bibliothèque nationale de France. [en ligne]. Disponible sur : http://signets.bnf.fr. Béatrice Foenix-Riou. « Identifier la date de publication d’une page ou d’un site web ». Netsources, n°99, 07-08/2012. p. 1-5. « List of academic databases and search engines ». Wikipedia. [en ligne]. Disponible sur : http://en.wikipedia.org/wiki/Academic_databases_and_search_engines. « List of digital library projects ». Wikipedia. [en ligne]. Disponible sur : http://en.wikipedia.org/wiki/List_of_digital_library_projects. Magali Guibert. « Trucs et astuces pour optimiser sa recherche dans LinkedIn ». Netsources, n°101, 11-12/2012. p. 10-13. Carole Tisserand-Barthole. « Revues et articles scientifiques en open access : où chercher ? ». Bases, n°304, 05/2013. p. 1-5. Bibliographie
    • Olivier Andrieu. Abondance. [en ligne]. Disponible sur : http://www.abondance.com/ et notamment un blog : http://www.abondance.com/actualites/. Bases. François Libman, dir. publ. Paris : Bases publications, 1985-. Thomas Bertrand et Chris Hede. Moteurzine. [en ligne]. Disponible sur : http://www.moteurzine.com. Karen Blakeman. Karen Blakeman’s blog. [en ligne]. Disponible sur : http://www.rba.co.uk/wordpress/. Phil Bradley. Phil Bradley’s weblog. [en ligne]. Disponible sur : http://philbradley.typepad.com/. Wendy Boswell. About.com Web search. [en ligne]. Disponible sur : http://websearch.about.com/. Centre de documentation et d’information interuniversitaire en sciences sociales et Inforpro. EchosDoc. [en ligne]. Disponible sur : http://www.echosdoc.net. Christophe Deschamps. Outils froids. [en ligne]. Disponible sur : http://www.outilsfroids.net/. Olivier Duffez. WebRankInfo. [en ligne]. Disponible sur : http://www.webrankinfo.com/ et forum : http://forum.webrankinfo.com/. Béatrice Foenix-Riou. Le blog de recherche-eveillee.com. [en ligne]. Disponible sur : http://blog.recherche-eveillee.com/. Gwen Harris. Web search guide and internet news. [en ligne]. Disponible sur : http://www.websearchguide.ca/netblog/. Les infostratèges. Didier Frochot et Fabrice Molinaro, dir. publ. [en ligne]. Disponible sur : http://www.les-infostrateges.com/. InternetActu. [en ligne]. Disponible sur : http://www.internetactu.net. Le journal du net. [en ligne]. Disponible sur : http://www.journaldunet.com/. Mashable. [en ligne]. Disponible sur : http://mashable.com/ Netsources. François Libman, dir. publ. Paris : Bases publications, 1996-. Presse citron. [en ligne]. Disponible sur : http://www.presse-citron.net/. Gary Price. Infodocket. [en ligne]. Disponible sur : http://www.infodocket.com/. ReadWriteWeb. [en ligne]. Disponible sur : http://www.readwriteweb.com/. Research Buzz. [en ligne]. Disponible sur : http://researchbuzz.me/. Search Engine Journal. [en ligne]. Disponible sur : http://www.searchenginejournal.com/. Search Engine Land. [en ligne]. Disponible sur : http://searchengineland.com/. Search Engine Watch. Jonathan Allen, dir. publ. [en ligne]. Disponible sur : http://searchenginewatch.com. Techcrunch. [en ligne]. Disponible sur : http://techcrunch.com/. version européenne : http://techcrunch.com/europe/. ZdNet. [en ligne]. Disponible sur : http://www.zdnet.fr/. Marcus P. Zillman. Scholar Search Engine. [en ligne]. Disponible sur : http://www.scholarsearchengines.com/. nombreux white papers mis à jour régulièrement dont moteurs de recherche scientifiques, web invisible, recherche sociale… Zorgloob. Compte Twitter. [en ligne]. Disponible sur : https://twitter.com/Zorgloob. Suivre l’actualité de ces questions
    • Crédits photographiques Toutes images : Norman Rockwell, tous droits réservés avec, par ordre d’apparition, Mike Licht, Two bloggers after Norman Rockwell CC BY 2.0 Movie starlet and reporters - Saturday Evening Post, 7/03/1936 It’s income tax time again ! - Saturday Evening Post, 17/03/1945 Four sporting boys, oh yeah - Brown and Bigelow 1951 Four Seasons calendar, winter Perpetual motion – Popular Science, 10/1920 The gossips - Saturday Evening Post, 6/03/1948 Boy with stereoscope - Saturday Evening Post, 14/01/1922 Watchmaker – Publicité pour les Watchmakers of Switzerland, 1950 Family tree - Saturday Evening Post, 24/10/1959 The art critic - Saturday Evening Post, 16/04/1955 Willie Gillis in college - Saturday Evening Post, 5/10/1946 Little boy writing a letter - Saturday Evening Post, 17/01/1920 Graduate - Saturday Evening Post, 6/06/1959 Double take - Saturday Evening Post, 1er/03/1941