Gestion Info Synthese 2  Rech Doc Net
Upcoming SlideShare
Loading in...5
×
 

Gestion Info Synthese 2 Rech Doc Net

on

  • 1,752 views

 

Statistics

Views

Total Views
1,752
Views on SlideShare
1,752
Embed Views
0

Actions

Likes
0
Downloads
11
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Microsoft Word

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

Gestion Info Synthese 2  Rech Doc Net Gestion Info Synthese 2 Rech Doc Net Document Transcript

  • GESTION DE L’INFORMATION IUT GACO 1er année LA RECHERCHE D’INFORMATION SUR INTERNET Introduction Internet ayant été popularisé par l'apparition du web (www étant l'abréviation de World Wide Web, littéralement la Toile Mondiale), les deux sont parfois confondus. En réalité, le web est une des applications d'Internet, comme le sont le courrier électronique, la messagerie instantanée ou les systèmes de partage de fichiers poste à poste (FTP). Aujourd’hui, le WEB 2.0, blogs, wiki, réseaux sociaux : un véritable changement. Le web 2.0 apparaît comme une plateforme vers le tout en ligne : - On y trouve une meilleure ergonomie des interfaces - Un accroissement des possibilités de publication, de partage et de participation - Un incontournable effet communautaire (ou recherche d'effet communautaire) Dans sa conception originale, le Web (nommé dans ce contexte le « Web 1.0 ») comprenait des pages Web statiques qui étaient rarement mises à jour, voire jamais. Le Web était considéré principalement comme un outil de diffusion et de visualisation de données, d’informations. Avec le web 1.0, l’usager était donc passif et consommateur d’informations, avec la nouvelle génération de sites web 2.0, l’usager peut être contributeur, il devient actif dans la production de l’information. Ainsi il lest permis à l’internaute de donner son avis sur une vidéo (youtube), sur un morceau de musique ou un livre à vendre (amazon ou la fnac), de laisser des commentaires sur l’actualité (exemple : Libération) ou en partageant des photos (flickr, picasa) ou des vidéos (dailymotion). Il lui est possible aussi d’éditer, de publier n’importe quel support (texte, son, vidéo) et d’indexer à travers les tags. Le web voit se développer 3 principaux nouveaux outils : les blogs, le wiki, les fils RSS. Le blog : c'est un site internet constitué de publications nommées billets ou articles ou encore notes. Ils sont classés par ordre antéchronologique, ces billets peuvent être réunis par thèmes. Chacun de ces billets est inspiré du journal de bord, ou journal intime. L'auteur (appelé le blogueur) y inscrit un contenu souvent textuel mais aussi d'images ou de vidéos. Ces articles peuvent enrichis de liens hypertexte. Chaque lecteur peut généralement (selon la volonté du blogger) apporter des remarques, des réflexions aux contenus dans des commentaires. Les lecteurs et/ ou le blogger peuvent aussi commenter les commentaires. Réaliser un blog est très simple, deux choix : - Des plates formes hébergées (la plupart des blogs) exemple blogger, myspace, skyblog, Haut-et- fort... Ce sont des plateformes qui ne nécessitent aucune opération technique, ni maintenance, ce qui les rend faciles d'utilisation et populaires. A l'inverse, ces blogs souffrent parfois d'uniformisation dans la mise en page, de manque de souplesse, de manque d'évolution (impossible de faire passer un blog d'une plateforme à une autre) et aussi parfois de pollution publicitaires ! - Des « blogs » à installer sur son serveur : exemple wordpress. Ce sont en fait des suites logicielles qui permettent de paramétrer entièrement les fonctionnalités de son blog. Cette maîtrise totale du site nécessite bien sur un minimum de compétences ! Le wiki : un wiki est un système de gestion de contenu de site web rendant ses pages web librement modifiables par tous les visiteurs y étant autorisés. Les wikis sont utilisés pour faciliter l'écriture collaborative de documents avec un minimum de contraintes. Un wiki n'est pas forcément modifiable par tout le monde ; on peut exiger que les visiteurs s'inscrivent avant d'être autorisés à modifier les pages. Dans le cas des wikis qui sont complètement ouverts au public, diverses procédures techniques et sociales sont mises en œuvre pour limiter et annuler les modifications jugées indésirables (identification de l'adresse IP par exemple). La modération est de mise et sur les sites importants des comités (bénévoles ou non) veillent à une certaine garantie des contenus Exemple : wikipedia
  • Les fils ou flux RSS : Un fil rss est constitué d'un fichier au format xml Ils sont utiles pour suivre l'actualité éditoriale d'un site, se tenir informé ou suivre la publication de billets sur un blog ou tout autre informations d'un site. Ils sont gérés par les navigateurs internet et la gestion des favoris ou par des ses agrégateurs de flux rss : c'est en fait une page internet que chacun dispose à sa volonté et qui va réunir différents fils choisis. Exemple : Netvibes ou Igoogle Internet est un donc réseau qui permet de : • rechercher des informations (le Web principalement) • communiquer (courrier électronique, forums de discussion, listes et lettres de diffusion) L'information sur Internet se caractérise par son hétérogénéité, mais aussi par le fait qu’Internet n’est pas un centre documentaire organisé ! Les caractéristiques de bases que sont la sélection, le classement, le tri, l’archivage ne s’y appliquent pas automatiquement. Il existe des informations de qualité très variable et on ne peut pas tout prendre sans précaution. 1. Méthodologie de recherche d’informations sur Internet : S'accorder un temps de réflexion : Une formulation claire et précise des besoins permet : > d'affiner la requête, et dégager des mots clés. > d'obtenir des résultats plus pertinents. Se poser au moins les 2 questions suivantes : - Qu'est-ce que je cherche exactement ? - Pour quoi faire ? Rappel sur l’exercice TP : vous cherchez des supports de cours et des documents en français et format pdf sur le fonctionnement et l(architecture des ordinateurs Mots clefs : fonctionnement + architecture + ordinateurs Restriction de langue : en français restriction de format de fichiers : seulement en pdf La méthode QQOQCCP : cet outil consiste à se poser toutes les questions suivantes : Qui – Quoi – Où – Quand - Comment -Combien - Pourquoi L'objectif est de se poser toutes les questions relatives à un problème afin de fixer le périmètre d'un problème en vue d'une future démarche de résolution de problème. (ci on laissera de côté le quand et le combien) Qui ? profil du demandeur Quoi ? nature de l'information, je recherche quoi : Quel type d’information ? Une adresse ? Des chiffres-clés ? Des statistiques ? Une définition ? Des éclaircissements sur un concept ? Des articles de presse ? Des études ? Des points de vue d’experts ? Des outils pratiques ? Des exemples d’expérimentations ?… Où ? limites géographiques, niveau local ? national ? lieux ressources Pourquoi ? objectif(s), à quoi cette information va-t-elle servir ? Quel est l’objectif principal ? Quels autres objectifs encore ? Satisfaire une curiosité personnelle ? Prendre une décision ? si oui, laquelle ? Préparer un cours, un exposé, une intervention ? si oui, dans quel contexte ?... Comment ? outils, méthodes, stratégie : Avec quel(s) outil(s) ? Un outil ou plusieurs outils ? Un outil généraliste ou un outil spécialisé ? Un annuaire, un moteur ou un métamoteur ? Sur le web visible ou sur le web invisible ? Avec quelle méthode ? Quels mots clés ? Quelle syntaxe ? Quel mode de recherche : simple ou avancée ? Des outils de recherche permettent cependant de s'y retrouver; ils se répartissent, "en théorie", en 3 catégories : • les moteurs de recherche • les annuaires • les métamoteurs GESTION DE L’INFORMATION - IUT GACO 1er année - LA RECHERCHE D’INFORMATIONS SUR INTERNET -2-
  • 2. Les moteurs de recherche Principe de fonctionnement Ce sont des programmes de recherche informatiques qui se chargent d'une recherche sur tout ou partie de l'Internet. Ils répondent à une requête exprimée généralement sous forme de mots, éventuellement séparés par des opérateurs booléens. Leurs fonctionnements reposent sur la collecte de données par des robots balayant automatiquement le Web. Le moteur de recherche indexe le contenu du web et enregistre les données des pages repérées (adresses, titres des pages, métadonnées inscrites, premiers caractères du texte, etc.) pour pouvoir faire des recherches plus ou moins complexes. Google annonce plus de 8 milliards de pages indexées. Principaux moteurs Google : http://www.google.com/ (http://www.google.fr) Yahoo : http://fr.yahoo.com/) Bing : http://www.bing.com/ Avantages et limites Avantages : Limites : · richesse infinie : Les moteurs sillonnant jour et nuit le web, et il est rare de faire une · Un robot ne possède pas l'intelligence d'un "recherche vide" humain en indexant des mots clés sans en Notion de silence = pas de résultats à l’inverse comprendre le sens : on tombe parfois sur des du bruit = trop de résultats pages qui contiennent bien le mot-clé mais sans rapport avec l'objet de notre recherche. · Accès rapide et facile soit en langage naturel, soit avec des mots clé simples. · La plupart des moteurs sont incapables de distinguer les homonymies Ex. à orange on trouve l'orange (le fruit), orange (la couleur) et Orange (l’opérateur de Téléhonie). · Les moteurs indexent non pas des mots mais des "chaînes de caractères" ce qui fait qu'ils indexent aussi des mots avec des fautes d'orthographes. · Beaucoup de pages Web ne sont pas à jour (adresses modifiées, liens morts...) · Pas de structuration logique. GESTION DE L’INFORMATION - IUT GACO 1er année - LA RECHERCHE D’INFORMATIONS SUR INTERNET -3-
  • Exemple avec Google. La recherche se fait par mots-clés. Il est possible de sélectionner la langue des résultats à retrouver. La page de recherche avancée explicite propose d'autres fonctionnalités : Outre les fonctionnalités de recherche Web classique, n'oubliez pas que Google offre en outre les onglets de recherche suivants : · Web : recherche classique sur le web par mots cl 駸 · Images : recherche d'images sur le Web · Groupes (Groups) : recherche dans les forums · Livres (Books) : recherche dans ouvrages numérisés · Actualités (News) : accès à l'actualité GESTION DE L’INFORMATION - IUT GACO 1er année - LA RECHERCHE D’INFORMATIONS SUR INTERNET -4-
  • Alerte Google : Google peut vous avertir par courriel lorsqu’une nouvelle page sur Internet traite d’un sujet qui vous intéresse! Pour cela accédez au service gratuit Alertes Google , en entrant dans les champs suivants : - les termes recherchés (votre recherche régulière dans Google) - le type : Actualité & Web donnera un maximum de résultats - la fréquence à laquelle Google effectuera la recherche - et votre adresse de courriel (Email) ex : xxxxxxxxx@hotmail.com 3. Les répertoires de sites web (annuaires) Principe Les répertoires de sites Web proposent des adresses de sites ou de services (et non pas des adresses de pages isolées). Ces sites sont classés par catégories thématiques et décrits de façon plus ou moins détaillée. Ils ne permettent pas une recherche sur le texte intégral des pages, mais seulement sur le texte descriptif du site, sur le titre du site ou du service, et sur l’intitulé des catégories thématiques utilisées dans le classement. L'utilisateur peut naviguer à partir des rubriques de la classification offerte out formuler des équations de recherche qui interrogront les sites sélectionnés. Principaux annuaires The Open Directory Project (Dmoz.org) en français : http://dmoz.fr/ The ODP fonctionne grâce au volontariat de plus de 40000 surfeurs à travers la planète qui gèrent chacun une catégorie. Ce qui en fait le plus grand annuaire web avec plus de 3 millions de sites répertoriés. La présentation est un peu austère mais cet annuaire, au fil du temps, est devenu plus complet que Yahoo! l'Open Directory est repris par Google dans son répertoire Google directory. Annuaire Google : http://www.google.fr/dirhp Le Web présenté par sujets et par catégories Yannuaire : http://www.yannuaire.fr/ Plus de 14000 sites inscrits dans cet annuaire francophone. Faites vos recherches et trouvez un site de qualité sélectionnés par nos soins. Le positionnement de votre site est important sur la toile avec des moteurs comme Google, yahoo, ou Bing, alors inscrivez le sur Yannuaire.Fr. De nouvelles catégories pour vos sites web vous attendent pour encore plus de pertinence lors de vos recherches. Avantages et limites L'intérêt de cette approche est la valeur humaine ajoutée (contrôle, validation), qui permet de limiter le bruit dans les réponses. La couverture est, bien sûr, moins importante que les moteurs. GESTION DE L’INFORMATION - IUT GACO 1er année - LA RECHERCHE D’INFORMATIONS SUR INTERNET -5-
  • 4. Les métamoteurs Principe Ils permettent d'envoyer simultanément à plusieurs moteurs et annuaires la même requête. Selon les métamoteurs, les 10 à 50 premiers documents identifiés par chaque outil de recherche sont affichés. Les résultats peuvent être triés par moteur ou annuaire, dédoublonnés, analysés. Les possibilités de recherche des métamoteurs sont réduites, et donc inférieures aux possibilités de recherche de chaque outil utilisé isolément, à cause de la différence de syntaxe de ces outils. Les métamoteurs sont adaptés pour des recherches simples (2 mots-clés reliés par AND par exemple); mais, pour répondre à une question complexe, l'utilisation successive des divers moteurs et annuaires reste indispensable. Divers types de métamoteurs Copernic : http://www.copernic.com Strategic Finder : http://www.strategicfinder.com Des métamoteurs cartographiques : ils privilégient une présentation visuelle des résultats sous forme de carte. Kartoo : http://www.kartoo.com 5. Les sites ressource ou répertoires de signets Réalisés par des experts d'un domaine, ils proposent un recensement très complet de l'ensemble des ressources dans un domaine. Les sites sont sélectionnés sur des critères qualitatifs et proposés sous la forme d'une collection de liens (bookmarks). La Bibliothèque nationale de France met à la disposition de ses lecteurs une sélection de ressources accessibles par Internet (Les Signets de la BNF), sous environ sept cents catégories. http://www.bnf.fr/pages/liens/index.htm La BPI Bibliothèque publique d’Information du centre George Pompidou à Paris : http://www.bpi.fr/fr/professionnels/documents_de_reference/dossiers_thematiques/signets_de_la_fran ce_contemporaine.html Service-public.fr Les services publics en France et à l’étranger www.service-public.fr RIME Ressources sur Internet en Management et Economie http://www.ccip.fr/rime/ … parmi tant d’autres… 6. La gestion des signets : un outil d’efficacité Les signets (favoris, bookmarks) sont des pages dont on garde l'adresse afin de pouvoir les retrouver facilement. On peut les organiser sous forme de collection de liens hypertextes. Ceci afin de garder a disposition une série de sites que l’on consulter très souvent ou que l’on garde en « archives ». Il existe toujours plusieurs façons de procéder pour effectuer les opérations suivantes (une seule est proposée, au moyen d'Internet Explorer). Créer un dossier Menu Favoris / Organiser les favoris Dans la fenêtre qui s'ouvre (Organiser les favoris) : Créer un dossier Donner un nom au dossier GESTION DE L’INFORMATION - IUT GACO 1er année - LA RECHERCHE D’INFORMATIONS SUR INTERNET -6-
  • Ajouter un signet Menu Favoris / Ajouter aux favoris Sélectionner le dossier dans lequel vous souhaitez inclure le nouveau signet Déplacer un signet Sélectionner le signet; faire glisser jusqu'au signet ou répertoire sous lequel on veut le placer Supprimer un signet Sélectionner le signet ou répertoire Bouton droit Supprimer le signet Utilitaires de gestion de signets De nombreux logiciels permettent d'optimiser la gestion des signets. A signaler : www.favoritoo.com Gratuit, il permet de gérer et de consulter les signets à distance. 7. Le Web invisible : ce qui échappe aux recherches Les moteurs de recherche ne peuvent indexer la totalité du web; chacun d'eux n'explore qu'une partie des sites visités. Certains sites sont inaccessibles comme les banques de données qui ne sont interrogeables qu'avec un mot de passe. Le Web invisible correspond à l’ensemble des documents (textes, vidéos, images...) qui n’est pas indexé par les outils de recherche. Selon la société américaine BrightPlanet, le Web contiendrait de 400 à 500 milliards de pages, dont environ 10 milliards seulement sont accessibles aux "robots" qui indexent automatiquement la Toile. 8. L’information circulante : des ressources utiles Les lettres de diffusion (newsletters) Une lettre de diffusion est un courrier électronique envoyé régulièrement, par une seule et même source, à ses abonnés. L'information adressée aux abonnés peut être : Une revue de presse : Le Figaro, Le Monde,... L'actualité d'un site : Lire.fr, Orphanet,... L'actualité d'un domaine : la recherche d'information (lettre du site Abondance) Les listes de diffusion (mailing lists) La liste de diffusion représente un moyen de communication, sur un thème donné, par l'intermédiaire du courrier électronique. Chaque abonné écrit à l'adresse électronique de la liste. Un automate se charge de distribuer les messages à tous les participants. Il est nécessaire de s'abonner à la liste pour pouvoir participer aux discussions. Mode de fonctionnement Un automate gère la liste. C'est un programme qui fonctionne en permanence sur une machine. Il reçoit les messages adressés aux listes qu'il gère et les retransmet aux abonnés. Les forums de discussion (newsgroups) Principe Les forums de discussion, ou "newsgroups", sont des espaces de rencontre et de dialogue sur le Web. Les sujets de conversation sont des plus variés et d'un intérêt inégal. Le principe de ces dialogues est le même que celui des listes de diffusion. La seule différence est le mode d'accès aux messages : Lorsque vous entrez sur un forum, vous pouvez accéder à l'ensemble des méls échangés par toutes les personnes. A la différence des listes de diffusion, vous ne recevez aucun mél dans votre boîte aux lettres. Retrouver un forum de discussion : Google Groups est le site de référence concernant les forums de discussion : GESTION DE L’INFORMATION - IUT GACO 1er année - LA RECHERCHE D’INFORMATIONS SUR INTERNET -7-
  • http://groups.google.com/ 9. Pistes pour l’évaluation d’un site web FIABILITE + PERTINENCE = VALIDITE FIABILITE = sécurité qui garantit quelque chose ou quelqu’un, à qui l’ont peut faire confiance PERTINENCE = se dit de quelque chose qui se rapporte exactement à ce dont il est question, qui est approprié VALIDITE = conformité d’un élément réel avec sa représentation, caractère de ce qui est valide ou acceptable, admissible ou autorisé. Critères de qualité pour l'évaluation d'un site web Devant l’abondance de résultats il est nécessaire d’analyser rapidement la valeur des pages affichées avec l’aide de quelques critères. 1. la page de résultats du moteur de recherche  Présence en gras des mots de recherche ou des expressions  Nature de l’adresse de la page : l’URL donne des indications sur le type de page ou de site (site national, commercial,….) 2. le site sélectionné :  Est-il structuré avec des rubriques claires ? hiérarchisées ?  Les liens proposés sont-ils en rapport avec le sujet ? 3. l’auteur du site  Peut-on clairement identifier l’auteur ? rentrer en contact avec lui ?  Quelles sont ses compétences sur le sujet ?  Documente-il précisément son sujet ?  Propose-t-il des sources identifiées ?  Explique-il pourquoi il diffuse ses informations ? 4. l’actualisation La validité de l'information sur l'Internet doit être systématiquement remise en cause. En effet, l'information disponible sur ce réseau n'a pas été évaluée dans l'extrême majorité des cas. Grâce à la facilité de création d'un site Web, tout un chacun peut s'autoproclamer éditeur. Ainsi, les sources d'informations sont très hétérogènes, variant d'un site commercial vantant ses produits, à un site universitaire, gouvernemental, voire personnel. De même, la qualité des informations présentes est très variable : certaines sources sont fiables et validées, d'autres sont fausses, intentionnellement ou non, pouvant orienter dangereusement l'internaute en quête d'information. Il peut être difficile pour l'utilisateur de déterminer ce qui est utilisable ou non. D'où la nécessité de conserver un esprit critique lorsque l'on prend connaissance d'une information quelconque, comme sur n'importe quel média. De quand date la dernière actualisation de son site ? Le site contient-il des informations périmées ? des liens inactifs ? Connaît-on la date des publications des différents articles ? 5. le contenu Quel est le thème général du résumé de la page ? Le public visé est-il le grand public ou un public de spécialiste L’information est-elle seulement mentionnée sur ce site ou sur d’autres sites ? y a-t-il des liens entre ces sites ? Le sujet est-il traité de manière exhaustive ? GESTION DE L’INFORMATION - IUT GACO 1er année - LA RECHERCHE D’INFORMATIONS SUR INTERNET -8-
  • 10. Glossaire Internet Adresse IP (Internet Protocol) Série de numéros identifiant de façon unique un ordinateur sur le réseau. Par exemple, 192.2.144.1 Cookie Témoin de connexion Fichier contenant des informations sur vos connexions à un site web, pouvant être utilisées lors de consultations ultérieures FAQ (Frequently Asked Questions)/ Foire Aux Questions Documents d'information mis à la disposition des nouveaux venus sur un site pour répondre aux questions les plus fréquemment posées Favori (Signet) / Bookmark Référence mise en mémoire par l'internaute, qui lui permet de retrouver des adresses de sites ou de pages jugées intéressantes, lors d'une consultation ultérieure Fournisseur d'Accès Internet / Provider Prestataire de services qui permet l'accès au réseau Internet FTP (File Transfer Protocol) / Protocole de transfert de fichiers Domaine de l'Internet régi par un protocole (FTP), qui permet de télécharger des fichiers sans toutefois que l'on puisse les afficher au préalable (pas de navigation possible) Groupe (forum) de discussion / Newsgroup Groupe constitué autour d'un thème de discussion précis, permettant d'échanger des messages Home Page / Page d'accueil Page principale d'un site HTML (HyperText Markup Language) Language de codage de l'hypertexte Langage permettant de développer les pages du Web HTTP (Hypertext Transfer Protocol) Protocole de transfert de l'hypertexte Ensemble de règles régissant l'échange de pages Web Hypertexte / Hypertext Technologie permettant d'accéder à des informations grâce à des liens intégrés dans les documents Internet (International Network) / Internet Réseau informatique mondial constitué d'un ensemble de réseaux nationaux IP (Internet Protocol) / Protocole Internet Protocole (ou plutôt ensemble de protocoles) de communication propre à l'Internet Liste de diffusion / Mailing list Permet de faire parvenir aux personnes inscrites les messages adressés à cette liste Mail (e-mail) / courriel, mél Service de correspondance sous forme d'échange de messages électroniques, à travers un réseau informatique Navigateur / Browser Logiciel permettant de se déplacer parmi les différents sites du Web. C'est un programme qui sert d'interface entre l'utilisateur et le réseau Internet pour permettre d'explorer des serveurs Web. Nom de domaine / Domain name Adresse d'identification d'un site Internet. Les noms de domaine comportent au moins deux parties. La première partie désigne le nom de l'entreprise ou de l'organisme, tandis que la deuxième partie GESTION DE L’INFORMATION - IUT GACO 1er année - LA RECHERCHE D’INFORMATIONS SUR INTERNET -9-
  • correspond au sous-domaine servant à désigner soit un pays (par exemple, ca pour Canada, fr pour France), soit un type d'organisation (com pour commercial; gouv pour gouvernemental,…) GESTION DE L’INFORMATION - IUT GACO 1er année - LA RECHERCHE D’INFORMATIONS SUR INTERNET - 10 -