L’internet des sciences humaines et sociales. Recherches - Perspectives

  • 2,030 views
Uploaded on

Cours à la demande du GeFem [Genre, Femmes, Méditerranée], le 17 novembre 2011, MMSH.

Cours à la demande du GeFem [Genre, Femmes, Méditerranée], le 17 novembre 2011, MMSH.

More in: Education
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
No Downloads

Views

Total Views
2,030
On Slideshare
0
From Embeds
0
Number of Embeds
0

Actions

Shares
Downloads
26
Comments
0
Likes
1

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide
  • Elsevier Science (ou plus simplement Elsevier) est un des plus grands éditeurs de littérature scientifique. Elsevier fait partie du groupe Reed Elsevier et dispose de 7 000 collaborateurs répartis sur une centaine d'endroits. Tout est parti d'un chirurgien mordu par le monde des affaires (Pierre Vinken) qui publiait des revues scientifiques dans sa branche, sachant combien cela pouvait lui rapporter de bénéfices ; tout cela devint une entreprise importante qu'il vendit vers 1980 à Elsevier ce qui lui valut d'ailleurs une place au Conseil d'administration.
  • Advisory board = comité de lecture
  • Nom utilisateur : HOMUSR3125 Mote de passe IVBRX7OP
  • L’économie de l’attention est un marché, où les consommateurs acceptent de recevoir des services en échange de leur attention. Par exemple des actualités personnalisées, de la recherche personnalisée, ou encore des alertes et des recommandations d’achat. Toute l’économie de l’attention est basée sur la captation du fameux temps de cerveau disponible : la question du choix du consommateur de « dépenser » son attention. Et l’un des éléments clé de ce système est la pertinence : un contenu perçu comme pertinent par le consommateur retiendra son attention – et créera des opportunités supplémentaires de lui vendre quelque chose… Cette notion, déjà fortement ancrée dans l’économie du Web, essentiellement basée sur la gratuité de services cherchant littéralement à capturer l’attention, sous la forme d’utilisateurs, abonnés, de profils qualifiés, de trafic, est promise a un développement important dans la prochaine décennie selon les experts.
  • pour faciliter le travail du programme qui vous financera, du collègue qui vous écrira pour débattre d’une de vos thèse, du journaliste qui vous appellera pour (enfin?) com­prendre le sens pro­fond d’une loi, d’un événe­ment ou d’une découverte.
  • Digital object identifier (DOI, littéralement « identifiant d'objet numérique ») est un mécanisme d'identification deressources numériques, comme un film, un rapport, des articles scientifiques, etc. C'est une alternative aux URI. Depuis février 2010, l'Institut de l'information scientifique et technique (INIST, du CNRS), est doté d'un statut « agence DOI », faisant partie du consortium DataCite. Les DOI permettent notamment de faciliter l'utilisation des bases de données bibliographiques ainsi que les logiciels de gestion bibliographique. Digital object identifier (DOI, littéralement « identifiant d'objet numérique ») est un mécanisme d'identification deressources numériques, comme un film, un rapport, des articles scientifiques, etc. C'est une alternative aux URI. Depuis février 2010, l'Institut de l'information scientifique et technique (INIST, du CNRS), est doté d'un statut « agence DOI », faisant partie du consortium DataCite. Les DOI permettent notamment de faciliter l'utilisation des bases de données bibliographiques ainsi que les logiciels de gestion bibliographique. Digital object identifier (DOI, littéralement « identifiant d'objet numérique ») est un mécanisme d'identification deressources numériques, comme un film, un rapport, des articles scientifiques, etc. C'est une alternative aux URI. Depuis février 2010, l'Institut de l'information scientifique et technique (INIST, du CNRS), est doté d'un statut « agence DOI », faisant partie du consortium DataCite. Les DOI permettent notamment de faciliter l'utilisation des bases de données bibliographiques ainsi que les logiciels de gestion bibliographique. Digital object identifier (DOI, littéralement « identifiant d'objet numérique ») est un mécanisme d'identification deressources numériques, comme un film, un rapport, des articles scientifiques, etc. C'est une alternative aux URI. Depuis février 2010, l'Institut de l'information scientifique et technique (INIST, du CNRS), est doté d'un statut « agence DOI », faisant partie du consortium DataCite. Les DOI permettent notamment de faciliter l'utilisation des bases de données bibliographiques ainsi que les logiciels de gestion bibliographique. Au bout d'un DOI, on trouve : les métadonnées (restrictions d'usage ou bien droit d'auteur, par exemple), décrites par un modèle de données commun à tous les DOI, le indecs Data Dictionary, une adresse ou localisation physique (en général un URL), le traducteur cité plus haut redirige vers cet URL, diverses informations, comme l'autorité de nommage.

Transcript

  • 1.
    • L’internet des sciences humaines et sociales
    • Recherches - Perspectives
    • Véronique Ginouvès
    • http://phonotheque.hypotheses.org
  • 2. Internet et les SHS, 3 questions
    • 1. Comment mettre en place une stratégie de recherche sur internet ?
    • 2. Comment mettre en place une stratégie d’ego référencement ?
    • 3. Comment citer et être cité correctement sur le web ?
  • 3. Mettre en place une stratégie de recherche sur le Web pour les SHS
    • Différencier les moteurs, des banques de données ou des répertoires – le libre accès des bases payantes ;
    • Connaître la syntaxe des équations de recherche : elle est différente selon les moteurs mais aussi les catalogues de bibliothèque ;
  • 4. Mettre en place une stratégie de recherche sur le Web pour les SHS
    • Comprendre l’architecture d’une base de données pour une exploitation optimum (ex : index, thésaurus, RAMEAU ... ) ;
    • Savoir que ne pas avoir de résultat ne signifie pas qu’il n’existe pas ou évaluer la part du web invisible ;
    • Connaître les outils de veille (alertes, réseaux sociaux, blogs, syndication de contenu).
  • 5. Des repères pour s’adapter
    • Distinguer au moment de la recherche
    • les univers fermés (les catalogues de bibliothèque, les sites spécialisés…)
    • les univers infinis (web, courriel, forums…)
    • Revenir aux sources documentaires classiques car tout ne se trouve pas sur la toile…
  • 6. La loi de Mooers
    • "Un système d’information ne sera pas utilisé tant qu'il apparaîtra à l'utilisateur plus pénible d’obtenir l'information grâce à ce système que de ne pas l'avoir."
    • Mooers ajoutera "Il est de mon opinion que beaucoup d'utilisateurs pourraient ne pas vouloir d'information et qu'ils éviterons d'utiliser un système précisément parce qu'il leur donne de l'information... Obtenir de l'information est douloureux et troublant." Référence : Peter Morville, Ambient findability (O'Reilly Media, Inc., 2005), http://oreilly.com/catalog/9780596007652 p. 44
  • 7. Vous êtes des êtres sociaux, il en va de même pour l'information
    • « Derrière la plupart des sites Web, intranet et produits interactifs ratés, se cache une compréhension ratée des utilisateurs et de leur comportement dans la recherche d'information. Les utilisateurs sont complexes. L'utilisateur est un être social, l'information est aussi de nature sociale »
    • Référence : Peter Morville, Ambient findability (O'Reilly Media, Inc., 2005), http://oreilly.com/catalog/9780596007652 p. 45
  • 8. Une astuce : interroger ce que l’on connait
    • Interrogation du catalogue de la bibliothèque de la médiathèque de la MMSH :
    • http://mediabase.mmsh.univ-aix.fr
  • 9. Les moteurs
    • Un moteur visite périodiquement une partie des fichiers statiques accessibles sur Internet et met à jour un index comprenant tout ou partie des mots des fichiers visités. Le résultat est une liste de pages web. Un moteur donne une image du Web déjà obsolète car il peut y avoir parfois des décalages importants entre ce que le moteur a « aspiré » et la forme actuelle du site.
  • 10.
  • 11.
  • 12. La pertinence des résultats : un algorithme nommé Panda
    • Le nombre de liens qui pointent vers la page ;
    • La qualité du code en particulier la balise html <title>Titre de la page</title> ;
    • Les mots clés contenu dans l’URL ex : www.femmes-emploi.fr ;
    • La fréquence de mise à jour du site (35% des requêtes prend en compte ce critère) ;
    • Détection automatique de sites dits « officiels » ;
    • Le nombre de requêtes faites à travers le moteur ;
  • 13. La pertinence des résultats : un algorithme nommé Panda
    • Il y en a d’autres moins faciles à percevoir comme la traduction automatique des résultats lorsqu'une requête est demandée dans une langue et renvoie à trop peu de résultats ;
    • Et d’autres encore, …
    • c’est le mariage de tous ces critères qui permet le calcul de pertinence de Google, véritable secret industriel, constamment modifié (jusqu’à 500 fois par) pour lutter contre le spamindexing .
  • 14. Prédominance de Google
    • Google représente 91,6 % du trafic généré par les moteurs de recherche francophones
    • AT Internet Institute , mars 2011
    • Plus de la moitié des recherches Google proviennent de pays autres que les États-Unis. (Données internes à Google)
    • Carte du monde de l'utilisation de Google
  • 15. Relativiser les modes de recherche
    • Sur Google 34% des internautes se contentent de requêtes en un mot,
    • 30% en 2 mots,
    • 18% en 3 mots
    • Source : http://www.journaldunet.com/chiffres-cles.shtml ( Journal du net , décembre 2010)
  • 16. Relativiser les modes de recherche
    • 42% des utilisateurs cliquent uniquement sur le premier résultat de la recherche.
    • 8% cliquent ensuite sur le deuxième résultat.
    • Source : http://www.useit.com/alertbox/defaults.html
  • 17. Relativiser l’emploi des langues sur l’internet
  • 18. Les moteurs spécialisés
    • Google Scholar , depuis novembre 2004
    • Scirus - For scientific information, depuis 2001
    • Isidore - Accès aux données numériques des SHS, depuis 2010
    • In-Extenso créé en 2002, arrêté en 2009
    • OAIster créé 2002, devenu le moteur d'OCLC en octobre 2009
  • 19. Google Scholar
    • Moteur de recherche spécialisé dans la littérature universitaire lancé fin 2004, encore en version beta en septembre 2011.
    • Base de données pluridisciplinaire
    • http:// scholar.google.com/
  • 20. Qu’interroger sur Google Scholar ?
    • La couverture de Google Scholar ne peut pas être définie avec précision. L’objectif est de retrouver les documents du monde scientifique. La base de données est multidisciplinaire avec une prépondérance des ressources en sciences exactes et médicales.
  • 21. Dans Google Scholar vous y trouvez …
    • - Des fichiers en texte intégral à accès libre et payants en format HTML et PDF : éditeurs scientifiques, sociétés savantes, répertoires de pre-prints, serveurs universitaires...
    • - Des articles avec évaluation par les pairs ( peer reviewed ), des thèses, des livres, des articles en pré-publication, des rapports…
    • Google Scholar ne fournit aucune liste des éditeurs commerciaux ni de liste des serveurs d’archives qu’il indexe.
  • 22. Vous ne savez rien sur…
    • La période couverte par ces documents
    • Le volume des documents présents sur Google Scholar
    • Les langues représentées même si l’anglais est prédominant.
    • La mise à jour des informations.
  • 23. Scirus
    • Scirus est un moteur de recherche scientifique pluridisciplinaire développé par l’éditeur scientifique Elsevier
    • Son « Advisory board » est composé de chercheurs et de professionnels de l’information
    • Scirus annonce l’indexation de plus de 410 millions de pages issues du web scientifiques (Septembre 2011)
    • http://www.scirus.com
  • 24. Scirus vous explique son fonctionnement
    • Scirus indexe le texte intégral des pages Web qu’il visite.
    • Les ressources obtenues suites à vos interrogations sont toutes accessibles depuis le Web, mais un certain nombre seront d’accès payant (Lexis Nexis, Science Direct d’Elsevier... )
    • Vous interrogez dans Scirus aussi bien le texte intégral d’articles de recherches que le texte de sites d’informations institutionnels (plaquettes de laboratoire en ligne, sites d’universités)
  • 25. Scirus vous explique son fonctionnement, mais :
    • La politique d’indexation et sa fréquence sont clairement annoncées
    • La nature commerciale du moteur tend à mettre en avant les ressources issues des portails payants
    • Malgré la volonté annoncée de créer un moteur scientifique vous y trouvez un certain nombre de pages non scientifiques (pages de sites personnels ou commerciaux).
  • 26. Isidore - Accès aux données numériques en SHS
    • Isidore est une plateforme de recherche qui s'appuie sur les principes du web de données et donne accès à des données en accès libre ( open access ).
    • En septembre 2011 Isidore donnait accès à 1151 sources de données numériques, regroupées en 49 collections.
    • http://www.rechercheisidore.fr
  • 27. Le « Web de données » comment ça marche ?
    • Moissonnage ciblé des métadonnées et données scientifiques structurées ;
    • Indexation des données (non structurées et structurées ;
    • Normalisation et enrichissement des métadonnées à partir de référentiels reconnus dans la communauté ;
    • Interface graphique de recherche ;
    • Mise à disposition des métadonnées enrichies par le moteur.
  • 28. Des outils spécialisés : blogs et annuaires
    • Aldébaran
    • http:// aldebaran.revues.org
    • Internet per gli umanisti
    • http:// biblio.lett.unitn.it
    • La boîte à outil des historiens
    • http://www.boiteaoutils.info/
    • Les aspects concrets de la thèse
    • http://act.hypotheses.org/
  • 29. Les bases de données - 1
    • Chaque base donne des informations en fonction de son principe de fonctionnement
    • Le catalogue SUDOC  fournit :
    • Des notices bibliographiques (9 millions) ;
    • La localisation des ouvrages sur 2000 établissements ;
    • Le PEB avec les bibliothèques adhérentes au réseau.
  • 30. Les bases de données - 2 Le catalogue Worldcat , est l'une des bases de données de l' OCLC (Online Computer Library Center) créé en 1971 : vous accédez aux catalogues de plus de 10 000 bibliothèques à travers le monde proposant 1,5 milliards de documents en 31 langues (chiffres 2011). http://www.worldcat.org
  • 31. Les bases de données - 3 Les points forts de Worldcat : - La création de bibliographies, publiques ou non, exportables vers des logiciels (EndNote, Refworks, Zotero) ; - L'intégration du portail OAISTER en octobre 2009 pour accéder à des documents numériques ; - L'accès à un index auteur original : Worldcat indentities .
  • 32. Les bases de données - 4
    • Deux bases à accès réservé :
    • Université de Provence : ENT
    • environnement numérique de travail
    • http://entu1.phocean.fr/uPortal/render.userLayoutRootNode.uP
    • Biblio SHS http://biblioshs.inist.fr /
  • 33. Le libre accès , qu'est-ce que c'est ?
    • - Visibilité et accessibilité à la recherche
    • - Mise à disposition gratuite des publications scientifiques
    • - Des dispositifs techniques de stockage et de partage des informations
    • - Un mouvement international structuré
    • - Le libre accès ne concerne pas seulement la recherche (ex : Data.gov http:// www.data.gov ).
  • 34. OAI
    • L’Open Archive Initiative, créée par la convention de Santa Fé (Nouveau Mexique) en 1999, pour :  - développer et de promouvoir des standards interopérables pour les bases d’articles scientifiques ;  - définir un ensemble de protocoles techniques pour la description des données et leur interrogation ;  - oeuvrer pour que la constitution d’archives électroniques devienne un processus établi dans la communication scientifique.
  • 35. Le dépôt dans HAL-SHS
    • L'auteur peut déposer la version &quot;manuscrite&quot; de son document :
    • AVANT publication : il est détenteur des droits sur son texte
    • APRES publication SOUS contrat :
    • - Sauf interdiction explicitement précisée dans le contrat, l’auteur a le droit de diffuser son document dans une archive institutionnelle électronique.
    • - En cas de clause explicite autorisant l’exploitation électronique du document par l’éditeur : l’auteur doit demander l’autorisation de dépôt à l’éditeur.
    • APRES publication SANS contrat L’auteur a le droit de diffuser son document (version preprint ).
    • Les questions de droits des images contenues dans le texte doivent être réglées par l’auteur
  • 36. Accès aux articles en SHS
    • - Revues.org : http://www.revues.org
    • - Persée : http://www.persee.fr
    • - Cairn : http://www.cairn.info
    • - Erudit : http://www.erudit.org/revue
    • - HAL SHS : http://halshs.ccsd.cnrs.fr
  • 37. Le web invisible
  • 38. Les 4 types de web invisible
    • The Opaque Web : les pages qui pourraient être indexées par les moteurs mais qui ne le sont pas (limitation d'indexation du nombre de pages d'un site, fréquence d'indexation, liens absents vers des pages, limite décidée par le moteur…) - The Private Web : les pages web volontairement exclues par les webmasters. - The Proprietary web : pages seulement accessibles pour les personnes qui s'identifient. Le robot ne peut pas toujours y accéder. - The Truly Invisible Web : contenu qui ne peut être indexé pour des raisons techniques, comme un format inconnu par le moteur (même si Google reconnaît la majorité des formats) et surtout de nombreuses des bases de données.
    • Source : Chris Sherman et Gary Price, The Invisible Web : Finding Hidden Internet Resources Search Engines Can't See
  • 39. L’ egoréférencement ou de la nécessité de maîtriser son identité numérique*
    • 1. Faites le choix du libre accès
    • 2. Entrez dans l’économie de l’attention
    • 3. Entrez dans la conversation scientifique
    • 4. Ne laissez personne définir pour vous votre identité numérique
    • * Repris de Marin Dacos, source : Blogonumericus .
  • 40. Faites le choix du libre accès
    • Les revues en accès restreint font partie du web invisible. Elles ne contribuent pas à votre identité numérique.
    • Par ailleurs, elles contribuent bien faiblement à la marche de la science, parce qu’elles misent sur l’invisibilité en lieu et place de la mise en public. Or, la publication est bien la mise en visibilité, pas la mise au secret
  • 41. Entrez dans l’économie de l’attention
    • Prenez conscience que vous entrez dans une économie de l’attention, sous le sceau de la prolifération documentaire.
    • Nous avons quitté le paradigme de la rareté. Autrefois, les lecteurs cherchaient les articles. Aujourd’hui, les articles cherchent les lecteurs. Il y a plus de documents en ligne que d’habitants sur cette planète.
  • 42. Entrez dans la conversation scientifique
    • La science moderne est née grâce à la correspondance entre savants. Ces correspondances ont donné les revues.
    • La science moderne est aussi faite de disputatio , le débat entre chercheurs, qui a donné le séminaire. Aujourd’hui, le numérique introduit la notion de séminaire virtuel permanent.
    • Il s’agit d’une conversation scientifique qui se joue des contraintes de temps et d’espace.
  • 43. Hypotheses.org ou la nouvelle conversation scientifique
    • Femmes au travail, question de genre
    • http://fht.hypotheses.org/1797
    • Devenir historien-ne
    • http://devhist.hypotheses.org/
    • Efigies, Etudes Féministes, Genre et Sexualité
    • http://efigies-ateliers.hypotheses.org
  • 44. Ne laissez personne définir pour vous votre identité numérique
    • Utilisez des outils qui vous permettent de regrouper dynamiquement l’ensemble des informations, vous concernant, que vous souhaitez agréger autour de votre identité numérique :
    • - vos articles sur HAL SHS
    • - vos billets sur Hypotheses.org
    • - votre bibliographie sur Zotero
    • - vos images sur MediHal
    • - vos cours sur Slideshare
    • - vos colloques sur Calenda…
  • 45. Les nouvelles lois de la citabilité
    • Le DOI qu’est-ce que c’est ?
    • http://www.doi.org/
    • Citer une référence électronique
    • http://aldebaran.revues.org/69
    • Utiliser Zotero
    • http://phonotheque.hypotheses.org/5341
  • 46. Bonnes recherches...
    • N'hésitez pas à contacter les professionnels de la bibliothèque à la médiathèque de la MMSH
    • [email_address]
    • Mon courriel :
    • [email_address]