• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
Formation Gephi : La science des réseaux
 

Formation Gephi : La science des réseaux

on

  • 508 views

 

Statistics

Views

Total Views
508
Views on SlideShare
508
Embed Views
0

Actions

Likes
1
Downloads
22
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    Formation Gephi : La science des réseaux Formation Gephi : La science des réseaux Presentation Transcript

    • La science des réseaux
    • 1| 2| 3| Science des réseaux et exploration de données une ingénierie de la découverte propriétés la science des réseaux SOMMAIRE
    • Science des réseaux et exploration de données -1-
    • Le web, et tous les systèmes complexes d’information, représentent un défi pour l’étude des architectures documentaires : distribués, à grande échelle et dynamiques dans le temps, ils doivent être explorés comme des espaces inédits pour en comprendre la structure et les propriétés mais aussi pour en proposer des modèles exploitables aux usagers. L’exploration scientifique et expérimentale des propriétés des masses de données distribuées, ou de tout système complexe, ouvre ainsi sur des pistes d’innovation technologique, des outils, des méthodes ou des services qui pourront accompagner demain les usagers, autant experts que publics, dans des tâches de management de l’information, de veille stratégique ou d’aide à la décision. L’une des solutions prometteuses pour maîtriser les univers complexes consiste à développer une approche par les graphes et leur visualisation. Les graphes représentent des pivots entre, d’une part, les données accumulées sur le web, les intranets, les BDD…et, d’autre part, les interfaces graphiques de manipulation et d’exploration. Comme instrument d’exploration, les interfaces cartographiques à base de graphes ouvrent sur des dispositifs novateurs de visualisation et d’interaction avec les masses de données, et révèlent souvent des propriétés de corpus jusque-là inaperçues, implicites ou sous-jacentes. Elles peuvent ainsi participer de la prospection, de l’évaluation et de la décision. la science des réseaux contexte
    • La science des réseaux Interfaces, graphes et cartographies de l’information http://maps.linkfluence.net/blogopole/2009/http://www.youtube.com/watch?v=2guKJfvq4uI http://www.stargit.net/
    • base de données structure de graph boussole cartographique Visualisation de graphes / La visualisation de graphes : un domaine périphérique à la théorie des graphes / cependant, des vertus expérimentales : la visualisation de graphes relationnels et la manipulation de leurs dimensions permettent de produire des « vues » originales sur les données. En particulier, il s’agit d’identifier des patterns statistiques ou des saillances visuelles associées aux corpus explorés. C’est le principe d’une géographie de l’information nourrie de problématiques théoriques en Network Sciences et qu’il s’agit en même temps de rendre tangible à des usagers (knowledge mapping tools). La science des réseaux Interfaces, graphes et cartographies de l’information
    • la science des réseaux interfaces, graphes et cartographie Issues des graphes (outillage analytique d’un degré supérieur en abstraction, outil privilégié d’exploration/analyse de la complexité) Cartographies/espace de représentation (dimensions des données, réduction, projection/spatialisation). Elles éclairent la forme(s) des données présentes dans un système d’information, l’état d’un corpus, l’organisation sous-jacente d’une architecture documentaire / participent de la prospection, de l’évaluation et de la décision espace en évolution de solutions graphiques, lieu d’échanges et de mise au point d’un code commun.
    • une ingénierie de la découverte -2-
    • La science des réseaux Une ingénierie de la découverte et de l’exploration REDUIRE LES MASSES ET LES DIMENSIONS • Produire des indicateurs de masses, de densité, de clustering, de voisinage et de centration • Concevoir des filtres • Décomposer les dimensions (topologie hypertexte, texte et contenu, indicateurs d’usage…) • Modèle(s) de distribution des propriétés des corpus CONSTRUIRE DES FIGURES • Principes d’agrégation • Organisation, architecture et sous-ensembles • Couches et profondeurs des corpus • Temporalités et événements FAIRE EMERGER DES PATTERNS • Méthodes de projection spatiale, visualisation des données • Identification de saillances logico-graphiques • Capitaliser/archiver les phases de transformation des corpus • Ingénierie de l’exploration des corpus par : • Fusion des données de données hétérogènes • Niveaux de navigation/zoom • Réduction (algorithmes de hiérarchisation/clustering…) • Projection (fonds géoréférencés, schémas fonctionnels, organigrammes…) 321
    • La science des réseaux Une ingénierie de la découverte et de l’exploration LingLog mode of ForceAtlas 2 Force Atlas 2Fruchterman-Rheingold
    • Techniquement, la cartographie de l’information repose sur la maîtrise des différentes étapes de la chaîne de production • Curation, Enrichissement des données • Visualisation de graphes • Spatialisation, hiérarchisation, groupement • Finalisation cartographique ajout de méta-données ou de descripteurs aux données natives Patterns à explorer Nouvelles métriques à intégrer Vues complémentaires à produire système d’information anayse des données cartographie graphes interface La science des réseaux GEPHI : un élément central dans le cycle de production de la cartographie
    • La science des réseaux Gephi, un consortium, une communauté 100.000 téléchargements 10 ANS d’existence d’une communauté 1.000 Membres sur facebook Sébastien Heymann
    • La science des réseaux gephi en différents contextes d’applications recherche scientifique exploration (Stanford, Workshop-Gephi) scénographie (international design biennal 2010)
    • propriétés -3-
    • LA notion d’ordre -a- (entre ordre et aléatoire)
    • La science des réseaux la notion d’ordre En moyenne, pour un network de 1million de noeuds distribués en mode régulier (avec pour chaque noeud 100 voisins proches, 50 à gauche, 50 à droite), la distribution de 5 liens en mode random fait chuter les distances moyennes de 50%. Il faut multiplier ce chiffre par 10 (soit 5x10 = 50) pour faire chuter la moyenne encore de 50%. Et ainsi de suite… Les effets sont donc décroissants.
    • La science des réseaux Une ingénierie de la découverte et de l’exploration Clustering + distance + Clustering + distance + Clustering + distance - Clustering - distance -
    • une organisation en « couches » -b- (networks layers)
    • la science des réseaux une organisation en couches Couche la plus visible du web : Google, Amazon, SCNF, ... Couche intermédiaire : agrégats, communautés en ligne Couche profonde : bases de données
    • classements, hierarchies et visibilité -C-
    • La science des réseaux Classements, hierarchies et visibilité
    • clusters, groupes et communautés -D-
    • LES CARTES DES SCIENCES clusters, groupes et communautés
    • le principe de « centralité » dans les réseaux -e-
    • ECOLOGY ecology biodiversity conservation zoology marine & freshwater biology ornithology evolutionary biology oceanography fisheries forestry entomology GEOSCIENCES geosciences, multidisciplinary geology geochemistry & geophysics geography, physical paleontology mineralogy engineering, geological engineering, petroleum remote sensing meteorology & atmospheric sciences imaging science & photographic technology ENVIRONMENTAL SCIENCES engineering, environmental environmental sciences water resources engineering, civil limnology agricultural engineering engineering, ocean AGRICULTURE horticulture agronomy agriculture, multidisciplinary plant sciences food science & technology soil science integrative & complementary medicine agriculture, dairy & animal science materials science, paper & wood INFECTIOUS DISEASESES infectious diseases immunology microbiology allergy virology tropical medicine parasitology mycology veterinary sciences GENERAL MEDICINE / HEALTH health care sciences & services medical ethics public, environmental & occupational health medicine, general & internal medical informatics nursing history & philosophy of science education, scientific disciplines statistics & probability MATERIAL SCIENCES materials science, multidisciplinary nanoscience & nanotechnology materials science, coatings & films physics, applied materials science, ceramics metallurgy & metallurgical engineering physics, condensed matter materials science, characterization & testing mining & mineral processing instruments & instrumentation electrochemistry energy & fuels COMPUTER SCIENCES computer science, hardware & architecture computer science, information systems computer science, artificial intelligence engineering, electrical & electronic computer science, theory & methods computer science, software engineering telecommunications computer science, cybernetics automation & control systems transportation science & technology computer science, interdisciplinary applications robotics operations research & management science mathematics, applied engineering, industrial ENGINEERING mechanics engineering, mechanical mathematics, interdisciplinary applications thermodynamics engineering, multidisciplinary engineering, aerospace materials science, composites engineering, marine construction & building technology engineering, manufacturing acoustics mathematics CHEMISTRY chemistry, multidisciplinary chemistry, organic chemistry, inorganic & nuclear chemistry, physical chemistry, applied crystallography chemistry, medicinal spectroscopy engineering, chemical chemistry, analytical materials science, textiles polymer science materials science, biomaterials PHYSICS physics, multidisciplinary physics, mathematical physics, nuclear physics, particles & fields physics, fluids & plasmas optics physics, atomic, molecular & chemical astronomy & astrophysics nuclear science & technology BIOMEDICAL SCIENCES cell biology biochemistry & molecular biology biophysics developmental biology multidisciplinary sciences genetics & heredity biology medicine, research & experimental microscopy anatomy & morphology endocrinology & metabolism biotechnology & applied microbiology physiology reproductive biology andrology medical laboratory technology biochemical research methods pathology oncology mathematical & computational biology toxicology pharmacology & pharmacy obstetrics & gynecology nutrition & dietetics medicine, legal urology & nephrology CLINICAL MEDICINE surgery critical care medicine emergency medicine transplantation respiratory system peripheral vascular disease cardiac & cardiovascular systems orthopedics engineering, biomedical hematology pediatrics sport sciences anesthesiology gastroenterology & hepatology radiology, nuclear medicine & medical imaging otorhinolaryngology rheumatology dermatology dentistry, oral surgery & medicine NEURO-SCIENCES neurosciences psychology behavioral sciences neuroimaging psychiatry clinical neurology substance abuse geriatrics & gerontology rehabilitation ophthalmology Map Of Science based on I.S.I. Subject Categories Distribution of ISI Subject Categories over 6,164 journal included in the Science Citation Index (SCI - Thomson-Reuters) in year 2006 Aggregated journal-journal citation matrix produced from L. Leydesdorff § I. Rafols data (see paper and informations available at http://www.leydesdorff.net) Nb. of Nodes : 172 Nb. of Edges : 22667 METRIC Diameter: 2 Average Path length: 1.2351761185910513 Graph Density: 0.770671834625323 (max.=1) Average Clustering Coefficient: 0.8256993889808655 VIZUALISATION Directed Graph / Vizualisation using Ifan Hu algorithm with GEPHI v.0.7 (available at : http://gephi.org/) Acoustics Agriculture, Multidisciplinary Biochemical Research Methods Biochemistry and Molecular Biology Biology Biotechnology and AppliedMicrobiology Chemistry, Analytical Computer Science, Artificial Intelligence Engineering, Environmental Engineering, Electrical and Electronic Environmental Sciences Public, Environmental and Occupational Health Instruments and Instrumentation Multidisciplinary Sciences Pharmacology and Pharmacy Radiology, Nuclear Medicine and Medical Imaging Statistics and Probability Toxicology Water Resources Mathematical and Computational Biology Mathematics, Interdisciplinary Applications Vizualisation using Betweeness Centrality Algorithm Biochemistry and Molecular Biology Pharmacology and Pharmacy Neurosciences Multidisciplinary Sciences Cell Biology Surgery Chemsistry Physical Medecine, General and Internal Immunology Chemsitry, Multidisciplinary Oncology Material Sciences, Multidisciplinary Genetics and Heredity Environmental Sciences Clinical Neurology Biotechnology and Applied Microbiology Physics, Applied Medecine, Research and Experimentation Physiology Ecology Water Resources Statistics and Probability Multidisciplinary Sciences Environmental Sciences Biology Biotechnology and Applied Microbiology Mathematics, Interdisciplinary Applications Chemistry, Analytical Engineering, Electrical and Electronic Biochemical research Methods Public, Environmental and Occupational Health Acoustics Pharmacology and Pharmacy Computer Science, Artificial Intelligence Biochemistry and Molecular Biology Toxicology Mathematical and Computational Biology Engineering, Environmental Radiology, Nuclear Medecine Instruments and Instrumentation Radiology, Nuclear Medecine and Medical Imaging Top 20 ISI Subject Categories using : Degree Ranking Betweeness Centrality Acoustics Automation and Control Systems Agriculture, Dairy and Animal Science Agronomy Allergy Anatomy and Morphology Anesthesiology Biodiversity Conservation Astronomy and Astrophysics Behavioral Sciences Biochemical Research Methods Biochemistry and Molecular BiologyBiology Biophysics Biotechnology and Applied Microbiology Plant Sciences Oncology Cardiac and Cardiovascular Systems Cell Biology Critical Care Medicine Thermodynamics Chemistry, Applied Chemistry, Medicinal Chemistry, Multidisciplinary Chemistry, Analytical Chemistry, Inorganic and Nuclear Chemistry, Organic Chemistry, Physical Computer Science, Artificial Intelligence Computer Science, Hardware and Architecture Computer Science, Information Systems Computer Science, Interdisciplinary Applications Computer Science, Software Engineering Computer Science, Theory and Methods Construction and Building Technology Crystallography Dentistry, Oral Surgery and Medicine Dermatology Geochemistry and Geophysics Substance Abuse Ecology Health Care Sciences and Services Electrochemistry Evolutionary Biology Developmental Biology Endocrinology and Metabolism Energy and Fuels Engineering, Multidisciplinary Engineering, Biomedical Engineering, Environmental Engineering, Chemical Engineering, Industrial Engineering, Manufacturing Engineering, Civil Engineering, Electrical and Electronic Engineering, Mechanical Engineering, Geological Entomology Environmental Sciences Fisheries Food Science and Technology Forestry Gastroenterology and Hepatology Genetics and Heredity Geography, Physical Geology Geosciences, Multidisciplinary Geriatrics and Gerontology Hematology Mathematical and Computational Biology Horticulture Public, Environmental and Occupational Health Immunology Infectious Diseases Nanoscience and Nanotechnology Instruments and Instrumentation Limnology Operations Research and Management Science Marine and Freshwater Biology Materials Science, Ceramics Materials Science, Multidisciplinary Mathematics, Applied Mathematics, Interdisciplinary Applications Mathematics Mechanics Medical Laboratory Technology Medicine, General and Internal Metallurgy and Metallurgical Engineering Medicine, Research and Experimental Materials Science, Biomaterials Materials Science, Coatings and Films Meteorology and Atmospheric Sciences Microbiology Mineralogy Multidisciplinary Sciences Mycology Clinical Neurology Neuroimaging Nuclear Science and Technology Nutrition and Dietetics Obstetrics and Gynecology Oceanography Ophthalmology Optics Ornithology Orthopedics Otorhinolaryngology Paleontology Parasitology Pathology Pediatrics Pharmacology and Pharmacy Physics, Applied Physics, Fluids and Plasmas Physics, Atomic, Molecular and Chemical Physics, Multidisciplinary Physics, Condensed Matter Physiology Physics, Nuclear Physics, Particles and Fields Physics, Mathematical Polymer Science Psychiatry Psychology Radiology, Nuclear Medicine and Medical Imaging Rehabilitation Respiratory System Reproductive Biology Rheumatology Soil Science Spectroscopy Sport Sciences Statistics and Probability Surgery Telecommunications Toxicology Transplantation Tropical Medicine Urology and Nephrology Veterinary Sciences Peripheral Vascular Disease Virology Zoology Water Resources Andrology Emergency Medicine Medical Ethics Nursing Engineering, Aerospace Computer Science, Cybernetics Robotics Engineering, Marine Materials Science, Composites Transportation Science and Technology Mining and Mineral Processing Materials Science, Characterization and Testing Remote Sensing Imaging Science and Photographic Technology Materials Science, Paper and Wood Materials Science, Textiles Agricultural Engineering Agricultural Economics and Policy Medicine, Legal Integrative and Complementary Medicine Engineering, Ocean Engineering, Petroleum History and Philosophy Of Science Neurosciences Agriculture, Multidisciplinary Microscopy Education, Scientific Disciplines Medical Informatics Acoustics Agriculture, Multidisciplinary Biochemical Research Methods Biochemistry and Molecular Biology Biology Biotechnology and AppliedMicrobiology Chemistry, Analytical Computer Science, Artificial Intelligence Engineering, Environmental Engineering, Electrical and Electronic Environmental Sciences Public, Environmental and Occupational Health Instruments and Instrumentation Multidisciplinary Sciences Pharmacology and Pharmacy Radiology, Nuclear Medicine and Medical Imaging Statistics and Probability Toxicology Water Resources Mathematical and Computational Biology Mathematics, Interdisciplinary Applications Vizualisation using Betweeness Centrality Algorithm Biochemistry and Molecular Biology Pharmacology and Pharmacy Neurosciences Multidisciplinary Sciences Cell Biology Surgery Chemsistry Physical Medecine, General and Internal Immunology Chemsitry, Multidisciplinary Oncology Material Sciences, Multidisciplinary Genetics and Heredity Environmental Sciences Clinical Neurology Biotechnology and Applied Microbiology Physics, Applied Medecine, Research and Experimentation Physiology Ecology Water Resources Statistics and Probability Multidisciplinary Sciences Environmental Sciences Biology Biotechnology and Applied Microbiology Mathematics, Interdisciplinary Applications Chemistry, Analytical Engineering, Electrical and Electronic Biochemical research Methods Public, Environmental and Occupational Health Acoustics Pharmacology and Pharmacy Computer Science, Artificial Intelligence Biochemistry and Molecular Biology Toxicology Mathematical and Computational Biology Engineering, Environmental Radiology, Nuclear Medecine Instruments and Instrumentation Radiology, Nuclear Medecine and Medical Imaging Top 20 ISI Subject Categories using : Degree Ranking Betweeness Centrality Automation and Control Systems Computer Science, Hardware Computer Science, Information Computer Science, Softwa Engineering, Biomedical Engi Radio TelecoForce atlas 2 Taille et degrés couleur centralité La science des réseaux principe de centralité
    • LES CARTES DES SCIENCES Bibliographie A.-L. BARABASI – linked: the new science of networks, new ed., Perseus Publishing, 2005. A.-L. BARABASI – Bursts: The Hidden Pattern Behind Everything We Do, Dutton-Sciences, 2010. M. BUCHANAN – Nexus, Small Worlds and the groundbreaking Theory of Networks, W. W. Norton & Company, 2003. S. CHAKRABARTI – Mining the Web: Discovering Knowledge from Hypertext Data, Morgan Kaufmann, 2002. B.-A. HUBERMAN – the laws of the web: patterns in the ecology of information, MIT-Press, 2001. J. KLEINBERG, E. TARDOS – algorithm design, Addison Wesley, 2006. M. NEUMAN, A.-L. BARABASI, D.-J. WATTS – the Structure and Dynamics of Networks, Princeton Studies in Complexity, 2006. B. SHNEIDERMAN, S.-K. CARD, J. MACKINLAY - readings in information visualization: using vision to think, Morgan Kaufmann, 1999. S. STROGATZ – sync: the emerging science of spontaneous order, 2004, Hyperion, 2003. D. WATTS – six degrees – the science of a connected age, W. W. Norton & Company, 2004.