Ic05plan

1,628 views

Published on

Plan du cours IC05 UTC Ghitalla 2012

Published in: Education
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
1,628
On SlideShare
0
From Embeds
0
Number of Embeds
850
Actions
Shares
0
Downloads
27
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Ic05plan

  1. 1. Réseaux, Graphes, CartographieIC05 – Semestre Printemps 2012Université de Technologie de CompiègneINTRODUCTIONa) Networks L’émergence de la thématique des réseaux Le cas des Information networks : la diversité des sources de documents numériques L’importance actuelle des réseaux sociauxb) Quels modèles explicatifs, quels dispositifs d’observation, quellesdonnées ? Mais : comment expliquer des architectures massivement distribuées et dynamiques? Retour des questions d’ingénierie (instruments) et des outils d’exploration du complexe L’avènement des NetWork Sciences Application(s) aux Information networks La recherche des clefs de la maîtrise des Grandes Masses de Données numériques, distribuées et dynamiques Des origines, des emprunts, des migrations Les années 96-99 et les Web Sciencesc) Une démarche globale d’ingénierie Observer, comprendre, agir Les Networks Sciences vs « sciences du complexe » Un projet global d’infrastructure, de projets et d’acteurs (Linkfluence, GEPHI, Medialab…) Des terrains d’application… Les projets cartographiquesFranck GHITALLA / 2012 1
  2. 2. I) OBSERVER (Networks Analysis : Measures and Metrics)I-1) Networks and their representation (M.E.J. Newman, Networks – An introduction) • Graph theory (backgrounds and history) • Adjency Matrix • Weighted Networks • Directed networks • Bi and Tri-partite networks / Graph transformation • Acyclic directed networks • Data aggregation FOCUS : Les Cartes des Sciences : méthodes et enjeuxI-2) Degree, Paths and Distances (M.E.J. Newman, Networks – An introduction) • Density • Dense/sparse networks • Regular networks • IN-Degree, OUT-Degree • Distribution of links / degree distribution and power-law • Path length / shortest path length • Diameter FOCUS : Ecological networks and Food Webs (M.Buchanan, “The Tangled Web”)I-3) Components / Groups of nodes / Clustering (M.E.J. Newman, Networks – Anintroduction) “The hard task” (cf. M.-J. Newman) / between tradition (sociology) and the new Computational Social Sciences (CSS)Franck GHITALLA / 2012 2
  3. 3. I-3-a) Backgrounds • Connected/disconnected • Directed graph and weakly connected components / Giant component / Strongly connected component • Sets, sub-sets, cut sets I-3-b) Structural properties / Connectedness • Degree centrality • Eigenvector centrality • PageRank • Hubs and Authorities (HITS) I-3-c) Structural properties / Distances • Closeness centrality • Betweenness centrality FOCUS : Modèle topologique de l’agrégat dans un set de données (exemples de mesures avec GEPHI sur les données du WebDatarium) I-3-d) Grouping nodes through linkage distribution • Groups, communities, cliques, clusters, k-plex • Triades and transitivity • Local clustering and redundancy • Reciprocity • Similarity, cosine similarity • Regular equivalence • Homophily and Assortative Mixing • Assortative mixing by enumerative characteristics I-3-e) Dividing networks into clusters • Clustering coefficients • Social Data Mining and social engineering • Graph partitioning / from existing categories / from statistical properties (hard task) • Community detection / algorithms (modularity methods, dynamic methods, edges weights, actors and e-cologic competition) • Hierarchical clusteringFranck GHITALLA / 2012 3
  4. 4. FOCUS : Linkfluence et les Computational Social SciencesI-4) Dynamics, Evolution, Temporal Aspects (M.E.J. Newman, Networks – Anintroduction) I-4-a) Backgrounds • Networks formation / Genèse des patterns • Information IN/ON the net • Removal/addition of nodes/edges • Propagation, diffusion, spreadings I-4-b) Spreadings • Epidemics model(s) • The S.I.R.S. model I-4-c) Evolution • Preferential attachement / time and fitness (Price, Albert-Barabasi) • Vertex copying model(s) (Kleinberg) I-4-d) Structure • Phase transition • Percolation • Thresholds • Transition phase and “cascades” / Equilibrium FOCUS : le « cascade model » de D.Watts (Chapitre 8 de Six Degrees "Thresholds, Cascades and Predictibility")Franck GHITALLA / 2012 4
  5. 5. II) COMPRENDRE (Patterns and Canonical Models)II-1) Small World Experiments • “Six degrees of separation” (Barabasi, Linked) • M.Granovetter • S.Milgram (chapitre 5, Six Degrees, D. Watts)II-2) Le « tunner analytique » (D. Watts, Six Degrees, chapitre 4, S.Strogatz, Synch., chap.9) • Clusters, proximity and long distances • Randomness, universality and complex systems • Le paramètre p (Strogatz-Watts) et les modèles alpha et beta. / The « order-randomness- spectrum » (D. Watts, S. Strogatz) FOCUS : le « tunner analytique » et la typologie des réseauxII-3) Corrélation contenu/structure et modèle en agrégats II-3-a) Networks of content Data, Knowledge discovery, WWW and Hyperlinked worlds, Text as Data, Keywords and Citation networks, Topics Detection and Tracking (TDT), Focus-crawling FOCUS : Des contenus, des liens et des acteurs : StarGIT et CpanExplorerFranck GHITALLA / 2012 5
  6. 6. II-3-b) Principes du modèle en agrégats / Expansion / Attraction / Le modèle gravitationnel du web (Montgolfier et al.) / Couches (layers) et propriétés / Topical localities, agrégats (Kleinberg et HITS) FOCUS : un modèle experimental : le “modèle en couches” (network layers)II-4) Other dimensions • Beyond “power-law” : Scale-free Networks (Barabasi, Albert et al.) • Robustness and Aschile’ Heel / structural holes • Networks layers : la diversité des modèles topologiques mobilisés et l’imbrication des niveaux d’analyse • Synchronized Chaos and Small Worlds Networks (S.Strogatz, Synch, the emerging science of spontaneous order, chapitres 7, 8 et 9) FOCUS : la Fabrique du vivant (Biological Networks)Franck GHITALLA / 2012 6
  7. 7. III) VISUALISER-CARTOGRAPHIERIII-1) Interfaces, graphes et cartographies de l’information • Visualisation de graphes / Le point de vue sur les visualisations de S.Strogatz (Sync.) et D. Watts (Six Degrees) • Mapping knowledge tools / Synthèse et exploration FOCUS : Infovis, exploration, cognition • Les Cartographies de l’information : comment les définir ? (graphes et cartographie, espaces de représentation d’un corpus de données, organisation sous-jacente et patterns, solutions graphiques et codes communs) • Les cartographies de l’information : quels enjeux ? (Le dispositif sémiologique : écriture, espace de projection et vue sur les données, composition, Cartes des réseaux : Les localités thématiques, Hybridation des espaces daction, La carte et le territoire, Lacte cartographique : "Où suis-je?", Le sceau du pouvoir, Cartes : collections et Atlas)III-2) GEPHI : la pierre angulaire • Le format GEXF • Trois espaces de travail • Algorithmes d’analyse des réseaux • Algorithmes de spatialisation / La famille des force-directed (Ifan-Hu, Fruchterman Rheingold, ForceAtlas 1, ForceAtlas2) FOCUS : Anatomy of ForceAtlas2 algorithmIII-3) Recherche de l’ordre, construction des vues • A différentes échelles (zoom, seuils statistiques…)Franck GHITALLA / 2012 7
  8. 8. • Selon différentes dimensions (une ou plusieurs dimensions, principes de corrélation…) Géographie de la « coopération » scientifique : le réseau des co- publications en Chimie (2006-2010) Identification des communautés par les mots- clefs et identification des mots-clefs spécialisés par les communautés (chercheurs spécialisés et vocabulaire expert) Production d’un graphe bi-partite 97.559 auteurs 85.381 mots-clefs 1.990.981 liens Visualisation des principales communautés de co-publication en Chimie (au moins 30 chercheurs et plus de 10 co-publications) • Temporalité(s) / La question des interfaces pour quels modèles et systèmes de mesure du temps dans les réseaux… • Vues possibles intégrant à la fois variations d’échelles et de dimensions / la nécessaire scénarisation d’un jeu de cartographies multiplesFranck GHITALLA / 2012 8
  9. 9. III-4) Le projet cartographique • Processing/Cycle de production / Les étapes préparatoires d’un projet cartographique • Types de méthodes / Traitement, filtrage et enrichissement des données - REDUIRE LES MASSES ET LES DIMENSIONS Produire des indicateurs de masses, de densité, de clustering, de voisinage et de centration Concevoir des filtres Décomposer les dimensions (topologie hypertexte, texte et contenu, indicateurs d’usage…) Modèle(s) de distribution des propriétés des corpus - FAIRE EMERGER DES PATTERNS Méthodes de projection spatiale, visualisation des données Identification de saillances logico-graphiques Capitaliser/archiver les phases de transformation des corpus Ingénierie de l’exploration des corpus par : Fusion des données de données hétérogènes Niveaux de navigation/zoom Réduction (algorithmes de hiérarchisation/clustering…) Projection (fonds géoréférencés, schémas fonctionnels, organigrammes…) - CONSTRUIRE DES FIGURES Principes d’agrégation Organisation, architecture et sous-ensembles Couches et profondeurs des corpus Temporalités et événements • Classes (techniques) de cartographies de l’information FOCUS : Anatomie d’une Fondation de rechercheFranck GHITALLA / 2012 9
  10. 10. IV) AGIR (Network Services Design)Computing for Networks FOCUS : INmapsIndicateurs et aide à la décision Le projet cartographique et classes de cartographies de l’information Social and Geographical monitoring of complex and distributed organizations Indicateurs d’aide à la gouvernance, I.S.T. Bases de connaissances et analyse des savoirs et/ou de la production scientifique Veille territoriale FOCUS : Le RADAR d’un pôle de compétitivitéVeille, Valeur de l’information stratégique Veille / IST / brevets / documentation Connaissances et opinions / le marché de l’influence, e-reputation and social management Stratégies et dispositifs d’observation des réseauxObserver l’Agora numérique (courant politiques et éthiques, controverses, opinionset croyances…) FOCUS : Opinions, diasporas, Controverses : un moteur web de recherche dédié à l’observation et à la cartographie des controverses sociétales est-il réalisable ?Franck GHITALLA / 2012 10
  11. 11. Exploration, ScienceData scientist, scientific applications, e-sciences, data and scientific networks FOCUS : les Socio-economic networks (Boards, companies, markets, products)Design, graphisme, esthétique FOCUS : Data-FlightsDéfense / Sécurité FOCUS : Thee March 11th Terrorist Network: In its weakness lies its strength (José A. Rodríguez)Franck GHITALLA / 2012 11
  12. 12. REFERENCESBIBLIOGRAPHIE (top 10)BARABASI A.-L., linked, the new science of network, Perseus Publishing, 2003.BORNER K., Atlas of Science: Visualizing What We Know, MIT Press, 2010.BUCHANAN M., Nexus, Small Worlds and the groundbreaking Theory of Networks 2003.CHAKRABARTI S., mining the web, 2002.DAVISON B.-D., « Unifying Text and Link Analysis », IBM, Palo-Alto, 2003.KLEINBERG J., LAWRENCE S., « The Structure Of The Web », Science, vol.294, 30, november,2001.KLEINBERG J., “Authoritative Sources in a Hyperlinked Environment“, Proceedings of the ACM-SIAMSymposium on Discret Algorithms, ACM Press,1998.NEWMAN M., The structure and dynamics of networks, Princeton University Press, 2003.STROGATZ S. Sync: the emerging science of spontaneous order, MIT-Press2004.WATTS D. Six Degrees. The Sciences of a Connected Age, Duncan Watts, Eds.W.W.Norton, New-York-London, 2004.Sites web sur les Network SciencesSanta Fe institute (http://www.santafe.edu/)CSCS (Center for the Study of Complex Systems) (http://cscs.umich.edu/)UCLA-HCS Human Complex Systems (http://hcs.ucla.edu/)New England Complex Systems Institute (http://necsi.edu/)Center for Computational Analysis of Social and Organizational Systems (CASOS)(http://www.casos.cs.cmu.edu/)CNets Center for Complex Networks and Systems Research (http://cnets.indiana.edu/)Argonne National Laboratory (http://www.anl.gov/)Center for Social Complexity (Georges Mason University) (http://socialcomplexity.gmu.edu/)Center for Social Dynamics and Complexity (Arizona State university) (http://csdc.asu.edu/)NICO (Northwestern Institute on Complex Systems) (http://www.northwestern.edu/nico/)Park Center for Complex Systems (M.I.T.) (http://web.mit.edu/pccs/)Sites web de référenceL’Atelier de Cartographie, http://ateliercartographie.wordpress.com/Linkfluence, http://fr.linkfluence.net/Le projet TicMigrations, http://ticmigrations.fr/GEPHI, http://gephi.org/Medialab Sciences-Po, http://www.medialab.sciences-po.fr/Les chercheursVictor-Laszlo Barabasi, Northeastern University, Center for Complex Network Research,http://www.barabasilab.com/Cyberinfrastructure for Network Science, http://cns.iu.edu/Duncan Watts, YAHOO ! Research, http://research.yahoo.com/Duncan_WattsJon Kleinberg, Department of Computer Science Cornell Universityhttp://www.cs.cornell.edu/home/kleinber/Marc E.-J. Newman, Department of Physics and Center for the Study of Complex Systems, Universityof Michiganhttp://www-personal.umich.edu/~mejn/Places and Spaces, Mapping Science, http://scimaps.org/Steven Strogatz, Cornell University, Theorical and Applied Mechanics, http://tam.cornell.edu/faculty-bio.cfm?NetID=shs7Franck GHITALLA / 2012 12

×