Your SlideShare is downloading. ×
Mund@Logiciel de veille en ligneRomain Cambier – romain.cambier@student.umons.ac.beMarc Honoré – marc.honore@student.umons...
Introduction Mundaneum ? Où ? Objectifs ? Services ?
Introduction Mundaneum ? Veille en ligne ? Idée ? But ? Mise en œuvre ?
Le problème Trouver la référence Comment ?
Le problème Trouver la référence L’indexer & l’extraire Récupérer du contenu Extraction d’infos
Le problème Trouver la référence L’indexer & l’extraire L’évaluer Pertinence ? Fiabilité ?
Le problème Trouver la référence L’indexer & l’extraire L’évaluer Pouvoir toujours y accéder Liens morts Modifications
Le problème Trouver la référence L’indexer & l’extraire L’évaluer Pouvoir toujours y accéder Un travail de titan !
Travail préliminaire Besoins ? Contraintes ? Choix technologiques ?
ChoixTechnologiques Architecture ? Client/Serveur Langages ? Robot Interface Base de données ?
Le projet Mund@ Module « Crawler »Mund@
Le projet Mund@ Module « Crawler » Module « Indexer »Mund@• Url:http://youtube.com• Titre:Youtube – BroadcastYourself• C...
Le projet Mund@ Module « Crawler » Module « Indexer » Module « Sorter »TripAdvisorWikipediaNewYorkTimesStanford Univers...
Le projet Mund@ Module « Crawler » Module « Indexer » Module « Sorter » Module « Storer »
Le projet Mund@ Module « Crawler » Module « Indexer » Module « Sorter » Module « Storer » PluginWEBMund@
Travail effectuéMund@, c’est… 5 modules développés 5000+ lignes de code 150+ heures de travail à deux 6 langages et 1 ...
Résultats Nouvelles entrées050100150200250300350400Sem. 1 Sem. 2 Sem. 3 Sem. 4 Sem. 5 Sem. 6Liens
Résultats Médias analysésSans liensSpamsNon-PertinentPertinent
Résultats Médias validésIntéressantsSpamsNon intéressants
Déploiements Cluster de test Mundaneum WSL UMons…. ?? ;-)
Perspectives Sources Formats Amélioration générale Meilleure extraction SécuritéObjet d’un futur PBA3IG ?
Conclusions Méthode de travail Datamining Expérience & CV Présentation le 25 avril
Questions ?
Upcoming SlideShare
Loading in...5
×

Présentation projet Mund@

203

Published on

Présentation d'un travail de 3ème Bachelier; un logiciel de veille en ligne complet à destination d'un musée/salle d'exposition

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
203
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
0
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide
  • BONJOURÉtudiant BA3IGPROJET ?
  • MUNDA = ?OU ?OBJECTIFS ARCHIVAGE VALORISATION DE COLLECTION -> visite/expos/…SERVICES AIDE RECHERCHE PRÊT PIECES VISITES GUIDEES
  • V-E-L ?IDEE SURVEILLER SYSTEMATIQUEMENT INFOS SUJETBUT CONNAITRE VISIBILITE TEMPS REEL WEB
  • 1ER BOULOT = TROUVER LIENSCOMMENT = GOOGLE + SCHOLAR + BING + TROLOLO
  • 2ème BOULOT = INDEXER & EXTRAIREINDEXER RECUPERE CONTENU (TEXTE ONLY)EXTRAIRE EXTRAIRE METAS (AUTEUR/LANGUE/PAYS/…)
  • 3ème BOULOT = EVALUATIONPERTI = EVALUER PERTINENCE DOC ?? BCP DE CRITERES !FIABILITE = EVALUER PERTINENCE AUTEUR/SITE/…
  • 4ème BOULOT = ACCES PERMANENTPROBLEME !!!LIENS CHANGEANTSMODIFS MEDIASSITE MORTS…
  • GROS BOULOTON NOUS DEMANDE D’Y REMEDIERREFLEXION AVANT TOUT !
  • BESOIN = REPONDRE AUX PROBLEMES PRECEDENTS COLLECTE ANALYSE TRIS STOCKAGE AUTOMATIQUE !!! MULTI-USERCONTRAINTES = PORTABILITE MULTI-OS MULTI-SITE (munda + VPN) SOFT LIBRE COMPAT INFRA EXISTANTE SIMULER COMPORTEMENT USER NAVIGATEUR!!!!!!!
  • MULTI-USER => CLIENT/SERVEURROBOT PORTABILITE => JAVA FAKE !!!!INTERFACE PORTABILITE + MULTI-OS => WEB (HTML + PHP) PERMET L’ACCES LOCAL OU DIST VIA VPNBDD MySQL (LIEN ROBOT-INTERFACE)
  • CONCLUSION METHODE TRAVAIL Gestion temps Travail équipe Standards développement (projet continué par d’autres) DATAMINING NOUVEAU NVLLES CONNAISSANCES EXPERIENCE EXPERIENCE « PRO » { VALORISANT { CV  => DVPT NVELLES COMPETENCES !!!!25 AVRIL STAND MUND@ !!
  • TROLOLOOOOOOO !
  • Transcript of "Présentation projet Mund@"

    1. 1. Mund@Logiciel de veille en ligneRomain Cambier – romain.cambier@student.umons.ac.beMarc Honoré – marc.honore@student.umons.ac.be
    2. 2. Introduction Mundaneum ? Où ? Objectifs ? Services ?
    3. 3. Introduction Mundaneum ? Veille en ligne ? Idée ? But ? Mise en œuvre ?
    4. 4. Le problème Trouver la référence Comment ?
    5. 5. Le problème Trouver la référence L’indexer & l’extraire Récupérer du contenu Extraction d’infos
    6. 6. Le problème Trouver la référence L’indexer & l’extraire L’évaluer Pertinence ? Fiabilité ?
    7. 7. Le problème Trouver la référence L’indexer & l’extraire L’évaluer Pouvoir toujours y accéder Liens morts Modifications
    8. 8. Le problème Trouver la référence L’indexer & l’extraire L’évaluer Pouvoir toujours y accéder Un travail de titan !
    9. 9. Travail préliminaire Besoins ? Contraintes ? Choix technologiques ?
    10. 10. ChoixTechnologiques Architecture ? Client/Serveur Langages ? Robot Interface Base de données ?
    11. 11. Le projet Mund@ Module « Crawler »Mund@
    12. 12. Le projet Mund@ Module « Crawler » Module « Indexer »Mund@• Url:http://youtube.com• Titre:Youtube – BroadcastYourself• Contenu:Bienvenue surYoutube!Youtube est uneplateforme….• Langue:Français…
    13. 13. Le projet Mund@ Module « Crawler » Module « Indexer » Module « Sorter »TripAdvisorWikipediaNewYorkTimesStanford UniversityLa nouvelle gazette1. Stanford University2. NewYorkTimes3. La nouvelle gazetteprovenancetextelangue
    14. 14. Le projet Mund@ Module « Crawler » Module « Indexer » Module « Sorter » Module « Storer »
    15. 15. Le projet Mund@ Module « Crawler » Module « Indexer » Module « Sorter » Module « Storer » PluginWEBMund@
    16. 16. Travail effectuéMund@, c’est… 5 modules développés 5000+ lignes de code 150+ heures de travail à deux 6 langages et 1 protocole utilisés 9 algorithmes de tri testés Une documentation utilisateur Une documentation du code
    17. 17. Résultats Nouvelles entrées050100150200250300350400Sem. 1 Sem. 2 Sem. 3 Sem. 4 Sem. 5 Sem. 6Liens
    18. 18. Résultats Médias analysésSans liensSpamsNon-PertinentPertinent
    19. 19. Résultats Médias validésIntéressantsSpamsNon intéressants
    20. 20. Déploiements Cluster de test Mundaneum WSL UMons…. ?? ;-)
    21. 21. Perspectives Sources Formats Amélioration générale Meilleure extraction SécuritéObjet d’un futur PBA3IG ?
    22. 22. Conclusions Méthode de travail Datamining Expérience & CV Présentation le 25 avril
    23. 23. Questions ?

    ×