More Related Content Similar to AFS@Publishing : Mieux valoriser les fonds éditoriaux avec un moteur de recherche grâce aux standards du web sémantique (20) AFS@Publishing : Mieux valoriser les fonds éditoriaux avec un moteur de recherche grâce aux standards du web sémantique1. AFS@Publishing
MIEUX VALORISER LES FONDS ÉDITORIAUX
AVEC UN MOTEUR DE RECHERCHE
GRÂCE AUX STANDARDS DU WEB SÉMANTIQUE
1
© Antidot™
2. AGENDA
Antidot
Vos enjeux
Notre réponse : AFS@Publishing
Témoignage
Marc Pautrat - responsable gestion du contenu
2
© Antidot™
4. Société ANTIDOT
Editeur de logiciels
depuis 1999 | Paris, Lyon, Aix-en-Provence
Solutions de recherche et d’accès à l’information
en Cloud ou en licence
Média | Portails | Entreprises | E-Commerce
4
© Antidot™
5. Société ANTIDOT
Croissance et rentabilité
soutenues, une garantie de pérennité
pour nos clients
Offre commerciale ouverte,
4000
dans le Cloud depuis 1999 3500
SaaS : pas d’investissement et 3000
2500
souplesse
2000
Licence sur site ou hébergée 1500
1000
500
0
50% du CA 2006
2007
2008
© Antidot™
investi en R&D 2009
2010
2011 5
6. Parmi nos clients
Entreprises E-commerce Presse et Media
Institutions
Santé
6
© Antidot™
8. Développer et fidéliser
Passage au numérique
Ubiquité des réseaux et terminaux connectés
Fragmentation de l’audience
8
© Antidot™
9. Développer et fidéliser
Accroître le trafic sur les services en ligne, quel que soit
le canal d’accès
le business model
Rendre accessible plus de contenus à partir des fonds
documentaires et éditoriaux existants, et à faible coût
Fidéliser l’audience par des services à valeur ajoutée
9
© Antidot™
12. Antidot Finder Suite
Un produit logiciel
pour
mieux trouver l’info
via le moteur de
recherche sémantique
12
© Antidot™
14. AFS@Publishing
Une solution logicielle
globale pour
enrichir et valoriser
les fonds éditoriaux
mieux trouver l’info
via le moteur de
recherche sémantique
la partager et
capitaliser avec des
outils collaboratifs
14
© Antidot™
16. Le Groupe Moniteur
• Depuis 1903 : information et services à
destination des professionnels de la
construction et des collectivités locales
Presse :
➡ ~20 titres dont 2 hebdos : Le Moniteur du BTP, La
Gazette des Communes
Edition et services
➡ livres + classeurs à mises à jour
➡ Salons, formation
Services numériques (~30 sites web) :
➡ Sites d’informations, liés ou non à des publications
papier
➡ Sites de services : offres d’emploi, appels
d’offres, catalogues produits,…
16
© Antidot™
17. Objectif : Capitaliser sur les contenus
• Le Groupe Moniteur brasse énormément de contenus
• La valorisation de ces contenus est unaxe d’évolution
important
“The future belongs to the companies and people
thatturn data intoproducts” (O’Reilly Radar)
17
© Antidot™
18. Les axes de valorisation des contenus
• structurer les données,
• les identifier de manière unique
réutiliser • les décorreler des usages
• présenter une vue unifiées de données
provenant de différents silos de contenus
mailler • définir les axes et les référentiels de maillages
• mettre les contenus en perspective dans
contexte métier pertinent
contextualiser
18
© Antidot™
19. Les difficultés à résoudre
les données il faut en
les données
sont il faut les donner une
sont
cloisonnées décloisonner vue
hétérogènes
en silo homogène
les il faut les
référentiels il faut les certaines extraire, grâce à
informations des technologies
sont épars recenser, les sont cachées au de Text Mining
et compléter sein des ou en utilisant le
incomplets contenus format données
sources.
19
© Antidot™
20. L’écosystème autour des contenus
éditoriaux
Une approche en trois temps :
TextMi
nng
xml www
Recherche
Publication
xml
www
Repository
xml
www
Production des Stockage/ enrichissement Diffusion
contenus
20
© Antidot™
21. La brique de recherche Antidot
7 sites web
(bientôt 10)
service de
2 000 000 recherche
9 sources de
requêtes unique pour données
/mois
nos sites
web
plus d’1
million de
documents
21
© Antidot™
22. La brique de recherche Antidot
• Des fonctionnalités pour améliorer l’efficacité de recherche :
Recherche par facette,
Suggestion orthographique,
Auto-complétion,
Dictionnaire de synonymes
• Permet de présenter une vue homogène des données
provenant de différents silos
Ex. Articles, livres, Textes Officiels,…
• Mise en avant les enrichissements sémantiques
Ex. Géolocalisation, catégorisation,…
• Commercialisation de mots clés sponsorisés
© Antidot™
22
25. Prochaine étape : systématiser le maillage de
nos données
• Maillage = créer une vue transversale sur nos silos de
données
Au-delà des contenus éditoriaux
Selon des axes pertinents
25
© Antidot™
26. Mailler les données plus en profondeur
• 3 niveaux de maillage
sur des termespartagés
➡ Ex. article de presse/nom de produit cité
mise en correspondance des plans de classements
➡ Ex. Article classé dans la catégorie "Produit et matériaux/béton" et un
produit classé dans la nomenclature correspondante
par des relations typées entre les contenus
➡ Ex. un produit "est fabriqué" par un fabricant, ce fabricant "est
distribué" par un distributeur, ce distributeur "dispose d'un point de
vente" à telle adresse, on peut donc mailler le produit et la
géolocalisation
Intérêt des standards web sémantique pour ce maillage
26
© Antidot™
27. La trajectoire à suivre
Diffuser cette
information métier
Créer les vues métiers
pertinentes
•Extraire vues de la base
de maillage
Extraire et stocker les
connaissances
•Centraliser informations
pour le maillage
Enrichir les contenus
•Ajout des méta-
données
nécessaires au
maillage
Recenser les
données/les
référentiels
•Ce qui a de la
valeur pour nos
clients
•Compléter/consol
ider
27
© Antidot™
28. L’architecture cible
xml Extraction
xml connais- www
sances
Vue
métier
RDF
Base www
Création Vue
vues métier
Base Base métier
de maillage Req. SPARQL
sources
(RDF Store)
www
Vue
métier
utilisation d’AIF pour alimenter un RDF store à partir des bases
sources,
puis calcul des bases d’index spécialisés pour la recherche avec
AFS
28
© Antidot™
29. Échangez avec nous :
Stand 23 - info@antidot.net - www.antidot.net
MERCI DE VOTRE ATTENTION
29
© Antidot™