Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Cas client CAIJ

488 views

Published on

Le CAIJ du Québec transforme l’accès à l’information juridique grâce au machine learning.
Créé en 2001, le CAIJ – Centre d’Accès à l’Information Juridique – a pour mission de faciliter l’accès à l’information juridique pour l’ensemble des membres du Barreau et de la magistrature du Québec. Pour ce faire, il opère un réseau de 40 bibliothèques, offre un service de recherche et de formation, et propose plus de 1,6 million de ressources via sa bibliothèque virtuelle www.caij. qc.ca. Il est la plus grande source d’information juridique au Québec.
Pour optimiser l’accès à l’information juridique, le CAIJ a besoin de classer finement chaque texte. Après avoir écarté l’hypothèse d’une approche manuelle qui aurait pris plusieurs années, et évalué sans succès des outils classiques de text-mining, le CAIJ a choisi la solution Antidot Content Classifier. En quelques semaines le projet était finalisé et les objectifs de qualité dépassés, pour un fonds documentaire de 1,7 millions de jurisprudences avec 10.000 nouveaux documents chaque mois.
Témoignage de Sonia Loubier, Directrice des technologies de l’information du CAIJ
"Antidot a su comprendre notre besoin et nous accompagner pas à pas dans la réalisation de notre projet. Leur parfaite compréhension de nos attentes leur a permis de nous aiguiller dans la mise en œuvre de notre solution qui se positionne désormais comme un maillon clé au sein de notre organisation."

Published in: Internet
  • Be the first to comment

  • Be the first to like this

Cas client CAIJ

  1. 1. Solutions de recherche et d’accès à l’information CAS CLIENT # 21 CAIJ.QC.CA Pour fournir à chacun l’information contextualisée qui l’intéresse, le CAIJ utilise une nomenclature de classement des domaines de droits qui compte 600 termes, dont 60 de premier niveau. Problème : les 1,7 millions de jurisprudences qui constituent le fonds documentaire ne sont pas étiquetées selon ce plan de classement. Et les 10 000 nouvelles qui arrivent chaque mois non plus… Le droit est un domaine d’experts. Pour optimiser l’accès à l’information juridique, le CAIJ a besoin de classer finement chaque texte. Après avoir écarté l’hypothèse d’une approche manuelle qui aurait pris plusieurs années, et évalué sans succès des outils classiques de text-mining, le CAIJ a choisi la solution Antidot Content Classifier. En quelques semaines le projet était finalisé et les objectifs de qualité dépassés. Professions juridiques : des besoins informationnels par domaine de droit 600 termes 1,7M docs 10 000 docs/mois !? Créé en 2001, le CAIJ (Centre d’Accès à l’Information Juridique) a pour mission de faciliter l’accès à l’information juridique pour l’ensemble des membres du Barreau et de la magistrature du Québec. Pour ce faire, il opère un réseau de 40 bibliothèques, offre un service de recherche et de formation, et donne accès à plus de 1,7 millions de ressources via sa bibliothèque virtuelle www.caij.qc.ca. Il est la plus grande source d’accès à l’information juridique au Québec. Transformer l’accès à l’information juridique A l’instar de la médecine, le métier juridique est fortement spécialisé. Les professions juridiques travaillent dans un domaine particulier de droit : un avocat en droit des entreprises ne plaide pas une affaire en droit de la famille. Par conséquent ils ne consultent pas la même documentation : les codes de loi, les jurisprudences auxquels ils se réfèrent et les sujets de droits sur lesquels ils veillent doivent être adaptés à leur domaine d’exercice. Entreprendre un chantier de catégorisation manuelle prendrait plus de 200 années hommes. Heureusement, des solutions automatiques existent.
  2. 2. Le CAIJ avait essayé des outils de classification automatique de documents traditionnels à base d’analyse linguistique. Trois écueils majeurs se sont présentés : la complexité du paramétrage du système nécessite des connaissances poussées en traitement du langage, la qualité plafonne vite à un niveau inacceptable pour les utilisateurs exigeants que sont les juristes, le coût de maintenance dans le temps est trop élevé car il faut continuellement ajouter de nouvelles règles. Le CAIJ a alors cherché une approche plus efficace et a opté pour la solution Antidot Content Classifier qui se base sur les approches modernes de machine learning. La classification par Machine Learning à la rescousse Solutions de recherche et d’accès à l’information www.antidot.net ‘‘ « Antidot a su comprendre notre besoin et nous accompagner pas à pas dans la réalisation de notre projet. Leur parfaite compréhension de nos attentes leur a permis de nous aiguiller dans la mise en œuvre de notre solution qui se positionne désormais comme un maillon clé au sein de notre organisation. Désormais, accéder rapidement en ligne aux jurisprudences est une simple formalité. A ce point s’ajoutent les bénéfices liés à l’enrichissement rapide et continu de notre fonds documentaire rendu possible grâce aux puissantes fonctionnalités de la plateforme. Nous sommes donc en mesure de proposer une information exhaustive et de répondre parfaitement à notre mission » - Sonia Loubier, Directrice des technologies de l’information du CAIJ - La première étape du projet consiste à rassembler un corpus d’entraînement (quelques documents étiquetés manuellement) pour ensuite apprendre à la machine à faire de même. La solution Antidot Content Classifier se distingue des autres solutions du marché par la qualité de ses algorithmes et par son atelier d’entraînement. Cette interface guide les utilisateurs métiers dans la constitution de la meilleure base d’entraînement possible. Le système fournit aussi des rapports de qualité pour mesurer continuellement l’impact des modifications apportées. Grâce à Antidot Content Classifier le CAIJ a obtenu très rapidement des résultats de grande qualité en impliquant uniquement des intervenants métiers dans le projet. De plus, le maintien de la qualité d’étiquetage du corpus nécessite très peu de maintenance. Un projet bien cadré Grâce à sa stratégie d’Active Learning, Antidot Content Classifier minimise l’investissement humain tout en maximisant la qualité de l’apprentissage.

×