3. Bla Bla Bla
Les conversations représentent la
majorité du trafic
3
4. Analyser le langage naturel est une
obligation!
•U don't got da jack but remember we got da
screenin 2mro at 8
•C vré ke C pa + facil ! G mi 2x + 2 tan a lir C 2
post en langaj SMS ke 2 posts ékri normleman
• Hexo x ti y xa ti, tú pones las reglas
• Sda7med ya 5ouya Ma chba3tech biiik allah
ghaleb...nchallah kol 3aam wenti 7ay b5iiir
4
5. fonctionnement
analyse en temps réel des
communications digitales pour fournir de
l’information décisionnelle aux éditeurs de logiciels,
agences marketing éditeurs de services…
Réseaux sociaux Forums, blogs E-mails Instant Messaging
Notre Text Meaning Technology est capable d’analyser en temps réel
un flux de communications textes, de détecter les
éléments vous intéressant et d’alerter bo
la personne ou de déclencher l’action appropriée –
tout cela automatiquement
6. A propos http://scanandtarget.com/ - contact@scanandtarget.com
Solution française. 10 personnes.
créée en 2008 par:
Bastien Hillen, CEO, ex DG Digiplug
David Tilloy, CTO, ex Neocom Multimedia
Ian Sprunck, COO, ex Neocom Multimedia et Telestore
(chez.com, ibazar…)
fonds levés depuis la création: 2,5M€ auprès
d’investisseurs comme:
Crédit Agricole Private Equity
Truffle Capital
8. La technologie
Contrairement aux solutions à base de sémantique ou de mots-clés,
notre technologie peut traiter les différentes variantes et
altérations des expressions pour analyser le contenu comme :
Utilisation lettres majuscules / minuscules ;
Répétition de lettres (vvviiiagrrra par exemple) ;
Variantes orthographiques (vi@gra, vlagra, v1@gra, v149r4) ;
Elision de lettres dans certains cas (v|agra, v agra…)
Utilisation de symboles non alpha numériques (v.i.a.g.r.a, v_i°ag#r:a, v-
iagra, viagr"a...) ;
Altérations phonétiques ;
Inversion, omission (hilter, v_agra, etc.) ;
Formes plurielles et conjuguées ;
Langages SMS et chat (« a 2m1 », etc.) ;
Arabizi / translitération.
Ainsi que la combinaison de chacun de ces formes
9. La technologie
contact@scanandtarget.com
ttp://scanandtarget.com/ -
La solution est basée sur un moteur intelligent qui note non seulement
les mots pris individuellement mais également le contenu dans son
intégralité. Les termes sont ainsi remis dans leur contexte afin
d’extraire le sens du contenu
La solution utilise des thesauri thématiques : les Smart Wordbooks.
L’analyse se fait au niveau des concepts et non seulement sur des mots-clés
Grâce à un système puissant et précis d’analyse conditionnelle nos
clients bénéficient d’un très faible niveau de faux positifs
10. Concurrence
•Solutions à base de mots
clés
– problème de précision
(V1@gr@)
–Bcp de faux positifs
•Solutions sémantiques:
– Pas adaptées aux
conversations + forte
volumétrie + temps réel
–Implémentation longue
et complexe
11. Big Data? Pas de problème.
•La solution est disponible en SaaS ou sous forme
d’appliance à héberger chez vous (matériel IBM)
•Capacité à traiter en temps réel de très fortes
volumétries
–L’intégralité du trafic de Twitter (10 TB / jour, moyenne de 2000
Tweets par seconde)* peut être analysé en temps réel avec un IBM
blade center
–*Source - Twitter
13. Que pouvons-nous identifier pour vous?
Intention d’achat
D’accord / Pas
plaintes d’accord
Perception de la
questions
marque
Centre
d’intérêt J’aime / Déjà client?
J’aime pas
14. Nos APIs
•Nos APIs peuvent être implémentées sur n’importe
quelle plate-forme en utilisant le connector
–Disponible en PHP5.2+, Java1.4+, C#.NET 2.0+, Ruby…
•Simple à implémenter
–Entre quelques heures à 2 jours en moyenne
•Possibilité de récupérer le contenu sur les réseaux sociaux
•Nos APIs sont aujourd’hui disponibles en Anglais et en
Français
–Bientôt en Espagnol, Portugais, Arabe…
15. Use case: Moderation API
LB Poker chat rooms monitoring
700000
600000
500000
400000 Alerts for human
300000 Refused
200000 Approved
100000
0
Sep-10 Oct-10 Nov-10 Dec-10 Jan-11 Feb-11
Le contenu non conforme est passé de 15% à < 3%
–Détournement de trafic
–Insultes, vulgarité
–Triche
Modération full automatique
16. Use case: analyse avis
consommateurs
•Customer: Pixmania
•Challenge: analyser en 5 langues les avis
consommateurs à des fins de:
–Modération automatique (environ 80%), 20% avis
litigieux revus par agents
–Identification des problématiques clients dans les avis
(produit incomplet problème de livraison…) et alerte
du service concerné
•Résultats: diminution des coûts de modération,
avis publiés plus rapidement, amélioration
relation client
17. Use case: Fan Page monitoring
Modération: jusqu’ 7K
posts / comments par jour
CRM: détection des
questions / pb liés à la
vente de tickets
18. Use case: social profiling
•Customer: client US pour le compte de Motorola
•Challenge:
–65K messages de différentes sources (blogs, Facebook, Twitter),
fort besoin de NLP (exemple utilisation de Motorola Zoom au
lieu de Motorola Xoom)
–Identification des clients existants (avec le produit associé),
intntions d’cht (vc l produit ssocié) qustions
répondre
•Résultats:
–98% élimination du bruit
–Environ 500 positive hits avec précision > 95%