SlideShare a Scribd company logo
1 of 12
Download to read offline
OUTILS LINGUISTIQUES POUR LE DÉVELOPPEMENT DES APPLICATIONS AUTOMATIQUES DE L’ARABE 
Prof. Dr. Mohamed El Hannach 
Université Sidi Mohamed Ben Abdellah, FES & 
Arabic Language Engineering Society in Morocco
POSTULAT & HYPOTHÈSE 
La majorité des applications informatiques développées pour l’arabe connaissent un échec à différents degrés, en particulier le traitement incorrecte des données linguistiques, et ce, est dû à notre avis, à l’insuffisance des descriptions informelle des données linguistiques de cette langue, sur lesquelles sont basés les développeurs. 
A notre avis, il est impératif d’entamer une ré-description formelle de différents parties de discours de l’arabe, tenant en compte le et le système algorithmique de l’arabe et le développement que connait les techniques informatiques destinés au traitement automatique des langues naturelles, en particulier l’arabe qui se veut une langue fusionniste, par opposition au reste des langues fondées sur le système ensembliste.
CADRE THÉORIQUE & MÉTHODOLOGIQUE 
Pourquoi une ré-description de l’arabe ? 
Description structurale et autres (l’histoire irrationnel) 
Grammaire combinatoire, empirisme et métalangage rationnel: 
La phrase est l’unité minimale du sens: Sens=: V N0 W 
Le mot isolé n’a pas d’autonomie linguistique 
Le verbe est une phrase simple 
Les verbes se divisent en trois catégories: 
Verbe ordinaire 
Verbe support 
Verbe figé 
Chaque forme linguistique (mot ou phrase) est associée à un schéma formel qui détermine son appartenance au système linguistique de l’arabe. 
Les phrases de la langue sont finies et relativement acceptables 
Les règles formelles sont relatives
BASE DE DONNÉES : MORPHOLOGIE 
Le cadre morphologique générale de l’arabe: 
Morphologie: Racine + Schème (ajouts)= Mot 
Trois bases de données en découlent: 
1, Racines, 2, Schèmes, 3, algorithmes morphologico - phonologique 
Chaque mot est le résultat de la fusion / combinaison d’une racine est d’un schème en plus des ajouts=: سألتمونيها 
Le schème assure la distribution des voyelles sur les consonnes des la racine 
Les voyelles se divises en trois catégories à nature phonologique: 
Inchoative =: lexicale 
Médiane =: morphologique 
Last =: flexionnelle 
Noms: simple, fléchi et complétives 
Verbes (simple et fléchi): trois catégories 
V-a déverbaux (simples et fléchis): 10 catégories 
V-n (simples et fléchis): 5 catégories
LES FORMES LINGUISTIQUES 
Les structures sont basées sur cinq cadres formels dont le schéma de base est: V N0 W conçue sous forme de sujets et prédicats: 
1.V N0 
2.V N0 N1 
3.V N0 Prép N1 
4.V N0 N1 Prép N2 
5.V N0 Prép N1 Prép N2 
Remarques: 
- Pas de verbe sans sujet à cause de l’absence de la catégorie infinitif en arabe 
- Le N peut être simple ou flexionnel 
- Le N = Nj occupe une place déterminé dans la structure 
- Chaque verbe sélectionne sa séquence nominale
LES BASES DE DONNÉES: SYNTAXE 
A partir de la forme de base (ci-dessus): V N0 W 
P=: V (x, y, … ) 
Nous avons 19 classes syntaxiques, divisées selon des critères distributionnelles relevant du verbe ordinaire voire principale. 
Les contraintes distributionnelles sont à la base de la classification transformationnelle 
Chacune des classes syntaxiques possède ses propriétés transformationnelles. 
Il y a cinq propriétés transformationnelles couvrant la totalité des verbes: 
Restructuration, passif, nominalisation, adjectivation, et la propriété ‘non restreint’ =: V Nnr W, ou V N0 N1nr 
N2 directe, comme se veut la tradition, n’existe pas en arabe
COLLECTION DES DONNÉES SYNTAXIQUES 
5 structures de base: V N0 W (W=: 0, 1, 2) 
L’adoption du principe de transf. non orientée nous donne trois types de structures : 
Phrase ordinaire: 
V N0 W < => 5 formes transformées 
كسر أحمد )عنق الزجاجة( > -- < كسر أحمد الزجاجة 1 من عنقها 2 R=: 
Phrase a verbe support: 
Exemple: V N0 W < => 3 formes nominalisées 
أقلق هذا الأمر عليا > -- < أثار هذا الأمر القلق في علي Nom A=: 
Phrase figés: 
Exemple: V N0 W < => nombre indéfini de formes 
Fig=: لقي أحمد حتفه
SAMPLE SYNTACTIC DATABASE 
Verb 
No 
Nominalization =: Vsup N0 nr V-n Prep N1 +hum 
No=: +Concret 
No=: Nnr 
Completive 
Sabbaba V-n Li N1 
Sabbaba No Det V-n Li N1 
'athara No V-n Fi N1 
'athara No Det V-n Fi N1 
'athara N1 (V-n N1) 
Xalaqa No Det V-n Li N1 
Xalaqa No V-n Li N1 
'adxala No Det V-n 'ala N1 
'adxala No V-n 'ala N1 
'ahdatha No Det V-n Li N1 
'ahdatha No V-n Li N1 
Harraka No Det V-n Fi N1 
Harraka No V-n Fi N1 
Ba'atha No Det V-n Fi N1 
'a'ta No Det V-n Li N1 
'adhfa No V-n 'ala N1 
Jalaba No Det V-n Li N1 
No=: 'an P 
No=: 'anna P 
No=: Kawn P 
No=: V-n W 
Sabbaba No (V-n N1)1 
أطرب 
+ 
+ 
+ 
+ 
- 
+ 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
+ 
- 
- 
+ 
- 
+ 
أطفأ 
- 
+ 
+ 
+ 
+ 
+ 
+ 
- 
+ 
- 
- 
- 
- 
- 
- 
- 
- 
+ 
- 
- 
- 
- 
- 
- 
أظلم 
- 
+ 
+ 
+ 
+ 
+ 
- 
- 
- 
- 
- 
- 
+ 
+ 
- 
- 
- 
+ 
+ 
+ 
+ 
+ 
- 
+ 
أكل 
- 
+ 
+ 
+ 
- 
+ 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
+ 
- 
- 
- 
- 
- 
أكمل 
- 
+ 
+ 
+ 
+ 
+ 
+ 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
+ 
- 
- 
- 
+ 
- 
+ 
ألجم 
+ 
+ 
+ 
+ 
+ 
+ 
+ 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
+ 
- 
- 
- 
+ 
- 
- 
ألزم 
+ 
+ 
+ 
+ 
+ 
+ 
+ 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
+ 
- 
+ 
- 
- 
ألم 
+ 
+ 
+ 
+ 
+ 
+ 
+ 
- 
+ 
+ 
+ 
+ 
+ 
+ 
+ 
+ 
- 
+ 
+ 
+ 
+ 
+ 
- 
+ 
ألهب 
+ 
+ 
+ 
+ 
+ 
+ 
+ 
+ 
+ 
- 
+ 
- 
+ 
+ 
+ 
- 
- 
+ 
+ 
+ 
+ 
- 
- 
+ 
ألهم 
- 
+ 
+ 
+ 
- 
+ 
- 
- 
- 
+ 
- 
- 
- 
- 
- 
- 
+ 
- 
+ 
- 
+ 
- 
- 
- 
أمات 
- 
+ 
+ 
+ 
- 
+ 
+ 
- 
+ 
- 
- 
- 
- 
- 
- 
- 
- 
- 
+ 
- 
- 
+ 
- 
+ 
أنحل 
- 
+ 
+ 
+ 
- 
+ 
+ 
- 
+ 
- 
- 
- 
- 
- 
+ 
+ 
+ 
+ 
- 
- 
- 
+ 
- 
+ 
أنذر 
+ 
+ 
+ 
+ 
- 
+ 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
+ 
- 
- 
أنعش 
+ 
+ 
+ 
+ 
+ 
+ 
- 
- 
- 
- 
- 
- 
- 
- 
- 
+ 
- 
+ 
+ 
+ 
+ 
+ 
- 
+ 
أنقد 
+ 
+ 
+ 
+ 
- 
+ 
+ 
- 
+ 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
أنشي 
- 
+ 
+ 
+ 
+ 
+ 
+ 
+ 
- 
+ 
- 
+ 
+ 
+ 
+ 
- 
- 
+ 
- 
+ 
+ 
+ 
- 
+ 
أنهك 
+ 
+ 
+ 
+ 
+ 
+ 
+ 
- 
+ 
- 
- 
- 
- 
- 
- 
- 
+ 
+ 
- 
- 
- 
- 
+ 
- 
أنهض 
+ 
+ 
+ 
+ 
- 
+ 
+ 
- 
+ 
+ 
- 
- 
- 
- 
- 
- 
- 
- 
+ 
- 
+ 
- 
- 
- 
أصاب 
+ 
+ 
+ 
+ 
- 
+ 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
+ 
- 
- 
- 
- 
- 
- 
أصحى 
+ 
+ 
+ 
+ 
+ 
+ 
+ 
- 
+ 
+ 
- 
+ 
+ 
- 
- 
- 
+ 
+ 
+ 
- 
+ 
- 
- 
+ 
أصلح 
- 
+ 
+ 
+ 
- 
+ 
- 
- 
- 
- 
- 
- 
- 
- 
+ 
+ 
- 
+ 
+ 
- 
+ 
+ 
- 
- 
أضاء 
- 
+ 
+ 
+ 
+ 
+ 
- 
- 
- 
+ 
- 
- 
+ 
+ 
+ 
+ 
- 
- 
+ 
- 
+ 
+ 
+ 
+ 
أضجر 
+ 
+ 
+ 
+ 
+ 
+ 
+ 
+ 
+ 
- 
- 
- 
+ 
- 
+ 
+ 
+ 
+ 
+ 
+ 
+ 
+ 
+ 
+ 
أضحك 
+ 
+ 
+ 
+ 
+ 
+ 
- 
- 
- 
+ 
- 
+ 
- 
- 
- 
- 
- 
- 
+ 
- 
+ 
- 
- 
+ 
أضرم 
- 
+ 
+ 
+ 
+ 
+ 
- 
- 
- 
+ 
+ 
+ 
- 
- 
+ 
- 
- 
+ 
+ 
- 
+ 
- 
+ 
+ 
أضني 
+ 
+ 
+ 
+ 
+ 
+ 
+ 
- 
+ 
+ 
- 
- 
+ 
+ 
- 
- 
+ 
+ 
+ 
- 
+ 
+ 
+ 
+ 
أضعف 
- 
+ 
+ 
+ 
+ 
+ 
- 
- 
- 
- 
- 
- 
+ 
- 
+ 
+ 
- 
+ 
+ 
- 
+ 
+ 
+ 
+ 
أعاق 
+ 
+ 
+ 
+ 
+ 
+ 
- 
- 
- 
- 
- 
- 
+ 
+ 
- 
- 
- 
+ 
- 
- 
- 
- 
- 
- 
أعجب 
+ 
+ 
+ 
+ 
+ 
+ 
- 
- 
- 
+ 
+ 
+ 
+ 
+ 
+ 
+ 
- 
- 
+ 
- 
+ 
- 
+ 
- 
أعدي 
+ 
+ 
+ 
+ 
+ 
+ 
+ 
- 
- 
+ 
- 
- 
+ 
- 
- 
- 
- 
- 
+ 
- 
+ 
- 
- 
+ 
أعلي 
+ 
+ 
+ 
+ 
- 
+ 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
+ 
- 
+ 
+ 
- 
- 
أعمي 
- 
+ 
+ 
+ 
+ 
+ 
+ 
- 
+ 
- 
- 
- 
+ 
- 
- 
- 
- 
+ 
- 
- 
+ 
+ 
- 
-
BASE DE DONNÉES: STRUCTURES FIGÉS 
30,000 expressions idiomatiques 
Combinaison fixe entre les éléments de la structure syntaxique: 
Structure opaque 
Syntaxe locale 
Sous forme de graphes 
Réduction morphologique 
Réduction transformationnelle 
Sens métaphorique
DICTIONNAIRES ÉLECTRONIQUES 
Recueil électronique des données linguistique: 
Les noms non dérivés 
Les verbes 
Les Adverbes 
Noms déverbaux 
Les sons (Kacst) 
Lexicon grammar
APPLICATIONS 
Ontologie 
Contenu digital 
Traduction automatique 
Web Sémantique, OWL 
OCR 
Résumé automatique 
Enseignement =: teaching et évaluation 
Indexation 
Analyseurs automatiques 
Moteur de recherche sur le net
CONCLUSION 
Nous insistons sur le fait de prendre en considération les travaux linguistiques basés sur un cadre théorique formel. 
Nos bases de données linguistiques sont à la disposition des chercheurs désirant collaborer avec notre société en vue de développement des applications sur l’arabe 
Nos remercions l’équipe de chercheurs ayant travaillé sur les bases de données pendand des années.

More Related Content

Featured

Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTExpeed Software
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsPixeldarts
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthThinkNow
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfmarketingartwork
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Applitools
 

Featured (20)

Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
 

Mohammed el hannach keynote anlp ieee cist 2014

  • 1. OUTILS LINGUISTIQUES POUR LE DÉVELOPPEMENT DES APPLICATIONS AUTOMATIQUES DE L’ARABE Prof. Dr. Mohamed El Hannach Université Sidi Mohamed Ben Abdellah, FES & Arabic Language Engineering Society in Morocco
  • 2. POSTULAT & HYPOTHÈSE La majorité des applications informatiques développées pour l’arabe connaissent un échec à différents degrés, en particulier le traitement incorrecte des données linguistiques, et ce, est dû à notre avis, à l’insuffisance des descriptions informelle des données linguistiques de cette langue, sur lesquelles sont basés les développeurs. A notre avis, il est impératif d’entamer une ré-description formelle de différents parties de discours de l’arabe, tenant en compte le et le système algorithmique de l’arabe et le développement que connait les techniques informatiques destinés au traitement automatique des langues naturelles, en particulier l’arabe qui se veut une langue fusionniste, par opposition au reste des langues fondées sur le système ensembliste.
  • 3. CADRE THÉORIQUE & MÉTHODOLOGIQUE Pourquoi une ré-description de l’arabe ? Description structurale et autres (l’histoire irrationnel) Grammaire combinatoire, empirisme et métalangage rationnel: La phrase est l’unité minimale du sens: Sens=: V N0 W Le mot isolé n’a pas d’autonomie linguistique Le verbe est une phrase simple Les verbes se divisent en trois catégories: Verbe ordinaire Verbe support Verbe figé Chaque forme linguistique (mot ou phrase) est associée à un schéma formel qui détermine son appartenance au système linguistique de l’arabe. Les phrases de la langue sont finies et relativement acceptables Les règles formelles sont relatives
  • 4. BASE DE DONNÉES : MORPHOLOGIE Le cadre morphologique générale de l’arabe: Morphologie: Racine + Schème (ajouts)= Mot Trois bases de données en découlent: 1, Racines, 2, Schèmes, 3, algorithmes morphologico - phonologique Chaque mot est le résultat de la fusion / combinaison d’une racine est d’un schème en plus des ajouts=: سألتمونيها Le schème assure la distribution des voyelles sur les consonnes des la racine Les voyelles se divises en trois catégories à nature phonologique: Inchoative =: lexicale Médiane =: morphologique Last =: flexionnelle Noms: simple, fléchi et complétives Verbes (simple et fléchi): trois catégories V-a déverbaux (simples et fléchis): 10 catégories V-n (simples et fléchis): 5 catégories
  • 5. LES FORMES LINGUISTIQUES Les structures sont basées sur cinq cadres formels dont le schéma de base est: V N0 W conçue sous forme de sujets et prédicats: 1.V N0 2.V N0 N1 3.V N0 Prép N1 4.V N0 N1 Prép N2 5.V N0 Prép N1 Prép N2 Remarques: - Pas de verbe sans sujet à cause de l’absence de la catégorie infinitif en arabe - Le N peut être simple ou flexionnel - Le N = Nj occupe une place déterminé dans la structure - Chaque verbe sélectionne sa séquence nominale
  • 6. LES BASES DE DONNÉES: SYNTAXE A partir de la forme de base (ci-dessus): V N0 W P=: V (x, y, … ) Nous avons 19 classes syntaxiques, divisées selon des critères distributionnelles relevant du verbe ordinaire voire principale. Les contraintes distributionnelles sont à la base de la classification transformationnelle Chacune des classes syntaxiques possède ses propriétés transformationnelles. Il y a cinq propriétés transformationnelles couvrant la totalité des verbes: Restructuration, passif, nominalisation, adjectivation, et la propriété ‘non restreint’ =: V Nnr W, ou V N0 N1nr N2 directe, comme se veut la tradition, n’existe pas en arabe
  • 7. COLLECTION DES DONNÉES SYNTAXIQUES 5 structures de base: V N0 W (W=: 0, 1, 2) L’adoption du principe de transf. non orientée nous donne trois types de structures : Phrase ordinaire: V N0 W < => 5 formes transformées كسر أحمد )عنق الزجاجة( > -- < كسر أحمد الزجاجة 1 من عنقها 2 R=: Phrase a verbe support: Exemple: V N0 W < => 3 formes nominalisées أقلق هذا الأمر عليا > -- < أثار هذا الأمر القلق في علي Nom A=: Phrase figés: Exemple: V N0 W < => nombre indéfini de formes Fig=: لقي أحمد حتفه
  • 8. SAMPLE SYNTACTIC DATABASE Verb No Nominalization =: Vsup N0 nr V-n Prep N1 +hum No=: +Concret No=: Nnr Completive Sabbaba V-n Li N1 Sabbaba No Det V-n Li N1 'athara No V-n Fi N1 'athara No Det V-n Fi N1 'athara N1 (V-n N1) Xalaqa No Det V-n Li N1 Xalaqa No V-n Li N1 'adxala No Det V-n 'ala N1 'adxala No V-n 'ala N1 'ahdatha No Det V-n Li N1 'ahdatha No V-n Li N1 Harraka No Det V-n Fi N1 Harraka No V-n Fi N1 Ba'atha No Det V-n Fi N1 'a'ta No Det V-n Li N1 'adhfa No V-n 'ala N1 Jalaba No Det V-n Li N1 No=: 'an P No=: 'anna P No=: Kawn P No=: V-n W Sabbaba No (V-n N1)1 أطرب + + + + - + - - - - - - - - - - - - + - - + - + أطفأ - + + + + + + - + - - - - - - - - + - - - - - - أظلم - + + + + + - - - - - - + + - - - + + + + + - + أكل - + + + - + - - - - - - - - - - - - + - - - - - أكمل - + + + + + + - - - - - - - - - - + - - - + - + ألجم + + + + + + + - - - - - - - - - - + - - - + - - ألزم + + + + + + + - - - - - - - - - - - - + - + - - ألم + + + + + + + - + + + + + + + + - + + + + + - + ألهب + + + + + + + + + - + - + + + - - + + + + - - + ألهم - + + + - + - - - + - - - - - - + - + - + - - - أمات - + + + - + + - + - - - - - - - - - + - - + - + أنحل - + + + - + + - + - - - - - + + + + - - - + - + أنذر + + + + - + - - - - - - - - - - - - - - - + - - أنعش + + + + + + - - - - - - - - - + - + + + + + - + أنقد + + + + - + + - + - - - - - - - - - - - - - - - أنشي - + + + + + + + - + - + + + + - - + - + + + - + أنهك + + + + + + + - + - - - - - - - + + - - - - + - أنهض + + + + - + + - + + - - - - - - - - + - + - - - أصاب + + + + - + - - - - - - - - - - - + - - - - - - أصحى + + + + + + + - + + - + + - - - + + + - + - - + أصلح - + + + - + - - - - - - - - + + - + + - + + - - أضاء - + + + + + - - - + - - + + + + - - + - + + + + أضجر + + + + + + + + + - - - + - + + + + + + + + + + أضحك + + + + + + - - - + - + - - - - - - + - + - - + أضرم - + + + + + - - - + + + - - + - - + + - + - + + أضني + + + + + + + - + + - - + + - - + + + - + + + + أضعف - + + + + + - - - - - - + - + + - + + - + + + + أعاق + + + + + + - - - - - - + + - - - + - - - - - - أعجب + + + + + + - - - + + + + + + + - - + - + - + - أعدي + + + + + + + - - + - - + - - - - - + - + - - + أعلي + + + + - + - - - - - - - - - - - - + - + + - - أعمي - + + + + + + - + - - - + - - - - + - - + + - -
  • 9. BASE DE DONNÉES: STRUCTURES FIGÉS 30,000 expressions idiomatiques Combinaison fixe entre les éléments de la structure syntaxique: Structure opaque Syntaxe locale Sous forme de graphes Réduction morphologique Réduction transformationnelle Sens métaphorique
  • 10. DICTIONNAIRES ÉLECTRONIQUES Recueil électronique des données linguistique: Les noms non dérivés Les verbes Les Adverbes Noms déverbaux Les sons (Kacst) Lexicon grammar
  • 11. APPLICATIONS Ontologie Contenu digital Traduction automatique Web Sémantique, OWL OCR Résumé automatique Enseignement =: teaching et évaluation Indexation Analyseurs automatiques Moteur de recherche sur le net
  • 12. CONCLUSION Nous insistons sur le fait de prendre en considération les travaux linguistiques basés sur un cadre théorique formel. Nos bases de données linguistiques sont à la disposition des chercheurs désirant collaborer avec notre société en vue de développement des applications sur l’arabe Nos remercions l’équipe de chercheurs ayant travaillé sur les bases de données pendand des années.