إبراهيم بونحاس و يحيى سليماني, نحو مقاربة شاملة لتحليل وتمثيل الوثائق العربية في الويب الاجتماعي الدلالي. الندوة الدولية لعلوم و هندسة الحاسوب, الحمامات, تونس, 2010, ص. 197-210
يعتبر تكشيف المواد السمعية البصرية من القضايا ذات الأولوية لدى منتجي و مستخدمي المواد السمعية البصرية ، لأن الوصول إلى هذه المواد و استخدامها يتوقف على جودة التكشيف .فلطالما وجد المختصون في مجال السمعي البصري صعوبة في حفظ هذه المواد في شكلها التناظري على المدى البعيد، فجاءت الرقمنة كحل لمشكلة الحفظ إلا أنها طرحت إشكالا أكثر تعقيدا زيادة على التقادم التكنولوجي ألا و هو التكشيف.
فقد وجد منتجو و مستخدمو المواد السمعية البصرية أنفسهم أمام مواد معقدة التركيب و متشعبة الخصائص و من هنا تم طرح اشكالية مفادها كيف يمكن تكشيف المواد السمعية البصرية بطريقة تسمح لنا باسترجاع جزئيات معينة من هذه المادة دون الاضطرار إلى تشغيلها من البداية إلى النهاية ؟ هذا من جهة و من جهة أخرى كيف يمكن ضبط واصفات لمادة سمعية بصرية تعبر في سياقها عن عدة معاني مختلفة؟
و سنحاول من خلال هذه الدراسة الاجابة عن هذه التساؤلات و تقديم حلول للإشكاليات المتعلقة بتكشيف المواد السمعية البصرية ، و لعل أبرز الصعوبات التي واجهتنا هي انعدام المراجع العربية و تركيز المراجع الأجنبية على طرق تصميم أنظمة تكشيف المواد السمعية البصرية الرقمية و ما يجب أن تكون عليه أكثر من التركيز على كيفية استخدامها.
This document discusses how emojis, emoticons, and text speak can be used to teach students. It provides background on the origins of emoticons in 1982 as ways to convey tone and feelings in text communications. It then suggests that with text speak and emojis, students can translate, decode, summarize, play with language, and add emotion to language. A number of websites and apps that can be used for emoji-related activities, lessons, and discussions are also listed.
Study: The Future of VR, AR and Self-Driving CarsLinkedIn
We asked LinkedIn members worldwide about their levels of interest in the latest wave of technology: whether they’re using wearables, and whether they intend to buy self-driving cars and VR headsets as they become available. We asked them too about their attitudes to technology and to the growing role of Artificial Intelligence (AI) in the devices that they use. The answers were fascinating – and in many cases, surprising.
This SlideShare explores the full results of this study, including detailed market-by-market breakdowns of intention levels for each technology – and how attitudes change with age, location and seniority level. If you’re marketing a tech brand – or planning to use VR and wearables to reach a professional audience – then these are insights you won’t want to miss.
Artificial intelligence (AI) is everywhere, promising self-driving cars, medical breakthroughs, and new ways of working. But how do you separate hype from reality? How can your company apply AI to solve real business problems?
Here’s what AI learnings your business should keep in mind for 2017.
محاضرة ألقيت في ندوة الأدوات الحديثة لفهرسة وتكشيف مصادر المعلومات في البيئة الرقمية والتي أقامها المعهد العالي للتوثيق بالتعاون مع الاتحاد العربي للمكتبات والمعلومات (اعلم)، تونس، ابريل 2013
تقنيات الوصول للمعلومة العربية
استعراض لنظم وادوات الوصول الى فهارس المكتبات العربية ومصادر المعلومات
التركيز على برمجيات المصدر المفتوح
العرض يتناول الجانب التقني من التحديات
الحماس – العاطفة من أجل حماية هويتنا
Information Access Technology (IAT) software development, arabization, marketing and support, based on the Open Source Software (OSS) concepts and Web 2.0 trends. IAT applications include: Integrated Library Systems, Media Archiving Systems, Federated Search and Taxonomy/Foxonomy based Retrieval, Reference Linking (OpenURL), Document Delivery and Smart Knowledge Portals.
يعتبر تكشيف المواد السمعية البصرية من القضايا ذات الأولوية لدى منتجي و مستخدمي المواد السمعية البصرية ، لأن الوصول إلى هذه المواد و استخدامها يتوقف على جودة التكشيف .فلطالما وجد المختصون في مجال السمعي البصري صعوبة في حفظ هذه المواد في شكلها التناظري على المدى البعيد، فجاءت الرقمنة كحل لمشكلة الحفظ إلا أنها طرحت إشكالا أكثر تعقيدا زيادة على التقادم التكنولوجي ألا و هو التكشيف.
فقد وجد منتجو و مستخدمو المواد السمعية البصرية أنفسهم أمام مواد معقدة التركيب و متشعبة الخصائص و من هنا تم طرح اشكالية مفادها كيف يمكن تكشيف المواد السمعية البصرية بطريقة تسمح لنا باسترجاع جزئيات معينة من هذه المادة دون الاضطرار إلى تشغيلها من البداية إلى النهاية ؟ هذا من جهة و من جهة أخرى كيف يمكن ضبط واصفات لمادة سمعية بصرية تعبر في سياقها عن عدة معاني مختلفة؟
و سنحاول من خلال هذه الدراسة الاجابة عن هذه التساؤلات و تقديم حلول للإشكاليات المتعلقة بتكشيف المواد السمعية البصرية ، و لعل أبرز الصعوبات التي واجهتنا هي انعدام المراجع العربية و تركيز المراجع الأجنبية على طرق تصميم أنظمة تكشيف المواد السمعية البصرية الرقمية و ما يجب أن تكون عليه أكثر من التركيز على كيفية استخدامها.
This document discusses how emojis, emoticons, and text speak can be used to teach students. It provides background on the origins of emoticons in 1982 as ways to convey tone and feelings in text communications. It then suggests that with text speak and emojis, students can translate, decode, summarize, play with language, and add emotion to language. A number of websites and apps that can be used for emoji-related activities, lessons, and discussions are also listed.
Study: The Future of VR, AR and Self-Driving CarsLinkedIn
We asked LinkedIn members worldwide about their levels of interest in the latest wave of technology: whether they’re using wearables, and whether they intend to buy self-driving cars and VR headsets as they become available. We asked them too about their attitudes to technology and to the growing role of Artificial Intelligence (AI) in the devices that they use. The answers were fascinating – and in many cases, surprising.
This SlideShare explores the full results of this study, including detailed market-by-market breakdowns of intention levels for each technology – and how attitudes change with age, location and seniority level. If you’re marketing a tech brand – or planning to use VR and wearables to reach a professional audience – then these are insights you won’t want to miss.
Artificial intelligence (AI) is everywhere, promising self-driving cars, medical breakthroughs, and new ways of working. But how do you separate hype from reality? How can your company apply AI to solve real business problems?
Here’s what AI learnings your business should keep in mind for 2017.
محاضرة ألقيت في ندوة الأدوات الحديثة لفهرسة وتكشيف مصادر المعلومات في البيئة الرقمية والتي أقامها المعهد العالي للتوثيق بالتعاون مع الاتحاد العربي للمكتبات والمعلومات (اعلم)، تونس، ابريل 2013
تقنيات الوصول للمعلومة العربية
استعراض لنظم وادوات الوصول الى فهارس المكتبات العربية ومصادر المعلومات
التركيز على برمجيات المصدر المفتوح
العرض يتناول الجانب التقني من التحديات
الحماس – العاطفة من أجل حماية هويتنا
Information Access Technology (IAT) software development, arabization, marketing and support, based on the Open Source Software (OSS) concepts and Web 2.0 trends. IAT applications include: Integrated Library Systems, Media Archiving Systems, Federated Search and Taxonomy/Foxonomy based Retrieval, Reference Linking (OpenURL), Document Delivery and Smart Knowledge Portals.
نظام إيجاد المستندات العربية المتشابهة بالمعنى والسياقMouhamad Kawas
محمد القواص، وجدي بشارة
Mouhamad Kawas, Wajdi Bshara
يهدف المشروع إلى بناء نظام يقوم بعملية فهم لمستند مكتوب باللغة العربية، وإيجاد ما يشابهه بالمعنى والسياق ضمن مجموعة من المستندات، وذلك بالاعتماد على أنطولوجيات محددة للغة العربية، حيث أن الأبحاث في هذا المجال لاتزال فقيرة وتعتمد في معظمها على تقنيات استرجاع المعلومات دون الخوض في غمار السياق والمعنى الدلالي للمستند، ولم ترتقِ حتى الآن إلى مستوى الأبحاث والأنظمة المنجزة للغات الأخرى.
ويمكن تلخيص أهداف المشروع بما يلي:
• قياس نسبة التشابه بين مستنديين مكتوبيين باللغة العربية اعتماداً على المعنى والسياق.
• عنقدة مجموعة من المستندات العربية باستخدام مقياس التشابه السابق.
• ايجاد المستندات المشابه لمستند.
• بناء نواة مساعدة للتطبيقات التي تبحث في مجال معالجة اللغة العربية (موسوعة عربية - قاموس – أنظمة السؤال والجواب...إلخ).
برمجيات كتابة و تبويب المراجع العلمية والبحثيةvdsr_ksu
محاضرة برمجيات كتابة و تبويب المراجع العلمية والبحثية إعداد الدكتورة حنان عبدالله القرشي
ضمن سلسلة محاضرات البحث العلمي لعام 1437هـ.
وكالة عمادة البحث العلمي للأقسام النسائية، جامعة الملك سعود.
نظام إيجاد المستندات العربية المتشابهة بالمعنى والسياقMouhamad Kawas
محمد القواص، وجدي بشارة
Mouhamad Kawas, Wajdi Bshara
يهدف المشروع إلى بناء نظام يقوم بعملية فهم لمستند مكتوب باللغة العربية، وإيجاد ما يشابهه بالمعنى والسياق ضمن مجموعة من المستندات، وذلك بالاعتماد على أنطولوجيات محددة للغة العربية، حيث أن الأبحاث في هذا المجال لاتزال فقيرة وتعتمد في معظمها على تقنيات استرجاع المعلومات دون الخوض في غمار السياق والمعنى الدلالي للمستند، ولم ترتقِ حتى الآن إلى مستوى الأبحاث والأنظمة المنجزة للغات الأخرى.
ويمكن تلخيص أهداف المشروع بما يلي:
• قياس نسبة التشابه بين مستنديين مكتوبيين باللغة العربية اعتماداً على المعنى والسياق.
• عنقدة مجموعة من المستندات العربية باستخدام مقياس التشابه السابق.
• ايجاد المستندات المشابه لمستند.
• بناء نواة مساعدة للتطبيقات التي تبحث في مجال معالجة اللغة العربية (موسوعة عربية - قاموس – أنظمة السؤال والجواب...إلخ).
برمجيات كتابة و تبويب المراجع العلمية والبحثيةvdsr_ksu
محاضرة برمجيات كتابة و تبويب المراجع العلمية والبحثية إعداد الدكتورة حنان عبدالله القرشي
ضمن سلسلة محاضرات البحث العلمي لعام 1437هـ.
وكالة عمادة البحث العلمي للأقسام النسائية، جامعة الملك سعود.
3. الويب التجتمالعي الدللي
•
وضعية الويب الحالية
–
–
–
–
•
كمية هائلة من المعلومات
تنامي عدد منتجي المعلومة وناقليها
تباين وتجهات النظر
تعدد وتنوع حاتجيات المستخدمين
التحديات المطروحة
–
–
–
–
صعوبة العثور على المعلومة
صعوبة التحقق من اعتمادية المعلومة
صعوبة فهم أو ضبط المجال المعرفي
صعوبة حصر وتجهات النظر أو تأويلها
إبراهيم بونحاس ويحيى سليماني, قسم اللعليمية, كلية العلوم3بتونس
4. الويب التجتمالعي الدللي
•
الويب الدللي
–
–
تمثيل المعارف والوثائق على مستوى المفاهيم حتى تتمكن محركات البحث من فهم معنى
الوثيقة والتعامل معه
إستعمال المكانز الشكلية ):(formal ontology
•
•
•
•
•
يمثل المكنز نموذتجا للمجال المعرفي يمكن من فهم هيكله وتمثيل معارفه
مُ نكَ
كما انه وسيلة لفهرسة الوثائق والبحث في المدونة
يمكن من حوسبة المعنى وبالتالي من معالجة الوثائق على مستوى المفاهيم
مُ نكَ
صعوبة تحيين المكانز خاصة مع الصبغة التطورية للويب
التركيز على حوسبة المعنى لمعالجته آليا أدت إلى تجاهل الحاتجيات البشرية والتجتماعية
للمستخدمين:
–
–
–
حاتجيات التصال
التفاعل مع المعلومة
تبادل ودراسة وتجهات نظر مختلفة
إبراهيم بونحاس ويحيى سليماني, قسم اللعليمية, كلية العلوم4بتونس
5. الويب التجتمالعي الدللي
•
الويب التجتمالعي
–
–
–
–
–
الستجابة للحاتجيات التجتماعية )التصال، التفاعل، تبادل ودراسة وتجهات النظر(
تسهيل التفاعل بين مستخدمين موزعين في الزمان والمكان
عّ
استعمال مكانز لشكلية تسمى المفضلات التجتماعية ):(folksonomy
• ترتيب محتويات موقع بطريقة تعاونية بين المستخدمين باستخدام كلمات تربط بكل
مُ
محتوى بغرض وصفه، و تعرف هذه الكلمات بالبطاقات )(tags
مُ
سهولة وسرعة التحيين
يصعب تحقيق تماسك المفضلة التجتماعية والفهارس خاصة مع غياب سلطة إشراف
إبراهيم بونحاس ويحيى سليماني, قسم اللعليمية, كلية العلوم5بتونس
6. الويب التجتمالعي الدللي
•
الويب التجتمالعي الدللي
–
–
–
–
–
إعداد المكانز يجب أن يستجيب للحاتجيات البشرية
الوثيقة هي نتيجة للتفاعل بين مستخدمين موزعين في الزمان والمكان
معنى الوثيقة يتكون تدريجيا مع التفاعلت التجتماعية
تمثيل الوثائق يجب أن يسهل الستعمالت والتفاعلت المستقبلية
استعمال مكانز شبه شكلية ) (semi-formalتسمى المكانز السيميائية
) .(semiotic ontologyتأخذ بعين العتبار
•
•
•
•
تعقيد العلقات بين الوثائق والتجزاء
الصبغة التطورية للوثائق
اختلف الرطراف الفاعلة وتنوع أدوارهم وإمكانياتهم
سياق إنتاج الوثائق والمواضيع التي تتناولها
إبراهيم بونحاس ويحيى سليماني, قسم اللعليمية, كلية العلوم6بتونس
7. الويب التجتمالعي الدللي
الخبير
تصميم نازل
)(Top Down Design
الويب الدللي
الويب التجتمالعي الدللي
تصميم صاعد
)( Bottom Up Design
الويب التجتمالعي
شكلي )(formal
شبه شكلي )(semi-formal
لشكلي )(informal
يمجتمع
المستخديمين
إبراهيم بونحاس ويحيى سليماني, قسم اللعليمية, كلية العلوم7بتونس
8. نولعية الستخدام
•
•
•
•
•
ينتمي المستخدمون إلى جماعات ممارسة كل منها يهتم بالوثيقة بكيفية معينة
يسمى نوعية الستخدام
حسب انتمائه فإن المستخدم سيهتم بأجزاء دون أخرى أو يرتب هذه الجزاء
تَ ه بّ
ترتيبا معينا
عُ تَ
ضرورة تجزئة الوثيقة إلى أجزاء متماسكة
ضرورة ربط الجزاء لتمكين المستخدم من البحار الدللي عبر الوثائق
تحديد مستوى الحبوبية المثل عند التجزئة: إجراء دراسة اجتماعية وذلك بتحديد
تَ تَ
ممارسات المستخدمين
إبراهيم بونحاس ويحيى سليماني, قسم اللعليمية, كلية العلوم8بتونس
9. إلعتمادية المعلويمة
•
تعريفات:
–
–
•
•
دراسة العتمادية ضروري من أجل فهم الوثيقة وتفسيرها واستغللها
هذه الدراسة تعتمد على:
–
–
•
إعتمادية المعلومة ) :(Information Reliabitliyمدى ثقة المستخدم بالمعلومة
السلطة ) :(Authorityمجموعة المؤشرات التي تثبت )أو يمكن أن تستخدم لدراسة(
عُ تَ
عُ
تَ
مصداقية الجهات الفاعلة في إنتاج ونقل المعلومة
عناصر داخلية مثل أسماء الكتاب ومعلومات التصال ونصوص حقوق النشر
عُ باّ
عناصر خارجية مثل سيرة الكتاب
عُ باّ
ضرورة التعرف على هوية الجهات الفاعلة وأدوارها والعلقات التي تربطها
إبراهيم بونحاس ويحيى سليماني, قسم اللعليمية, كلية العلوم9بتونس
10. إلعداد المكانز
•
•
•
المكنز في حده الدنى لبد أن يشتمل على عنصرين هما : المصطلحات
باّ
والعلقات الدللية التي تربطها
السماء )البسيطة والمركبة( هي العناصر التي تمثل موضوع الوثيقة
إعداد المكانز من الوثائق العربية
–
التحديات:
• إلتباس النصوص العربية: اللغة العربية لغة اشتقاقية تعتمد على التصريف، يضاف إلى ذلك
التصاق الحروف ببعضها وغياب الشكل
• لعدم توفر يموارد لغوية كافية كالمعاجم والمحللت النحوية
–
المراحل
•
•
•
التحليل الصرفي النحوي: تحديد السماء البسيطة ثم تشكيل مركبات اسمية: ضرورة تخصيص
عُ
مرحلة تعنى بإزالة أو تقليل اللتباس
عُ تَ
غربلة المفردات لتحديد المصطلحات التي تمثل المجال المعرفي
استخراج العلقات الدللية التي تمكن من ربط المصطلحات وتشكيل هيكل المكنز
م نْ
عُ تَ باّ
01
إبراهيم بونحاس ويحيى سليماني, قسم اللعليمية, كلية العلوم بتونس
11. النموذج التجتمالعي الدللي
نوعية العلةقة ط - ط
علةقة ط - ط
نوعية
طرف
نوعية العلةقة ج - ط
نوعية العلةقة ج - ج
علةقة ج - ط
نوعية
علةقة ج – ج
نوعية
جزء
النوع
المحتوى
إلخ.
علةقة م - م
نوعية
نوعية العلةقة م - م
مصطلح
نوع - ج
نوعية التستخدام
11
إبراهيم بونحاس ويحيى سليماني, قسم اللعليمية, كلية العلوم بتونس
13. البنية المقترحة
.1
الدراسة التجتمالعية
]بونحاس و سليماني، 9002ب[
1.1 دراسة مراحل إنتاج الوثائق
نوعية العلةقة ج - ط
1.2 دراسة التنظيم التجتماعي للجهات الفاعلة
نوعية العلةقة ط - ط
1.3 تحديد فئات المستخدمين وممارساتهم
نوعية التستخدام
نوع - ج
1.4 تحديد أنواع التجزاء وكيفية ترابطها
نوعية العلةقة ج - ج
نوع - ج
1.5 ربط أنواع التجزاء بممارسات المستخدمين
نوعية التستخدام
31
إبراهيم بونحاس ويحيى سليماني, قسم اللعليمية, كلية العلوم بتونس
14. البنية المقترحة
استخراج هيكل الوثيقة
.2
–
–
–
.3
استخراج الهيكل المادي )(Physical Structure
استخراج الهيكل المنطقي الكلي ) (Logical Structureمن خل ل تحديد عناوين
التجزاء الكبرى كالفصو ل أو البواب: العتماد على النماط
التحليل الجزئي للهيكل المنطقي: التعرف على المكونات الجزئية لكل تجزء كلي: استعما ل
لُ:يّ
قاعدة لغات حرة ) (CFGيتم تعلمها بطريقة شبه آلية من مجموعة من المثلة
عَ :يّ
ِC
تقييم اللعتمادية
.2
.3
.4
]بونحاس و سليماني، 9002ب[
]بونحاس و سليماني، 0102ب[
استخراج أسماء الرطراف الفاعلة )(Name Entity Recoginition
التعرف على هوية الرطراف الفاعلة باستعما ل محرك بحث اتجتماعي
)(Identity Recoginition
تقييم اعتمادية المعلومة من خل ل قاعدة البيانات حو ل الرطراف
41
إبراهيم بونحاس ويحيى سليماني, قسم اللعليمية, كلية العلوم بتونس
15. البنية المقترحة
التحليل اللغوي
.4
–
–
–
.5
التحليل الصرفي بأداة مادا
التحليل النحوي ]بونحاس و سليماني، 9002أ[
إزالة اللتباس اللغوي: خوارزمية مبنية على نظرية المكانيات )] (Possibilty Theoryبونحاس و
سليماني، 0102ج[
الفهرسة النولعية النازلة للوثائق
–
إعطاء وزن أكبر للمفردات الموتجودة في العناوين:
–
الفهرسة النازلة:
•
•
.6
اتستخراج
–
–
]بونحاس و سليماني، 0102ب[
اختيار المفردات التي تميز كل وثيقة: )ت. ل.ع.ت.و, (TF-IDF
توريث فهرس الوثيقة للتجزاء من المستوى الو ل ثم الثاني,..., إلخ
العلةقات الدللية ]بونحاس و سليماني، 0102ب[
العلقات الأفقية: ربط اللفاظ التي تتردد في نفس الجزء: قياس درتجة التقارب بين المصطلحات عبر
القياس ل. ل.ر
العلقات العمودية: ربط اللفاظ التي تظهر في عنوان تجزء معين باللفاظ الموتجودة في فهارس
أتجزاءه الفرعية
51
إبراهيم بونحاس ويحيى سليماني, قسم اللعليمية, كلية العلوم بتونس
16. التجارب والنتائج
•
تقديم المشروع
–
–
إنتاج خرائط اتجتماعية دللية من كتب الحديث
الهداف:
•
•
•
تسهيل عمل الباحثين في مجا ل الحديث
الستفادة من منهجية علوم الحديث كحل لمشاكل الويب
المدونة: كتب الحديث الستة :
صحيح البخاري وصحيح مسلم و سنن أبي داود وسنن النسائي
وسنن الترمذي وسنن ابن ماتجة
–
–
–
–
الحديث ينقل أحداثا تاريخية أو أقوال تنسب إلى شخص ما
لُ
كل حديث يتضمن سلسلة من الرواة تسمى السند أو السناد يحتوي على أسماء الرواة
وصيغ التحمل
تم تجميع الحاديث من قبل علماء في كتب متخصصة منظمة حسب المواضيع
تم إضافة تعاليق تتعلق بصحة الحاديث أو تأويلها أو إشارات إلى روايات أخرى
61
إبراهيم بونحاس ويحيى سليماني, قسم اللعليمية, كلية العلوم بتونس
19. المراجع
[]بونحاس و سليماني، 9002أ
Bounhas I. Slimani Y. A hybrid Approach for Arabic Multi-Word Term Extraction. IEEE International Conference
on Natural Language Processing and Knowledge Engineering (IEEE NLP-KE'09), pp. 429-436, Dalian, Chine,
September 24-27, 2009.
[]بونحاس و سليماني، 9002ب
Bounhas I. Slimani Y. A social approach for semi-structured document modeling and analysis. International
Conference on Knowledge Management and Information Sharing KMIS 09, pp. 95-102, Madeira, Portugal, 6 - 8
October, 2009.
[]بونحاس و سليماني، 0102أ
Bounhas I. Slimani Y. A hierarchical approach for semi-structured document indexing and terminology extraction.
International conference on information retrieval and knowledge management (CAMP’2010).
[]بونحاس و سليماني، 0102ب
Ibrahim Bounhas, Bilel Elayeb, Fabrice evrard and Yahya Slimani, “Towards a computer study of the reliability of
Arabic stories”, Journal of the American Society for Information Science and Technology (A paraitre).
[]بونحاس و سليماني، 0102ج
Ibrahim Bounhas and Yahya Slimani, “Désambiguïsation de textes Arabes pour l'extraction des syntagmes
nominaux, L'apport de la structure des documents”, 10ème Colloque Africain sur la Recherche en Informatique
et en Mathématiques Appliquées, Yamoussoukro, Côte d'Ivoire, 18 – 21 octobre 2010.
19
إبراهيم بونحاس ويحيى سليماني, قسم اللعليمية, كلية العلوم بتونس