دراسة وصفية تحليلية للمحتوى العربي على العنكبوتية العالمية، اشتملت على عرض وتوثيق للإنتاج الفكري للدراسات التجريبية والتقييمية الخاصة بنظم استرجاع المعلومات التي أُجريت منذ منتصف خمسينات القرن الماضي وحتى العام 2010، مع التركيز على تلك الدراسات التي اتخذت من اللغة العربية أساسًا للبحث. كما اشتملت الدراسة على مناقشة للتحديات التي تواجه محركات البحث في تعاملها مع المصادر الإلكترونية للمعلومات، خاصة الزحف في العنكبوتية العالمية وتكشيف المحتوى الرقمي، مع تسليط الضوء على أبعاد هذه التحديات وسُبُل مواجهتها. وحاولت الدراسة كذلك التحقق من سمات وخصائص المحتوى العربي على العنكبوتية العالمية، مع اتخاذ مجال المكتبات والوثائق والمعلومات كعينة ممثلة لهذا المحتوى، وذلك بالاعتماد على أساليب القياسات الوراقية، وباستخدام قانون برادفورد في صيغة بروكس لتوزيع برادفورد-زبف، ومقياس بروكس للتشتت الفئوي في الإنتاج الفكري. مع إجراء تجربتين؛ إحداهما لاختبار كفاءة اللغة العربية، مقارنة باللغة الإنجليزية، في التعامل مع النظم الآلية للتعامل مع النصوص، من حيث مدى الإحكام في اللغة الطبيعية، بينما جاءت التجربة الأخرى لاختبار كفاءة محركات البحث في استرجاع الوثائق العربية اعتمادًا على مجموعة من المعايير؛ وهي: الاستدعاء، والتحقيق، وإخفاقات عمليات البحث، والترتيب الطبقي، والجِدة، والاستفادة مما وراء البيانات.
A survey of Arabic Web content, deals with the literature of the experimental and evaluative studies in information retrieval systems, from the mid-fifties of the last century through 2010, with a concentration on these which dealt with Arabic. The challenges that encounter search engines in dealing with electronic resources are discussed, including crawling and indexing the Web content. The characteristics of Arabic Web content is evaluated in terms of bibliometrics, using Bradford’s Law and Brookes’ Measure for Categorical Dispersion. Two experiments are conducted to test the efficiency of Arabic in dealing with automatic systems, compared with English. The other experiment is carried out to measure the ability of search engines that handle Arabic, depends upon recall, precision, search failures, search results ranking, novelty and making use of metadata. Two electronic questionnaires were mailed to a sample of researchers in information science. Results are summarized and recommendations are presented.