Your SlideShare is downloading. ×
Defense
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×

Introducing the official SlideShare app

Stunning, full-screen experience for iPhone and Android

Text the download link to your phone

Standard text messaging rates apply

Defense

462
views

Published on


0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
462
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
22
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. ‫مدلی برای تحلیل و تولید متن وبلگ‬ ‫فرزانه سرافراز‬ ‫استاد راهنما: دکتر شیری‬ ‫استاد مشاور: دکتر عزمی‬ ‫بهمن ۵۸۳۱‬
  • 2. ‫پدیدههای زبانی قرن حاضر‬ ‫گسترده شدن ه جهانی اینترنت و روشهای تبادل اطلعات‬ ‫شبک‬ ‫●‬ ‫عمومی شدن خدمات کامپیوتری و آشنایی بیشتر مردم با ابزارهای‬ ‫●‬ ‫کامپیوتری‬ ‫استاندارد شدن خطها و زبانهای مختلف برای ه الکترونیکی‬ ‫مبادل‬ ‫●‬ ‫یونیکد‬ ‫–‬ ‫اهمیت زبانهای مادری‬ ‫–‬ ‫پیدایش نرمافزارهای محلیشده‬ ‫–‬ ‫افزایش سریع حجم دادههای نوشتاری و گفتاری زبانهای مختلف‬ ‫●‬ ‫۰۱میلیون پیام کوتاه در ایران (گزارش مخابرات) با ۰۶۱ نویسه در هر کدام‬ ‫–‬ ‫با افزایش تعداد نویسههای پیام کوتاه به ۰۰۸ نویسه پنج برابر خواهد شد‬ ‫–‬
  • 3. ‫پیامدهای این وضعیت‬ ‫تأثیر روی واژگان و ویژگیهای ساختی زبانهای مختلف‬ ‫●‬ ‫فراهم شدن حجم عظیم دادههای زبانی به صورت الکترونیکی‬ ‫●‬ ‫منبع مهم تجزیه و تحلیل زبانی‬ ‫–‬ ‫زیاد شدن اهمیت پردازش دادههای زبانی برای دستیابی به سیستمهای‬ ‫●‬ ‫مختلف فنآوری زبان‬ ‫پردازش زبان طبیعی ‪NLP‬‬ ‫–‬ ‫ن شناسی محاسباتی ‪CL‬‬‫زبا‬ ‫–‬
  • 4. ‫پردازش زبان طبیعی (‪)NLP‬‬ ‫زیرشاخ ‌ی‌هوش‌مصنوعی‌و‌زبا ‌شناسی‬ ‫ن‬ ‫ه‬ ‫●‬ ‫مسأله+‌تولید‌و‌درک‌زبانهای‌طبیعی‌انسان: انگلیسی‌و‌...‬ ‫●‬ ‫سیست ‌های‌تولید‌زبان‌طبیعی‬ ‫م‬ ‫–‬ ‫● اطلعات‌پایگاه‌داد‌ها‌←‌زبان‌طبیعی‌انسان‬ ‫ه‬ ‫سیست ‌های‌درک‌زبان‌طبیعی‬ ‫م‬ ‫–‬ ‫● زبان‌طبیعی‌تولیدشده‌توسط‌انسان‌←‌نمایش‌فرمال‌قابل‌استفاده‌برای‌کامپیوتر‬
  • 5. ‫مسائل اصلی در پردازش زبان طبیعی‬ ‫تولید گفتار‬ ‫●‬ ‫تبدیل اشکال مختلف نمایش اطلعات به صوت گفتار طبیعی‬ ‫>‬ ‫–‬ ‫● متن به گفتار‬ ‫● نشانههای آوایی به گفتار‬ ‫● سایر اشکال نمایش زبانشناسی به گفتار‬ ‫کاربردها‬ ‫–‬ ‫● کودکان و دسترسیپذیری برای کسانی که مشکل خواندن دارند‬ ‫● سیستمهای هوشمند مخابراتی‬ ‫● کاربردهای‌دیگر‌در‌رابط +‌متقابل‌انسان‌و‌کامپیوتر‬ ‫ه‬
  • 6. ‫مسائل اصلی...‬ ‫بازشناسی‌گفتار‬ ‫●‬ ‫تشخیص‌گفتاری‌که‌انسان‌تولید‌کرده‌و‌انجام‌عمل‌متناسب‬ ‫–‬ ‫‪ ‬تبدیل‌گفتار‌به‌متن‌(از‌جمله‌در‌کاربردهای‌دسترس ‌پذیری)‬ ‫ی‬ ‫‪ ‬کاربردهایی‌مثل‌شمار‌گیری‌خودکار‌تفن‌همراه‬ ‫ه‬ ‫‪ ‬تشخیص‌نام‌شهر‌و‌استان‌و‌شماره‌تلفن‌در‌سیست ‌های‌هوشمند‌مخابراتی‬ ‫م‬
  • 7. ‫مسائل اصلی...‬ ‫بازیابی اطلعات‬ ‫●‬ ‫جس ‌وجو‌به‌دنبال‌اطلعات‌در‌مدارک‌و‌پروند‌ها‬ ‫ه‬ ‫ت‬ ‫–‬ ‫جس ‌وجو‌به‌دنبال‌خود‌مدارک‌و‌پروند‌ها‬ ‫ه‬ ‫ت‬ ‫–‬ ‫جس ‌وجو‌به‌دنبال‌اطلعات‌متا‌در‌مورد‌مدارک‬ ‫ت‬ ‫–‬ ‫جس ‌وجو‌در‌پایگا‌های‌داده‬ ‫ه‬ ‫ت‬ ‫–‬ ‫و...‬ ‫–‬
  • 8. ‫مسائل اصلی...‬ ‫پاسخ‌به‌سؤال‬ ‫●‬ ‫– نوع‌خاصی‌بازیابی‌اطلعات‬ ‫– به‌عنوان‌گام‌بعدی‌پس‌از‌موتورهای‌جس ‌وجو‬ ‫ت‬ ‫– دو‌نوع‌اصلی:‬ ‫‪ ‬دامن +‌محدود‬ ‫ه‬ ‫– سؤالت‌شکل‌تعری ‌شده‌دارند‬ ‫ف‬ ‫– جس ‌وجو‌در‌پایگاه‌داده‌است‬ ‫ت‬ ‫ه+‌نامحدود‬ ‫‪ ‬دامن‬ ‫– هر‌سؤالی‌م ‌توان‌پرسید‬ ‫ی‬ ‫– جس ‌وجو‌در‌شبک +‌اینترنت‌و‌با‌منابع‌زیاد‬ ‫ه‬ ‫ت‬
  • 9. ‫مسائل اصلی...‬ ‫خلص ‌سازی‌خودکار‬ ‫ه‬ ‫●‬ ‫غل ‌یاب‌و‌ویراستار‌خودکار‬ ‫ط‬ ‫●‬ ‫املیی‬ ‫–‬ ‫دستوری‬ ‫–‬ ‫ویرایش‌متون‌در‌چاپ‌و‌نشر‬ ‫–‬ ‫کم ‌کنند +‌نوشتن/خواندن‌زبان‌خارجی‬ ‫که‬ ‫–‬
  • 10. ‫مسائل اصلی...‬ ‫تولید زبان طبیعی‬ ‫●‬ ‫برنامههای ساده مثل‌طال ‌بینی‌یا‌نام ‌نگار ‌های‌رسمی‬ ‫هی‬ ‫ع‬ ‫–‬ ‫برنام ‌های‌پیچیده‌مراحل‌بیشتری‌دارند:‬ ‫ه‬ ‫–‬ ‫● برنام ‌ریزی‌هوش‌مصنوعی‌برای‌متنی‌که‌قرار‌است‌تولید‌شود‬ ‫ه‬ ‫● تعیین‌ساختار‌متن‬ ‫● تعیین‌ساختار‌جملت‬ ‫● مربوط‌کردن‌کلمات‌با‌مفاهیم‬ ‫● مسائل‌مربوط‌به‌نحو‌(سینتکس)،‌ریخ ‌شناسی‌و‌دستور‌(گرامر)‬ ‫ت‬ ‫● مسائل‌مربوط‌به‌نقط ‌گذاری‌و‌رس ‌الخط‬ ‫م‬ ‫ه‬
  • 11. ‫روشهای اصلی در علوم شناختی‬ ‫دو روش اصلی متفاوت برای پردازش زبان طبیعی و به طور خاص تولید‬ ‫●‬ ‫زبان طبیعی‬ ‫روش تکوینی یا منطقی (‪)rational or formalist approach‬‬ ‫–‬ ‫روش تجربی (‪)empirical approach‬‬ ‫–‬ ‫در روش تکوینی به دنبال اطلعات تحلیلی هستیم که بدون استفاده از‬ ‫●‬ ‫دادههای تجربی به دست میآیند‬ ‫در روش تجربی ارزش زیادی به دادههای زبانی میدهیم‬ ‫●‬ ‫از نظریهپردازان روش تجربی: نوام چامسکی، ن شناس‬ ‫زبا‬ ‫–‬ ‫در سالهای اخیر روش تجربی بین دانشمندان اهمیت زیادی پیدا کرده است‬ ‫–‬
  • 12. ‫نقش پیکره‬ ‫مهمترین ابزار مورد نیاز برای حل مسائل مختلف به روش تجربی در حیطه‬ ‫●‬ ‫پردازش زبان طبیعی وجود پیکره زبانی بزرگ است‬ ‫در زبان فارسی با رشد ک ‪N‬ی وبلگهای فارسی چنین پیک ه متنیای در‬ ‫ر‬ ‫م‬ ‫●‬ ‫اینترنت وجود دارد‬ ‫«وبلگ یک قالب روزنامهنگاری برخط است که به ترتیب زمانی عکس‬ ‫●‬ ‫منتشر میشود، مرتب‪ V‬بهروز میشود، و نوع‪ V‬شامل تفکرات و تأملت شخصی،‬ ‫ا‬ ‫ا‬ ‫زندگی روزمره، مقالت، نظرات دیگران، و پیوند به صفحات وب است.»‬
  • 13. ‫راهحلهای پیشین برای مسائل کلسیک‬ ‫پردازش زبان و مسائل خاص زبان فارسی‬ ‫مشکلت فنی و ساختاری‬ ‫●‬ ‫قالبهای گوناگون پروندههای کامپیوتری‬ ‫–‬ ‫● زرنگار، کلک، نشر الف، لت>ک، پیدیاف، و‪Q‬رد مایکروسافت‬ ‫– حتی نسخههای «فارسیشده»ی مختلف و‪Q‬رد فارسی را یک جور پشتیبانی نمیکنند‬ ‫● تبدیل این قالبها به تصویر برای سازگاری بیشتر‬ ‫برتری قالب ‪( xml‬از جمله صفحات وب)‬ ‫–‬ ‫● قالب استاندارد ←‌امکان‌استفاده‌از‌تجزی ‌گرهای‌استاندارد‬ ‫ه‬ ‫● پشتیبانی‌و‌ب ‌روزرسانی‌از‌سوی‌‪w3c‬‬ ‫ه‬ ‫● تعداد‌زیاد‌کاربران‌که‌هر‌روز‌به‌دامن +‌آنها‌افزوده‌م ‌شود‬ ‫ی‬ ‫ه‬ ‫● توانای ‌ها‌و‌امکانات‌زیاد: قابلیت‌نمایش‌و‌چاپ‬ ‫ی‬ ‫● قابلیت‌حمل‌روی‌کامپیوترها‌و‌سیست ‌عام ‌های‌گوناگون‬ ‫مل‬
  • 14. ‫ی ها و نقاط تمایز وبلگ با سایر‬‫ویژگ‬ ‫پیکرههای زبانی‬ ‫زبان غیررسمی و محاورهای‬ ‫●‬ ‫مفاهیم و موضوعات محدود و تکراری‬ ‫●‬ ‫وجود شکلک و پیوند به صفحات وب در بین متن‬ ‫●‬ ‫نویسندگان مختلف‬ ‫●‬ ‫استفاده از سیستمها و نرمافزارهای گوناگون برای حروفچینی‬ ‫●‬ ‫کدگذاریهای غیراستاندارد و مختلف‬ ‫●‬ ‫رسمالخطهای متفاوت‬ ‫●‬ ‫کلمات خارج از دایره واژگان فارسی‬ ‫●‬
  • 15. ‫استاندارد خط در کامپیوتر‬ ‫نویسه: کوچکترین واحد نوشته‬ ‫●‬ ‫نویسه «ی» شکلهای اول، وسط، آخر تنها، آخر چسبان دارد:‬ ‫‪Y‬‬ ‫–‬ ‫●ی ی ی ی‬ ‫استاندارد (منسوخ) ۰۰۹۲ موسسه استاندارد و تحقیقات صنعتی ایران‬ ‫●‬ ‫ه اروپا‬ ‫چندین کدگذاری مختلف برای دربرگرفتن ه ن های اتحادی‬ ‫هم زبا‬ ‫●‬ ‫این کدگذاریها با هم تعارض هم داشتند‬ ‫●‬ ‫تحریف دادهها هنگام عبور از ط های مختلف‬ ‫محی‬ ‫●‬
  • 16. ‫ک‪D‬د‬ ‫استاندارد یونی‬ ‫کد یکتا به هر نویسه؛ مستقل از محیط، برنامه، زبان‬ ‫●‬ ‫کار کردن یک وبگاه یا نرمافزار در ط های متعدد بدون ه اضافی‬ ‫هزین‬ ‫محی‬ ‫●‬ ‫مورد قبول پیشتازان صنعت کامپیوتر‬ ‫●‬ ‫استاندارد ۲۴۳۳ موسسه استاندارد و تحقیقات صنعتی ایران‬ ‫●‬
  • 17. ‫ک‪D‬د‬ ‫استاندارد یونی‬ ‫مجموعه سه های استاندارد خط فارسی‬ ‫نوی‬ ‫●‬ ‫کك‬ ‫–‬ ‫یي‬ ‫–‬ ‫ه‪ Y‬ة‬ ‫–‬ ‫۶۵۴‬ ‫–‬ ‫فا له بیعرض‬ ‫ص‬ ‫●‬ ‫خانهها‬ ‫–‬ ‫خانهها‬ ‫–‬ ‫اتصال مجازی‬ ‫●‬ ‫– ه . ش.‬
  • 18. ‫خلصه‪ E‬مراحل کاری‬ ‫مع آوری پیکره‬ ‫ج‬ ‫●‬ ‫استخراج متن خام‬ ‫●‬ ‫پیشپردازش‬ ‫●‬ ‫تحلیل اطلعات زبانی‬ ‫●‬ ‫تولید متن‬ ‫●‬ ‫ارزیابی متن تولیدشده‬ ‫●‬ ‫بررسی امکانات ه طرح‬ ‫توسع‬ ‫●‬
  • 19. ‫جمعآوری پیکره‬ ‫روش مطلوب: روشی که تا جای ممکن وبلگهای تصادفی را از روی وب‬ ‫●‬ ‫بارگیری کند‬ ‫استفاده از کارگزار پینگ‬ ‫●‬ ‫هر وبلگ وقتی که بهروز میشود پیغامی به یک کارگزار پینگ میفرستد‬ ‫–‬ ‫در بازههای زمانی معین فهرست وبلگهای بهروزشده را بارگیری میکنیم‬ ‫–‬ ‫بارگیری صفحات مرتبط با دنبال کردن پیوندها و با استفاده از خزنده وب‬ ‫●‬ ‫جدا کردن وبلگهای فارسی: استفاده از روش مکاشفهای‬ ‫●‬ ‫عه‪ Y‬نویسههای خط فارسی‬ ‫مجمو‬ ‫–‬ ‫تمییز از صفحات عربی، اردو، پشتو، کردی، کشمیری‬ ‫–‬
  • 20. ‫استخراج متن خام‬ ‫دستهبندی صفحات بارگیریشده‬ ‫●‬ ‫تشخیص انواع برچسبهای بهکار رفته در صفحه‬ ‫●‬ ‫تشخیص آشغال از نظر موتور پردازش زبان طبیعی‬ ‫●‬ ‫سرصفحهها‬ ‫–‬ ‫کدنوشتههای جاوااسکریپت، ایاسپی، پیاچپی‬ ‫–‬ ‫پیوند‬ ‫–‬ ‫عبارتهای غیرفارسی‬ ‫–‬ ‫پروندههای تصویری (شکلکها و...)‬ ‫–‬
  • 21. ‫استخراج متن خام‬ ‫پیدا کردن متن هر مطلب و جدا کردن آن از‬ ‫●‬ ‫عنوان صفحه‬ ‫–‬ ‫عنوان مطلب‬ ‫–‬ ‫حاشیهها‬ ‫–‬ ‫شرح پیوندها‬ ‫–‬ ‫و...‬ ‫–‬ ‫نیاز به روش جداگانه برای هر سرویسدهنده، و حتی هر قالب طراحیشده‬ ‫●‬ ‫هدف: بهینه کردن جوابهای درست، بیتوجه به مطلب آشغال تشخیص‬ ‫●‬ ‫داده شده (‪)false negative‬‬
  • 22. ‫پیشپردازش‬ ‫تبدیل سه های غیرمجاز به سه های یونیکدی صحیح فارسی‬ ‫نوی‬ ‫نوی‬ ‫●‬ ‫حذف نویسه کشـیـده‬ ‫●‬ ‫حذف ‪n‬عراب‬ ‫ا‬ ‫●‬ ‫حذف تنوین (شدید‪V‬ا ←‌شدیدا)‬ ‫●‬ ‫حذف ساک ‪ o‬و تشدید‬ ‫ن‬ ‫●‬ ‫حذف ء از آخر کلماتی مثل شهداء‬ ‫●‬ ‫یکنواخت کردن ارقام‬ ‫●‬ ‫تبدیل رشتههای ه ة هی ه ی به ه‬ ‫●‬
  • 23. ‫پیشپردازش‬ ‫حذف فاصله و اضافه کردن فاصلهی مجازی در رشتههای «می »، «بر‬ ‫●‬ ‫می»، «برمی »، «درمی »، «در می »، «نمی »، و «بی »‬ ‫می روند ←‌م ‌روند‬ ‫ی‬ ‫–‬ ‫حذف‌فاصله‌و‌اضافه‌کردن‌فاصل ‌ی‌مجازی‌در‌رشت ‌های‌« ها»،‌«‬ ‫ه‬ ‫ه‬ ‫●‬ ‫های»،‌« هایی»،‌« هایم»،‌« هایت»،‌و...‬ ‫چسباندن‌«تر» و‌«ترین» به‌آخر‌کلمات‬ ‫●‬ ‫یکنواخت‌کردن‌نقط ‌گذار ‌ها‬ ‫هی‬ ‫●‬
  • 24. ‫تحلیل متن‬ ‫تشخیص واژه‬ ‫●‬ ‫تعریف گرافیکی واژه ←‌رس ‌الخ ‌های‌مختلف‬ ‫مط‬ ‫–‬ ‫● می‌توان‬ ‫● شده‌است‬ ‫● شد‌ام‬ ‫ه‬ ‫● دربرابرباد‬ ‫شک ‌های‌مختلف‌نگارش‬‫ل‬ ‫–‬ ‫● مسوول،‌مسؤول،‌مسئول‬ ‫● پاییز،‌پائیز‬
  • 25. ‫واژه‬ ‫نوع خاص متن مورد بررسی‬ ‫●‬ ‫منو گرفته، گرفتهتم، گرفتتم‬ ‫–‬ ‫غلطای املیی‬ ‫–‬ ‫این لینکو، منو برد خونه‬ ‫–‬ ‫منو دوستام‬ ‫–‬ ‫خودمون، چشمهایشان، بهش، بهاش، براتون‬ ‫–‬ ‫برام مسخرست، اوضاش‬ ‫–‬ ‫وااااای، اووووه‬ ‫–‬
  • 26. ‫رتبه/بسامد‬ ‫1‬ ‫و‬ ‫8767‬ ‫8767‬ ‫واژگان را بر حسب تعداد‬ ‫●‬ ‫2‬ ‫از‬ ‫7605‬ ‫43101‬ ‫3‬ ‫به‬ ‫6274‬ ‫87141‬ ‫تکرارشان در پیکره مرتب میکنیم‬ ‫4‬ ‫در‬ ‫1134‬ ‫44271‬ ‫قانون زیپف:‬ ‫5‬ ‫را‬ ‫1353‬ ‫55671‬ ‫●‬ ‫6‬ ‫که‬ ‫1043‬ ‫60402‬ ‫حاصل ضرب رتبه در بسامد عدد‬ ‫–‬ ‫7‬ ‫این‬ ‫3992‬ ‫15902‬ ‫ثابتی است‬ ‫8‬ ‫که‬ ‫5452‬ ‫06302‬ ‫9‬ ‫هم‬ ‫7052‬ ‫36522‬ ‫01‬ ‫است‬ ‫2912‬ ‫02912‬
  • 27. ‫رتبه/بسامد‬ ‫00001‬ ‫قانون زیپف‬ ‫●‬ ‫با استفاده از‬ ‫0001‬ ‫–‬ ‫۴۰۷۰۱۲‬ ‫‪Frequency‬‬ ‫واژه از پیکره‬ ‫001‬ ‫01‬ ‫1‬ ‫01‬ ‫001‬ ‫0001‬ ‫00001‬ ‫000001‬ ‫‪Rank‬‬
  • 28. ‫تولید متن‬ ‫فرض: رفتار گذشته راهنمای خوبی برای چیزی است که در آینده رخ‬ ‫●‬ ‫خواهد داد ←‌مدل‌باثبات‌است‬ ‫پی ‌بینی‌واژ +‌بعدی‬ ‫ه‬ ‫ش‬ ‫●‬ ‫تلش‌برای‌تقریب‌زدن‌تابع‌احتمال‌زیر‬ ‫–‬ ‫(1-‪n| w1,…, wn‬‬ ‫‪●P)w‬‬ ‫برپای +‌اینکه‌مقدار‌زیادی‌به‌مت ‌ها‌نگاه‌کرد‌ایم،‌تخمینی‌از‌احتمال‌رخداد‬ ‫ه‬ ‫ن‬ ‫ه‬ ‫●‬ ‫دنبال ‌های‌مشخص‌از‌واژ‌ها‌داریم‬ ‫ه‬ ‫ه‬
  • 29. ‫مدل ‪-n‬نگاشتی‬ ‫ه متنی را تا جای ممکن بزرگ فرض کنیم‬ ‫مطلوب است ه تاریخچ‬ ‫دنبال‬ ‫●‬ ‫ممکن نیست، چون اغلب جملهای میشنویم که تا به حال نشنیدهایم‬ ‫–‬ ‫فرض مارکوف: فقط بافت موضعی پیشین بر ژه بعدی اثر میگذارد‬ ‫وا‬ ‫●‬ ‫مدل ‪-n‬نگاشتی‬ ‫●‬ ‫هر دنباله به طول ‪ n‬از واژگان را یک ‪-n‬نگاشت مینامند‬ ‫–‬ ‫میخواهیم ‪n‬های ‪ -n‬ت هایمان نسبت‪ V‬بزرگ باشند‬ ‫ا‬ ‫نگاش‬ ‫●‬ ‫پیچیدگی محاسباتی (رشد نمایی با رشد ‪)n‬‬ ‫–‬ ‫کوچک شدن ظرفهای نمونه‬ ‫–‬
  • 30. ‫روش تولید‬ ‫بررسی فرایند تولید با مدل ‪-n‬نگاشتی با ‪n‬های برابر ۰، ۱، ۲، و ۳‬ ‫●‬ ‫استفاده از تخمینگر ‪MLE‬‬ ‫●‬ ‫استفاده از قانون لپلس برای قرار دادن یک احتمال کوچک (غیرقابل‬ ‫●‬ ‫تنظیم) برای پیشامدهای تاکنونمشاهدهنشده‬
  • 31. ‫نتیجهگیری‬ ‫نگاه به اعداد از دید زبانشناختی‬ ‫●‬ ‫مغرب در سه شنبه شانزدهم خرداد ۵۸۳۱ ساعت ۰۰:۰۲‬ ‫–‬ ‫با وجود بیقاعدگیهای نحوی دنبالههای نسبت‪ V‬طولنی با ساخت نحوی قابل‬ ‫ا‬ ‫●‬ ‫قبول و محتوای یکنواخت تولید شد‬ ‫مگر در هر ثانیه چند کلمه میتواند از میان لبان بیرون بریزیم تا بیانگر احساس درون‬ ‫–‬ ‫ام بود و هزار نامه هایم به رویاهایشان چنگ میزنند‬ ‫–‬
  • 32. ‫توسعه‪ E‬طرح‬ ‫استفاده از دادگان فارسی‬ ‫●‬ ‫استفاده از تحلیلگر نحوی تغییریافته برای این نوع خاص پیکره‬ ‫●‬ ‫استفاده از تحلیلگر مورفولوژیک تغییریافته برای این نوع خاص پیکره‬ ‫●‬ ‫ع سازی با یک نرمافزار انتشار وبلگ و انتشار برخط مطالب‬‫مجتم‬ ‫●‬ ‫خواندن نظرات دیگران و تولید پاسخ مناسب‬ ‫●‬ ‫انتشار مطلب جدید در با ه های زمانی معقول متناسب با تعداد‬ ‫ز‬ ‫●‬ ‫بازدیدکنندههای صفحه و محتوای کامنتها‬
  • 33. ‫توسعه‪ E‬طرح‬ ‫سرزدن به وبلگهای دیگر، گذاشتن نظر، و تبادل پیوند‬ ‫●‬ ‫اضافه کردن مطالب منتشرشده روی گ های دیگر و سایتهای خبری‬ ‫وبل‬ ‫●‬ ‫مربوط به محتوا به مجموعهی دادههای آموزشی و تولید مطلب هماهنگ و‬ ‫مربوط به وقایع روز‬ ‫استفاده از قالببندیهای ‪ ،html‬شکلک، پیوند، تصویر، و... برای شبیهتر شدن‬ ‫●‬ ‫به کارهایی که یک فرد هوشمند وبلگنویس انجام میدهد‬
  • 34. ‫امکان استفاده در حیطههای دیگر‬ ‫●‬ ‫تاریخچهی متن ‪ n‬یکسانی دارند در بارگیر ‪ n‬بازگشتی اجازهی آبونه شدن و پردازش دادهها، و بدون نزدیک‬ ‫ی‬ ‫ی‬ ‫شدن صف دیگر ۶67 -۴-۷-۱قانون زیپف اگر چنین ترکیباتی لزوم‪ V‬ل„‪ V‬به بخش روی جنبههای مختلف‬ ‫„ قب‬ ‫ا‬ ‫برای فعل «دید» یک نمونه را بدون ایجاد میکنند، پیوندهای دائم به حروف اول فهرست وبلگهایی که‬ ‫کم میکنند و «هی» در زیر یک قالب روزنامهنگاری برخط72 است ولی با فارسی صرف‪ V‬محاسباتی‬ ‫ا‬ ‫نگریست از رشتههای « و پشت سر هم که برآیندهای یک راه حل بهکاررفته در انتهای پاراگراف بال‬ ‫ی شده حذف حرکتها و دستوری با‬‫بسامد در بازههای ۰۰۰۰۱ کلمهای بشماریم. تعداد وبلگهای بارگیر‬ ‫تشخیص داد. این منظور، توجه خود تنوین حذف فاصله قبل و سوم به خوبی از همهی علئم نقطهگذاری‬ ‫را برمیشماریم و فهرست واژگان‬
  • 35. ‫؛)‬ ‫باد دانه را بگرفت. نوشته دوست داره؟ بایدبگم من و عشقمه...!!!‬ ‫●‬ ‫وقتی حرفهای مرا بر خواهیم خندید .بیا بی جواب تام خستگیهر روز‬ ‫ده نفربت گفت هیچ کس دوست داشتنی ترین واژه برای ایجاد میط بدون‬ ‫اندیشه و به هرجا که خیلی بی تودنیابامن چه آرزو وهزار رویای بی‬ ‫تاب وتوان وبال وپرسوخته کنج قفس نانده باشد و مسدود کننده هستیم‬ ‫میدانیم نا سلمتی خودت از عشقت پاسخ دادمتو اجازه دادی که قلبش‬ ‫به صرفه است وآهسته بی رحم دردهای زندگی ، نات میدهد افرادی که‬ ‫نگاه کن . هر زمان درازای هر آینه من اگر با هه جدایی هاست و شش‬ ‫دفت مثنوی او رویاهای بچه گانهات . میخواهم بگویم خیلی دوستت‬ ‫دارم................مواظب خودت رپ ایران چطوره ؟؟؟ تنهایی و‬ ‫گناهم را داری با گریه های متنوعی وجود من نادرجان روخیلی دوسش‬ ‫دارم گله از امشب بسوزم چونکه میدان آتش آن آشیان دارند. چرا‬ ‫مثبت بودن مثل ماه شب را تنها هربار که دعاکنیدمنواون به تونادرم‬ ‫نوشته شده باید بدست خودم میبینم با تام اندیشه هایت سر بکشم‬ ‫،جلوتر ازما تام نبودنای تو شدم پس هیچ لظهای هم نبود شگفت بر‬ ‫سخره شاه حرون خر گیری بر عهده دارد.کم خوابی ... امروز و خاموشم‬ ‫مکن درکنارت نیستم امافراموشم مکن نوشته دوست ندارند ؟ سلم..من‬ ‫کامیار هون راسکال از میزان اشتها را امتحان کردم ، آزاد و ساعت‬ ‫۶۲:۶۱ لینک کلیک کنید جایزه بگیرید لینک کلیک کنید جایزه بگیرید‬ ‫لینک ثابت (۰۱)؛ آهای دنیا نگاه میکنی ... کویرم خشک و آرامش با‬ ‫مژگانت اشارهای کنی . جز امید تو بان و آفرینش صور خیال ،از‬ ‫سردیه دستام ... من معنا میکنی ... آرزو داشتی مرا میبشیدی .‬ ‫میدونی چرا وقتی بیشت کل نیست...کل خودش یه عاله دوستت دارم...‬