مقدمه ای بر داده های پيوندی
Upcoming SlideShare
Loading in...5
×
 

مقدمه ای بر داده های پيوندی

on

  • 2,764 views

مروری بر کارهای انجام شده در داده های پيوندی

مروری بر کارهای انجام شده در داده های پيوندی

Statistics

Views

Total Views
2,764
Views on SlideShare
2,763
Embed Views
1

Actions

Likes
2
Downloads
170
Comments
3

1 Embed 1

http://www.slideshare.net 1

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel

13 of 3 Post a comment

  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
  • سلام ممنون عالی بود ایمیلتون چیه سوالمو ایمیل کنم؟
    Are you sure you want to
    Your message goes here
    Processing…
  • سلام اگه سوال داشتيد به همان آدرس ايميلم ارسال کنيد جواب ميدم
    Are you sure you want to
    Your message goes here
    Processing…
  • سلام آقای خسروی اسلایدهاتون عالی بود.من هم پروژه کارشناسیم در مورد همین موضوعه و یه سری مقاله پیدا کردم اما متاسفانه به دلیل آشنا نبودن استد پروژه به این موضوع کارم به شدت کند پیش میره.امکانش هست فایل ورد یا هرگونه فایلی که به من کمک کنه برام ایمیل کنید لطفا.متشکرم
    nfh_online@yahoo.com
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    مقدمه ای بر داده های پيوندی مقدمه ای بر داده های پيوندی Presentation Transcript

    • 1389/2/26 دانشگاه اصفهان دانشکده فني و مهندسي گروه کامپيوتر بررسی ساختار و چالشهای وب 3 وب مبتنی بر داده های پيوندی استاد راهنما : دکتر محمدعلی نعمت بخش ارائه دهنده : هادي خسروي فارسانی ارديبهشت 1389
    • فهرست مطالب
      • بررسی وب سنتی و معرفی مشکلات آن
      • معرفی مفاهيم، اصول و خصوصيات کليدی داده های پيوندی ( Linked Data )
      • بررسی روش انتشار داده در ساختار جديد
      • معرفی تعدادی از ابزارهای مورد استفاده در اين تکنولوژی
      • آينده داده های پيوندي
      • سوال و پاسخ
      1389/2/26
    • وب سنتی ( The Web of Document )
      • مشابه
        • يک سيستم فايل توزيع شده
      • اشياء اوليه
        • اسناد
      • لينک ها مابين
        • اسناد ( به عنوان رابطه بخشی از )
      • درجه ساختار در اشياء
        • بسيار پايين
      • معناي محتوا و لينک ها
      • به صورت ضمنی
      • طراحی شده برای
        • مصرف انسان
      1389/2/26
    • وب سنتی ( وب مبتنی بر اسناد لينک داده شده ) 1389/2/26
    • سيلوهای داده ای در وب 1389/2/26
    • 1389/2/26 سيلوهای داده ای در وب
    • چالشهای وب سنتی
      • سادگی
        • داده های با ساختار بسيار پايين، لينک های بدون نوع ، داده های جدا از هم
      • يکپارچگی
        • تمام مقالات چاپ شده از اساتيد دانشگاه اصفهان در کنفرانس داده کاوی را نشان بده
      • پرس و جوی وب
        • نام مقاله ای را که من با استادی از دانشگاه تهران چاپ کرده ام
      1389/2/26
    • وب مبتنی بر داده های پيوندی
      • نه تنها لينک مابين اسناد وجود دارد بلکه مابين موجوديت ها نيز لينک وجود دارد
      1389/2/26
    • وب مبتنی بر داده های پيوندی
      • مشابه
        • يک پايگاه داده توزيع شده
      • طراحی شده
        • برای ماشين در ابتدا و سپس برای انسان
      • اشياء اوليه
        • موجوديت ها و يا توصيفی از موجوديت ها
      • لينک مابين
        • موجوديت ها
      • ميزان ساختار در موجوديت ها
        • بسيار بالا
      • معنای محتوا و لينک ها
        • به صورت واضح مشخص است .
      1389/2/26
    • تکنولوژی های مورد استفاده برای داده های پيوندی URI RDF HTTP (RDFS/OWL) تعدادی از انتولوژی های استاندارد ( FAOF, SKOS, etc ) SPARQL 1389/2/26
    • URI
      • روشی ساده برای شناسايي منابع در وب
      • شماهای مختلفی می تواند استفاده شود
        • FTP ، HTTP ، mailto:
      • تعدادی URI ها از موجوديت هاي واقعی
      • http://tomheath.com/id/me
      • http://eng.ui.ac.ir/~khosravi/hadi
      • http://dbpedia.org/resource/Talis_Group
      1389/2/26
    • RDF (Resource Description Framework)
      • فرمت داده ای برای توصيف موجوديت ها و روابط مابين آنها
      • subject -> predicate -> object
      • Hadi -> LivesIn -> Isfahan
      • hadi -> WorksFor -> ShaikhBahayi
      • <uri> -> <uri> -> <uri> or &quot;literal&quot;
      1389/2/26
    • Talis is Based Near Birmingham <http://dbpedia.org/resource/Talis_Group> <http://xmlns.com/foaf/0.1/based_near> <http://sws.geonames.org/3333125/> 1389/2/26
    • RDF Prefixes rc: <http://richard.cyganiak.de/foaf.rdf#> rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> foaf: <http://xmlns.com/foaf/0.1/> dbpedia: <http://dbpedia.org/resource/> dp: <http://dbpedia.org/property/> skos: <http://www.w3.org/2004/02/skos/core#> 1389/2/26
    • RDF 1389/2/26
    • SPARQL
            • زبان استانداردي براي پرس و جو بر روي آنتولوژي RDF است
            • اين زبان توسط w3c استاندارد شده و بسيار انعطاف پذير و قدرتمند است
            • مثال : تمام کلاسهايي که از کلاس دوربين ديجيتال مشتق مي شوند را نشان دهيد .
            • PREFIX foaf: <http://xmlns.com/foaf/0.1/>
            • SELECT ?name
            • WHERE { ?person foaf:name ?name . }
            • SELECT ?p ?o
            • { <http://nasa.dataincubator.org/spacecraft/1968-089A> ?p ?o }
      1389/2/26
    • SPARQL
            • PREFIX foaf: <http://xmlns.com/foaf/0.1/>
            • SELECT *
            • WHERE { ?person foaf:name ?name .
            • ?person foaf:mbox ?email . }
            • PREFIX foaf: <http://xmlns.com/foaf/0.1/>
            • SELECT ?craft ?homepage
            • { ?craft foaf:name &quot;Apollo 7&quot; .
            • ?craft foaf:homepage ?homepage }
      1389/2/26
    • SPARQL
            • PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
            • PREFIX type: <http://dbpedia.org/class/yago/>
            • PREFIX prop: <http://dbpedia.org/property/>
            • SELECT ?country_name ?population
            • WHERE { ?country a type:LandlockedCountries ;
            • rdfs:label ?country_name ;
            • prop:populationEstimate ?population .
            • FILTER (?population > 15000000) . }
      1389/2/26
    • FOAF: Friend of A Friend
      • يک RDF Vocabluary برای توصيف افراد :
        • نام، نام خانوادگی، و بقيه اطلاعات درباره شخص
        • علاقه های آنها
        • دوستان شخص
        • شبکه های اجتماعی
        • FOAF Ontology
      1389/2/26
    • SKOS: Simple Knowledge Organization System
      • يک RDF Vocabluary
      • برای مدل کردن و به اشتراک گذاری سيستمهای اطلاعاتی
      • SKOS:related
      • SKOS:Broader
      • SKOS:Collecion
      • مشاهده استاندارد
      1389/2/26
    • تکنولوژی های مورد استفاده در داده های پيوندی 1389/2/26
    • اصول داده های پيوندی ( Linked Data Principles ) 1389/2/26
    • The Web of Data The Linking Open Data Project LOD Project 1389/2/26
    • LOD project
      • پروژه ای است که با پشتيبانی W3C انجام شد
      • در سال 2007 شروع شد .
      • مجموعه داده های موجود در وب را گرفته و آنها را به فرمت RDF تبديل کردند .
      • داده ها را با داده های ديگر لينک دادند
      1389/2/26
    • مشارکت کنندگان • Massachusetts Institute of Technology (US) • University of Southampton (UK) • Freie Universitat Berlin (DE) • DERI (IE) • KMi, Open University (UK) • University of London (UK) • Universitat Hannover (DE) • University of Pennsylvania (US) • Universitat Leipzig (DE) • Universitat Karlsruhe (DE) • Joanneum (AT) • University of Toronto (CA) 1389/2/26 • BBC (UK) • Talis (UK) • Garlik (UK) • OpenLink (UK) • Thomson Reuters (US) • Zitgist (US) • Mondeca (FR) • Cyc Foundation (US)
    • 1389/2/26
    • فرايند ساخت DBPedia 1389/2/26
      • مثال ديگر: شهر برلين
    • فرايند ساخت DBPedia 1389/2/26
    • فرايند دسترسی به DBPedia 1389/2/26
      • Semantic Web browsers
        • Disco
        • Tabulator
        • OpenLink Data Web Browser
      • Semantic Web crawlers
        • SWSE
        • Swoogle
      • Semantic Web query
        • Semantic Web Client Library
        • SemWeb client
    • Geonames 1389/2/26
    • در ماه May 2007 1389/2/26
    • در July 2007 1389/2/26
    • در August 2007 1389/2/26
    • در November 2007 1389/2/26
    • در Feb 2008 1389/2/26
    • در Sep 2008 1389/2/26
    • در سال 2009 1389/2/26
    • LOD DataSet 1389/2/26
    • Linked Set in LOD 1389/2/26
    • 5 مرحله اساسی برای انتشار داده های پيوندی
      • فهم اصول انتشار داده ها ( Linked Data Principles )
      • شناخت داده هايي که می بايست انتشار يابند
      • انتخاب URI برای موجوديت ها در داده ها
      • ايجاد زيرساختار
      • پيوند ( لينک ) با ديگر داده ها
      1389/2/26
    • 1. Linked Data Principles
      • Use URIs as names for things
          • anything, not just documents
          • you are not your homepage
          • information resources and non-information resources
      • Use HTTP URIs
          • globally unique names, distributed ownership
          • allows people to look up those names
      • Provide useful information in RDF
          • when someone looks up a URI
      • Include RDF links to other URIs
          • to enable discovery of related information
      1389/2/26
    • 2. فهم داده ها
      • موجوديت های اساسي در داده ها را شناسايي کنيد
          • افراد
          • مکانها
          • عکس ها
          • فيلم ها
          • کتابها
          • مفاهيم
          • نظرات
          • مرورها
          • موسيقی
          • ....
      1389/2/26
    • 2. فهم داده ها
      • از چه واژه نامه ای برای توصيف اين داده ها استفاده شود
        • اصل
          • تا حد ممکن استفاده مجدد شود، در صورت نياز مجدد تعريف شود .
        • آنتولوژي های ممکن که می توانند مورد استفاده قرار گيرند
          • Geo
          • FOAF
          • GoodRelations
          • Review
          • SIOC
          • SKOS
          • Dbpedia
          • RDFS
      1389/2/26
    • 3. انتخاب URI برای موجوديت های شناسايي • http://dbpedia.org/resource/New_York_City ← Thing • http://dbpedia.org/data/New_York_City ← RDF data • http://dbpedia.org/page/New_York_City ← HTML page • http://kmi.open.ac.uk/people/tom/ ← Thing • http://kmi.open.ac.uk/people/tom/rdf ← RDF data • http://kmi.open.ac.uk/people/tom/html ← HTML page 1389/2/26
    • 4. لينک به ديگر داده ها
      • تعدادی از predicate های معروف برای لينک دادن
      • owl:sameAs
      • foaf:homepage
      • foaf:topic
      • foaf:based_near
      • foaf:maker/foaf:made
      • foaf:depiction
      • foaf:primaryTopic
      • rdfs:seeAlso
      1389/2/26
    • 4. لينک دادن به مجموعه داده های ديگر
      • الگوريتم های لينک دهی
        • تطابق رشته ای ( String Matching )
        • تطابق مبتنی بر کليد مشترک
          • مثلا ISBN و UNSPSC
        • تطابق مبتنی بر خصوصيات
          • اگر دو موجوديت دارای برچسب يکسان، نوع يکسان و ... يکسان باشند
      1389/2/26
    • چرا داده های پيوندی انتشار يابند؟
      • سادگی يافتن
      • سادگی مصرف
        • اشتراک داده به صورت استاندارد
      • کاهش تکرار
      • ارزش افزوده
      1389/2/26
    • مزايای داده های پيوندی
      • روش برای انتشار داده ها بر روی وب ( Publishing Data )
        • استفاده مجدد را بالا می برد
        • تکرار را کاهش می دهد .
        • سادگي مصرف، اشتراک داده به صورت استاندارد
        • اتصالات داخلی را افزايش می دهد .
        • باعث افزايش ارزش برای داده ها می شود .
      1389/2/26
    • 1389/2/26 Linked Data Applications
    • تعدادی از برنامه های که از داده های پيوندی استفاده می کنند 1389/2/26
    • تعدادی از ابزارهای توسعه يافته شده
      • مرورگرها
        • Marbles & DBPedia Mobile
      • جستجو
        • با استفاده از Falcons
      • Mashup
        • Revyu ، BBC Music
      1389/2/26
    • لايه اول : RDFa ، GRDDL و SPARQL
      • RDFa
      1389/2/26
    • توصيف يک مقاله با استفاده از RDFa 1389/2/26
    • توصيف يک عکس با استفاده از RDFa 1389/2/26
    • توصيف يک شخص در سند با استفاده از RDFa 1389/2/26
    • آينده داده های پيوندی
      • همه گير شدن استفاده از تکنولوژی نياز به زمان و شرايط محيطی دارد .
      • در سال 2010 داده های پيوندی در حوزه های دولتی و سازمانی اعمال خواهد شد
      • در سال 2011 ابزارها و کتابخانه های داده های پيوندی همه گير خواهد شد . برنامه نويسان از LOD در برنامه هايشان همچون يک پايگاه داده محلی استفاده می کنند .
      • در سال 2012 هزاران مجموعه داده LOD به وجود خواهد آمد . و مسايل مربوط به Provanance و مجموعه داده های پويا حل خواهد شد .
      • Special Issue of Web Semantic Journal Sep 2010
      • در سال 2013 راه حلهای مبتنی بر داده های پيوندی به عنوان راه حلهايي SOA سازمانها خواهد شد .
      • در سال 2014 داده های پيوندی همچون يک درس ابتدايي خواهد شد .
        • بازی تمام شده است
        • معما چو حل گشت آسان شود .
      1389/2/26
    • ؟ 1389/2/26
    • / با تشکر از حُسن توجه شما 1389/2/26
    • 59 رتبه بندی در داده های پيوندی
      • موتورهای جستجو در وب سنتی دارای بخشي برای رتبه بندی هستند
      • در وب ستنی، هدف اصلي رتبه بندی اسناد است
      • در وب جديد، هدف اصلی رتبه بندی موجوديت ها است .
      • هر چقدر لينک به يک موجوديت بيشتر شود احتمالا آن موجوديت در بين موجوديت های مشابه خودش دارای اعتبار بيشتری است .
      • علاوه بر تعداد لينک به يک داده در اين ساختار، معيارهای ديگری نيز لازم است مدنظر قرار گيرند . اين که يک داده چقدر اعتبار دارد، چفدر به روز است، منشا آن کجاست و مفاهيم ديگری که همگی مرتبط با کيفيت داده است می تواند در رتبه بندی مفاهيم مدنظر باشد .
      1389/2/26
    • 1389/2/26 موتور جستجوی مبتنی بر داده های پيوندی