Обработка слабоструктурированных веб-документов на основе облачных технологий  S emant i c Social Web Яблонский Сергей Але...
<ul><li>Social Web (Web 2.0) </li></ul><ul><li>Semantic Web (Web 3.0) </li></ul><ul><li>Semantic Social Web (Web 2.0+3.0) ...
<ul><li>Social Web (Web 2.0) </li></ul><ul><li>Semantic Web (Web 3.0) </li></ul><ul><li>Semantic Social Web (Web 2.0+3.0) ...
Эволюция сетей  WWW
<ul><ul><li>Web  1.0  – объединение в информационные сети (этап пройден, информация постоянно пополняется); </li></ul></ul...
<ul><li>Информационный взрыв Социального Веба ! </li></ul>image from tinyurl.com/nuketest
<ul><li>Boom! </li></ul>
 
 
<ul><li>http://map.web2summit.com/ </li></ul>
 
<ul><li>61% =  социальные сети </li></ul><ul><li>11% =  форумы </li></ul><ul><li>11% =  создаваемый пользователями  </li><...
 
 
 
Social websites are like data silos image from pidgintech.com
Нужны способы объединения  image from pidgintech.com
Данных и пользователей  image from pidgintech.com
<ul><li>Social Web (Web 2.0) </li></ul><ul><li>Semantic Web (Web 3.0) </li></ul><ul><li>Semantic Social Web (Web 2.0+3.0) ...
Эволюция сетей  WWW
Tim Berners-Lee, The 1st World Wide Web Conference, Geneva, May 1994 <ul><li>To a computer, the Web is a flat, boring worl...
<ul><ul><li>Переход от  «читаемых человеком»  к  «читаемых компьютером» (machine readable)  документам на основе технологи...
The Semantic Web stack image from  www.w3.org/2007/03/layerCake.png
Semantic Web <ul><li>Базовая модель  Semantic Web  включает следующие компоненты:  </li></ul><ul><ul><li>URI/ IRI  – униве...
Представление знаний   в  SW
RDF <ul><li>URIs identify resources: </li></ul><ul><ul><li>How do we define assertions about these resources? </li></ul></...
RDF  пример  <ul><li>@prefix dct: <http://purl.org/dc/terms/> .  </li></ul><ul><li><http://example.org/dm110-semweb> </li>...
Онтологии состоят из  classes  и  properties <ul><ul><li>:Person a rdfs:Class . </li></ul></ul><ul><ul><li>:father a rdfs:...
Metadata and ontologies
Известные онтологии <ul><li>Social networks and social data:  </li></ul><ul><ul><li>FOAF, SIOC </li></ul></ul><ul><li>Soft...
<ul><li>Social Web (Web 2.0) </li></ul><ul><li>Semantic Web (Web 3.0) </li></ul><ul><li>Semantic Social Web (Web 2.0+3.0) ...
The S emantic S ocial Web
Linked Data <ul><li>Building a “Web of  Data ” to enhance the current Web </li></ul><ul><li>The Linking Open Data (LOD) pr...
The LOD cloud 2008 2007
The LOD cloud 2009 2008
image from  richard.cyganiak.de/2007/10/lod/lod-datasets_2009-07-14.png
LOD
LOD
LOD
 
 
<ul><li>Данные о 2.6 миллионах “вещей” (things), </li></ul><ul><li>включая </li></ul><ul><li>213,000 персоналий ; </li></u...
Wikipedia
<ul><li>Найти всех, родившихся в 19 веке в Берлине. </li></ul>SPARQL
 
<ul><li>DBpedia  ( L OD-версия  Wikipedia , www.wikipedia.org/), включающая:  </li></ul><ul><ul><li>3.5 млн сущностей, в т...
<ul><li>Freebase (www.freebase.com/)  – аналогична DBpedia, но в 10 раз меньше при значительно лучшем качестве данных;  </...
<ul><li>YAGO  ( http :// www . mpi - inf . mpg . de / yago - naga / yago /) – это онтология, связывающая  Wikipedia с  Wor...
<ul><li>W 3 C WordNet   ( http :// www . w 3. org / TR / wordnet - rdf /) –  RDF/OWL   представление лексической онтологии...
<ul><li>Open Government Data :   </li></ul><ul><ul><li>Data . gov  – 2400 наборов данных (но только 400 из них в настоящее...
Friend Of A Friend (FOAF)
 
<ul><li>An ontology for describing people and the relationships that exist between them: </li></ul><ul><ul><li>http://foaf...
FOAF (Friend-of-a-Friend)
FOAF (Friend-of-a-Friend)
FOAF at a glance
FOAF from Flickr
FOAF from Twitter
Экспорт  FOAF  данных <ul><li>Facebook: </li></ul><ul><ul><li>http://www.dcs.shef.ac.uk/~mrowe/foafgenerator.html </li></u...
Определение связей на основе  FOAF
Кросс-сайтовые социальные рекомендации  FOAF
Semantically-Interlinked Online Communities (SIOC)
 
Некоторые онтологические классы и свойства  SIOC
Объединение  SIOC  и  FOAF
 
Разъединенные сайты  Social Web / Web 2.0  могут быть    связаны   на основе  Semantic Web   / Web 3.0  словарей
 
 
Web 1.0
Web  2 .0
Web 2.0 + 3.0
<ul><li>Social Web (Web 2.0) </li></ul><ul><li>Semantic Web (Web 3.0) </li></ul><ul><li>Semantic Social Web (Web 2.0+3.0) ...
Information Extraction
<ul><li>Под извлечением информации традиционно понимается извлечение из текста  </li></ul><ul><li>именованных сущностей  (...
IE Systems
IE Systems
 
IE Systems
<ul><li>Avatar:  Semantic search on personal emails </li></ul><ul><li>DBLife:  Use IE to build a knowledge base about data...
<ul><li>Enterprise Semantic Search </li></ul><ul><li>Enterprise Data as a Service </li></ul><ul><li>Business Intelligence ...
Enterprise Semantic Search
Enterprise Data as a Service
Business Intelligence
Business Intelligence
Data-Driven Mashups
 
 
 
 
 
GATE
<ul><li>IBM project (2005) for information extraction (named entities) in textual data </li></ul><ul><li>IBM UIMA (v1.4) <...
UIMA
UIMA
<ul><li>2006 -   Incubation at the ASF (Apache Software Foundation) (v2.2) </li></ul><ul><li>2009 -  OASIS Members Approve...
<ul><li>XML Metadata Interchange (XMI) </li></ul><ul><ul><li>XML language to represent MOF (Meta-Object Facility) </li></u...
OASIS Specification
<ul><li>Development API  : Java, C++ but Perl, Python,TCL...  </li></ul><ul><li>Bean Scripting Framework (BSF) Annotators ...
<ul><li>wrappers for GATE  (IBM UIMA) (Hamish Cunningham – University of Sheeld) </li></ul><ul><li>wrappers for OpenNLP To...
<ul><li>Apache UIMA Sandbox  - Regular Expression Annotator </li></ul><ul><li>WEKA for IBM UIMA  - Machine Learning </li><...
<ul><li>IBM Semantic Search , a Free Apache version is developed by IBM </li></ul><ul><li>IBM OmniFind Enterprise Search ,...
UIMA
<ul><li>OASIS Specification  http://docs.oasis-open.org/uima/v1.0/cd01/uima-spec-cd-01.html </li></ul><ul><li>Apache UIMA ...
<ul><li>Social Web (Web 2.0) </li></ul><ul><li>Semantic Web (Web 3.0) </li></ul><ul><li>Semantic Social Web (Web 2.0+3.0) ...
Эволюция ИТ “ Clouds will transform the information technology (IT) industry… profoundly change the way people work and co...
Gartner Hypercycle
<ul><li>Облачные сервисы (Cloud  Services )  –  это товары, услуги и решения для потребителей и предпринимателей, которые ...
<ul><li>К настоящему времени можно выделить три основных вида о блачных вычислений : </li></ul><ul><ul><li>инфраструктура ...
Облачная экосистема
Облачная экосистема Cloud   Applications (Apps-as-a-Service) Cloud (Application)   Platforms (Platform-as-a-Service) Cloud...
Облачные сервисы
<ul><li>Облачная платформа  превращает ресурс в услугу :  IaaS, PaaS, SaaS </li></ul><ul><li>Облачная платформа  автоматиз...
Web  2 .0
Web 2.0 + 3.0
<ul><li>www.opencalais.com/ </li></ul><ul><ul><li>50.000  API calls, content - 100K </li></ul></ul><ul><li>Zemanta  </li><...
http://aws.amazon.com/
 
Cloud  IE
 
 
Благодарю за внимание. Вопросы ?
Upcoming SlideShare
Loading in...5
×

Обработка слабоструктурированных веб-документов на основе облачных технологий Semantic Social Web

1,022

Published on

Яблонский Сергей Александрович
СПбГУ

0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
1,022
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
38
Comments
0
Likes
2
Embeds 0
No embeds

No notes for slide
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • FIX THE TRIPLES
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • мроьаьо
  • Обработка слабоструктурированных веб-документов на основе облачных технологий Semantic Social Web

    1. 1. Обработка слабоструктурированных веб-документов на основе облачных технологий S emant i c Social Web Яблонский Сергей Александрович СПбГУ y ablonsky. [email_address]
    2. 2. <ul><li>Social Web (Web 2.0) </li></ul><ul><li>Semantic Web (Web 3.0) </li></ul><ul><li>Semantic Social Web (Web 2.0+3.0) </li></ul><ul><li>IE + c лабоструктурированные веб-документы </li></ul><ul><li>IE + Облачные технологии </li></ul>
    3. 3. <ul><li>Social Web (Web 2.0) </li></ul><ul><li>Semantic Web (Web 3.0) </li></ul><ul><li>Semantic Social Web (Web 2.0+3.0) </li></ul><ul><li>IE + c лабоструктурированные веб-документы </li></ul><ul><li>IE + Облачные технологии </li></ul>
    4. 4. Эволюция сетей WWW
    5. 5. <ul><ul><li>Web 1.0 – объединение в информационные сети (этап пройден, информация постоянно пополняется); </li></ul></ul><ul><ul><li>Web 2.0 – объединение в социальные сети – Social Web (пройден, социальные сети стали реальностью и стремительно растут); </li></ul></ul><ul><ul><li>Web 3.0 – объединение в семантические сети – S emantic Web (начинается сейчас); </li></ul></ul><ul><ul><li>Web 4.0 – такое объединение информационных, социальных и семантических сетей, когда и люди, и компьютеры в сети смогут общаться и получать знания наравне друг с другом (перспектива). </li></ul></ul>WEB 1.0, 2.0, 3.0, 4.0 (?)
    6. 6. <ul><li>Информационный взрыв Социального Веба ! </li></ul>image from tinyurl.com/nuketest
    7. 7. <ul><li>Boom! </li></ul>
    8. 10. <ul><li>http://map.web2summit.com/ </li></ul>
    9. 12. <ul><li>61% = социальные сети </li></ul><ul><li>11% = форумы </li></ul><ul><li>11% = создаваемый пользователями </li></ul><ul><li>контент - > urbandictionary.com </li></ul><ul><li>10% = создаваемые пользователями </li></ul><ul><li>рынки и классификаторы - > craigslist.org </li></ul><ul><li>03% = блоги </li></ul><ul><li>01% = создаваемые пользователями обзоры - > apartmentratings.com </li></ul><ul><li>01% = вики </li></ul><ul><li>02% = прочее </li></ul>
    10. 16. Social websites are like data silos image from pidgintech.com
    11. 17. Нужны способы объединения image from pidgintech.com
    12. 18. Данных и пользователей image from pidgintech.com
    13. 19. <ul><li>Social Web (Web 2.0) </li></ul><ul><li>Semantic Web (Web 3.0) </li></ul><ul><li>Semantic Social Web (Web 2.0+3.0) </li></ul><ul><li>IE + c лабоструктурированные веб-документы </li></ul><ul><li>Облачные технологии </li></ul>
    14. 20. Эволюция сетей WWW
    15. 21. Tim Berners-Lee, The 1st World Wide Web Conference, Geneva, May 1994 <ul><li>To a computer, the Web is a flat, boring world, devoid of meaning. This is a pity, as in fact documents on the Web describe real objects and imaginary concepts, and give particular relationships between them. […] Adding semantics to the Web involves two things: allowing documents which have information in machine-readable forms , and allowing links to be created with relationship values . Only when we have this extra level of semantics will we be able to use computer power to help us exploit the information to a greater extent than our own reading. </li></ul>
    16. 22. <ul><ul><li>Переход от «читаемых человеком» к «читаемых компьютером» (machine readable) документам на основе технологий SW стал одним из важнейших путей дальнейшего развития WWW . </li></ul></ul>Semantic Web – Web 3.0
    17. 23. The Semantic Web stack image from www.w3.org/2007/03/layerCake.png
    18. 24. Semantic Web <ul><li>Базовая модель Semantic Web включает следующие компоненты: </li></ul><ul><ul><li>URI/ IRI – универсальный идентификатор ресурсов; </li></ul></ul><ul><ul><li>расширяемый язык разметки (XML) ; </li></ul></ul><ul><ul><li>общая схема описания ресурсов RDF; </li></ul></ul><ul><ul><li>метаданные и схема RDF Schema (RDFS); </li></ul></ul><ul><ul><li>онтологии и языки их описания ( OWL : OWL Lite , OWL DL , OWL Full ); </li></ul></ul><ul><ul><li>метаданные и схема OWL Schema ( OWL S); </li></ul></ul><ul><ul><li>язык запросов SPAROL к RDF-хранилищам; </li></ul></ul><ul><ul><li>агенты/сервисы WSDL и схемы WSDL S и пр. </li></ul></ul><ul><li>Консорциум W3C предложил и использует стандарты практически </li></ul><ul><li>по всем компонентам SW ( Berners - Lee , 2003). </li></ul>
    19. 25. Представление знаний в SW
    20. 26. RDF <ul><li>URIs identify resources: </li></ul><ul><ul><li>How do we define assertions about these resources? </li></ul></ul><ul><li>We use RDF (Resource Description Framework): </li></ul><ul><ul><li>A data model; a directed, labeled graph using URIs </li></ul></ul><ul><ul><li>Various serialisations (RDF/XML, N3, RDFa, etc.) </li></ul></ul><ul><li>RDF is based on triples: </li></ul><ul><ul><li><subject> <predicate> <object> </li></ul></ul>
    21. 27. RDF пример <ul><li>@prefix dct: <http://purl.org/dc/terms/> . </li></ul><ul><li><http://example.org/dm110-semweb> </li></ul><ul><li>dct:title “ Introduction to the Semantic Web” ; </li></ul><ul><li>dct:author <http://apassant.net/alex> ; </li></ul><ul><li>dct :subject < http://dbpedia.org/resource/Semantic_Web> . </li></ul>
    22. 28. Онтологии состоят из classes и properties <ul><ul><li>:Person a rdfs:Class . </li></ul></ul><ul><ul><li>:father a rdfs:Property . </li></ul></ul><ul><ul><li>:father rdfs:domain :Person . </li></ul></ul><ul><ul><li>:father rdfs:range :Person . </li></ul></ul>
    23. 29. Metadata and ontologies
    24. 30. Известные онтологии <ul><li>Social networks and social data: </li></ul><ul><ul><li>FOAF, SIOC </li></ul></ul><ul><li>Software development: </li></ul><ul><ul><li>DOAP, BEATLE </li></ul></ul><ul><li>Comprehensive / top-level: </li></ul><ul><ul><li>Yago, OpenCYC </li></ul></ul><ul><li>Lexical ontologies </li></ul><ul><ul><li>WordNet </li></ul></ul><ul><li>Taxonomies and controlled vocabularies: </li></ul><ul><ul><li>SKOS </li></ul></ul>
    25. 31. <ul><li>Social Web (Web 2.0) </li></ul><ul><li>Semantic Web (Web 3.0) </li></ul><ul><li>Semantic Social Web (Web 2.0+3.0) </li></ul><ul><li>IE + c лабоструктурированные веб-документы </li></ul><ul><li>IE + Облачные технологии </li></ul>
    26. 32. The S emantic S ocial Web
    27. 33. Linked Data <ul><li>Building a “Web of Data ” to enhance the current Web </li></ul><ul><li>The Linking Open Data (LOD) project: </li></ul><ul><ul><li>http://linkeddata.org/ </li></ul></ul><ul><ul><li>Translating existing datasets into RDF and linking them together, for example DBpedia (Wikipedia) and GeoNames, Freebase, BBC programmes, etc. </li></ul></ul><ul><ul><li>Governement data also available as Linked Data </li></ul></ul>
    28. 34. The LOD cloud 2008 2007
    29. 35. The LOD cloud 2009 2008
    30. 36. image from richard.cyganiak.de/2007/10/lod/lod-datasets_2009-07-14.png
    31. 37. LOD
    32. 38. LOD
    33. 39. LOD
    34. 42. <ul><li>Данные о 2.6 миллионах “вещей” (things), </li></ul><ul><li>включая </li></ul><ul><li>213,000 персоналий ; </li></ul><ul><li>328,000 мест ; </li></ul><ul><li>57,000 музыкальных альбомов ; </li></ul><ul><li>36,000 фильмов ; </li></ul><ul><li>20,000 компаниях. </li></ul><ul><li>Всего 274 миллионов RDF триплетов, в том числе </li></ul><ul><li>609,000 ссылок на изображения ; </li></ul><ul><li>3,150,000 ссылок на внешние веб-страницы ; </li></ul><ul><li>4 878 100 ссылок на данные во внешних RDF наборах . </li></ul>Wikipedia
    35. 43. Wikipedia
    36. 44. <ul><li>Найти всех, родившихся в 19 веке в Берлине. </li></ul>SPARQL
    37. 46. <ul><li>DBpedia ( L OD-версия Wikipedia , www.wikipedia.org/), включающая: </li></ul><ul><ul><li>3.5 млн сущностей, в том числе 410000 описаний мест ( places ), 3100000 персоналий ( persons ), 146000 видов, 1400000 организаций, 950000 музыкальных альбомов, 50000 фильмов, 33000 строений, 150000 видеоигр, 5000 заболеваний; </li></ul></ul><ul><ul><li>описания на 90 языках; </li></ul></ul><ul><ul><li>1 млрд RDF -триплетов, 10 млн связей с внешними RDF -наборами данных из L O D; </li></ul></ul><ul><ul><li>онтологию, содержащую 260 классов, 1200 свойств, 3.5 млн экземпляров; </li></ul></ul>DBpedia
    38. 47. <ul><li>Freebase (www.freebase.com/) – аналогична DBpedia, но в 10 раз меньше при значительно лучшем качестве данных; </li></ul><ul><li>OpenCyc ( http :// www . cyc . com / cyc / opencyc ) ─ часть базы знаний Cyc, которая является собственностью компании Cycorp, Inc , вошла в состав LOD . Последняя версия OpenCyc, 1.0 была выпущена в июле 2006 г. и включает в себя полную онтологию Cyc из сотни тысяч выражений. База знаний содержит 470000 концепций и 306000 экземпляров-фактов. Стратегическая цель компании Cycorp, Inc , – создать полностью открытую, свободно распространяемую базу знаний для использования в Web 3.0; </li></ul>Freebase и OpenCyc
    39. 48. <ul><li>YAGO ( http :// www . mpi - inf . mpg . de / yago - naga / yago /) – это онтология, связывающая Wikipedia с WorldNet ; состоит из более 2 млн сущностей (persons, organizations, cities, etc.) и 20 млн фактов-экземпляров об этих сущностях; </li></ul><ul><li>UMBEL (Upper Mapping and Binding Exchange Layer, www . umbel . org /) – подмножество 20000 концептов OpenCyc , обеспечивающее связь с YAGO и DBpedia и возможность логического вывода на основе Cyc ; </li></ul>YAGO и UMBEL
    40. 49. <ul><li>W 3 C WordNet ( http :// www . w 3. org / TR / wordnet - rdf /) – RDF/OWL представление лексической онтологии WordNet в LD; </li></ul><ul><li>GeoNames ( http :// www . geonames . org /) – содержит информацию о 6 млн мест (places); </li></ul><ul><li>MusicBrainz ( musicbrainz . org /) – содержит информацию о 55000 артистов, 220000 альбомов, 36 млн RDF -триплетов; </li></ul>
    41. 50. <ul><li>Open Government Data : </li></ul><ul><ul><li>Data . gov – 2400 наборов данных (но только 400 из них в настоящее время представлены в виде RDF -триплетов), 6.5 млрд триплетов/ 0.5 млрд сущностей; </li></ul></ul><ul><ul><li>Data . gov . uk 3 тыс. наборов данных; </li></ul></ul><ul><ul><li>Data Publica 2 тыс. наборов данных; </li></ul></ul><ul><ul><li>Eurostat 4 тыс. наборов данных; </li></ul></ul><ul><ul><li>OpenGovData.ru ( http :// opengovdata . ru /) – это российский некоммерческий проект, точных статистических данных пока не получено. </li></ul></ul>
    42. 51. Friend Of A Friend (FOAF)
    43. 53. <ul><li>An ontology for describing people and the relationships that exist between them: </li></ul><ul><ul><li>http://foaf-project.org/ </li></ul></ul><ul><ul><li>Identity, personal profiles and social networks </li></ul></ul><ul><ul><li>Can be integrated with other SW vocabularies </li></ul></ul><ul><li>FOAF on the Web: </li></ul><ul><ul><li>LiveJournal, MyOpera, identi.ca, MyBlogLog, hi5, Fotothing, Videntity, FriendFeed, Ecademy, Typepad </li></ul></ul>FOAF (Friend-of-a-Friend )
    44. 54. FOAF (Friend-of-a-Friend)
    45. 55. FOAF (Friend-of-a-Friend)
    46. 56. FOAF at a glance
    47. 57. FOAF from Flickr
    48. 58. FOAF from Twitter
    49. 59. Экспорт FOAF данных <ul><li>Facebook: </li></ul><ul><ul><li>http://www.dcs.shef.ac.uk/~mrowe/foafgenerator.html </li></ul></ul><ul><li>Twitter: </li></ul><ul><ul><li>http://semantictweet.com/ </li></ul></ul><ul><li>Flickr: </li></ul><ul><ul><li>http://apassant.net/blog/2007/12/18/rdf-export-flickr-profiles-foaf-and-sioc/ </li></ul></ul><ul><li>и др. (Drupal 7, WordPress plug-ins, .. .) </li></ul>
    50. 60. Определение связей на основе FOAF
    51. 61. Кросс-сайтовые социальные рекомендации FOAF
    52. 62. Semantically-Interlinked Online Communities (SIOC)
    53. 63.
    54. 65. Некоторые онтологические классы и свойства SIOC
    55. 66. Объединение SIOC и FOAF
    56. 68. Разъединенные сайты Social Web / Web 2.0 могут быть связаны на основе Semantic Web / Web 3.0 словарей
    57. 71. Web 1.0
    58. 72. Web 2 .0
    59. 73. Web 2.0 + 3.0
    60. 74. <ul><li>Social Web (Web 2.0) </li></ul><ul><li>Semantic Web (Web 3.0) </li></ul><ul><li>Semantic Social Web (Web 2.0+3.0) </li></ul><ul><li>IE + c лабоструктурированные веб-документы </li></ul><ul><li>Облачные технологии </li></ul>
    61. 75. Information Extraction
    62. 76. <ul><li>Под извлечением информации традиционно понимается извлечение из текста </li></ul><ul><li>именованных сущностей (люди, организации, компании, местоположение, книги, альбомы, авторы и пр.; всего более 250 классов), </li></ul><ul><li>фактов (позиция, образование и пр.), </li></ul><ul><li>событий (спорт, управление, изменения, IPO – Initial Public Offering – первоначальное публичное предложение акций компании на продажу, трудовые действия и пр.), </li></ul><ul><li>отношений между сущностями и ряда других. </li></ul>Information Extraction
    63. 77. IE Systems
    64. 78. IE Systems
    65. 80. IE Systems
    66. 81. <ul><li>Avatar: Semantic search on personal emails </li></ul><ul><li>DBLife: Use IE to build a knowledge base about database researchers </li></ul><ul><li>AliBaba: IE over medical research papers </li></ul>IE Systems
    67. 82. <ul><li>Enterprise Semantic Search </li></ul><ul><li>Enterprise Data as a Service </li></ul><ul><li>Business Intelligence </li></ul><ul><li>Data-driven Enterprise Mashups </li></ul>New IE Systems
    68. 83. Enterprise Semantic Search
    69. 84. Enterprise Data as a Service
    70. 85. Business Intelligence
    71. 86. Business Intelligence
    72. 87. Data-Driven Mashups
    73. 93. GATE
    74. 94. <ul><li>IBM project (2005) for information extraction (named entities) in textual data </li></ul><ul><li>IBM UIMA (v1.4) </li></ul><ul><li>OmniFind (semantic search engine) et DB2 Data Warehouse </li></ul>UIMA
    75. 95. UIMA
    76. 96. UIMA
    77. 97. <ul><li>2006 - Incubation at the ASF (Apache Software Foundation) (v2.2) </li></ul><ul><li>2009 - OASIS Members Approve Open Standard for Accessing Unstructured Information (data model, component interface, ...) </li></ul><ul><ul><li>IBM, EMC, Carnegie Mellon University, University of Manchester, University of Tokyo, U.S. National Center for Supercomputing Applications, ... and Others Collaborate on Platform for Semantic Analysis and Search </li></ul></ul><ul><ul><li>http://docs.oasis-open.org/uima/v1.0/os/uima-spec-os.html </li></ul></ul>UIMA
    78. 98. <ul><li>XML Metadata Interchange (XMI) </li></ul><ul><ul><li>XML language to represent MOF (Meta-Object Facility) </li></ul></ul><ul><li>OMG (Object Management Group) standards to exchange UML metadata </li></ul><ul><ul><li>Импорт / Экспорт ииз любой DB </li></ul></ul><ul><ul><li>Пример : JDBC for Apache Derby DataBase </li></ul></ul>UIMA
    79. 99. OASIS Specification
    80. 100. <ul><li>Development API : Java, C++ but Perl, Python,TCL... </li></ul><ul><li>Bean Scripting Framework (BSF) Annotators , (http ://jakarta.apache.org/bsf) : Beanshell, Rhino Javascript, Jython, Jruby </li></ul><ul><li>Deployment in REST service (Representational StateTransfer) HTTP + URL + XML/HTML/GIF/JPEG/etc (Resource Representations) + mime type </li></ul>UIMA
    81. 101. <ul><li>wrappers for GATE (IBM UIMA) (Hamish Cunningham – University of Sheeld) </li></ul><ul><li>wrappers for OpenNLP Tools </li></ul><ul><li>wrapper for LingPipe </li></ul><ul><li>JULIE Lab NLP Toolsuite </li></ul><ul><li>IBM LanguageWare on Alphaworks </li></ul>NLP UIMA
    82. 102. <ul><li>Apache UIMA Sandbox - Regular Expression Annotator </li></ul><ul><li>WEKA for IBM UIMA - Machine Learning </li></ul><ul><li>TextMarker Rule-based information extraction </li></ul><ul><li>Apache UIMA Sandbox </li></ul><ul><ul><li>Tika Annotator </li></ul></ul><ul><ul><li>Cas Editor </li></ul></ul><ul><ul><li>Dictionary Annotator, Concept Mapper </li></ul></ul>UIMA
    83. 103. <ul><li>IBM Semantic Search , a Free Apache version is developed by IBM </li></ul><ul><li>IBM OmniFind Enterprise Search , </li></ul><ul><li>Yahoo ! Edition index documents based on Lucene </li></ul><ul><li>u-compare.org a web-based integrated platform for the purpose of sharing and comparing UIMA components and tools, including visualizers and utilities </li></ul><ul><li>bio-nlp number of popular bio-informatic annotators as UIMA components wrapped by the center of Computational Pharmacology at the University of Colorodo </li></ul><ul><li>Semantic Web ? </li></ul>Приложения для UIMA
    84. 104. UIMA
    85. 105. <ul><li>OASIS Specification http://docs.oasis-open.org/uima/v1.0/cd01/uima-spec-cd-01.html </li></ul><ul><li>Apache UIMA http://incubator.apache.org/uima/ </li></ul><ul><li>Getting started http://incubator.apache.org/ </li></ul>
    86. 106. <ul><li>Social Web (Web 2.0) </li></ul><ul><li>Semantic Web (Web 3.0) </li></ul><ul><li>Semantic Social Web (Web 2.0+3.0) </li></ul><ul><li>IE + c лабоструктурированные веб-документы </li></ul><ul><li>IE + Облачные технологии </li></ul>
    87. 107. Эволюция ИТ “ Clouds will transform the information technology (IT) industry… profoundly change the way people work and companies operate.”
    88. 108. Gartner Hypercycle
    89. 109. <ul><li>Облачные сервисы (Cloud Services ) – это товары, услуги и решения для потребителей и предпринимателей, которые поставляются и потребляются в режиме реального времени через Интернет. </li></ul><ul><li>Облачные вычисления (Cloud Computing) – это новая модель разработки, развертывания и доставки облачных сервисов. </li></ul>Облачные вычисления
    90. 110. <ul><li>К настоящему времени можно выделить три основных вида о блачных вычислений : </li></ul><ul><ul><li>инфраструктура как сервис ( Infrastructure as a Service, IaaS ); </li></ul></ul><ul><ul><li>платформа как сервис ( Platform as a Service, PaaS ); </li></ul></ul><ul><ul><li>программное обеспечение как сервис ( Software as a Service, SaaS ). </li></ul></ul>Виды “ облаков ”
    91. 111. Облачная экосистема
    92. 112. Облачная экосистема Cloud Applications (Apps-as-a-Service) Cloud (Application) Platforms (Platform-as-a-Service) Cloud Infrastructure (Infrastructure-as-a-Service) App Deploy App Dev/Test
    93. 113. Облачные сервисы
    94. 114. <ul><li>Облачная платформа превращает ресурс в услугу : IaaS, PaaS, SaaS </li></ul><ul><li>Облачная платформа автоматизирована </li></ul><ul><li>Облачная платформа автономна </li></ul><ul><li>Ресурсы в облаке измеряемы </li></ul><ul><li>Облако управляемо из приложений ( PaaS ) </li></ul>Облако, как корпоративная платформа
    95. 115. Web 2 .0
    96. 116. Web 2.0 + 3.0
    97. 117. <ul><li>www.opencalais.com/ </li></ul><ul><ul><li>50.000 API calls, content - 100K </li></ul></ul><ul><li>Zemanta </li></ul><ul><ul><li>1.000 API calls, content - 8K </li></ul></ul>Services
    98. 118. http://aws.amazon.com/
    99. 120. Cloud IE
    100. 123. Благодарю за внимание. Вопросы ?
    1. A particular slide catching your eye?

      Clipping is a handy way to collect important slides you want to go back to later.

    ×