Your SlideShare is downloading. ×
0
×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

Zastosowanie technologii semantycznych w porządkowaniu wiedzy / Jolanta Szulc

189

Published on

II Konferencja Naukowa : Nauka o informacji (informacja naukowa) w okresie zmian, Warszawa, 15-16.04.2013 r. Instytut Informacji Naukowej i Studiów Bibliologicznych, Uniwersytet Warszawski …

II Konferencja Naukowa : Nauka o informacji (informacja naukowa) w okresie zmian, Warszawa, 15-16.04.2013 r. Instytut Informacji Naukowej i Studiów Bibliologicznych, Uniwersytet Warszawski

The 2nd Scientific Conference : Information Science in an Age of Change, April 15-16, 2013. Institute of Information and Book Studies, University of Warsaw

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
189
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
0
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. ZASTOSOWANIE TECHNOLOGIISEMANTYCZNYCH WPORZĄDKOWANIU WIEDZY.PRZEGLĄD ROZWIĄZAŃJolanta SzulcKonferencja nt. "Nauka o informacji (informacja naukowa)w okresie zmian„Warszawa 2013
  • 2. CEL PREZENTACJICelem badania jest przedstawienie wybranych technologiisemantycznych, które znajdują wielorakie zastosowaniapraktyczne w porządkowaniu wiedzy.
  • 3. PLAN PREZENTACJI Wstęp Technologie semantyczne• grafy i wykresy semantyczne• sieci semantyczne wykorzystywane do przetwarzania językanaturalnego• sieci semantyczne łączone z metatezaurusami• ramy semantyczne• semantyczne klasyfikacje• systemy hybrydowe Podsumowanie i wnioski
  • 4. WPROWADZENIE
  • 5. OKREŚLENIA I DEFINICJENa potrzeby badań przyjęto następującą definicję siecisemantycznej:Sieć semantyczna jest rozszerzeniem dzisiejszej sieciWeb, w której informacja ma dobrze zdefiniowaneznaczenie, przez co umożliwi lepszą współpracę komputerówi ludzi(T. Berners-Lee, J. Hendler, O. Lassila, 2001).Technologie semantyczne są to zaawansowane narzędziainformatyczne pozwalające na efektywne zarządzaniedanymi, których kluczową cechą jest możliwośćuwzględniania kontekstu i różnorodnych relacji. Cecha tapozwala na zarządzanie danymi, informacjami oraz wiedzą.
  • 6. TECHNOLOGIE SEMANTYCZNE
  • 7. GRAFY I WYKRESY SEMANTYCZNE (1)Koncepcja grafów semantycznych nawiązuje do idei grafówegzystencjalnych (ang. existential graphs) opracowanąprzez Charlesa Sandersa Peirce’a (1839-1914).W latach 60. dwudziestego wieku reprezentacje semantycznez wykorzystaniem grafów znalazły zastosowanie zarówno wjęzykoznawstwie teoretycznym, jak i komputerowym.Margaret Masterman przedstawiła graficzną notację, nazwanąsiecią semantyczną, która zawierała siatkę różnych typówkonceptów (M. Masterman, 1961).Analizowano także inne zagadnienia, takie jak: siatki (sieci)korelacyjne, wykorzystujące różne relacje (typu część-całość, relacje przypadkowe, relacje pokrewieństwa) izwiązane z nimi instancje i atrybuty (Silvio Ceccato ).David Hays przedstawił grafy zależności (ang. dependencygraphs), których sformalizowana notacja była przedmiotembadań językoznawców (m.in. Lucien Tesnière).
  • 8. GRAFY I WYKRESY SEMANTYCZNE (2)Pod koniec lat 70. John F. Sowa opracował wersję grafówkonceptualnych (ang. conceptual graphs, CGs), rozumianychjako język mapowania pytań i twierdzeń zapisanych wjęzyku naturalnym do relacyjnych baz danych (Sowa [32]).
  • 9. GRAFY I WYKRESY SEMANTYCZNE (3)Graf semantyczny -jest identyfikowany jako graf, dla którego dodatkowo definiujesię typy wierzchołków (np. osoba, zdarzenie, obiekt, itd.).- zakłada się także, że liczba zdefiniowanych typówwierzchołków jest dużo mniejsza niż liczba wierzchołkówwystępujących w danym grafie semantycznym.- połączenia między wierzchołkami w grafie należą dookreślonych typów.- ten sam typ łuku między różnymi typami wierzchołków możereprezentować odrębny związek (ma odrębne znaczeniesemantyczne).Wykres semantyczny -(ang. relational data graph, attributed relational graph)zawiera zakodowane relacje (powiązania) między parąwpisywanych węzłów. Ponadto, każdy węzeł ma zestawatrybutów z nim związanych (np. wiek może być atrybutemwęzła typu osoby).
  • 10. GRAFY I WYKRESY SEMANTYCZNE (4)Zdanie: Gabriela jedzie do Milton autobusem.Graf:Formuła:(∃x)(∃y)(Jedzie(x) ∧ Osoba(Gabriela) ∧ Miasto(Milton) ∧Autobus(y) ∧ Narzędzie(x, Gabriela) ∧ Cel(x, Milton) ∧Narzędzie(x, y))
  • 11. GRAFY I WYKRESY SEMANTYCZNE (5)Grafy konceptualne -są wykorzystywane w tzw. wspólnej logice (ang. CommonLogic (CL).Ogólny model teorii CL został określony przez Hayesa iMenzela, a następnie zastosowany przez Hayesa i McBride’aw celu określenia semantyki dla języków RDF(S) i OWL.Ze względu na fakt, że różne języki zostały zaprojektowane izaimplementowane w różnym czasie i miejscu, uogólnionymodel CL uwzględnia: języki sieci semantycznych, język modelowania UML (ang. Unified ModelingLanguage), języki programowania logicznego (ang. Logic-Programming Languages), język baz danych SQL (ang. Structured Query Language).
  • 12. GRAFY I WYKRESY SEMANTYCZNE (6)Definicje i określenie CL, a także struktura logiki pierwszegorzędu przeznaczonej do wymiany i transmisji danych sąprzedmiotem normy:ISO/IEC 24707:2007 Information Technology, CommonLogic (CL). A Framework for a family of Logic-BasedLanguages.Norma określa trzy dialekty, zgodne ze standardami CL. Są to: Common Interchange Format Logic (CLIF), Conceptual Interchange Format Graph (CGIF) , XML dla wspólnej logiki (XCL).
  • 13. SIECI SEMANTYCZNE DO PRZETWARZANIAJĘZYKA NATURALNEGO (1)Sieci semantyczne wykorzystywane są również wprzetwarzaniu języka naturalnego (NLP, ang. NaturalLanguage Processing), a także języka medycznego(MLP, ang. Medical Language Processing).Przetwarzanie języka naturalnego- obejmuje wszelkie prace zmierzające do automatycznegotworzenia lub przetwarzania wypowiedzeń, związane zeznaczeniem lub strukturą lingwistyczną tych wypowiedzeń(A. Przepiórkowski, 2008).Prace te mogą być prowadzone na kilku poziomach, którezasadniczo odpowiadają podziałowi językoznawstwa napragmatykę, semantykę, składnię, morfologię, fonologię ifonetykę.
  • 14. SIECI SEMANTYCZNE DO PRZETWARZANIAJĘZYKA NATURALNEGO (2)W procesie przetwarzania języka naturalnego można wyróżnićnastępujące cykle:1) transformacja zdań na ich reprezentację w pamięcikomputera,2) integracja reprezentacji zdań w bazie wiedzy,3) transformacja pytań użytkowników na taką postać, jaka jestreprezentowana w bazie wiedzy,4) realizacja procesu wnioskowania na reprezentacji zdańznajdujących się w bazie wiedzy,5) transformacja ciągów symboli będących wynikiemwnioskowania na zdania języka naturalnego. cykle 2, 4 i 5 nie zależą od przyjętego języka naturalnego, cykle 1 i 3 – zależą od przyjętego języka naturalnego, tzn.transformacja zdań wprowadzanych do komputera będzieinna dla języka angielskiego, a inna dla języka polskiego.
  • 15. SIECI SEMANTYCZNE DO PRZETWARZANIAJĘZYKA NATURALNEGO (3)Konieczność opracowania transformacji języka polskiego nareprezentację symboliczną w bazie wiedzy podkreślali polscybadacze (m.in. R. Tadeusiewicz, J. Kazimierczak i in.).Do nielicznych prób implementacji gramatyk języka polskiegonależą prace Zygmunta Vetulaniego nad opracowaniem wjęzyku programowania Prolog praktycznego parsera, wktórym znaczenia wypowiedzeń i ich części składowychreprezentowane są za pomocą logiki predykatów (Z.Vetulani, 2004).
  • 16. SIECI SEMANTYCZNE DO PRZETWARZANIAJĘZYKA NATURALNEGO (4)Podstawowe metody reprezentacji wiedzy wyrażonej w językunaturalnym obejmują metody : z wykorzystaniem logiki predykatów, różnych logik nieklasycznych, wyrażeń symbolicznych, sieci semantycznych, zależności pojęciowych (CD, ang. Conceptual Dependences), ram (ang. frames), scenariuszy (ang. scripts).Cztery ostatnie metody określane są mianem strukturalnejorganizacji wiedzy, ponieważ uwzględniają relacje międzyelementami wiedzy (J. Kazimierczak, 2005).
  • 17. SIECI SEMANTYCZNE DO PRZETWARZANIAJĘZYKA NATURALNEGO (4)Na semantycznym poziomie przetwarzania języka dokonuje siępodziału semantyki na- leksykalną (ang. lexical semantics)- kompozycyjną (ang. compositional semantics).Semantyka leksykalna zajmuje się znaczeniamipojedynczych jednostek leksykalnych, a semantykakompozycyjna określa budowę znaczeń większychkonstrukcji składniowych na podstawie znaczeń ichskładników.
  • 18. SIECI SEMANTYCZNE DO PRZETWARZANIAJĘZYKA NATURALNEGO (5)W przetwarzaniu języka naturalnego prace związane zsemantyką leksykalną obejmują: tworzenie słowników semantycznych, takich jakWordNet, FrameNet, metody automatycznego ujednoznaczniania sensu słów wtekstach (WSD, ang. Sense Disambiguation).Prace związane z semantyką kompozycyjną dotycząstosowania różnych języków reprezentacji znaczenia, takichjak: język logiki pierwszego rzędu (bez kwantyfikatorów), logika intensjonalna Richarda Montague, język Teorii Reprezentacji Dyskursu (ang. DiscourseRepresentation Theory), inne języki pozwalające na skrótową reprezentacjęwieloznaczności semantycznych .
  • 19. SIECI SEMANTYCZNE DO PRZETWARZANIAJĘZYKA NATURALNEGO (6)Podstawowe metody reprezentacji wiedzy wyrażonej w językunaturalnym obejmują metody : z wykorzystaniem logiki predykatów, różnych logik nieklasycznych, wyrażeń symbolicznych, sieci semantycznych, zależności pojęciowych (CD, ang. Conceptual Dependences), ram (ang. frames), scenariuszy (ang. scripts).Cztery ostatnie metody określane są mianem strukturalnejorganizacji wiedzy, ponieważ uwzględniają relacje międzyelementami wiedzy (J. Kazimierczak, 2005).
  • 20. SYSTEMY HYBRYDOWEPrzykładem systemu hybrydowego jest systemzaprojektowany przez pracowników Pacific NorthwestNational Laboratory, Sandia National Laboratories i CracyInc. w Stanach Zjednoczonych.System ten posiada zdolność obliczeniową do przetwarzaniabazy semantycznych wykresów i wykorzystuje architekturęplatformy Cray XMT, tradycyjne klastry oraz duże bazydanych (C.A. Joslyn, et al., 2011).
  • 21. PODSUMOWANIE I WNIOSKI
  • 22. PODSUMOWANIE I WNIOSKI (1)Zastosowanie: Sieci semantyczne mogą być wykorzystywane doporządkowania różnych obszarów wiedzy, np. podczas epidemiiSARS, w pierwszej dekadzie XXI wieku, wykorzystanotechnologie sieci semantycznych na potrzeby reagowaniakryzysowego (J.E. Powell, L.M. Collins, M.L.B. Martinez, 2009). Rozwój technologii semantycznych umożliwia automatyczneprzetwarzanie nie tylko danych liczbowych, lecz także informacjitekstowych i ich znaczenia. Technologie semantyczne wykorzystują różne metodyreprezentacji wiedzy, takie jak: reguły, ramy, strukturygramatyczne, reprezentacje logiczne, systemy obiektowe, czysieci neuronowe. W praktyce pojawiają się coraz nowsze zastosowania siecisemantycznych łączonych z takimi formami organizacjiwiedzy, jak ontologie, RDF (ang. Resource DescriptionFramework), SPARQL (ang. SPARQL Protocol and RDF QueryLanguage), reguły oparte na systemach danych powiązanych zSemantic Web.
  • 23. PODSUMOWANIE I WNIOSKI (2)Problemy badawcze: Niektórzy badacze określają obszary badań siecisemantycznej obejmujące cztery zakresy: sieć (ang.web), zawartość (ang. content), usługi (ang. services) ipoznanie (ang. cognition) (D. Mills, 2005). Należy sądzić, że dalsze prace badawcze będą dotyczyćpodnoszenia funkcjonalności technologiisemantycznych, przy użyciu których muszą być brane poduwagę potrzeby i zachowania użytkowników. Inne: jak/czy struktura sieci semantycznych wpływa naorganizację wiedzy.
  • 24. PODSUMOWANIE I WNIOSKI (3)Informacja semantyczna (ang. semantic information) –ukształtowane, sensowane, prawdziwe dane (L.Floridi, 2002, 2003, 2011)Yehoshua Bar-Hillel i Rudolf Carnap opracowali teorięinformacji semantycznej (Y. Bar-Hillel, R. Carnap, 1953)Semantyczna informacja a dane:- interpretacja danych;- neutralnośćtaksonomiczna, typologiczna, ontologiczna, genetyczna;- dlaczego informacja jest fałszywa (jest pseudoinformacją):występuje nadmiar informacji, informacja jestsprzeczna, niespójna, zawiera tautologie;- właściwą (prawdziwą) informacją jest informacjasemantyczna.(L. Floridi: The Philophy of Information. Oxford: UniversityPress, 2011, p. 204)
  • 25. BIBLIOGRAFIAChmielewski M.: Ukryte zależności w sieciach semantycznych.„Biuletyn Instytutu Systemów Informatycznych” T. 1 (2008), s. 9-16).Masterman M.: Semantic message detection for machinetranslation, using an interlingua. In: Proc. 1961 International Conf.on Machine Translation, p. 438–475, 1961).Przetwarzanie języka naturalnego. Praca ziorowa pod red. JKazimierczak. Warszawa: Wydawnictwa Komunikacji iŁączności, 2005.Przepiórkowski A.: Powierzchniowe przetwarzanie języka polskiego.Warszawa: Akademicka Oficyna Wydawnicza EXIT, 2008.Vetulani Z.: Komunikacja człowieka z maszyną. Komputerowemodelowanie komp[etencji językowej. Warszawa: AkademickaOficyna Wydawnicza EXIT.
  • 26. DZIĘKUJĘ ZA UWAGĘ.

×