Knowledge Formation and Dialogue Using the KRAKEN Toolset, 2002, Cycorp, Inc.
Kraken-Knowledge Rich Acquisition of Knowledge from Experts Who Are Non-Logicians
Final technical rept. Jun 2000-Feb 2004, Cycorp, Inc.
KRAKEN toolset Cycorp Inc.
1. Historia Krakenów 2. Cele i zadania systemu 3. Architektura 4. Podsumowanie KRAKEN toolset Cycorp Inc.
KRAKEN - legendarny stwór morski.
Pierwszym, który opisał to monstrum w epoce nowożytnej, był Erik Pontoppidan w swoim dziele z 1755 r. - Natural History of Norway. Jeszcze wcześniej pisał o nim Pliniusz Starszy - potwór miał blokować Cieśninę Gibraltarską, nie przepuszczając podróżujących tamtędy okrętów.
Wedle opowieści żeglarskich, krakeny były często brane za wyspy. Kiedy marynarze wychodzili na ląd budzili potwora, który się zanurzał, wciągając pod wodę załogę wraz z okrętem.
W legendach Kraken jest znany również jako Triangul. Jest pod władzą Neptuna, lecz słucha tego, kogo zobaczy zaraz po przebudzeniu. Zasypia na sto lat, by później przez kolejne sto atakować statki.
źródło: Wikipedia.pl
„ Cycorp, Inc., Austin, Texas, is being awarded an $8,504,113 cost-plus-fixed-fee contract to provide for design, development, and delivery of the Knowledge Rich Acquisition of Knowledge from Experts who are Non-Logicians ( KRAKEN ) software system.”
O co tak naprawdę chodzi?
K nowledge- R ich A cquisition of K nowledge from E xperts who are N on-logicians
Pozyskiwanie obszernej wiedzy od ekspertów, którzy nie są logikami.
KRAKEN – Cycorp, Inc.
CYCORP, Inc. Cycorp, Inc. to firma zajmująca się technologiami reprezentacji wiedzy, wnioskowania, przetwarzania języka naturalnego, integracją danych semantycznych, zarządzania informacją itp.
CYC Project Długoterminowy projekt zapoczątkowany przez dr Douglas Leant'a w 1984 r. Przedsięwzięcie mające na celu stworzenie prawdziwej sztucznej inteligencji.
CYCORP, Inc. udostępnia rdzeń ontologii na licencji Public Domain, dodatkowo oferuje darmową licencję na narzędzia programistyczne dla społeczności naukowej.
Baza Wiedzy CYC
Aktualnie największa na świecie ustrukturalizowana baza wiedzy. Ponad 190.000 pojęć zawierających relacje (funkcje, predykaty), kolekcje i wpisy indywidualne. Pojęcia połączone są 2.200.000 asercjami wyrażonymi w CycL.
1. Historia Krakenów 2. Cele i zadania systemu 3. Architektura 4. Podsumowanie KRAKEN toolset Cycorp Inc.
Sytuacja na początku projektu
W ramach projektu Rapid Knowledge Formation powstała potrzeba szybkiego i poprawnego wprowadzania danych do systemu sztucznej inteligencji.
Podczas pracy nad poprzednim projektem HPKF (High-Performance Knowledge Base) okazało się, że system potrafi czasami odpowiadać na pytania, które wydawałyby się bez odpowiedzi (LOL!)
Transfer wiedzy do systemu był utrudniony: najpierw eksperci musieli nauczyć ontologów, a ontologowie uczyli system
Pomysły
Stworzenie systemu umożliwiającego komunikację w języku naturalnym.
Na interfejs Krakena można patrzeć jak na metaforę rozmowy eksperta z laikiem (lub pana i władcy uczącego stwora co jest dobre a co złe). Mogą używać specjalistycznego słownictwa, które trzeba zdefiniować w trakcie rozmowy.
Rozmowa powinna być przeprowadzona w ten sposób, aby uzyskać najlepszą reprezentację i logikę zgromadzonej wiedzy. (Nie zadajemy pytań „Czy statki są jadalne?”)
KRAKEN – Cycorp, Inc.
Cele i zadania systemu: (wyspecyfikowanie przy starcie projektu)
1) Bogaty zestaw narzędzi – narzędzia do wprowadzania wiedzy powinny bazować na wiedzy
2) Narzędzia zależne od kontekstu – system powinien modelować zachowanie użytkownika, aby dostarczyć mu odpowiednich informacji i właściwie interpretować polecenia
3) Głębokie rozumienie tekstu
4) Prowadzenie rozmowy i klaryfikacja – system powinien umieć wypytać użytkownika o szczegóły dotyczące tematy rozmowy
KRAKEN – Cycorp, Inc.
5) Planowanie i rozwiązywanie problemów – system powinien planować swój dialog z użytkownikiem, ale także powinien potrafić rozwiązać jego problemy.
6) Wnioskowanie dotyczące metodologii wprowadzania wiedzy
7) Ustrukturalizowana baza wiedzy – podstawowe pojęcia powinny być wyraźnie reprezentowane
8) S ystem powinien obsługiwać anafory, katafory np. Małpa ukradła banana i go zjadła. ('Kołki zdaniowe', 'wskaźniki zdaniowe' - ang. discourse pegs )
KRAKEN – Cycorp, Inc.
9) Heterogeniczność – system powinien współpracować z wieloma różnymi systemami
10) Metafory, analogie i porównania
11) Wspieranie współpracy i nadzoru – system musi wspierać współpracę wprowadzających dane, a także umożliwiać sprawdzanie i poprawianie danych wprowadzonych przez innych.
12) Automatyczne mierzenie wydajności
13) System powinien być użyteczny nie tylko do celów wojskowych , ale potencjalnie także dla przemysłu i innych instytucji.
KRAKEN – plan działania
Rok pierwszy – 2000
„ Textbook Knowledge Challenge Problem (TKCP)” Zadanie polegało na wprowadzeniu do systemu treści książki „Biologia komórki – podstawy” - Alberts, et. al.
okazało się, że często w zdaniach pojawia się metafora, a CycL będąc dość precyzyjnym językiem, nie pozwala na opisywanie zachowań przedmiotów w poprzez analogię do zachowań żywych istot.
Rok drugi – 2001
Wydarzenia z 11 września odmieniły bieg prac. Zmieniły się cele i skład drużyn. Odpada Teknowledge , przychodzi NWU wraz z narzędziem do szkicowania nuSketch Battlespace.
Northwestern University's nuSketch BattleSpace.
KRAKEN – plan działania
Rok trzeci – 2002
Kolejne zwrot akcji i zmiany w składzie
Powrót do podstawowych celów projektu, przede wszystkim dotyczących uniwersalności powstającego systemu
Powstają nowe narzędzia „Factivore”, „Analysis Diagram Tool”. Inne umierają śmiercią naturalną (interfejs HTML)
Integracja z GIS'em
Czas na refleksje
1. Historia Krakenów 2. Cele i zadania systemu 3. Architektura 4. Podsumowanie KRAKEN toolset Cycorp Inc.
Procesor tekstu
Zawiera komponenty odpowiedzialne za przetwarzanie języka naturalnego
Parser fraz zdaniowych - wyszukiwanie rozbioru zdania, z możliwością ograniczenia liczby rozbiorów, przeszukiwanych kategorii, ogólnego kosztu. - Rezygnacja z HPSG - informacje syntaktyczne i słownikowe zostają. - Hybrydowy system top-down/bottom-up
Parser fraz rzeczownikowych
W przeciwieństwie do pozostałych elementów Procesora tekstu ten moduł wykorzystuje intensywnie bazę wiedzy Cyc'a.
Parser szablonów
Generator języka naturalnego
Natural language generation system
Produkuje słowa, fragmenty zdań i zdania na podstawie danych z bazy wiedzy i szablonów
iCycL - Intermediate CYC Language
Język ewoluował przez 15 lat, aktualnie można go porównać do logiki wysokiego poziomu.
Obserwacja: ludzie zazwyczaj nie mówią językami formalnymi. Wniosek: pozwalamy na nieformalne struktury zdaniowe, jak np. jest-Niedospecyfikowany, trochę, kilka, ...
If two brigades in one battalion are being attacked, then the brigade is being attacked. (implies (and (isa ?THE-1ST-TASK AssignedTaskType) (targetInAttackTask ?THE-1ST-TASK ?THE-1ST-BATALLION) (isa ?THE-1ST-BATALLION Batallion-MilitaryEchelon) (subOrganizations ?THE-BRIGADE ?THE-1ST-BATALLION) (isa ?THE-BRIGADE Brigade-MilitaryEchelon) (different ?THE-1ST-TASK ?THE-2ND-TASK) (isa ?THE-1ST-TASK AssignedTaskType) (different ?THE-1ST-BATALLION ?THE-2ND-BATALLION) (isa ?THE-2ND-BATALLION Batallion-MilitaryEchelon) (subOrganizations ?THE-BRIGADE ?THE-2ND-BATALLION) (targetInAttackTask ?THE-2ND-TASK ?THE-2ND-BATALLION)) (targetInAttackTask ?THE-1ST-TASK ?THE-BRIGADE)) If a unit is assigned to attack another unit, then it is responsible for that unit. (implies (and (isa ?UNITA ModernMilitaryUnit-Deployable) (different ?UNITA ?UNITB) (isa ?UNITB ModernMilitaryUnit-Deployable) (targetInAttackTask ?THE-ATTACKING-TASK ?UNITA) (unitAssignedToAction ?THE-ATTACKING-TASK ?UNITB) (isa ?THE-ATTACKING-TASK AssignedTaskType)) (unitAssignedToUnit ?UNITB ?UNITA)) Fragment wiedzy w języku CycL
Specjalistyczne narzędzia wprowadzania tekstu
Deskryptor białych kart (sailent descriptor)
Zadaje pytania odnośnie wszelkich nowo wprowadzonych pojęć
Początkowo moduł zadawał użytkownikowi po jednym pytaniu, w ustalonym porządku; niektórym ekspertom bardzo się to nie podobało, ponieważ musieli odpowiadać na pytania, które wg systemu miały być interesujące, a nie były i w dodatku nie miały żadnego związku z omawianym zagadnieniem.
Aktualnie duża część funkcjonalności została przeniesiona do Factivore'a
Wyszukiwanie nie tylko po nazwie, ale także po właściwościach gramatycznych. Dzięki temu możemy używać systemu nie tylko w rozwiązaniach angielskojęzycznych (jeszcze nie przetestowane)
Glossary
Wcześniej: Concept Refinement Interviewer, jeszcze wcześniej Salient Descriptor
Narzędzie do gromadzenia faktów
Osobna aplikacja stand-alone napisana w Javie
Factivore
Factivore
Factivore
Query Library
Query Library
Precission Suggestor
Why Not? (ISI)
Rysowanie bazy wiedzy / KB Graphing
Analysis Diagram Tool
Wielu wojskowym ekspertom jest łatwiej wyrażać się w formie procedur , niż w formie konkretnych sytuacji i uniwersalnych reguł.
To procedura, a konkretnie historia wnioskowania , ustanawia kontekst wnioskowania ekspertów i sprawia, że daje się zarządzać procesem decyzyjnym.
„ Eksperci wiedzą o tym co już zostało rozważone i postanowione.”
1. Historia Krakenów 2. Cele i zadania systemu 3. Architektura 4. Podsumowanie KRAKEN toolset Cycorp Inc.
Wskazówki od ekspertów (COA – Course of Action)
„ First , we had to develop meaningful (measurable) evaluation criteria, when COA ‘standards’ (like the principles of war) are generally expressed in platitudes (e.g. Achieve surprise, establish overwhelming force superiority at the decisive point, allocate minimum force to secondary efforts).
„ Second , we had to develop an understanding of how to enter the rules; that is, how to break down a rule into manageable entry pieces (we had to communicate with KRAKEN on KRAKEN’s conditions).
„ Third , the process of actual entry required that we deal with the limited and sometimes erroneous military knowledge in KRAKEN, which we generally gained awareness of through trial and error.”
Wskazówki dla projektantów UI w NLP
Pytania zadawane przez system powinny być sensowne (poprawne semantycznie).
Nie pytamy o rzeczy, które już wiemy.
Pytania powinny być interesujące – szczególnie interesujące jest uczenie nowych faktów, o których nic nie wiemy (wyjątki: wiele atrybutów: „przyjaźni się z”, „mówi w języku”)
Wydaje się, że pytanie jest bardziej interesujące, jeśli zwiększa prawdopodobieństwo odpowiedzi na kolejne pytania
Wskazówki dla projektantów UI w NLP
Unikaj wszelkich niepotrzebnych opóźnień (rezygnacja z DHTML na rzecz Javy i stopniowego wyświetlania elementów interfejsu)
Stwórz odpowiednie narzędzia pokrywające największą część zapotrzebowania użytkowników (Osobne narzędzia dla każdego „sweet point'a”.)
Szerokie spektrum interakcji z użytkownikiem:
swobodna rozmowa
forma pośrednia (frazy rzeczownikowe)
komunikacja graficzna
komunikacja binarna tak-nie
Podsumowanie
Wskaźnik wiedzy pozyskiwanej z użyciem Factivora był najwyższy z testowanych do tej pory w RKF narzędzi ogólnego użytku .
Z powodu ograniczonych funduszy w roku trzecim integracja z GIS'em była bardzo prosta, ale udało się osiągnąć wyraźne postępy w wykorzystaniu możliwości GIS'a do wnioskowania symbolicznego .
Najlepiej sprawdziły się interfejsy graficzno/tekstowe napisane w Javie, co sugeruje, że to jest właściwy kierunek dla tego typu rozwiązań.
Plany
Cyc będzie kontynuował pracę nad leksykonem pod kątem pokrycia szeregu ogólnych problemów NLP, nie związanych z żadnym konkretnym projektem
Prace nad EMBT - example-based machine translation. Mapowania pomiędzy zdaniami w języku naturalnym a ich odpowiednikami w CycL.
Factivore i Query Library – od razu zaprzęgnięte do pracy gdzie się dało.
Analysis Diagram Tool – grant od SBIR 'a (Small Business Innovation Research)
Salient Descriptor + Factivore = trafniejsze pytania dla użytkownika
Gdzie można by wykorzystać KRAKEN'a?
Inteligentny asystent osobisty
Narzędzia szkoleniowe dla uczniów
Głos z kratki – podpowiadający adeptom sztuki wojennej podejmować właściwe decyzje przy dużej informacji danych
Wsparcie dla jakichkolwiek projektów opartych o wiedzę
0 comments
Post a comment