Ontology  介绍 李  荣 2002 年 3 月
内容: 什么是 ontology GO:Gene Ontology Ontology  环境
什么是 ontology 哲学:存在论,讨论对象的存在性,一个存在的系统说明 在知识共享方面,指概念化的详细说明, a specification of a conceptualization 一个 agent 或其群体的概念与关系的描述 目的:知识共享与重用 一个 ontology 就是一个正式词汇表的定义
基础:概念化  conceptualization 假设在某感兴趣领域存在的对象、概念、其他实体及其中关系 为实现某目标而期望表示的世界的抽象、简化的视图 知识库、基于知识的系统、知识层次的 agent 都可以对应于某概念化 一个 ontology 就是一个概念化的显式指定
Ontology 的本质 一个逻辑理论的陈述 一套表达术语的定义 用人类可读的文本定义一个领域内(类型、关系、功能等)实体名字来描述其含义,定义正式公理以限制其解释及这些术语的形式良好的使用
ontology 历史 80 、 90 年代 在专家系统中应用 由知识表示与推理专家建立 多用于图书分类 互连网驱动 非分类学专家 未受训公众 研究、电子商务、计算机配置、通用信息站点、生物数据
与分类学的区别 Ontology 是类的分类学层次,不是类定义、包含关系,但不限于此形式 不限于保守的传统逻辑意义上的定义 增加了知识 指定一个概念化要陈述限制名词可能的解释的公理
Ontology 使用 Ontology 承诺:同意按照一个 ontology 指定的理论一致、连贯地使用词汇表,如查询,发表声明 按照 ontology 建立 agent,  通过这些 agent 共享知识 Agent 共享词汇表而不必共享知识库 每个 Agent 知道的东西其他 agent 不知道 一个 Agent 不必回答所有可由共享词汇表表达的查询,即与 ontology 一致但不必完备
Formal Ontology&informal Ontology Formal ontology: 着重在子类型和上层类型的区分 用逻辑语言或计算机语言描述 公理化 ontology 由公理和定义陈述 用于数学、物理、工程 基于原型 ontology 由每个子类的典型成员或原型的比较区分子类型 用于植物、动物及普通家用物品 Informal ontology: 自然语言中定义或未定义的类型分类 由一个概念和关系的名字集描述 由部分子类型的关系排序、组织 大型 ontology 用混合方法
KR ontology 基于 Knowledge Representation (by John D. Sowa) 基本的类型和区分由逻辑、语言学、 AI 导出 系统化的,开放的系统 基于区别的框架,自动生成层次,而不是基于固定的分类层次
图例:由属性用正规概念分析方法( FCA )构成
FCA 技术 属于数据挖掘 生成子网格,可与更通用的分类网格自动合并
GO : Gene Ontology  Gene Ontology TM  Consortium 制定 动态受控的词汇表 用于所有生物体,即使基因与蛋白质在细胞中的角色知识积累、变化仍然适用 现有的 GO : 分子功能、生物学过程、细胞成分 相关文件: 术语定义: XML 格式:每月更新
GO 名词: 注释: 参与合作的数据库用 GO 术语注释它们的基因或基因产物 物种特性: 当某文本串(功能、过程、成分)在不同物种含义不同时, GO 加以区别 数据库缩略名: 调用其他数据库中的标识符时,加其缩略名做前缀  DB:identifier   数据表示: 直接非循环图 directed acyclic graphs (DAGs)   或网络表示, 父子术语是多对多的关系, 对每一父术语,子术语有不同的关系类
同义词 一个术语有一个或多个同义词 唯一标识符: 每个术语有一,用做数据库交叉参考 格式  GO:nnnnnnn  ( 7 位数字, 0 补齐)   数据库交叉参考 即唯一标识符 Terma 与 termb 合并 , termb 标识做第二标识  terma; GO:idterma, GO:idtermb, GO:idtermc, ... 术语分裂 作为每个新术语的第二标识  文件: ontology Biological Process ( process.ontology ) Molecular Function ( function.ontology ) Cellular Component ( component.ontology )
版本信息 :  !version: $Revision: 1.48 $ !date: $Date: 2002/01/15 18:25:40 $ !source: $Source:  /share/go/cvs/go/doc/GO.doc.html,v $ ! !Gene Ontology ![domain of file] !editors: Michael Ashburner (FlyBase),  Midori Harris (GO), Judith Blake (MGD) !Leonore Reiser (TAIR), Karen Christie  (SGD) and colleagues !with software by Suzanna Lewis (FlyBase  Berkeley).
语法 :   父子关系:  parent_term child_term   实体关系 : term1 既是 term0 的实体,也是 term2 的实体    %term0   %term1 % term2   部分关系 : term1 是 term0 的实体,也是   term2 和 term3 的一部分 %term0   %term1 < term2 < term3
XML 版本: <?xml version=&quot;1.0&quot; encoding=&quot;UTF-8&quot;?> <!DOCTYPE go:go>  <go:go xmlns:go=&quot;http://www.geneontology.org/dtds/go.dtd#&quot; xmlns:rdf=&quot;http://www.w3.org/1999/02/22-rdf-syntax-ns#&quot;>  <go:version timestamp=&quot;Wed May  9 23:55:02 2001&quot; />  <rdf:RDF>
<go:term rdf:about=  &quot;http://www.geneontology.org/go#GO:0003674&quot;>  <go:accession>GO:0003674</go:accession>  <go:name>molecular_function</go:name>  <go:definition>The action characteristic of a gene  product.</go:definition>  <go:part-of rdf:resource=&quot;http:  //www.geneontology.org/go#GO:0003673&quot; />  <go:dbxref>  <go:database_symbol>go</go:database_symbol>  <go:reference>curators</go:reference>  </go:dbxref>  </go:term>   </rdf:RDF> < /go:go>
定义: GO. defs   文本文件定义  GO terms   tag: text or value   Tag 是以下之一: 术语  GO_id  定义  注释 Bibliography  : GO.bib   格式  tag: text or value   其他分类系统的索引 database:<identifier> > GO:<term> ; GO:<GO_id>   e.g.:  TIGR_role:11030 73 Amino acid biosynthesis Glutamate family > GO:glutamine family amino-acid biosynthesis ; GO:0009084
Ontology  环境 合并多个 Ontology 诊断、升级 Ontology
Chimaera Ontology  环境 Knowledge Systems Laboratory   ,   Stanford University   Web-based browser environment 接受 15 种指定格式的输入 提供潜在的合并候选项 支持分类法决议模式,及发现语义包含关系功能 提供分析功能套件,包括不完全的测试、分类学分析、语义检查 提供规则语言,以允许用户添加测试工具
系统发现 mammal  和 mammalia 名字相似,建议合并

香港六合彩

  • 1.
    Ontology 介绍李 荣 2002 年 3 月
  • 2.
    内容: 什么是 ontologyGO:Gene Ontology Ontology 环境
  • 3.
    什么是 ontology 哲学:存在论,讨论对象的存在性,一个存在的系统说明在知识共享方面,指概念化的详细说明, a specification of a conceptualization 一个 agent 或其群体的概念与关系的描述 目的:知识共享与重用 一个 ontology 就是一个正式词汇表的定义
  • 4.
    基础:概念化 conceptualization假设在某感兴趣领域存在的对象、概念、其他实体及其中关系 为实现某目标而期望表示的世界的抽象、简化的视图 知识库、基于知识的系统、知识层次的 agent 都可以对应于某概念化 一个 ontology 就是一个概念化的显式指定
  • 5.
    Ontology 的本质 一个逻辑理论的陈述一套表达术语的定义 用人类可读的文本定义一个领域内(类型、关系、功能等)实体名字来描述其含义,定义正式公理以限制其解释及这些术语的形式良好的使用
  • 6.
    ontology 历史 80、 90 年代 在专家系统中应用 由知识表示与推理专家建立 多用于图书分类 互连网驱动 非分类学专家 未受训公众 研究、电子商务、计算机配置、通用信息站点、生物数据
  • 7.
    与分类学的区别 Ontology 是类的分类学层次,不是类定义、包含关系,但不限于此形式不限于保守的传统逻辑意义上的定义 增加了知识 指定一个概念化要陈述限制名词可能的解释的公理
  • 8.
    Ontology 使用 Ontology承诺:同意按照一个 ontology 指定的理论一致、连贯地使用词汇表,如查询,发表声明 按照 ontology 建立 agent, 通过这些 agent 共享知识 Agent 共享词汇表而不必共享知识库 每个 Agent 知道的东西其他 agent 不知道 一个 Agent 不必回答所有可由共享词汇表表达的查询,即与 ontology 一致但不必完备
  • 9.
    Formal Ontology&informal OntologyFormal ontology: 着重在子类型和上层类型的区分 用逻辑语言或计算机语言描述 公理化 ontology 由公理和定义陈述 用于数学、物理、工程 基于原型 ontology 由每个子类的典型成员或原型的比较区分子类型 用于植物、动物及普通家用物品 Informal ontology: 自然语言中定义或未定义的类型分类 由一个概念和关系的名字集描述 由部分子类型的关系排序、组织 大型 ontology 用混合方法
  • 10.
    KR ontology 基于Knowledge Representation (by John D. Sowa) 基本的类型和区分由逻辑、语言学、 AI 导出 系统化的,开放的系统 基于区别的框架,自动生成层次,而不是基于固定的分类层次
  • 11.
  • 12.
    FCA 技术 属于数据挖掘生成子网格,可与更通用的分类网格自动合并
  • 13.
    GO : GeneOntology Gene Ontology TM Consortium 制定 动态受控的词汇表 用于所有生物体,即使基因与蛋白质在细胞中的角色知识积累、变化仍然适用 现有的 GO : 分子功能、生物学过程、细胞成分 相关文件: 术语定义: XML 格式:每月更新
  • 14.
    GO 名词: 注释:参与合作的数据库用 GO 术语注释它们的基因或基因产物 物种特性: 当某文本串(功能、过程、成分)在不同物种含义不同时, GO 加以区别 数据库缩略名: 调用其他数据库中的标识符时,加其缩略名做前缀 DB:identifier 数据表示: 直接非循环图 directed acyclic graphs (DAGs) 或网络表示, 父子术语是多对多的关系, 对每一父术语,子术语有不同的关系类
  • 15.
    同义词 一个术语有一个或多个同义词 唯一标识符:每个术语有一,用做数据库交叉参考 格式 GO:nnnnnnn ( 7 位数字, 0 补齐) 数据库交叉参考 即唯一标识符 Terma 与 termb 合并 , termb 标识做第二标识 terma; GO:idterma, GO:idtermb, GO:idtermc, ... 术语分裂 作为每个新术语的第二标识 文件: ontology Biological Process ( process.ontology ) Molecular Function ( function.ontology ) Cellular Component ( component.ontology )
  • 16.
    版本信息 : !version: $Revision: 1.48 $ !date: $Date: 2002/01/15 18:25:40 $ !source: $Source: /share/go/cvs/go/doc/GO.doc.html,v $ ! !Gene Ontology ![domain of file] !editors: Michael Ashburner (FlyBase), Midori Harris (GO), Judith Blake (MGD) !Leonore Reiser (TAIR), Karen Christie (SGD) and colleagues !with software by Suzanna Lewis (FlyBase Berkeley).
  • 17.
    语法 : 父子关系: parent_term child_term 实体关系 : term1 既是 term0 的实体,也是 term2 的实体   %term0 %term1 % term2 部分关系 : term1 是 term0 的实体,也是 term2 和 term3 的一部分 %term0 %term1 < term2 < term3
  • 18.
    XML 版本: <?xmlversion=&quot;1.0&quot; encoding=&quot;UTF-8&quot;?> <!DOCTYPE go:go>  <go:go xmlns:go=&quot;http://www.geneontology.org/dtds/go.dtd#&quot; xmlns:rdf=&quot;http://www.w3.org/1999/02/22-rdf-syntax-ns#&quot;> <go:version timestamp=&quot;Wed May 9 23:55:02 2001&quot; /> <rdf:RDF>
  • 19.
    <go:term rdf:about= &quot;http://www.geneontology.org/go#GO:0003674&quot;> <go:accession>GO:0003674</go:accession> <go:name>molecular_function</go:name> <go:definition>The action characteristic of a gene product.</go:definition> <go:part-of rdf:resource=&quot;http: //www.geneontology.org/go#GO:0003673&quot; /> <go:dbxref> <go:database_symbol>go</go:database_symbol> <go:reference>curators</go:reference> </go:dbxref> </go:term> </rdf:RDF> < /go:go>
  • 20.
    定义: GO. defs 文本文件定义 GO terms tag: text or value Tag 是以下之一: 术语 GO_id 定义 注释 Bibliography : GO.bib 格式 tag: text or value 其他分类系统的索引 database:<identifier> > GO:<term> ; GO:<GO_id> e.g.: TIGR_role:11030 73 Amino acid biosynthesis Glutamate family > GO:glutamine family amino-acid biosynthesis ; GO:0009084
  • 21.
    Ontology 环境合并多个 Ontology 诊断、升级 Ontology
  • 22.
    Chimaera Ontology 环境 Knowledge Systems Laboratory , Stanford University Web-based browser environment 接受 15 种指定格式的输入 提供潜在的合并候选项 支持分类法决议模式,及发现语义包含关系功能 提供分析功能套件,包括不完全的测试、分类学分析、语义检查 提供规则语言,以允许用户添加测试工具
  • 23.
    系统发现 mammal 和 mammalia 名字相似,建议合并