SlideShare a Scribd company logo
1 of 61
Download to read offline
中医药信息学是中医学与信息科学交叉所产生;以中医药信
中医药   息为研究对象;以中医药系统信息运动规律及其作用为研究
信息学   内容;以中医药信息学方法论为研究方法;以提高中医药信
      息获取、转化、传播与利用能力为目标的一门新兴学科。




              2008,崔蒙、尹爱宁等学者撰写论文,
              提出建立中医药信息学,阐述该学科
              的内涵和原理。
中医药    中医药知识工程是中医药信息学的核心课题,旨在支持中医
知识工程   药经验性知识的获取、融合、创新与传播。




                初步完成中医药理论和经典文献
                的系统整理和诠释;深入认识和
                挖掘中医药理论的科学内涵,建
                立中医药知识库;运用信息技术
                和数据挖掘技术,开展名老中医
                学术思想、临床经验和辨证论治
                方法的总结研究。
中医药信息学
                   博士后

   中医药知识工程         研究课题



         面向中医药知识密集型数据

          的知识创造与知识发现
中医药信息学
                   1
                       立足于中医药信息研究所组织
   中医药知识工程
                       建设的中医药科学数据库群。



         面向中医药知识密集型数据

             的知识创造与知识发现
         2                 3
             研究中医个体性知识         研究基于中医药文献
             创造的模式与方法。         数据库的知识发现方法。
中医药知识
密集型数据       中医药信息所
• 知识获取所得    开发的数据库

• 富含中医知识    • 方剂数据库

• 文献型数据     • 临床数据库

• 知识管理的基础   • 古文献数据库
            …
中医药   中医药信息研究所搭建了基于Web的数据库共建与共享平台。
科学数   该平台支持全国数十家大学和科研院所的数百名科研工作者
据库群
      进行数据录入工作,产生了全面的中医药科技数据库体系。
1    中医药个案数据库

          病案情况                 资助情况
                     文献情况
          加工信息                 作者情况




       转归信息      患者情况       患者病史                       就诊症状


     诊断用理化检查     病案情况       诊疗情况      病症zf             就诊体征


 判断疗效用理化检查                                治疗


判断疗效所使用的量表        中药治疗       西药治疗     针灸治疗             按摩治疗       其他治疗


       参考标准             中                      穴        按     按
                 中      药     西       针        位   按    摩     摩
                 药      配     药       灸        配   摩    穴     手
                 组      合     成       穴        合   穴    位     法
                 成      情     分       位        情   位    配     描
                        况                      况        合     述
                                                        情
                                                        况

                                                                     核心概念
2     中医药针灸数据库


         医家信息               患者诊治信息
                 患者基本信息
         加工信息                图片信息




    治疗前理化检查                         患者症状信息


    治疗后变化指标          病症证             症状


      诊疗标准                           治疗


                中药治疗       西药治疗      针灸治疗    按摩治疗   其他治疗



                 中          西                 穴
                 药          药         穴       位
                 组          成         位       按
                 成          分                 摩
3   中医药临床数据库

                                                 疾病



    对照组                     抽象临床研究对象             证候


    临床诊疗    临床研究主表                 实验检查
                                                 临床症状

    实验检查                    具体治疗过程


           药方治疗      西药治疗   针灸治疗          按摩治疗        其他治疗




            药                        穴
            物                        位
4   中医药药理数据库




       实验基本信息
                  文献情况   文献原文
           加工信息




                            药理实验   模型组
    实验对象

                  研究药物      临床药理   试验检测

     对照组
                            毒理试验
5    中医疾病数据库

           康复      出处      预防


           疗效              预后




    中药病机                        抽象治疗对象               穴位


    中药病因           疾病           症状                   药物


    西医病机                        症候            治疗     药物成分


    西药病因        中药治疗    西药治疗    针灸治疗          按摩治疗   其他治疗


                                       正骨治疗
    地区
6   中药化学数据库

             化学实验     实验室条件



             化学成份纯化   熔点、旋光度、活性、纯化倍数、回收率、纯度、纯化物组合

    1、全局ID
    2、名称     化学成份分离     沉降平衡、沉降系数、沉降速度、沉降时间、K系数
    3、供试品
    4、试剂
    5、实验仪器   化学成份合成
    6、方法
    7、步骤     化学成份鉴定           物理常数测定、化学特性试验
    8、相关因素
    1、实验结果
    2、结论     化学成份提取            重量、收率、物理性质
    3、备注
                       检测品含量、精密度测定、线性关系、稳定性试验、
             含量测定
                      重现性试验、回收率、标准曲线、相对标准偏差、结构测定

             通用检测方法   ID、方法、异名、适用范围、主要观测指标、应用条件、定义



                                                     属性
著名知识管理学家野中郁次郎(Ikujiro Nonaka)等人
                   知识创造
                          于1995年提出了面向知识创造的知识共享模型—SECI。
  野中郁次郎
(Ikujiro Nonaka)




                   SECI模型针对各种形式的知识如何在组织中传播和共享
                   的问题,提出了社会化、外化,组合,内化等四种知识
                   转化模式,构成知识转化的循环,推动知识的创造。




                   借鉴知识创造模型SECI,提出了中医药经验型知识
                   的激活与传播的原理。利用信息学的方法和技术,
                   通过中医药知识的数字化过程、数据分析、人工智
《中医药信息学的           能方法等,加速知识转化过程,促进知识的传播。
内涵及原理研究》
中医药知识创造活动本质上具有个体性。中医药知识创造的个
个体性中
            体性与中医药知识工程的整体性之间的矛盾,是所提出的中医
医药知识
            药知识创造模型需要解决的基本矛盾。
创造模型
            可借鉴SECI模型,提出具有个体性的中医药知识创造模型。


知识创造              知识工程
的个体性              的整体性



       历代    数据
       名家    加工
                   知识密集
                   型数据库
       经典                           国际中
       文献                  知识服务     医团体
数据库中知识发现 (Knowledge Discovery in Database,KDD)
数据库
      是20世纪80年代末兴起的一种信息技术,是人工智能与数据库、
中的知
      统计学、机器学习等技术的交叉产物,是从海量数据中获取有效、
识发现
      新颖、有潜在应用价值和最终可理解模式的过程。


             KDD is the nontrivial process of identifying valid, novel,
             potentially useful, and ultimately understandable patterns
             in data (KDD是从海量数据中获取有效、新颖、有潜在应
             用价值和最终可理解模式的过程).
             Data mining is a step in the KDD process that consists of
             applying data analysis and discovery algorithms that, under
             acceptable computational efficiency limitations, produce
             a particular enumeration of patterns (or models) over the
             data (数据挖掘是KDD过程中的一步,即通过使用各种
             数据分析和发现算法,在可以接受的时间内产生模式).
The KDD process involves using the database along with
any required selection, preprocessing, subsampling, and
transformations of it; applying data-mining methods
(algorithms) to enumerate patterns from it; and evaluating
the products of data mining to identify the subset of the
enumerated patterns deemed knowledge.
中医药    中医药KDD的探索性工作包括:方剂配伍规律发现,中医药作用
    知识发现   机制的科学解释,证候—疾病—基因关联网络分析等。

1                          2
    周雪忠等通过文本挖掘等手段挖掘中医证         周忠眉等通过关联规则挖掘等手段分析方
    候和基因之间的潜在联系。               剂的配伍规律和功效。




3                          4
    雷蕾等研发中药化学辅助研发系统,辅助药        张连文和袁世宏使用隐结构模型揭示中医
    学家从中药知识中获得关于候选药物的线索。       证候的实质,建立辩证的客观标准。
中医药KDD基于“知识密集型数据库”,本质上是“从知识
中医药
            到知识”的“知识精炼(Knowledge Refinement)”过程。
知识发现
            该过程是人机交互式的迭代过程,在每一次迭代中通过机器
的特点
            计算和人工评估相结合的方式实现知识增值,终极目标是实
            现中医药知识遗产的永久保真和持续创新。


知识遗产                永久保真和持续创新


       历代
       名家    数据加工
                     知识密集        知识
                                 精炼
                     型数据库
       经典
       文献
研究思路:基于语义Web的知识发现



 研究思路   针对中医药领域需求和KDD主要问题,将语义Web技术与数据挖
        掘技术相结合,设计并实现基于语义Web的知识发现解决方案。




                                  应用层
                               (知识发现与创造)



                                  语义层
                                (知识的集成)




                                  资源层
                                (知识的结构化)
研究思路:基于语义Web的知识发现



 关联数据   关联数据云(Linked Open Data Cloud)可以被理解为全球性
        巨型数据网络,其中每个节点代表一个数据集,每条边代表两个
        数据集之间的关联。
研究思路:基于语义Web的知识发现


2007        2008                 2009




Sep. 2010            Sep. 2011




                                        295个数据集
研究思路:基于语义Web的知识发现


2007        2008              2009




               近五年来,关联数据取得高速发展。
               当前,关联数据云拥有近300个数据
               集,得到耶鲁、牛津、Nature、
Sep. 2010             Sep. 2011
               BBC、雅虎、Facebook 等机构和
               公司的关注、参与和支持。


                                     295个数据集
研究思路:基于语义Web的知识发现


2007        2008                  2009




               关联数据的成功,巩固了语义
               Web的学术地位。
Sep. 2010             Sep. 2011


               仍然需要示范性、研究性的大型
               应用项目,推动语义Web的发展。
                                         295个数据集
研究思路:基于语义Web的知识发现


            博士阶段研究语义Web技术及其在中医药等领域的应用,5年语义Web软
工作基础
            件和系统开发经验,发表论文10余篇,撰写《面向语义Web的设计模式
            名录》等技术报告,以及语义Web在生物医学领域的应用综述。


  Semantic Web Meets Integrative Biology: A Survey. In Briefings in
 Bioinformatics (SCI, IF=9.283) (Publication in progress)
                        … We provide insight into how Semantic Web technologies can be used
            Abstract    to build open, standardized, and interoperable solutions for
                        interdisciplinary integration on a global basis. We present a rich set of
                        case studies in system biology, integrative neuroscience, bio-
                        pharmaceutics, and translational medicine, to highlight the technical
                        features and benefits of Semantic Web applications in integrative
                        biology…


                            Reviewer 1: “ … an excellent paper that does a very nice job
                            surveying the ways in which semantic web technology is being used
            Feedbacks       beneficially in bioinformatics…”
                            Reviewer 2: ”…The overall framework the authors set up for this
                            review is an interesting one, and could be quite compelling to some
                            readers of the Journal…”
                            Reviewer 3: ”… Overall this is a well-written article, with a very
                            useful list of references.”
研究思路:基于语义Web的知识发现



工作基础   报告人在博士研究中,针对中医药信息化的核心问题,兼顾现代
       服务业的发展趋势,提出“知识即服务”的理念,以及“知识网
       络”和“知识生态系统”等理论模型,并在中医药领域具体实施。


       知识网   …一种网络化的知识表示模型,将领域知识体系表达为
       络模型   一组既相互独立,又彼此关联的知识模块。该模型具有
             异构性,分布性, 关联性,普适性等特征…


       知识生   …知识生态系统模型旨在刻画群体性知识系统的形态,
       态系统
             为中医药电子科学环境的构建提供指导意见。该模型将
             各种知识体系视为相互影响、相互竞争的活体,研究如
             何营造“百花齐放、百家争鸣”的知识共享环境,尽可
             能保护各种知识体系(尤其是濒危无形文化遗产)的生
             存,实现文化的多元化…
研究思路:基于语义Web的知识发现




     中医知识创
     造的个体性



         知识网络   是一种网络化的知识
             表示模型,将领域知识体系
          表达为一组既相互独立,又彼此
             关联的知识模块。该模型具有
          异构性,分布性, 关联性,
             普适性等特征。


                             中医知识工
                             程的整体性
研究思路:基于语义Web的知识发现




     中医知识创
     造的个体性




    个人                        社会
                       本体
    本体                        网络
                       网络

                知识网络




                            中医知识工
                            程的整体性
研究思路:基于语义Web的知识发现




        中医知识创
        造的个体性




    个人                        社会
                       本体
    本体                        网络
                       网络

                知识网络




 知识密集    关联数                中医知识工
 型数据库    据网络                程的整体性
研究思路:基于语义Web的知识发现




        中医知识创               基于知识网络
        造的个体性               的知识发现




    个人                          社会
                       本体
    本体                          网络
                       网络

                知识网络




 知识密集    关联数                 中医知识工
 型数据库    据网络                 程的整体性
研究思路:基于语义Web的知识发现




        中医知识创                 基于知识网络
        造的个体性                 的知识发现



知识
网络   基于社会网络模型,将个人本体互联为本体网络,作为知识网络的骨架
      将知识密集型数据互联为数据网络,作为知识网络的基础内容
     个人                            社会
                      本体
      兼顾知识创造的个体性和知识工程的整体性,符合中医药知识的多样性、
     本体                            网络
                      网络
      分布性、复杂性等特点
                 知识网络
      为进行知识发现的智能代理提供结构性知识资源



 知识密集    关联数                   中医知识工
 型数据库    据网络                   程的整体性
研究思路:基于语义Web的知识发现




中医知
识遗产




        知识获取
                    中医药
中医典籍                共享领
                    域本体


               中医药整合知识库


 历代名家
研究思路:基于语义Web的知识发现




中医知                              科学技
识遗产                              术知识




        知识获取              知识关联
                    中医药
中医典籍                共享领           医学
                    域本体


               中医药整合知识库


 历代名家                             生物学
研究思路:基于语义Web的知识发现




中医知                                   科学技
识遗产                                   术知识




        知识获取                   知识关联
                    中医药
中医典籍                共享领                医学
                    域本体


                中医药整合知识库
               知识         知识
 历代名家          服务         创造           生物学
                           国际中
                           医团体
研究思路:基于语义Web的知识发现



                     智能代理
中医知                                   科学技
识遗产            知识         知识          术知识
               查询         发现


        知识获取                   知识关联
                    中医药
中医典籍                共享领                医学
                    域本体


                中医药整合知识库
               知识         知识
 历代名家          服务         创造           生物学
                            国际中
                            医团体
研究思路:基于语义Web的知识发现


          知识生态
          系统模型       智能代理
中医知                                   科学技
识遗产            知识         知识          术知识
               查询         发现


        知识获取                   知识关联
                    中医药
中医典籍                共享领                医学
                    域本体


                 中医药整合知识库
               知识         知识
 历代名家          服务         创造           生物学
                            国际中
                            医团体
研究思路:基于语义Web的知识发现


             知识生态
             系统模型    智能代理
中医知                               科学技
识遗产            知识        知识       术知识
      知识生态     查询        发现
      系统模型

     回答中医药知识遗产保护、中医药现代化和国际化等问题。
        知识获取             知识关联
                 中医药
中医典籍 为“中医药知识密集型数据”、“知识创造”和“知识发现” 医学
                 共享领
                 域本体
     等论题中涉及的概念提供解释框架。
        涉及本体知识库、知识互联、知识查询与推理等技术,为语义
                  中医药整合知识库
        Web技术的使用提供依据和指导。
                知识       知识
 历代名家           服务       创造           生物学
                            国际中
                            医团体
研究思路:基于语义Web的知识发现


 中医药知识发现的主要问题:
       中医药领域知识模型复杂,并未形成标准化的知识体系,缺乏
  1    KDD所必需的明确需求和背景知识。



       中医药KDD所用的数据经常是不完整的,且存在一系列关键性
  2    质量问题,严重影响了知识发现的效果。
       中医药领域多为文本型数据,不易被数据挖掘算法直接处理。


       中医药KDD与领域知识密切相关,需要针对中医药领域的特定
  3    需求,结合知识表示和推理等技术,改进传统的数据挖掘方法,
       提出新颖的“领域知识驱动的数据挖掘方法”。


       缺乏中医药KDD结果的诠释和评价体系,导致所发现的知识没
  4    有得到充分的利用。
研究思路:基于语义Web的知识发现



      1            2           3           4
中医药       领域知识模        存在严重的       需要领域知       缺乏诠释、
知识发       型复杂,并        数据孤岛现       识驱动的数       评价、利用
现的主       未形成标准        象和数据质       据挖掘方法       挖掘结果的
要问题
          化知识体系。       量缺陷。        的支持。        有效手段。




      1            2           3           4
基于语       使用领域本        使用关联数       将领域本体       使用语义维
义互联       体进行领域        据技术实现       和语义推理       基等技术实
网的解       知识的分析        数据集成和       与数据挖掘       现挖掘结果
决方案
          与建模。         预处理。        方相结合。       的自动推送。
研究思路:基于语义Web的知识发现



中医药     疾病    方剂      五行    化学        结构性
                                 医案
数据库    知识库   知识库     知识库   知识库         文献




      中医药
   领域本体            数据库的语义集成




                   知识的创造与发现




                   知识的评价与利用
研究思路:基于语义Web的知识发现



中医药     疾病    方剂      五行    化学            结构性
                                     医案
数据库    知识库   知识库     知识库   知识库             文献



                                 2
      中医药                            基于语义互联网的数据
     领域本体          数据库的语义集成          互联与检索方法研究

 1
      基于本                        3
      体的中                            语义关系自动抽取与中
                   知识的创造与发现          医药知识发现方法研究
      医药复
      杂知识
      建模方                        4
      法研究                            基于语义维基的中医知
                   知识的评价与利用          识百科与服务技术研发
研究思路:基于语义Web的知识发现


           1
    知 识        领域   使用模糊逻辑、描述逻辑等知识表示方法,
               本体   对中医药领域知识进行建模,构建中医药领
    获 取        建模   域本体。



    知 识
           2   数据   基于中医药领域本体实现中医药数据库的互
               关联   联与集成,构建可浏览、可查询、可搜索的
    融 合        网络   数据关联网络。


           3   知识   基于数据关联网络,通过数据挖掘(如文本
    知 识
               发现   挖掘)和语义推理等算法,实现知识发现过
    创 新        方法   程,产生知识提案。


           4   知识   将知识提案自动推送到中医知识服务系统
    知 识        服务   (如百科服务),以供领域专家对知识提案
               系统   进行检查、诠释和利用。
    传 播
1   基于Web本体的中医药知识建模方法研究

       拟采用模糊描述逻辑等创新的知识建模方法,以Web本体为主
工作描述
       要技术手段,对中医药领域的概念、理论和知识体系进行建模,
       构建示范性领域本体,从而支持机器推理和文本挖掘等计算机
       辅助的知识处理方法,为知识管理和知识发现奠定基础。



       对中医的认知方法进行深入理解,对中医的核心思维模式(如取
具体任务
       向比类等)进行分析与建模。
       采用模糊逻辑、描述逻辑等手段,对阴阳五行、证候、方剂等中
       医药领域核心知识进行建模。
       构建中医药领域的示范性本体,实现中医药知识查询和可视化。
IITCM构建了基于Web的本体共建平台,支持数百人协同加工,产
中医药    生了中医药一体化语言系统( UTCMLS ),它是我国自主研发的
一体化语   大型医学领域本体,内容包括基础理论、中医诊断、中医疾病,中
言系统    药与方剂等,全面覆盖中医药领域,成为该行业事实标准。



              中医药一体化语言系统

 基于Web的协作式编辑工具

 基于关系型数据库的管理和存储
 定义基本的语义类型和语义关系
 将领域概念组织为大型语义网络
 提供本体服务,支持各类应用
中医药一体化语言系统
( UTCMLS )
 设计本体上层框架,定义基本的
 语义类型和语义关系。


 构建面向中医药虚拟组织的本体   目前世界最
 共建平台,支持数百人协同加工   大的传统医
                  学领域本体
 建立内容审核、质量控制、权限
 控制等协作方法和机制
拟采取的技术方案总览:

         模块化的本体结构

        基于OWL的复杂知识建模      语义推理
基于
Web
本体      基于RDFS定义本体结构      语义映射
加工
工具      基于SKOS的知识组织系统     术语转换

        基于SIOC等的语义标注      语义搜索



 基础理论   中医疾病    中医诊断    中药与方剂
2   基于关联数据云的中医药知识融合方法

       拟采用关联数据云等国际最新技术,基于中医药领域本体,实
工作描述
       现中医药领域术语系统的转换和融合,以及中医药知识密集型
       数据库的集成,构建一个面向中医药领域的整合知识库,在此
       基础上搭建中医百科等系统,为中医用户提供知识服务。



       将中医药领域的术语系统转化为语义Web本体,并实现中医药
具体任务
       术语系统的语义融合。
       拟实现IITCM开发的知识密集型数据库的集成,构建中医药整合
       知识库,从而建立相关领域知识之间的关联。
       拟在中医药整合知识库的基础上,搭建中医百科等服务系统。
调研了面向华人的Web本体的发展策略、技术方案和应用前景,讨
前期工作
           论了语义电子科学环境的最新进展和发展趋势,参与了中医药数据
           库集成平台和语义搜索引擎的开发工作。

        Semantic Web Development for Traditional Chinese Medicine. AAAI 2008 (EI)

                  … we present the first systematic adoption of the state-of-the-art Semantic
      Abstract    Web technologies in the codification, management, and utilization of TCM
                  information and knowledge resources…

        Information retrieval and knowledge discovery on the semantic web of traditional
         chinese medicine. WWW 2008 (EI)

      Abstract    … The platform and underlying methodology are proved effective in
                  TCM-related drug usage, discovery, and safety analysis...…

       Intelligent search on integrated knowledge base of traditional Chinese medicine.
        Journal of Southeast University (English Edition) (EI)

      Abstract     TCMSearch,a deployed intelligent search engine for
                   traditional Chinese medicine(TCM).is presented..…
通过一个语义映射工具,将分布式、异构数据转换为RDF图,构成一
技术思路
       个互联数据网络。各种智能应用和智能代理可以通过语义查询接口来
       访问该网络中的数据。




智能应用
                                   语义查询
                                   …

RDF图


                                     映射


异构数据
3   基于语义Web的中医药知识发现方法

       系统研究基于语义Web的知识发现方法,在中医药领域进行智
工作描述
       能应用和知识发现的探索,支持中医证候、辩证论治和方剂配
       伍规律的研究工作。




       基于中医药领域本体,使用文本挖掘方法,从文本中提取语义
具体任务
       关系,并对语义关系进行挖掘和推理。
       基于OWL推理机对中医脾系证候概念模型和分类结构进行推理
       基于语义关联规则挖掘方法,研究方剂配伍规律。
语义图挖掘          基于语义Web技术,提出一种新颖的知识发现框架,即语义图挖
               掘。将领域本体、机器推理与图挖掘相结合,支持复杂网络分析。



   Semantic web for integrated network analysis in biomedicine. In Briefings in
    Bioinformatics (SCI, IF=9.283)

                  …… We introduce a new conceptual framework, semantic graph mining,
    Abstract      to enable researchers to integrate graph mining with ontology reasoning
                  in network data analysis…
                  …
语义图挖掘方法与其他信息技术的关系
  语义图挖掘一
方面利用了本体工         语义图挖掘一方面可以
程所提供的大量的       通过语义查询和搜索获得语
领域本体,另一方       义网上的数据,另一方面可
面可以通过本体匹       以通过资源重要性计算和语
配以及本体可视化       义关联的技术手段来提高语
等手段提高本体工       义查询和搜索的质量.
程的质量.




                学术虚拟组织在增进领
                域专家合作的同时,也
                为通过语义图挖掘方法
  语义图挖掘可以       来分析社会网络提供了
利用生物医学语义网       数据源.
格提供的数据,从复
杂生物医学网络中发
现新颖的模式.
语义图挖掘的主要方法和生物医学应用案例
      语义资源评级              语义关联发现
基于LOD数据计算资源的重要性和相关   发现资源之间的
性,对资源进行评级与排名。被用于探    语义关联(包括
索慢性疾病的致病基因。          连通性,相似性
                     和等价性等类型。
                     被用于基因组学
                     研究。


                 语义图挖掘
     语义模式发现               语义规则发现
从LOD数据中发现各种新颖的模式     从LOD数据中导出各种新颖的领域规则,
(包括团体结构, 频繁子图等),并    存入规则库中维护,并支持语义推理与
做语义标注。被用于疾病网络分析。     临床决策支持。
知识发现的一般过程
1           2          3               4
    分析领域需     收集并筛选      设计并实现             对数据挖掘
    求和问题,       数据,按需         合适的算法,       的结果进行
    获取并表示       对数据进行         完成数据挖        诠释和评估,
    背景知识。       预处理。          掘实验。         并加以利用。



                       语义图挖掘方法
1           2             3            4
    使用领域本       使用关联数         将领域本体        使用语义维
    体进行领域       据技术实现         和语义推理        基等技术实
    知识的分析       数据集成和         与数据挖掘        现挖掘结果
    与建模。        预处理。          方相结合。        的自动推送。
工作    拟通过语义Web技术获取并整合中
描述    医药领域的数据,构成中医药知识         方剂配伍规律发现
      网络。并通过语义图挖掘方法,进
                              基于关联规则挖掘等手
      行各种中医药知识发现实验。
                            段,从方剂学数据集中挖掘
                            方剂配伍规律,辅助方剂学
                            研究。
                中医药知识网络




     领域实体关系发现
                           药物相互作用网络分析
  通过计算语义相似性以及路径
查找等手段,从各种数据源中获              从各种数据源中获取药
取药物之间的相关作用关系,整            物之间的相关作用关系,整
合为药物网络,并分析该网络的            合为药物网络,并分析该网
团体结构等网络特征。                络的团体结构等网络特征。
前期工作           提出基于多代理的语义关联发现方法,能从文本中挖掘语义关系,
               实现语义关系的表示、推理和传播。发表多篇SCI,EI检索的论文。



   A Multi-Agent Framework for Mining Semantic Relations from the Linked Data. In
    Journal of Zhejiang University-SCIENCE C (Computers & Electronics) (SCI)

                  … Here, we present a multi-agent framework for mining hypothetical
    Abstract      semantic relations from the Linked Data, in which the discovery,
                  management, and validation of relations can be carried out
                  independently by different agents..…
关联规则发现方法经常被用来分析方剂配伍规律。周忠眉、秘中
前期
     凯等都在此方向上做过系统性的探索。报告者本人在该领域发明
工作
     了《用于分析中医方剂药物组配规律的泛化关联规则挖掘方法》,
     已获得专利授权。拟在这些工作的基础上,进一步改进方法,改
     善挖掘的效果和结果的有用性。




         本发明公开了一种用于分析中医方剂药物组配规
         律的泛化关联规则挖掘方法,该方法实质上是一
         种结合关联规则挖掘和领域知识表示的泛化关联
         规则挖掘方法,它使用语义万维网技术作为领域
         知识表示的主要手段。
4   中医药知识发现与服务系统开发

       研究创新性的中医药知识服务模式,促进中医药知识的有效传
工作描述
       播。对现有的DartSpora平台进行改进和扩展,开发国际化的
       中医药知识发现与服务平台,使之更有效地服务于科学研究。



       实现知识发现方法与结果的服务化,实现DartSpora与其他知识
具体任务
       服务系统的集成,提高DartSpora的可靠性、可用性和易用性。
       通过一种“语义混搭”技术,将DartSpora的挖掘结果以知识提
       案的形式推送到一个中医百科服务,供领域专家审核和利用。
       与领域专家合作,实现DartSpora在各领域的应用。
基于中医药领域知识库,搭建了中医百科系统,实现语义浏览、语
前期工作
            义查询、语义搜索等功能,为各类用户和应用提供知识服务。相关
            成果发表于SCI检索期刊。

  DartWiki: A Semantic Wiki for Ontology-Based Knowledge Integration in the
 Biomedical Domain. In Current Bioinformatics (SCI, IF=0.976)
            … In this paper, we present a semantic wiki, named DartWiki, to build ontology-
 Abstract   based digital encyclopedia for the biomedicine domain. DartWiki provides a
            Web-based interface for accessing knowledge artifacts in both per-artifact and
            per-concept mode…
该项目预期研究周期为24个月,拟在中医药信息学、Web、AI等
研究
          领域的主流会议和期刊上发表SCI/EI检索的高质量论文4-6篇;申
计划        请国家专利1-2项;开发软件和系统,并申请相关的软件著作权。


     任务                         时间(共2年)

     相关工作调研与总体方案设计              1个月

     中医药知识建模方法研究与实验评估           4个月

     中医药知识融合方法研究与实验评估           4个月

     中医药知识发现方法研究与实验评估           8个月

     中医药知识发现与服务系统开发与部署          4个月

     课题总结、答辩与成果宣传               3个月
选题   选择中医药信息学中的重要课题,内容具体、可行。延续个人博
     士研究,与信息所研究方向一致,与国内、外正在进行的研究工
合理
     作有契合点。




基础   在中医药信息研究所与浙江大学CCNT实验室联合研制的中医药
     中医药知识发现平台和中医药知识服务平台的基础上,深入研究,
扎实
     开发新的功能。




示范   延续博士阶段工作,进一步将国际最新的语义Web技术引入中医
     药领域,研制中医药知识发现与服务系统,有望成为语义Web技
应用
     术在中国推广的示范性应用。

More Related Content

Similar to 面向中医药知识密集型数据的知识创造与发现研究

Cllnical trials protocol design
Cllnical trials protocol design Cllnical trials protocol design
Cllnical trials protocol design James Wei 魏正宗
 
1医院诊断
1医院诊断1医院诊断
1医院诊断meggy45
 
Chkd Kns5.0常用操作方法及其在临床、科研中的实际应用(北京)
Chkd Kns5.0常用操作方法及其在临床、科研中的实际应用(北京)Chkd Kns5.0常用操作方法及其在临床、科研中的实际应用(北京)
Chkd Kns5.0常用操作方法及其在临床、科研中的实际应用(北京)viv
 
高雄醫師會誌112期~專題論壇 | 楊宗龍:漫談3維成像到3D列印在醫療場域的應用-高榮經驗
高雄醫師會誌112期~專題論壇 | 楊宗龍:漫談3維成像到3D列印在醫療場域的應用-高榮經驗高雄醫師會誌112期~專題論壇 | 楊宗龍:漫談3維成像到3D列印在醫療場域的應用-高榮經驗
高雄醫師會誌112期~專題論壇 | 楊宗龍:漫談3維成像到3D列印在醫療場域的應用-高榮經驗J Yeo
 
20080513 鉅仁科技股份有限公司 醫護資訊系統
20080513 鉅仁科技股份有限公司 醫護資訊系統20080513 鉅仁科技股份有限公司 醫護資訊系統
20080513 鉅仁科技股份有限公司 醫護資訊系統Jason Tequila
 
新途健康管理
新途健康管理新途健康管理
新途健康管理LONGAID
 
基因管家辉瑞
基因管家辉瑞基因管家辉瑞
基因管家辉瑞tony peng
 
GlobalMD Journal Club Invitation 2009-11
GlobalMD Journal Club Invitation 2009-11GlobalMD Journal Club Invitation 2009-11
GlobalMD Journal Club Invitation 2009-11Hui Hu
 
1.臨床試驗設計的常見問題與分析
1.臨床試驗設計的常見問題與分析1.臨床試驗設計的常見問題與分析
1.臨床試驗設計的常見問題與分析netnk
 
臨床試驗設計的常見問題與分析
臨床試驗設計的常見問題與分析臨床試驗設計的常見問題與分析
臨床試驗設計的常見問題與分析netnk
 
PRECISION MEDICINE (肿瘤精准医学)
PRECISION MEDICINE (肿瘤精准医学)PRECISION MEDICINE (肿瘤精准医学)
PRECISION MEDICINE (肿瘤精准医学)Li (Philip) Ma
 
Pyscharitric Hospital Project
Pyscharitric Hospital ProjectPyscharitric Hospital Project
Pyscharitric Hospital ProjectZhongyi Dong
 
Complementary and alternative medicine
Complementary and alternative medicineComplementary and alternative medicine
Complementary and alternative medicinePetertan0223
 
臨床試驗的研究設計簡介 Pro tocol design
臨床試驗的研究設計簡介 Pro tocol design臨床試驗的研究設計簡介 Pro tocol design
臨床試驗的研究設計簡介 Pro tocol designnetnk
 
独立评审委员会_Final_0522
独立评审委员会_Final_0522独立评审委员会_Final_0522
独立评审委员会_Final_0522Xiaozhou Ma
 

Similar to 面向中医药知识密集型数据的知识创造与发现研究 (17)

Cllnical trials protocol design
Cllnical trials protocol design Cllnical trials protocol design
Cllnical trials protocol design
 
1医院诊断
1医院诊断1医院诊断
1医院诊断
 
香港六合彩
香港六合彩香港六合彩
香港六合彩
 
香港六合彩
香港六合彩香港六合彩
香港六合彩
 
Chkd Kns5.0常用操作方法及其在临床、科研中的实际应用(北京)
Chkd Kns5.0常用操作方法及其在临床、科研中的实际应用(北京)Chkd Kns5.0常用操作方法及其在临床、科研中的实际应用(北京)
Chkd Kns5.0常用操作方法及其在临床、科研中的实际应用(北京)
 
高雄醫師會誌112期~專題論壇 | 楊宗龍:漫談3維成像到3D列印在醫療場域的應用-高榮經驗
高雄醫師會誌112期~專題論壇 | 楊宗龍:漫談3維成像到3D列印在醫療場域的應用-高榮經驗高雄醫師會誌112期~專題論壇 | 楊宗龍:漫談3維成像到3D列印在醫療場域的應用-高榮經驗
高雄醫師會誌112期~專題論壇 | 楊宗龍:漫談3維成像到3D列印在醫療場域的應用-高榮經驗
 
20080513 鉅仁科技股份有限公司 醫護資訊系統
20080513 鉅仁科技股份有限公司 醫護資訊系統20080513 鉅仁科技股份有限公司 醫護資訊系統
20080513 鉅仁科技股份有限公司 醫護資訊系統
 
新途健康管理
新途健康管理新途健康管理
新途健康管理
 
基因管家辉瑞
基因管家辉瑞基因管家辉瑞
基因管家辉瑞
 
GlobalMD Journal Club Invitation 2009-11
GlobalMD Journal Club Invitation 2009-11GlobalMD Journal Club Invitation 2009-11
GlobalMD Journal Club Invitation 2009-11
 
1.臨床試驗設計的常見問題與分析
1.臨床試驗設計的常見問題與分析1.臨床試驗設計的常見問題與分析
1.臨床試驗設計的常見問題與分析
 
臨床試驗設計的常見問題與分析
臨床試驗設計的常見問題與分析臨床試驗設計的常見問題與分析
臨床試驗設計的常見問題與分析
 
PRECISION MEDICINE (肿瘤精准医学)
PRECISION MEDICINE (肿瘤精准医学)PRECISION MEDICINE (肿瘤精准医学)
PRECISION MEDICINE (肿瘤精准医学)
 
Pyscharitric Hospital Project
Pyscharitric Hospital ProjectPyscharitric Hospital Project
Pyscharitric Hospital Project
 
Complementary and alternative medicine
Complementary and alternative medicineComplementary and alternative medicine
Complementary and alternative medicine
 
臨床試驗的研究設計簡介 Pro tocol design
臨床試驗的研究設計簡介 Pro tocol design臨床試驗的研究設計簡介 Pro tocol design
臨床試驗的研究設計簡介 Pro tocol design
 
独立评审委员会_Final_0522
独立评审委员会_Final_0522独立评审委员会_Final_0522
独立评审委员会_Final_0522
 

面向中医药知识密集型数据的知识创造与发现研究

  • 1.
  • 2. 中医药信息学是中医学与信息科学交叉所产生;以中医药信 中医药 息为研究对象;以中医药系统信息运动规律及其作用为研究 信息学 内容;以中医药信息学方法论为研究方法;以提高中医药信 息获取、转化、传播与利用能力为目标的一门新兴学科。 2008,崔蒙、尹爱宁等学者撰写论文, 提出建立中医药信息学,阐述该学科 的内涵和原理。
  • 3. 中医药 中医药知识工程是中医药信息学的核心课题,旨在支持中医 知识工程 药经验性知识的获取、融合、创新与传播。 初步完成中医药理论和经典文献 的系统整理和诠释;深入认识和 挖掘中医药理论的科学内涵,建 立中医药知识库;运用信息技术 和数据挖掘技术,开展名老中医 学术思想、临床经验和辨证论治 方法的总结研究。
  • 4. 中医药信息学 博士后 中医药知识工程 研究课题 面向中医药知识密集型数据 的知识创造与知识发现
  • 5. 中医药信息学 1 立足于中医药信息研究所组织 中医药知识工程 建设的中医药科学数据库群。 面向中医药知识密集型数据 的知识创造与知识发现 2 3 研究中医个体性知识 研究基于中医药文献 创造的模式与方法。 数据库的知识发现方法。
  • 6. 中医药知识 密集型数据 中医药信息所 • 知识获取所得 开发的数据库 • 富含中医知识 • 方剂数据库 • 文献型数据 • 临床数据库 • 知识管理的基础 • 古文献数据库 …
  • 7. 中医药 中医药信息研究所搭建了基于Web的数据库共建与共享平台。 科学数 该平台支持全国数十家大学和科研院所的数百名科研工作者 据库群 进行数据录入工作,产生了全面的中医药科技数据库体系。
  • 8. 1 中医药个案数据库 病案情况 资助情况 文献情况 加工信息 作者情况 转归信息 患者情况 患者病史 就诊症状 诊断用理化检查 病案情况 诊疗情况 病症zf 就诊体征 判断疗效用理化检查 治疗 判断疗效所使用的量表 中药治疗 西药治疗 针灸治疗 按摩治疗 其他治疗 参考标准 中 穴 按 按 中 药 西 针 位 按 摩 摩 药 配 药 灸 配 摩 穴 手 组 合 成 穴 合 穴 位 法 成 情 分 位 情 位 配 描 况 况 合 述 情 况 核心概念
  • 9. 2 中医药针灸数据库 医家信息 患者诊治信息 患者基本信息 加工信息 图片信息 治疗前理化检查 患者症状信息 治疗后变化指标 病症证 症状 诊疗标准 治疗 中药治疗 西药治疗 针灸治疗 按摩治疗 其他治疗 中 西 穴 药 药 穴 位 组 成 位 按 成 分 摩
  • 10. 3 中医药临床数据库 疾病 对照组 抽象临床研究对象 证候 临床诊疗 临床研究主表 实验检查 临床症状 实验检查 具体治疗过程 药方治疗 西药治疗 针灸治疗 按摩治疗 其他治疗 药 穴 物 位
  • 11. 4 中医药药理数据库 实验基本信息 文献情况 文献原文 加工信息 药理实验 模型组 实验对象 研究药物 临床药理 试验检测 对照组 毒理试验
  • 12. 5 中医疾病数据库 康复 出处 预防 疗效 预后 中药病机 抽象治疗对象 穴位 中药病因 疾病 症状 药物 西医病机 症候 治疗 药物成分 西药病因 中药治疗 西药治疗 针灸治疗 按摩治疗 其他治疗 正骨治疗 地区
  • 13. 6 中药化学数据库 化学实验 实验室条件 化学成份纯化 熔点、旋光度、活性、纯化倍数、回收率、纯度、纯化物组合 1、全局ID 2、名称 化学成份分离 沉降平衡、沉降系数、沉降速度、沉降时间、K系数 3、供试品 4、试剂 5、实验仪器 化学成份合成 6、方法 7、步骤 化学成份鉴定 物理常数测定、化学特性试验 8、相关因素 1、实验结果 2、结论 化学成份提取 重量、收率、物理性质 3、备注 检测品含量、精密度测定、线性关系、稳定性试验、 含量测定 重现性试验、回收率、标准曲线、相对标准偏差、结构测定 通用检测方法 ID、方法、异名、适用范围、主要观测指标、应用条件、定义 属性
  • 14. 著名知识管理学家野中郁次郎(Ikujiro Nonaka)等人 知识创造 于1995年提出了面向知识创造的知识共享模型—SECI。 野中郁次郎 (Ikujiro Nonaka) SECI模型针对各种形式的知识如何在组织中传播和共享 的问题,提出了社会化、外化,组合,内化等四种知识 转化模式,构成知识转化的循环,推动知识的创造。 借鉴知识创造模型SECI,提出了中医药经验型知识 的激活与传播的原理。利用信息学的方法和技术, 通过中医药知识的数字化过程、数据分析、人工智 《中医药信息学的 能方法等,加速知识转化过程,促进知识的传播。 内涵及原理研究》
  • 15. 中医药知识创造活动本质上具有个体性。中医药知识创造的个 个体性中 体性与中医药知识工程的整体性之间的矛盾,是所提出的中医 医药知识 药知识创造模型需要解决的基本矛盾。 创造模型 可借鉴SECI模型,提出具有个体性的中医药知识创造模型。 知识创造 知识工程 的个体性 的整体性 历代 数据 名家 加工 知识密集 型数据库 经典 国际中 文献 知识服务 医团体
  • 16. 数据库中知识发现 (Knowledge Discovery in Database,KDD) 数据库 是20世纪80年代末兴起的一种信息技术,是人工智能与数据库、 中的知 统计学、机器学习等技术的交叉产物,是从海量数据中获取有效、 识发现 新颖、有潜在应用价值和最终可理解模式的过程。 KDD is the nontrivial process of identifying valid, novel, potentially useful, and ultimately understandable patterns in data (KDD是从海量数据中获取有效、新颖、有潜在应 用价值和最终可理解模式的过程). Data mining is a step in the KDD process that consists of applying data analysis and discovery algorithms that, under acceptable computational efficiency limitations, produce a particular enumeration of patterns (or models) over the data (数据挖掘是KDD过程中的一步,即通过使用各种 数据分析和发现算法,在可以接受的时间内产生模式).
  • 17. The KDD process involves using the database along with any required selection, preprocessing, subsampling, and transformations of it; applying data-mining methods (algorithms) to enumerate patterns from it; and evaluating the products of data mining to identify the subset of the enumerated patterns deemed knowledge.
  • 18. 中医药 中医药KDD的探索性工作包括:方剂配伍规律发现,中医药作用 知识发现 机制的科学解释,证候—疾病—基因关联网络分析等。 1 2 周雪忠等通过文本挖掘等手段挖掘中医证 周忠眉等通过关联规则挖掘等手段分析方 候和基因之间的潜在联系。 剂的配伍规律和功效。 3 4 雷蕾等研发中药化学辅助研发系统,辅助药 张连文和袁世宏使用隐结构模型揭示中医 学家从中药知识中获得关于候选药物的线索。 证候的实质,建立辩证的客观标准。
  • 19. 中医药KDD基于“知识密集型数据库”,本质上是“从知识 中医药 到知识”的“知识精炼(Knowledge Refinement)”过程。 知识发现 该过程是人机交互式的迭代过程,在每一次迭代中通过机器 的特点 计算和人工评估相结合的方式实现知识增值,终极目标是实 现中医药知识遗产的永久保真和持续创新。 知识遗产 永久保真和持续创新 历代 名家 数据加工 知识密集 知识 精炼 型数据库 经典 文献
  • 20. 研究思路:基于语义Web的知识发现 研究思路 针对中医药领域需求和KDD主要问题,将语义Web技术与数据挖 掘技术相结合,设计并实现基于语义Web的知识发现解决方案。 应用层 (知识发现与创造) 语义层 (知识的集成) 资源层 (知识的结构化)
  • 21. 研究思路:基于语义Web的知识发现 关联数据 关联数据云(Linked Open Data Cloud)可以被理解为全球性 巨型数据网络,其中每个节点代表一个数据集,每条边代表两个 数据集之间的关联。
  • 22. 研究思路:基于语义Web的知识发现 2007 2008 2009 Sep. 2010 Sep. 2011 295个数据集
  • 23. 研究思路:基于语义Web的知识发现 2007 2008 2009 近五年来,关联数据取得高速发展。 当前,关联数据云拥有近300个数据 集,得到耶鲁、牛津、Nature、 Sep. 2010 Sep. 2011 BBC、雅虎、Facebook 等机构和 公司的关注、参与和支持。 295个数据集
  • 24. 研究思路:基于语义Web的知识发现 2007 2008 2009 关联数据的成功,巩固了语义 Web的学术地位。 Sep. 2010 Sep. 2011 仍然需要示范性、研究性的大型 应用项目,推动语义Web的发展。 295个数据集
  • 25. 研究思路:基于语义Web的知识发现 博士阶段研究语义Web技术及其在中医药等领域的应用,5年语义Web软 工作基础 件和系统开发经验,发表论文10余篇,撰写《面向语义Web的设计模式 名录》等技术报告,以及语义Web在生物医学领域的应用综述。  Semantic Web Meets Integrative Biology: A Survey. In Briefings in Bioinformatics (SCI, IF=9.283) (Publication in progress) … We provide insight into how Semantic Web technologies can be used Abstract to build open, standardized, and interoperable solutions for interdisciplinary integration on a global basis. We present a rich set of case studies in system biology, integrative neuroscience, bio- pharmaceutics, and translational medicine, to highlight the technical features and benefits of Semantic Web applications in integrative biology… Reviewer 1: “ … an excellent paper that does a very nice job surveying the ways in which semantic web technology is being used Feedbacks beneficially in bioinformatics…” Reviewer 2: ”…The overall framework the authors set up for this review is an interesting one, and could be quite compelling to some readers of the Journal…” Reviewer 3: ”… Overall this is a well-written article, with a very useful list of references.”
  • 26. 研究思路:基于语义Web的知识发现 工作基础 报告人在博士研究中,针对中医药信息化的核心问题,兼顾现代 服务业的发展趋势,提出“知识即服务”的理念,以及“知识网 络”和“知识生态系统”等理论模型,并在中医药领域具体实施。 知识网 …一种网络化的知识表示模型,将领域知识体系表达为 络模型 一组既相互独立,又彼此关联的知识模块。该模型具有 异构性,分布性, 关联性,普适性等特征… 知识生 …知识生态系统模型旨在刻画群体性知识系统的形态, 态系统 为中医药电子科学环境的构建提供指导意见。该模型将 各种知识体系视为相互影响、相互竞争的活体,研究如 何营造“百花齐放、百家争鸣”的知识共享环境,尽可 能保护各种知识体系(尤其是濒危无形文化遗产)的生 存,实现文化的多元化…
  • 27. 研究思路:基于语义Web的知识发现 中医知识创 造的个体性 知识网络 是一种网络化的知识 表示模型,将领域知识体系 表达为一组既相互独立,又彼此 关联的知识模块。该模型具有 异构性,分布性, 关联性, 普适性等特征。 中医知识工 程的整体性
  • 28. 研究思路:基于语义Web的知识发现 中医知识创 造的个体性 个人 社会 本体 本体 网络 网络 知识网络 中医知识工 程的整体性
  • 29. 研究思路:基于语义Web的知识发现 中医知识创 造的个体性 个人 社会 本体 本体 网络 网络 知识网络 知识密集 关联数 中医知识工 型数据库 据网络 程的整体性
  • 30. 研究思路:基于语义Web的知识发现 中医知识创 基于知识网络 造的个体性 的知识发现 个人 社会 本体 本体 网络 网络 知识网络 知识密集 关联数 中医知识工 型数据库 据网络 程的整体性
  • 31. 研究思路:基于语义Web的知识发现 中医知识创 基于知识网络 造的个体性 的知识发现 知识 网络 基于社会网络模型,将个人本体互联为本体网络,作为知识网络的骨架 将知识密集型数据互联为数据网络,作为知识网络的基础内容 个人 社会 本体 兼顾知识创造的个体性和知识工程的整体性,符合中医药知识的多样性、 本体 网络 网络 分布性、复杂性等特点 知识网络 为进行知识发现的智能代理提供结构性知识资源 知识密集 关联数 中医知识工 型数据库 据网络 程的整体性
  • 32. 研究思路:基于语义Web的知识发现 中医知 识遗产 知识获取 中医药 中医典籍 共享领 域本体 中医药整合知识库 历代名家
  • 33. 研究思路:基于语义Web的知识发现 中医知 科学技 识遗产 术知识 知识获取 知识关联 中医药 中医典籍 共享领 医学 域本体 中医药整合知识库 历代名家 生物学
  • 34. 研究思路:基于语义Web的知识发现 中医知 科学技 识遗产 术知识 知识获取 知识关联 中医药 中医典籍 共享领 医学 域本体 中医药整合知识库 知识 知识 历代名家 服务 创造 生物学 国际中 医团体
  • 35. 研究思路:基于语义Web的知识发现 智能代理 中医知 科学技 识遗产 知识 知识 术知识 查询 发现 知识获取 知识关联 中医药 中医典籍 共享领 医学 域本体 中医药整合知识库 知识 知识 历代名家 服务 创造 生物学 国际中 医团体
  • 36. 研究思路:基于语义Web的知识发现 知识生态 系统模型 智能代理 中医知 科学技 识遗产 知识 知识 术知识 查询 发现 知识获取 知识关联 中医药 中医典籍 共享领 医学 域本体 中医药整合知识库 知识 知识 历代名家 服务 创造 生物学 国际中 医团体
  • 37. 研究思路:基于语义Web的知识发现 知识生态 系统模型 智能代理 中医知 科学技 识遗产 知识 知识 术知识 知识生态 查询 发现 系统模型 回答中医药知识遗产保护、中医药现代化和国际化等问题。 知识获取 知识关联 中医药 中医典籍 为“中医药知识密集型数据”、“知识创造”和“知识发现” 医学 共享领 域本体 等论题中涉及的概念提供解释框架。 涉及本体知识库、知识互联、知识查询与推理等技术,为语义 中医药整合知识库 Web技术的使用提供依据和指导。 知识 知识 历代名家 服务 创造 生物学 国际中 医团体
  • 38. 研究思路:基于语义Web的知识发现 中医药知识发现的主要问题: 中医药领域知识模型复杂,并未形成标准化的知识体系,缺乏 1 KDD所必需的明确需求和背景知识。 中医药KDD所用的数据经常是不完整的,且存在一系列关键性 2 质量问题,严重影响了知识发现的效果。 中医药领域多为文本型数据,不易被数据挖掘算法直接处理。 中医药KDD与领域知识密切相关,需要针对中医药领域的特定 3 需求,结合知识表示和推理等技术,改进传统的数据挖掘方法, 提出新颖的“领域知识驱动的数据挖掘方法”。 缺乏中医药KDD结果的诠释和评价体系,导致所发现的知识没 4 有得到充分的利用。
  • 39. 研究思路:基于语义Web的知识发现 1 2 3 4 中医药 领域知识模 存在严重的 需要领域知 缺乏诠释、 知识发 型复杂,并 数据孤岛现 识驱动的数 评价、利用 现的主 未形成标准 象和数据质 据挖掘方法 挖掘结果的 要问题 化知识体系。 量缺陷。 的支持。 有效手段。 1 2 3 4 基于语 使用领域本 使用关联数 将领域本体 使用语义维 义互联 体进行领域 据技术实现 和语义推理 基等技术实 网的解 知识的分析 数据集成和 与数据挖掘 现挖掘结果 决方案 与建模。 预处理。 方相结合。 的自动推送。
  • 40. 研究思路:基于语义Web的知识发现 中医药 疾病 方剂 五行 化学 结构性 医案 数据库 知识库 知识库 知识库 知识库 文献 中医药 领域本体 数据库的语义集成 知识的创造与发现 知识的评价与利用
  • 41. 研究思路:基于语义Web的知识发现 中医药 疾病 方剂 五行 化学 结构性 医案 数据库 知识库 知识库 知识库 知识库 文献 2 中医药 基于语义互联网的数据 领域本体 数据库的语义集成 互联与检索方法研究 1 基于本 3 体的中 语义关系自动抽取与中 知识的创造与发现 医药知识发现方法研究 医药复 杂知识 建模方 4 法研究 基于语义维基的中医知 知识的评价与利用 识百科与服务技术研发
  • 42. 研究思路:基于语义Web的知识发现 1 知 识 领域 使用模糊逻辑、描述逻辑等知识表示方法, 本体 对中医药领域知识进行建模,构建中医药领 获 取 建模 域本体。 知 识 2 数据 基于中医药领域本体实现中医药数据库的互 关联 联与集成,构建可浏览、可查询、可搜索的 融 合 网络 数据关联网络。 3 知识 基于数据关联网络,通过数据挖掘(如文本 知 识 发现 挖掘)和语义推理等算法,实现知识发现过 创 新 方法 程,产生知识提案。 4 知识 将知识提案自动推送到中医知识服务系统 知 识 服务 (如百科服务),以供领域专家对知识提案 系统 进行检查、诠释和利用。 传 播
  • 43. 1 基于Web本体的中医药知识建模方法研究 拟采用模糊描述逻辑等创新的知识建模方法,以Web本体为主 工作描述 要技术手段,对中医药领域的概念、理论和知识体系进行建模, 构建示范性领域本体,从而支持机器推理和文本挖掘等计算机 辅助的知识处理方法,为知识管理和知识发现奠定基础。 对中医的认知方法进行深入理解,对中医的核心思维模式(如取 具体任务 向比类等)进行分析与建模。 采用模糊逻辑、描述逻辑等手段,对阴阳五行、证候、方剂等中 医药领域核心知识进行建模。 构建中医药领域的示范性本体,实现中医药知识查询和可视化。
  • 44. IITCM构建了基于Web的本体共建平台,支持数百人协同加工,产 中医药 生了中医药一体化语言系统( UTCMLS ),它是我国自主研发的 一体化语 大型医学领域本体,内容包括基础理论、中医诊断、中医疾病,中 言系统 药与方剂等,全面覆盖中医药领域,成为该行业事实标准。 中医药一体化语言系统  基于Web的协作式编辑工具  基于关系型数据库的管理和存储  定义基本的语义类型和语义关系  将领域概念组织为大型语义网络  提供本体服务,支持各类应用
  • 45. 中医药一体化语言系统 ( UTCMLS ) 设计本体上层框架,定义基本的 语义类型和语义关系。 构建面向中医药虚拟组织的本体 目前世界最 共建平台,支持数百人协同加工 大的传统医 学领域本体 建立内容审核、质量控制、权限 控制等协作方法和机制
  • 46. 拟采取的技术方案总览: 模块化的本体结构 基于OWL的复杂知识建模 语义推理 基于 Web 本体 基于RDFS定义本体结构 语义映射 加工 工具 基于SKOS的知识组织系统 术语转换 基于SIOC等的语义标注 语义搜索 基础理论 中医疾病 中医诊断 中药与方剂
  • 47. 2 基于关联数据云的中医药知识融合方法 拟采用关联数据云等国际最新技术,基于中医药领域本体,实 工作描述 现中医药领域术语系统的转换和融合,以及中医药知识密集型 数据库的集成,构建一个面向中医药领域的整合知识库,在此 基础上搭建中医百科等系统,为中医用户提供知识服务。 将中医药领域的术语系统转化为语义Web本体,并实现中医药 具体任务 术语系统的语义融合。 拟实现IITCM开发的知识密集型数据库的集成,构建中医药整合 知识库,从而建立相关领域知识之间的关联。 拟在中医药整合知识库的基础上,搭建中医百科等服务系统。
  • 48. 调研了面向华人的Web本体的发展策略、技术方案和应用前景,讨 前期工作 论了语义电子科学环境的最新进展和发展趋势,参与了中医药数据 库集成平台和语义搜索引擎的开发工作。  Semantic Web Development for Traditional Chinese Medicine. AAAI 2008 (EI) … we present the first systematic adoption of the state-of-the-art Semantic Abstract Web technologies in the codification, management, and utilization of TCM information and knowledge resources…  Information retrieval and knowledge discovery on the semantic web of traditional chinese medicine. WWW 2008 (EI) Abstract … The platform and underlying methodology are proved effective in TCM-related drug usage, discovery, and safety analysis...…  Intelligent search on integrated knowledge base of traditional Chinese medicine. Journal of Southeast University (English Edition) (EI) Abstract TCMSearch,a deployed intelligent search engine for traditional Chinese medicine(TCM).is presented..…
  • 49. 通过一个语义映射工具,将分布式、异构数据转换为RDF图,构成一 技术思路 个互联数据网络。各种智能应用和智能代理可以通过语义查询接口来 访问该网络中的数据。 智能应用 语义查询 … RDF图 映射 异构数据
  • 50. 3 基于语义Web的中医药知识发现方法 系统研究基于语义Web的知识发现方法,在中医药领域进行智 工作描述 能应用和知识发现的探索,支持中医证候、辩证论治和方剂配 伍规律的研究工作。 基于中医药领域本体,使用文本挖掘方法,从文本中提取语义 具体任务 关系,并对语义关系进行挖掘和推理。 基于OWL推理机对中医脾系证候概念模型和分类结构进行推理 基于语义关联规则挖掘方法,研究方剂配伍规律。
  • 51. 语义图挖掘 基于语义Web技术,提出一种新颖的知识发现框架,即语义图挖 掘。将领域本体、机器推理与图挖掘相结合,支持复杂网络分析。  Semantic web for integrated network analysis in biomedicine. In Briefings in Bioinformatics (SCI, IF=9.283) …… We introduce a new conceptual framework, semantic graph mining, Abstract to enable researchers to integrate graph mining with ontology reasoning in network data analysis… …
  • 52. 语义图挖掘方法与其他信息技术的关系 语义图挖掘一 方面利用了本体工 语义图挖掘一方面可以 程所提供的大量的 通过语义查询和搜索获得语 领域本体,另一方 义网上的数据,另一方面可 面可以通过本体匹 以通过资源重要性计算和语 配以及本体可视化 义关联的技术手段来提高语 等手段提高本体工 义查询和搜索的质量. 程的质量. 学术虚拟组织在增进领 域专家合作的同时,也 为通过语义图挖掘方法 语义图挖掘可以 来分析社会网络提供了 利用生物医学语义网 数据源. 格提供的数据,从复 杂生物医学网络中发 现新颖的模式.
  • 53. 语义图挖掘的主要方法和生物医学应用案例 语义资源评级 语义关联发现 基于LOD数据计算资源的重要性和相关 发现资源之间的 性,对资源进行评级与排名。被用于探 语义关联(包括 索慢性疾病的致病基因。 连通性,相似性 和等价性等类型。 被用于基因组学 研究。 语义图挖掘 语义模式发现 语义规则发现 从LOD数据中发现各种新颖的模式 从LOD数据中导出各种新颖的领域规则, (包括团体结构, 频繁子图等),并 存入规则库中维护,并支持语义推理与 做语义标注。被用于疾病网络分析。 临床决策支持。
  • 54. 知识发现的一般过程 1 2 3 4 分析领域需 收集并筛选 设计并实现 对数据挖掘 求和问题, 数据,按需 合适的算法, 的结果进行 获取并表示 对数据进行 完成数据挖 诠释和评估, 背景知识。 预处理。 掘实验。 并加以利用。 语义图挖掘方法 1 2 3 4 使用领域本 使用关联数 将领域本体 使用语义维 体进行领域 据技术实现 和语义推理 基等技术实 知识的分析 数据集成和 与数据挖掘 现挖掘结果 与建模。 预处理。 方相结合。 的自动推送。
  • 55. 工作 拟通过语义Web技术获取并整合中 描述 医药领域的数据,构成中医药知识 方剂配伍规律发现 网络。并通过语义图挖掘方法,进 基于关联规则挖掘等手 行各种中医药知识发现实验。 段,从方剂学数据集中挖掘 方剂配伍规律,辅助方剂学 研究。 中医药知识网络 领域实体关系发现 药物相互作用网络分析 通过计算语义相似性以及路径 查找等手段,从各种数据源中获 从各种数据源中获取药 取药物之间的相关作用关系,整 物之间的相关作用关系,整 合为药物网络,并分析该网络的 合为药物网络,并分析该网 团体结构等网络特征。 络的团体结构等网络特征。
  • 56. 前期工作 提出基于多代理的语义关联发现方法,能从文本中挖掘语义关系, 实现语义关系的表示、推理和传播。发表多篇SCI,EI检索的论文。  A Multi-Agent Framework for Mining Semantic Relations from the Linked Data. In Journal of Zhejiang University-SCIENCE C (Computers & Electronics) (SCI) … Here, we present a multi-agent framework for mining hypothetical Abstract semantic relations from the Linked Data, in which the discovery, management, and validation of relations can be carried out independently by different agents..…
  • 57. 关联规则发现方法经常被用来分析方剂配伍规律。周忠眉、秘中 前期 凯等都在此方向上做过系统性的探索。报告者本人在该领域发明 工作 了《用于分析中医方剂药物组配规律的泛化关联规则挖掘方法》, 已获得专利授权。拟在这些工作的基础上,进一步改进方法,改 善挖掘的效果和结果的有用性。 本发明公开了一种用于分析中医方剂药物组配规 律的泛化关联规则挖掘方法,该方法实质上是一 种结合关联规则挖掘和领域知识表示的泛化关联 规则挖掘方法,它使用语义万维网技术作为领域 知识表示的主要手段。
  • 58. 4 中医药知识发现与服务系统开发 研究创新性的中医药知识服务模式,促进中医药知识的有效传 工作描述 播。对现有的DartSpora平台进行改进和扩展,开发国际化的 中医药知识发现与服务平台,使之更有效地服务于科学研究。 实现知识发现方法与结果的服务化,实现DartSpora与其他知识 具体任务 服务系统的集成,提高DartSpora的可靠性、可用性和易用性。 通过一种“语义混搭”技术,将DartSpora的挖掘结果以知识提 案的形式推送到一个中医百科服务,供领域专家审核和利用。 与领域专家合作,实现DartSpora在各领域的应用。
  • 59. 基于中医药领域知识库,搭建了中医百科系统,实现语义浏览、语 前期工作 义查询、语义搜索等功能,为各类用户和应用提供知识服务。相关 成果发表于SCI检索期刊。  DartWiki: A Semantic Wiki for Ontology-Based Knowledge Integration in the Biomedical Domain. In Current Bioinformatics (SCI, IF=0.976) … In this paper, we present a semantic wiki, named DartWiki, to build ontology- Abstract based digital encyclopedia for the biomedicine domain. DartWiki provides a Web-based interface for accessing knowledge artifacts in both per-artifact and per-concept mode…
  • 60. 该项目预期研究周期为24个月,拟在中医药信息学、Web、AI等 研究 领域的主流会议和期刊上发表SCI/EI检索的高质量论文4-6篇;申 计划 请国家专利1-2项;开发软件和系统,并申请相关的软件著作权。 任务 时间(共2年) 相关工作调研与总体方案设计 1个月 中医药知识建模方法研究与实验评估 4个月 中医药知识融合方法研究与实验评估 4个月 中医药知识发现方法研究与实验评估 8个月 中医药知识发现与服务系统开发与部署 4个月 课题总结、答辩与成果宣传 3个月
  • 61. 选题 选择中医药信息学中的重要课题,内容具体、可行。延续个人博 士研究,与信息所研究方向一致,与国内、外正在进行的研究工 合理 作有契合点。 基础 在中医药信息研究所与浙江大学CCNT实验室联合研制的中医药 中医药知识发现平台和中医药知识服务平台的基础上,深入研究, 扎实 开发新的功能。 示范 延续博士阶段工作,进一步将国际最新的语义Web技术引入中医 药领域,研制中医药知识发现与服务系统,有望成为语义Web技 应用 术在中国推广的示范性应用。