Your SlideShare is downloading. ×
互联网上的知识探索
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

互联网上的知识探索

2,614
views

Published on

对互联网上已有的知识类产品的一个学习报告

对互联网上已有的知识类产品的一个学习报告

Published in: Technology

3 Comments
4 Likes
Statistics
Notes
  • 互联网上的知识探索
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here
  • 多谢指正。这只是一个学习计划的第一阶段总结,我完整的版本还没有写完,我会再发布修正和补充后的版本。
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here
  • linked data我们翻译为“关联数据”,似乎更加具有语义性。哈哈。供参考。
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here
No Downloads
Views
Total Views
2,614
On Slideshare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
14
Comments
3
Likes
4
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. 互联网上的知识探索 苑明理 2012年5月Monday, May 7, 12
  • 2. 雷蒙·吕尔 zairja 加泰罗尼亚贵族(1232-1315) 戈特弗里德·莱布尼 (1646-1716) 中世纪阿拉伯的思想机器 从阿拉伯语翻译柏拉图著作为拉丁语 设想了演算推理器 一 利用字母组合的占星术工具 设想了一 思想机器 弗诺·文奇 高登·摩尔 约 ·冯·诺伊曼 查尔斯·巴贝奇 (1791-1871) (1944- ) (1929- ) (1903-1957) 差分机、分析机 技术奇点 摩尔定律 EDVAC、ENIAC 万尼瓦尔·布什 艾伦·图 (1890-1974) (1912-1954) memex 计算理论Monday, May 7, 12
  • 3. 目录 • 互联网上的知识探索:数据、信息、知识;一些提法;知识工程;近年案例 • 信息的组织:传统分类法、大众分类法、案例考察 • 信息的检索: 图书馆的方法、检索模型、主题模型 • 知识和社会化Monday, May 7, 12
  • 4. 数据、信息、知识 • 数据、信息、知识 • DIKW框架 • 知识的多 形态 • 教科书上的定型的知识 • 研究和实践团体中的未定型的知识 • 怎样打出租车?某地蔬菜的贵与贱Monday, May 7, 12
  • 5. 于知识的一些提法 • 情境知识、公共知识 • 隐性知识、显性知识 • 规则、自发秩序、 杂系统、自组织、涌现 哈耶克 • 知识的生产 • 方法的视角:试错法、科学方法 • 社会的视角:动态、演变的 杂过程,微观(企业内部决策过程的社会学考察)与 宏观的观察(清代的中国学术与同时期的欧洲学术发展)Monday, May 7, 12
  • 6. 知识市场 • 知识市场是一 散布知识的机制:稀缺商品或者公共物品? • 传统的知识产权制度:把知识作为稀缺商品来售卖 • 免费的网络知识市场:把知识作为公共物品,通过获得注意力的分配,从广告 或者其他附加的形式,获得持续运行的资金Monday, May 7, 12
  • 7. 知识工程 • 定义:费根鲍姆在1983年的版本—将知识整合入计算机系统来解决 杂任务; 后延伸至以知识为基础的系统的 发、运行和维护。 • 知识表示:框架、语义网络、RDF、OWL…… • 知识抽取:RDB2RDF、DBPedia、FreeBase • 知识发现:从结构数据中发现模式 • 推理引擎:Monday, May 7, 12
  • 8. 语义网 • 原初的想法:Web 不单由是人类能 理解的页面组 成,更要有由机器能 理解的结构数据构成,并以此 为基础,让机器更好的为人类服务。 • 链接数据(Linked Data):CKAN、DBPedia、 DBLP Bibliography、FOAF…… • 截止2011年,Web 上有300亿 RDF 三元组和 5 亿 RDF 链接。 蒂姆·伯纳斯-李 勋爵 对于 Web ,我有一个梦想,机器变得会分析 Web 上 所有的数据 — 内容、链接、人和机器之间的事 务。“语义网”,将会使这成为现实,并且已经在发生 • 对比之下,2008年Google宣布他们收录了 1 Tera的 了, 但当它实现之日,所有的贸易、行政之类的日常 机制和我们每日的生活都会被彼此之间对话着的机器 URL。 所处理。人们售卖多年的“智能代理”将最终被物化。Monday, May 7, 12
  • 9. 维基百科 • 聚沙成塔的人力知识工程 • 人人可编辑的页面 • 自我管理的社群 • 由维基媒体基金会运作 •变 :Scholarpedia、SemanticWikiMonday, May 7, 12
  • 10. 问答网站 • 早期形态:3form.org(1999)、63336(2002,Mobile)、Ask MetaFilter(2003) • 近期形态:Aardvark(2008,IM+Social)、StackOverflow(2008)、 Quora(2009)、Formspring(2009,Social)Monday, May 7, 12
  • 11. 推荐与协同过滤 • StumbleUpon: 2001 • Digg: 2004 • Reddit: 2005 • Hacker News: 2007 • Hunch: 2009Monday, May 7, 12
  • 12. 语义搜索 • 通常意义上的信息检索侧重于 键词的相 性匹配,给出的结果是匹配的各个 信息节点;语义搜索则把检索目标所在知识体系中的位置、上下文因素也纳入 考虑,搜索的的结果不是信息节点,而是可能匹配的知识节点的集合 • GoPubMed:成立于2002年的生物医药学专业检索引擎 • Research Gate:成立于2008年的专业研究者SNS,提供语义搜索和问答服务 • Powerset: 成立于2006,特色是自然语言搜索,2008年被微软收购并融入Bing • Google:也提供自然语言搜索Monday, May 7, 12
  • 13. Wolfram Alpha • 2009年5月上线;不是搜索引擎,它的检索 目标是有限的知识库 • 解算数学问题 • 自然语言理解和计算:伊莉莎白二世在1974 年年龄是多少? • 结合多数据源的计算:按照GDP排名倒数第 52位的是那个国家?Monday, May 7, 12
  • 14. IBM Watson • IBM DeepQA计 : 结合了自然语言处 理、信息检索、知识表示和推理的能不同领 域的技术 • 在电视问答比赛 Jeopardy! 中,打败人类选 手 • 硬件:90个IBM Power 750 服务器,共 2280芯 • 数据:百科全书、字典、文学作品、分类系 统、本体Monday, May 7, 12
  • 15. Siri • Siri公司于2007年创立,后于2010年被苹果收购,并在 iPhone4S 发布 • Siri 是 Speech Interpretation and Recognition Interface的缩写 • 语音识 • 对话型人机界面 • 个人上下文感知 • 服务代理Monday, May 7, 12
  • 16. 人工智能一 • 弱人工智能与强人工智能 • 常识问题:人工智能的巨大屏障,目前对此问题的解决需要以一 基础本体 (上本体)为根基,建立庞大的知识库,但这个做法有效与否仍然存有争议 • 常识知识库:Cyc、Open Mind Common Sense (OMCS)、YAGO等等 • 蓝脑计 :对哺乳动物的大脑进行逆向工程,模拟的细胞数量将在2014年达到 鼠脑的水平Monday, May 7, 12