数据库简史

2,052 views

Published on

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
2,052
On SlideShare
0
From Embeds
0
Number of Embeds
11
Actions
Shares
0
Downloads
22
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

数据库简史

  1. 1. Since 1970: 关系 数据库简史 吴琦 2007 年 5 月
  2. 2. 目标 <ul><li>了解关系数据库理论以及产业发展的历史脉络 </li></ul><ul><li>不同公司,不同人物在数据库 30 年发展历史中的沉浮也许能给我们带来一些启示 </li></ul>
  3. 3. 索引目录 <ul><li>数据库产业现状 </li></ul><ul><li>理论发展历史 </li></ul><ul><li>实验原型发展历史 </li></ul><ul><li>产品发展历史 </li></ul><ul><li>总结 </li></ul>
  4. 4. 数据库产业现状 <ul><li>数据库已成为 IT 行业的基石,成为最重要的产品 </li></ul><ul><li>各公司市场份额。 IBM 主要的 revenue 来自大型机。 Oracle 是 Unix/Linux 平台上的霸主, 50% 的营业收入来自数据库 </li></ul>
  5. 5. 数据库研究现状 <ul><li>论文发表数量最多的单位: Stanford University, IBM .. </li></ul><ul><li>IBM 在数据库方面专利的数量上有绝对优势。 </li></ul>
  6. 6. 索引目录 <ul><li>数据库产业现状 </li></ul><ul><li>理论发展历史 </li></ul><ul><li>实验原型发展历史 </li></ul><ul><li>产品发展历史 </li></ul><ul><li>总结 </li></ul>
  7. 7. What’s database? <ul><li>A computer database is a structured collection of records or data that is stored in a computer system so that a computer program or person using a query language can consult it to answer queries </li></ul><ul><li>第一个 database 出现在 19 世纪 60 年代,由在 GE 工作的 Charles Bachman 设计实现。 1973 年因此获得图灵奖。 </li></ul>See : http://en.wikipedia.org/wiki/Database
  8. 8. 层次数据库 <ul><li>层次数据库和现在的 LDAP 和 XPATH 很类似,以一棵树的形式来组织数据,每个节点只有一个父节点。 </li></ul><ul><li>IBM IMS 是最典型的层次数据库,源自阿波罗登月计划。 </li></ul><ul><li>国内建行还在使用。 </li></ul>
  9. 9. 网状数据库 <ul><li>网状数据库一个节点可以有多个父节点。大型机上网状数据库提供商主要有 Honeywell , Siemens AG , CulliNet 。小型机上主要有 DEC 。 </li></ul><ul><li>标准由 CODASYL ( “ Conference on Data Systems Languages ”) 下面的 DBTG 工作组来制定 . 又称为 CODASYL 模型或 DBTG 模型 </li></ul><ul><li>层次数据库和网状数据库统称为 Navigational 数据库。 </li></ul><ul><li>访问数据的方法 : </li></ul><ul><li>“ 中国 / 北京 /mysee/ 吴琦” </li></ul>
  10. 10. Ed.Codd : 关系数据模型的鼻祖 <ul><li>Ed.Codd , 1923 年出生于英格兰 , 二战时在英国皇家空军任机长 ,1948 年毕业于牛津大学数学系,随后加入 IBM 。 </li></ul><ul><li>6 0 年代,重回学校,在密歇根大学进修计算机与通信专业 ( 当时他已年近 4 0 ) , 65 年取得 博士学位 。 </li></ul><ul><li>84 年离开 IBM 。 </li></ul>[1] http://en.wikipedia.org/wiki/Edgar_F._Codd
  11. 11. 关系数据模型的早期命运 <ul><li>“ A Relational Model of Data for Large Shared Data Banks” 1970 年发表在 IBM system journal 上 </li></ul><ul><li>IBM 内部包括 Codd 本人没有意识到关系数据模型的影响力。 </li></ul><ul><li>IBM 已经有 IMS 层次关系数据库而且利润很高, IMS 部门位高权重,所以成了政治斗争的牺牲品 ,IBM 对关系数据库的看法是:“这东西过十年再说吧。 &quot; </li></ul><ul><li>Codd 积极在 IBM 外部推广关系数据模型的好处,获得了一定的认可,同时也更进一步加深了和 IBM 的矛盾。 </li></ul>
  12. 12. 索引目录 <ul><li>数据库产业现状 </li></ul><ul><li>理论发展历史 </li></ul><ul><li>实验原型发展历史 </li></ul><ul><li>产品发展历史 </li></ul><ul><li>总结 </li></ul>
  13. 13. SystemR ( 1973 ~ 1979 ) : 关系数据库的原型 <ul><li>1973 年 IBM 迫于竞争压力,开始研究 关系数据库的可行性。 </li></ul><ul><li>Codd 并没有加入该项目。 </li></ul><ul><li>SystemR 最终成为计算机发史上最有影响力的项目之一, 1988 年获得 ACM 系统奖。但是 SystemR 还是没有说服 IBM 放弃 IMS 。 </li></ul><ul><li>System R 项目中值得提及的人物包括 : Donald Chamberlain, James Gray, Leonard Liu (刘英武) 。 </li></ul>
  14. 14. SystemR 的重要成果 <ul><li>1975:IBM 的研究员 Don Chamberlin 和 Morton Astrahan 的论文 &quot;Implentation of a Structured English Query Language&quot; 在 SEQUEL 的基础上描述了 SQL 语言的第一个实现方案。这也是 System R 项目得出的重大成果之一。 </li></ul><ul><li>1976:IBM System R 项目组发表了论文 &quot;A System R: Relational Approach to Database Management&quot; ,描述了一个关系型数据库的原型。 </li></ul><ul><li>1976:IBM 的研究员 Jim Gray 发表了名为“ Granularity of Locks and Degrees of Consistency in a Shared DataBase” 的论文,正式定义了数据库事务的概念和数据一致性的机制。 </li></ul><ul><li>1979:IBM 的研究员 Pat Selinger 在她的论文 &quot;Access Path Selection in a Relational Database Management System&quot; 中描述了业界第一个关系查询优化器。 </li></ul>
  15. 15. 刘英武( Leonard Liu ) <ul><li>台湾人,普林斯顿计算机系博士。 </li></ul><ul><li>System R 项目起步阶段时的项目经理,将小组的研究方向从操作系统转移到数据库领域。 </li></ul><ul><li>在 IBM 青云直上, 30 多岁做到了负责 IBM 所有软件业务的 Senior VP 。 </li></ul><ul><li>1989 年加入宏碁集团 (Acer Group) 担任总裁, 1992 年离开。 </li></ul><ul><li>2003 年 8 月 在上海创立了软件外包公司群硕软件。 </li></ul><ul><li>每周工作七天的狂人 </li></ul>
  16. 16. Jim Gray <ul><li>由于在数据库事务方面开创性的研究, 1998 年获得图灵奖。 </li></ul><ul><li>1993 微软为邀请他加入特地在在湾区开设研究院。 </li></ul><ul><li>2007 年 1 月 28 日,独自驾帆船出海播撒母亲的骨灰,因此失踪。 </li></ul><ul><li>互联网展开规模庞大的营救。拍摄卫星图片,分割以后,供自愿者识别。 </li></ul>[1] : http://research.microsoft.com/~Gray/
  17. 17. Donald Chamberlain <ul><li>SQL ( Structured English Query Language )语言之父, SEQUEL 已被注册商标,因此采用 SQL 。 </li></ul><ul><li>特地找来语言学家,通过向圣何塞州立大学学生教授 SQL ,来寻找 SQL 的改进方案。 </li></ul><ul><li>随后对桌面系统产生兴趣离开数据库领域 </li></ul><ul><li>现在继续在 IBM 硅谷实验室工作。负责 XQuery 。 </li></ul><ul><li>ACM 院士 , 美国国家工程院院士, IBM 院士 </li></ul>
  18. 18. Ingres 项目 <ul><li>加州伯克利的两位教授领导,与 System R 几乎同时开始。总共 5 ~ 6 个程序员,主要是 Berkeley 的研究生 </li></ul><ul><li>基本上与 SystemR 类似,但是主要集中在 Unix 和小型机上。 </li></ul><ul><li>代码可以免费获得 </li></ul><ul><li>在它的基础上产生了 Sybase, Microsoft SQL Server, Informix 等重要的数据库产品 </li></ul><ul><li>采用了自己独特的查询语言 “ QUEL” 和 IBM 的 SQL 有所不同。 </li></ul>
  19. 19. 索引目录 <ul><li>数据库产业现状 </li></ul><ul><li>理论发展历史 </li></ul><ul><li>原型系统 </li></ul><ul><li>产品发展历史 </li></ul><ul><li>总结 </li></ul>
  20. 20. Oracle <ul><li>1977 年创建, 2000 美金起家,名字叫软件开发实验室,创始人包括: Larry Ellison , Bob Miner (总裁) 和 Ed Oates (副总裁),由国防部的一个外包项目开始。 </li></ul><ul><li>受到了 IBM 论文的启发,随后紧跟 IBM 得以成功 </li></ul><ul><li>1979 年发布第一款产品 Oracle 2.0 </li></ul><ul><li>1983 年获得红杉的风险投资 </li></ul><ul><li>1986 年上市 </li></ul>
  21. 21. 创始员工 <ul><li>Ed Oates: 由于婚姻问题, 80 年代离开 Oracle 后再加入, 99 年彻底离开。 </li></ul><ul><li>Bruce Scott : 83 年 Oracle 第三版发布之前因为工作压力太大,离开 Oracle 。 </li></ul><ul><li>Bob Miner :和 Scott 承担最主要的开发任务 ,Oracle 的幕后英雄。 1994 年死于癌症 </li></ul><ul><li>Larry Ellison :一直担任 CEO </li></ul>
  22. 22. Larry Ellison <ul><li>不可靠、傲慢、聪明、无耻、冷酷无情的 人 </li></ul><ul><li>Oracle (One Rich Asshole Called Larry Ellison) </li></ul><ul><li>32 岁创建 Oracle ,以前一事无成,被老婆抛弃。 </li></ul><ul><li>热衷航海 驾驶战斗机 </li></ul><ul><li>喜欢日本文化 </li></ul><ul><li>2000 年做过一星期的世界首富 </li></ul>
  23. 23. 黄金年代 <ul><li>Apple : Steve Jobs </li></ul><ul><li>Microsoft: Bill Gates </li></ul><ul><li>Oracle : Larry Ellison </li></ul>
  24. 24. DB2 历史 <ul><li>1983:IBM 在这一年发布了 DATABASE 2 ( DB2 ) for MVS </li></ul><ul><li>1993: 发布 Unix 平台上的 DB2 </li></ul><ul><li>1995:DB2 在 Windows NT 和 SINIX 平台上的第一个版本发布。 </li></ul><ul><li>2001: 收购 Informix </li></ul>
  25. 25. Sybase 和 SQLServer 的历史 <ul><li>1984 由 INGRESS 项目的成员 Mark Hoffman 和 Bob Epstein 创建 </li></ul><ul><li>1988 和微软合作,与微软共享代码。将数据库迁移到 OS/2 平台和 Windows 平台 </li></ul><ul><li>1991 年上市 </li></ul><ul><li>1993 和微软分家,微软基于 Windows 平台上的代码开发 SQLServer </li></ul>
  26. 26. 索引目录 <ul><li>数据库产业现状 </li></ul><ul><li>理论发展历史 </li></ul><ul><li>实验原型发展历史 </li></ul><ul><li>产品发展历史 </li></ul><ul><li>总结 </li></ul>
  27. 27. 数据库未来的趋势? <ul><li>开源数据库 : Mysql , Postgress </li></ul><ul><li>非结构化信息: XML 数据库 DB2 Viper </li></ul><ul><li>系统结构的变革:内存数据库 Times10(Oracle) ,gTable (Google) </li></ul>
  28. 28. 给我们的启示 ? <ul><li>顺应历史潮流 </li></ul><ul><li>夹缝中寻求机会 </li></ul><ul><li>IT 行业竞争惨烈,没有永远的霸主 </li></ul><ul><li>失败有时候不是因为你做错了 </li></ul><ul><li>关注 IT 领域发展包括学术研究领域的前沿 </li></ul>

×