BI 商业智能简述

1,962 views

Published on

商业智能简述

Published in: Technology
0 Comments
5 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
1,962
On SlideShare
0
From Embeds
0
Number of Embeds
345
Actions
Shares
0
Downloads
52
Comments
0
Likes
5
Embeds 0
No embeds

No notes for slide

BI 商业智能简述

  1. 1. 商业智能简述 jeffjie@botwave.com http://t.sina.com.cn/jeffjie 面向技术/非技术从业人员的BI扫盲课 Saturday, November 20, 2010
  2. 2. jeffjie@botwave.com 大纲 1.商业智能的概念 2.商业智能的技术 3.商业智能的工具 Saturday, November 20, 2010
  3. 3. jeffjie@botwave.com 何谓智能 Saturday, November 20, 2010
  4. 4. jeffjie@botwave.com 何谓智能 邻居大婶:明年前鸡还是鸭? Saturday, November 20, 2010
  5. 5. jeffjie@botwave.com 何谓智能 邻居大婶:明年前鸡还是鸭? 大学生小白:当公务员还是去私企? Saturday, November 20, 2010
  6. 6. jeffjie@botwave.com 何谓智能 邻居大婶:明年前鸡还是鸭? 大学生小白:当公务员还是去私企? 博汇Peter:加薪还是裁员? Saturday, November 20, 2010
  7. 7. jeffjie@botwave.com 何谓智能 一起回忆一下止尿布的故事 邻居大婶:明年前鸡还是鸭? 大学生小白:当公务员还是去私企? 博汇Peter:加薪还是裁员? Saturday, November 20, 2010
  8. 8. jeffjie@botwave.com 有决策就有智能 何谓智能 一起回忆一下止尿布的故事 邻居大婶:明年前鸡还是鸭? 大学生小白:当公务员还是去私企? 博汇Peter:加薪还是裁员? Saturday, November 20, 2010
  9. 9. jeffjie@botwave.com 决策的依据 Saturday, November 20, 2010
  10. 10. jeffjie@botwave.com 决策的依据 Saturday, November 20, 2010
  11. 11. jeffjie@botwave.com 决策的依据 特定目标 Saturday, November 20, 2010
  12. 12. jeffjie@botwave.com 决策的依据 特定目标 具体度量 Saturday, November 20, 2010
  13. 13. jeffjie@botwave.com 决策的依据 特定目标 具体度量具体度量 Saturday, November 20, 2010
  14. 14. jeffjie@botwave.com 决策的依据 特定目标 具体度量 基础和反馈信息 具体度量 Saturday, November 20, 2010
  15. 15. jeffjie@botwave.com • 它是:一套工具/解决方案 • 它能:将企业中现有的数据转化为知 识,帮助企业做出明智的业务经营决策 商业智能的定义 Saturday, November 20, 2010
  16. 16. jeffjie@botwave.com 商业智能模型 Text Text 数据仓库 数据挖掘 报表 联机分析数据源 ETL Saturday, November 20, 2010
  17. 17. jeffjie@botwave.com 大纲 1.商业智能的概念 2.商业智能的技术 3.商业智能的工具 Saturday, November 20, 2010
  18. 18. jeffjie@botwave.com • ETL (数据抽取、转换、装载) • 数据仓库 • OLAP--联机分析 • Cube--多维数据集与MDX • 数据挖掘、等等。。。 商业智能的技术 Saturday, November 20, 2010
  19. 19. jeffjie@botwave.com ETL 关系数据库 其他数据库 XML、文件 数据仓库 Extract Transform Load Saturday, November 20, 2010
  20. 20. jeffjie@botwave.com 数据仓库 OLAP 报表 挖掘 Saturday, November 20, 2010
  21. 21. jeffjie@botwave.com 数据仓库 1.它是关系数据库 OLAP 报表 挖掘 Saturday, November 20, 2010
  22. 22. jeffjie@botwave.com 数据仓库 1.它是关系数据库 2.包含事实表与维度表 OLAP 报表 挖掘 Saturday, November 20, 2010
  23. 23. jeffjie@botwave.com 数据仓库 1.它是关系数据库 3.表结构范型: 星型结构 雪花型结构 2.包含事实表与维度表 OLAP 报表 挖掘 Saturday, November 20, 2010
  24. 24. jeffjie@botwave.com OL(X)P哥俩好 OLAP = (联机分析) OnLine Analytical Processing OLTP = (联机事务) OnLine Transaction Processing E.F.Codd (1960S ─) (1993 ─) Saturday, November 20, 2010
  25. 25. jeffjie@botwave.com OLTP T-SQL select amount from sales where customer = 1 实时的 日常的 交易的 快速的 应用的 银行 系统 OA 订餐 系统 电子 商务关系数据库 Saturday, November 20, 2010
  26. 26. jeffjie@botwave.com OLAP MDX SELECT [Product] ON COLUMS,[Location] ON ROWS Cube 分析的 可延迟的 海量的 需求多变的 决策的 分析 系统 决策 系统 自助 报表 Saturday, November 20, 2010
  27. 27. jeffjie@botwave.com 凭什么选OLAP!!?? ── OLTP愤愤不平地说 Saturday, November 20, 2010
  28. 28. jeffjie@botwave.com 凭什么选OLAP!!?? ── OLTP愤愤不平地说 是马是骡 子拉出来 骝骝! Saturday, November 20, 2010
  29. 29. jeffjie@botwave.com 凭什么选OLAP!!?? ── OLTP愤愤不平地说 是马是骡 子拉出来 骝骝! Saturday, November 20, 2010
  30. 30. jeffjie@botwave.com 任务背景 “真不少”连锁超市是全球5000强公司之一,每天全 球各地的超市有上百万次交易,将近年末了,大 老板想要看看今年的销售统计报表。 下面是精简后的销售数据历史表结构及示例: ID 地区 产品 价格 时间 10909002 香港 口香糖 10.8 2010-10-20 今年销售数据历史表中有数据50亿条 Saturday, November 20, 2010
  31. 31. jeffjie@botwave.com 任务一 口香糖 洗发水 衣服 玩具 面包 亚太区 非洲 北美 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 我要今年每个地 区对应各种产品的销售额 报表! Saturday, November 20, 2010
  32. 32. jeffjie@botwave.com 任务一之OLTP篇 1.select count(价格) ,地区,产品 from 销售历史 group by 地区,产品 2.执行!两个小时过去了。。。。。 地区 产品 销售额 香港 口香糖 1000000 香港 衣服 2000000 ......... ......... .......... 3.哎哟,还得行转列!嗯,搞定! Saturday, November 20, 2010
  33. 33. jeffjie@botwave.com 任务一之OLAP篇 小菜一碟,以产品为列,以地区为行输 出销售额嘛。 select [产品] on columns,[地区] on rows from [销售历史仓库] 2秒不到,搞定! 口香糖 洗发水 衣服 玩具 面包 亚太区 非洲 北美 ....... 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 ....... ........ ........ ........ ........ Saturday, November 20, 2010
  34. 34. jeffjie@botwave.com 任务一总结 OLTP兄, 你动作慢不但止,查询时 还阻塞系统2小时! OLAP兄,你动作非常快, 慢着,我好像看得懂你的查询 语句,有空教教我! Saturday, November 20, 2010
  35. 35. jeffjie@botwave.com 任务二 香港 非洲 南美 新加坡 中国 春季 夏季 秋季 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 我要今年每个季 度对应各种地区的销售额 报表! Saturday, November 20, 2010
  36. 36. jeffjie@botwave.com 任务二之OLTP篇 2.select count(价格) ,地区,求季度(时间) from 销售历史 group by 地区,求季度(时间) 地区 季度 销售额 香港 春季 1000000 香港 夏季 2000000 ......... ......... .......... 4.哎哟,还得行转列!终于搞定! 3.执行!我了个去,8个小时过去了。 1.首先我得写一个求季度的函数哇。 Saturday, November 20, 2010
  37. 37. jeffjie@botwave.com 任务二之OLAP篇 没难度,以地区为列,以季度为行输出 销售额嘛。 select [地区] on columns,[时间].[季 度].children on rows from [销售历史仓库] 还是2秒不到,搞定! 香港 非洲 南美 新加坡 中国 春季 夏季 秋季 秋季 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 2,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 3,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 4,000,000,000 5,000,000,000 Saturday, November 20, 2010
  38. 38. jeffjie@botwave.com 任务二总结 OLTP兄, 一次比一次慢,我不敢再 拿系统阻塞冒险了 OLAP兄,一如往常的快,接 下来我还要看月份的报表。 Saturday, November 20, 2010
  39. 39. jeffjie@botwave.com OLAP的秘密 多维数据库 数据仓库 各种数据源 Saturday, November 20, 2010
  40. 40. jeffjie@botwave.com 魔术发生的地方-Cube T-Shit hats Clothes Saturday, November 20, 2010
  41. 41. jeffjie@botwave.com 魔术发生的地方-Cube 维度(Dimension) T-Shit hats Clothes Saturday, November 20, 2010
  42. 42. jeffjie@botwave.com 魔术发生的地方-Cube 度量(Measure) 维度(Dimension) T-Shit hats Clothes Saturday, November 20, 2010
  43. 43. jeffjie@botwave.com 魔术发生的地方-Cube 度量(Measure) 维度(Dimension) T-Shit hats Clothes 层次结构 (Hierarchy) Saturday, November 20, 2010
  44. 44. jeffjie@botwave.com 魔术师的咒语-MDX SELECT {[维度成员],[维度成员]} ON 坐标, FROM [多维数据集] WHERE ([切片维度]) 总坐标数为128 常用坐标常量: COLUMNS(0),ROWS(1), PAGES(2),SECTIONS(3),CHAPTERS(4) 语法 PS. Saturday, November 20, 2010
  45. 45. jeffjie@botwave.com 数据挖掘 分类 | 回归 | 分割 | 关联 | 序列分析 | 概率预测 决策树 获得数据之间的关系 并做出预测 贝叶斯 聚合算法 关联算法 Saturday, November 20, 2010
  46. 46. jeffjie@botwave.com 大纲 1.商业智能的概念 2.商业智能的技术 3.商业智能的工具 Saturday, November 20, 2010
  47. 47. jeffjie@botwave.com • ETL工具 • 数据仓库 • OLAP工具 • 报表工具 • 挖掘工具 工欲善其事 Saturday, November 20, 2010
  48. 48. jeffjie@botwave.com 商用BI工具 Saturday, November 20, 2010
  49. 49. jeffjie@botwave.com 开源BI工具 BIRT 开源免费 组件 开源免费 方案 开源商用 方案 Saturday, November 20, 2010
  50. 50. jeffjie@botwave.com 参考 一、Introduction to data cube http://www2.cs.uregina.ca/~dbd/cs831/notes/dcubes/dcubes.html 二、Rapid Miner http://rapid-i.com/content/view/181/90/ 三、SpagoBI http://www.spagoworld.org/xwiki/bin/view/SpagoBI/ 四、Jasperreports http://jasperforge.org/projects/jasperreports 五、pentaho商业智能解决方案 http://www.pentaho.com/ 六、pentaho社区版商业智能解决方案 http://community.pentaho.com/projects/bi_platform/ 七、Palo for Excel http://www.palo.net/en/ 八、《MicroSoft SQL Server 2005商业智能实现》 http://book.douban.com/subject/3016243/ 九、商业智能工具维基百科 http://en.wikipedia.org/wiki/Business_intelligence_tools Saturday, November 20, 2010
  51. 51. jeffjie@botwave.com 讨论 Saturday, November 20, 2010
  52. 52. jeffjie@botwave.com 感谢聆听 Bio: 微勃&Twitter: @jeff_kit jeff@fallever.com Saturday, November 20, 2010

×