Your SlideShare is downloading. ×
数据挖掘实例入门
数据挖掘实例入门
数据挖掘实例入门
数据挖掘实例入门
数据挖掘实例入门
数据挖掘实例入门
数据挖掘实例入门
数据挖掘实例入门
数据挖掘实例入门
数据挖掘实例入门
数据挖掘实例入门
数据挖掘实例入门
数据挖掘实例入门
数据挖掘实例入门
数据挖掘实例入门
数据挖掘实例入门
数据挖掘实例入门
数据挖掘实例入门
数据挖掘实例入门
数据挖掘实例入门
数据挖掘实例入门
数据挖掘实例入门
数据挖掘实例入门
数据挖掘实例入门
数据挖掘实例入门
数据挖掘实例入门
数据挖掘实例入门
数据挖掘实例入门
数据挖掘实例入门
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

数据挖掘实例入门

1,282

Published on

在公司做的数据挖掘入门培训,部分页面使用了谢邦昌的例子

在公司做的数据挖掘入门培训,部分页面使用了谢邦昌的例子

Published in: Technology
0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
1,282
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
0
Comments
0
Likes
2
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide
  • 一个用户终身的 pv
  • 算法有多重要?
  • Transcript

    • 1. 中关村在线开发三组 易铎 [email_address] 2010-10-15 数据挖掘实例入门
    • 2. 什么是数据挖掘?
    • 3. 全球最大的在线商店,利用推荐系统,展示相关商品 推荐系统为整体销售增加了 15% 的购买量 Source: 谢邦昌
    • 4. 美 国国 防 财务 部需要 从 每年上百 万次 的 军 火交易中 发现 可能存在的 欺诈现象 。 发现 可能存在 欺诈 的交易, 进行 深入調查, 节约 了大量的 调查 成本 Source: 谢邦昌
    • 5. 汇丰 銀行需要 对 不 断 增長的客戶群 进 行分 类 , 对 每 种产 品找出最有 价 值的客戶。 营销费用 減少了 30 % Source: 谢邦昌
    • 6. 数据挖掘 ( Data Mining) 应用方向 Source: 谢邦昌 0 20 40 60 80 % of Respondents Customer profiling Targeted marketing Market basket analysis Attrition management Fraud detection Credit risk analysis Type of Application
    • 7. 数据挖掘
        • 将积累的大量的历史数据,进行分析归纳和整合。
        • 萃取有用的信息。如趋势、特征及相关性,找出有意义而且用户有兴趣的模式
        • 提供管理阶层进行决策的参考依据。
    • 8. 五大功能
        • 分类
        • 估计
        • 预测
        • 关联分组
        • 聚类
      Source: TBD
    • 9. 数据挖掘常见算法 序列聚类 神经网络 逻辑回归 线性回归 决策树 聚类 时间序列 关联规则 贝叶斯
    • 10. 商业智能数据挖掘步骤
    • 11. 垃圾信息过滤系统架构图 Source: TBD 费舍尔算法
    • 12. 数据挖掘实例 Source: TBD
    • 13. 出口预测
        • 背景
        • 为制定利率、税收等政策需要对下半年的出口量进行预测
        • 数据
        • 历史出口数据
      Source: TBD
    • 14. 出口预测
        • 时间序列算法
        • 通过数字进行决策
        • 应用
        • 访问量预测
        • 系统负载
        • 容量规划
      Source: TBD
    • 15. 胆固醇含量
        • 背景
        • 医生需要了解体重、年龄、体重、血压和胆固醇之间的关系
        • 数据
        • 体重、年龄、体重、血压和胆固醇
      Source: TBD
    • 16. 胆固醇含量
        • 线性回归算法
        • 复杂规律简单化
        • 节省检查成本
        • 应用
        • 推导出可简单计算的公式
        • 效果分析
      Source: TBD
    • 17. 超市促销广告投放
        • 背景
        • 超市发动促销广告攻势,广告预算是有限的。如何发挥最大作用?
        • 数据
        • 促销费用、店面面积、顾客数、所处位置
      Source: TBD
    • 18. 超市促销广告投放
        • 线性回归算法
        • 复杂规律简单化
        • 节省成本,精准投放
        • 货源供给补充
        • 应用
        • 推导出可简单计算的公式
        • 投入产出明细
      Source: TBD
    • 19. 肾切除手术
        • 背景
        • 有一种高风险的治疗肾癌的肾切除手术,需要预测手术后癌细胞是否转移
        • 数据
        • 内皮生长因子、年龄、癌细胞分级、转移状况等
      Source: TBD
    • 20. 肾切除手术
        • 逻辑回归算法
        • 预测手术成功率
        • 应用
        • 是非判断
        • 客户流失分析
        • 寻找关键因素
        • 预测、检验效果
      Source: TBD
    • 21. 谁会购买自行车
        • 背景
        • 某商家需要促销一种自行车,促销预算有限,需要找到会购买自行车的人群,进行针对促销
        • 数据
        • 交通距离、是否购买、性别、住房、汽车、孩子
        • 婚姻状况、地区
      Source: TBD
    • 22. 谁会购买自行车
        • 多种算法都可以实施
        • 定向邮件群发
        • 应用
        • 自定义内容推送
        • 邮件群发
      Source: TBD
    • 23. 算法? Source: TBD
    • 24. SVM 支持向量机 http://blog.pluskid.org/?p=682
    • 25. 数据挖掘应用问题
        • 明确商业定义
        • 闭环持续
        • 战略性
        • 数据挖掘的作用不能夸大
      Source: TBD
    • 26. 推荐图书 Source: TBD
    • 27. 有问题? Source: TBD
    • 28. 谢谢! Source: TBD
    • 29.  

    ×