数据的价值和灵魂

  • 823 views
Uploaded on

大数据资讯满天飞,做数据的专业人士需要静下下思考的一些问题,这是个人心得,分享之。

大数据资讯满天飞,做数据的专业人士需要静下下思考的一些问题,这是个人心得,分享之。

  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
    Be the first to like this
No Downloads

Views

Total Views
823
On Slideshare
0
From Embeds
0
Number of Embeds
7

Actions

Shares
Downloads
9
Comments
0
Likes
0

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. 数据的价值和灵魂 司学峰 2013.7
  • 2. 目 录 • 大数据时代 • 视频行业数据价值 • 社交数据运营典范-Linkedin • 数据科学家成长之路--资源分享
  • 3. 大数据时代
  • 4. 不忘挖井人 • Google之伟大:基于GFS与Map-Reduce计算模 式解决了大数据存储计算瓶颈 • Hadoop之父Doug Cutting
  • 5. 虽然企业部署Hadoop大数据系统的最终目的是 进行“性感”的分析应用,但是大多数企业距离这 一目标还很远很远, Hadoop目前只是“穷人的 ETL” --IDC
  • 6. 数据 • Data are values of qualitative or quantitative variables, belonging to a set of items. Data in computing (or data processing) are represented in a structure, often tabular (represented by rows and columns), a tree (a set of nodes with parent-children relationship) or a graph structure (a set of interconnected nodes). Data are typically the results of measurements and can be visualised using graphs or images. Data as an abstract concept can be viewed as the lowest level of abstraction from which information and then knowledge are derived. -------维基百科 数据是定性或定量化的变量,属于一组Item集合。在计算机中数据通常以表(行列)、 树、图进行表示。典型的数据是可量化的结果,能够以图的形式进行展现。相对于信 息与知识,数据是最低层次的抽象概念。
  • 7. 知识 数据信息
  • 8. 视频行业数据价值 • 面向业务,支持运营:比如产品A/B测试 • 面向管理,服务决策:比如网站合作决策 • 面向用户,数据产品:比如视频推荐
  • 9. 要什么-做什么-怎么做 • 整体流量:PV、UV、VV、CV、在线时长等等 • 用户行为:弹出率、人均观看时长等 • 剧集表现:视频排行、视频观看效果等 • 合作渠道:引入流量、引入质量等 • 其他如广告、运维等等
  • 10. 要什么-做什么-怎么做 PV日志 • 页面点击日志—记录用户每次点击行为 VV日志 • 视频观看日志—心跳记录用户观看时长
  • 11. 要什么-做什么-怎么做 • 细分 • 排列组合 • 分类汇总 • 数据可视化
  • 12. 无细分毋宁死 • 用户细分: 地区细分:国家、地区、省份等 用户特征:入口来源(至于年龄、男女、职业等,打住!) • 页面细分: 页面类型:播放页、详情页、首页等等 频道类型:首页、电视剧、电影等等 • 来源细分: 来源类型:直接、导航、搜索、社交等等 来源功能模块:直接、剧集列表、推荐、视频后联播、 • 视频细分: 静态特征:导演、演员、地区、类型等等 动态特征:观看时长分组、VV量分组等等
  • 13. 面对问题 • 频道流量中播放页、频道首页、列表页、子频道流量的分布如何 • 频道流量中站内、站外来路分布 • 对于站内来路,其他频道导入的流量分布 • 对于站内来路,静态页来源、播放页来源带来的流量分布 • 娱乐频道首页流量来路、流出分布 • 娱乐频道子频道及专题页面流量排行 • 哪些子频道及专题页比较受欢迎,受欢迎的特征原因是什么,如何让更多用户看到。 • 哪些子频道及专题页处于沉没状态,原因何在,是调整页面布局、内容以进行优化,还是直 接砍掉 • 频道列表页使用状况如何,是否对热点位置进行凸出显示 • 站外来源给娱乐频道带来的流量现状,哪些是用户搜索关键词来的,哪些是推荐视频来的 • 娱乐频道视频播放页流量分布如何 • 热点TOP N视频流量在站内、站外来源的分布如何 • 热点视频TOP N站内静态页来路分布 • 热点视频TOP N能够热起来与什么有关系,视频名称、视频截图、视频推荐位置等 • 视频流量分类分布 • ……..
  • 14. 模型研发背景 • 广告竞价---大数据挖掘 • 版权买卖—大数据挖掘 • 年度盛典—大数据故事化 • 剧运营:渠道与来源—大数据BI-CUBE • 拳头指数---业内特色Sexy大数据产品
  • 15. 价值模型原型 数据 产品 决策依据 运营支撑
  • 16. 剧价值模型原型
  • 17. 模型更多 ……
  • 18. 社交数据运营典范
  • 19. • LinkedIn本质上就是一家通过运营大数据进而产生商业价值企业。从 2002年12月创立到2013年初,LinkedIn注册用户已到2亿,平均每秒 增加一个新用户,86%的“财富100强企业”正在使用LinkedIn的付费解 决方案, • 有人将LinkedIn定义为找工作的平台,但事实上,从LinkedIn的数据 来看,只有20%的人是比较活跃地在找工作,大约80%的LinkedIn用 户主要的商业目的是同其他公司建立联系/关系。他们希望能够连接世 界上所有的专业人士,使工作更为有效率、更富影响力、更成功。 • “您可能认识的人”,以及我们现在开发的“您会感兴趣的工作、您会认 识的人、您可能会喜欢看的等”,这些产品会促进业务增长,增强用 户粘性。而在此基础上,最核心的业务(目前收益占到40%—50%) 猎头业务,作为纯数据的业务,目的就是帮助企业找到最适合的、最 优秀的人才。在LinkedIn看来,保证公司成功最核心的就是人才,从 数据中分析人,帮助这些人才成功。---利人利己。 • 主营收入与核心功能相关,由能衡量效果的用户直接支付,所以营收 非常稳健,不容易被别人抢走。
  • 20. Linkedin数据核心—面向决策 LinkedIn构建了一套新模型,从金字塔变成菱形,面积缩小一半,真正将大数据做小,实 现团队快速运行。因为对决策团队而言,真正有价值的数据也许只有1K—几十K。用语言 描述就是实现“是还是不是,做还是不做,什么时候做,做什么。”
  • 21. We do not believe in Data. we believe in Energy. We do not believe in Analytics, we believe in Actions. We do not believe in Insights, we believe in Value.
  • 22. 面向运营-A/B 测试
  • 23. linkedin数据产品
  • 24. 深入Linkedin数据产品之魂
  • 25. Linkedin模式小结 • Linkedin模式:Linkedin创始人豪尔指出:“我们创造了一 种独特的商业模式,这一模式与我们构建的产品相匹 配。” • Linkedin数据价值:Linkedin收入的三个层面:招聘、营销 方案和付费资讯是对数据的组合打包兜售--业务+模式+ 挖掘。 • Linkedin平台战略:LinkedIn 的愿景是绘制完整的经济图 谱(Economic Graph),将企业所需要的技能与拥有技 能的用户进行精确的匹配和对接。并预计达成这样的目 标将需要五到十年的时间,这一次 LinkedIn 在用户关系 方面的新探索,和对用户数据的进一步挖掘,无疑使它 在这样的道路上迈出了坚实的一步。
  • 26. 互联网商业模式 广告 会员订阅 出售用户资 料 APP分成 商品直销 沃顿商学院营销学教授皮纳·伊尔迪里姆
  • 27. 统一标准的盈利模式并不存在 • 找到适合自己的模式 • 看得到的容易模仿,看不到的只能去悟, 去探索。 • 有钱可以几天盖一座摩天大楼,但却无法 拔苗助长
  • 28. 数据科学
  • 29. 数据科学时代 • 通过大数据处理技术,对用户产生的海量日志进行 采集、预处理、细分、分类汇总,基于BI解决方案 形成各种日常报表、Dashboard等很好的解决了数据 是什么的问题,从一定程度上解决了为什么的问题。 • 那么然后呢,数据价值就此止步吗?NO! 看数据不能仅仅看涨跌,看趋势,更要透过数据看 到“情景”化的数据故事;还要实现数据的ROI最大化。 • 一个哲学问题:数据从用户中到,还要回到用户中去, 数据是用户行为、事件场景的记录与刻画,那么数 据结果要还原出用户行为和事件场景,还有数据产 品化。
  • 30. 品质 品味 运营支撑 决策参考 数据产品
  • 31. 凤凰涅磐
  • 32. 做把握数据灵魂的人 • 面对纷繁复杂的业务调整、面对海量数据 的快速增长、面对多数据少价值的尴尬局 面如何去做?还原数据本身价值! • 数据科学家!21世纪最SEXY的人
  • 33. WEB建模三个理论 • 厨房超市理论—--数据部定位 蔬菜生产、收割、清洗加工、形成模块、 大厨特色菜 • 交通流量理论-------流量建模 出入京主干道、市内主干道、频繁路径 • 影视剧剧组理论----数据故事化 素材、主题、故事、主演、拍摄、产品
  • 34. 数据科学家 • 数据科学与数据科学家的认识是一个渐进的过 程,一个探索的过程 • 是一个团队:大数据处理专家、统计专家、 Coding专家、算法专家、业务专家构成 • 数据科学家:做数据的人,不是在做数学题, 而是在做作文题,命题作文更多是非命题作文。 面对一堆海量数据,没人具体知道这些到底要 怎么用,能怎么用,能产生什么价值,更没有 人告诉你怎么去干。但是你要紧紧围绕数据 “灵魂”或“宪法”去做。
  • 35. 数据科学的灵魂 1)把碎片化的数据还原为情景化信息 2)从信息中探索有意义有价值知识 价值知识=业务+策略+挖掘 3)数据从哪里来到哪里去 基于用户数据形成面向用户的数据产品
  • 36. 几点建议 • 简单 优于 复杂 • 便宜 优于 昂贵 • 明晰 优于 晦涩 • 目的 比 过程更重要 • 洞见 比 精确更重要 • 理解 比 技术更重要 • 行动! ------《数据之魅》
  • 37. • 数据的价值: 什么:是什么、为什么、怎么样 方向:决策参考,运营依据,数据产品与变现 • 数据灵魂: 还原数据记录时的场景,用直观易懂的方式表 现有价值的信息;数据从哪里来回哪里去。 数据平台建设:开发、共赢、可持续发展模式 总结
  • 38. 谢谢
  • 39. 个人简介 • 2010.12至今 网络视频行业数据建模与挖掘 • 2010.12之前 电信行业BI系统开发,微软BI认证专家 • 2009.7 毕业于北京工业大学 管理科学与工程专业 • 2005.7 毕业于河北师范大学 计算机科学与技术专业
  • 40. 参考资料 • 图片来自 google图片搜索 • http://www.datasciencecentral.com/forum/to pics/the-3vs-that-define-big-data • http://www.forbes.com/sites/davefeinleib/20 12/06/19/the-big-data-landscape/ • https://en.wikipedia.org/wiki/Data • ….