Submit Search
Upload
Bigdata introduction
•
0 likes
•
652 views
T
Techwiser
Follow
大数据简介
Read less
Read more
Technology
Business
Report
Share
Report
Share
1 of 19
Recommended
唯品会大数据实践 Sacc pub
唯品会大数据实践 Sacc pub
Chao Zhu
No sql@vip new
No sql@vip new
Chao Zhu
自助工具助Dba提升效率
自助工具助Dba提升效率
Chao Zhu
数据架构方面的一些探讨
数据架构方面的一些探讨
Chao Zhu
X program-within-a-month
X program-within-a-month
Chao Zhu
大型电商的数据服务的要点和难点
大型电商的数据服务的要点和难点
Chao Zhu
中大型规模的网站架构运维 Saac
中大型规模的网站架构运维 Saac
Chao Zhu
数据库性能量化
数据库性能量化
mysqlops
Recommended
唯品会大数据实践 Sacc pub
唯品会大数据实践 Sacc pub
Chao Zhu
No sql@vip new
No sql@vip new
Chao Zhu
自助工具助Dba提升效率
自助工具助Dba提升效率
Chao Zhu
数据架构方面的一些探讨
数据架构方面的一些探讨
Chao Zhu
X program-within-a-month
X program-within-a-month
Chao Zhu
大型电商的数据服务的要点和难点
大型电商的数据服务的要点和难点
Chao Zhu
中大型规模的网站架构运维 Saac
中大型规模的网站架构运维 Saac
Chao Zhu
数据库性能量化
数据库性能量化
mysqlops
数据库性能量化
数据库性能量化
yzsind
Mesos-based Data Infrastructure @ Douban
Mesos-based Data Infrastructure @ Douban
Zhong Bo Tian
艺龙旅行网架构案例分享-Qcon2011
艺龙旅行网架构案例分享-Qcon2011
Yiwei Ma
Big Data Taiwan 2014 Track1-3: Big Data, Big Challenge — Splunk 幫你解決 Big Data...
Big Data Taiwan 2014 Track1-3: Big Data, Big Challenge — Splunk 幫你解決 Big Data...
Etu Solution
阿里自研数据库 Ocean base实践
阿里自研数据库 Ocean base实践
drewz lin
2016-07-12 Introduction to Big Data Platform Security
2016-07-12 Introduction to Big Data Platform Security
Jazz Yao-Tsung Wang
Track A-3 Enterprise Data Lake in Action - 搭建「活」的企業 Big Data 生態架構
Track A-3 Enterprise Data Lake in Action - 搭建「活」的企業 Big Data 生態架構
Etu Solution
Exadata那点事
Exadata那点事
freezr
豆瓣数据架构实践
豆瓣数据架构实践
Xupeng Yun
OTN软硬件结合数据库解决方案
OTN软硬件结合数据库解决方案
freezr
Track A-1: Cloudera 大數據產品和技術最前沿資訊報告
Track A-1: Cloudera 大數據產品和技術最前沿資訊報告
Etu Solution
Hadoop的典型应用与企业化之路 for HBTC 2012
Hadoop的典型应用与企业化之路 for HBTC 2012
James Chen
GDG Taichung - Firebase Introduction 01
GDG Taichung - Firebase Introduction 01
Duran Hsieh
Query store查詢調校新利器
Query store查詢調校新利器
Rico Chen
Alibaba数据库运维最佳实践
Alibaba数据库运维最佳实践
freezr
Portfolio
Portfolio
Jimmy Chu
Sql server 2014 新功能探索
Sql server 2014 新功能探索
Rico Chen
給開發人員的資料庫效能建議
給開發人員的資料庫效能建議
Rico Chen
Hadoop con 2015 hadoop enables enterprise data lake
Hadoop con 2015 hadoop enables enterprise data lake
James Chen
Cloudera企业数据中枢平台
Cloudera企业数据中枢平台
Jianwei Li
Hadoop 與 SQL 的甜蜜連結
Hadoop 與 SQL 的甜蜜連結
James Chen
高科技產業資料分析解決方案 Hare DB
高科技產業資料分析解決方案 Hare DB
Etu Solution
More Related Content
What's hot
数据库性能量化
数据库性能量化
yzsind
Mesos-based Data Infrastructure @ Douban
Mesos-based Data Infrastructure @ Douban
Zhong Bo Tian
艺龙旅行网架构案例分享-Qcon2011
艺龙旅行网架构案例分享-Qcon2011
Yiwei Ma
Big Data Taiwan 2014 Track1-3: Big Data, Big Challenge — Splunk 幫你解決 Big Data...
Big Data Taiwan 2014 Track1-3: Big Data, Big Challenge — Splunk 幫你解決 Big Data...
Etu Solution
阿里自研数据库 Ocean base实践
阿里自研数据库 Ocean base实践
drewz lin
2016-07-12 Introduction to Big Data Platform Security
2016-07-12 Introduction to Big Data Platform Security
Jazz Yao-Tsung Wang
Track A-3 Enterprise Data Lake in Action - 搭建「活」的企業 Big Data 生態架構
Track A-3 Enterprise Data Lake in Action - 搭建「活」的企業 Big Data 生態架構
Etu Solution
Exadata那点事
Exadata那点事
freezr
豆瓣数据架构实践
豆瓣数据架构实践
Xupeng Yun
OTN软硬件结合数据库解决方案
OTN软硬件结合数据库解决方案
freezr
Track A-1: Cloudera 大數據產品和技術最前沿資訊報告
Track A-1: Cloudera 大數據產品和技術最前沿資訊報告
Etu Solution
Hadoop的典型应用与企业化之路 for HBTC 2012
Hadoop的典型应用与企业化之路 for HBTC 2012
James Chen
GDG Taichung - Firebase Introduction 01
GDG Taichung - Firebase Introduction 01
Duran Hsieh
Query store查詢調校新利器
Query store查詢調校新利器
Rico Chen
Alibaba数据库运维最佳实践
Alibaba数据库运维最佳实践
freezr
Portfolio
Portfolio
Jimmy Chu
Sql server 2014 新功能探索
Sql server 2014 新功能探索
Rico Chen
給開發人員的資料庫效能建議
給開發人員的資料庫效能建議
Rico Chen
Hadoop con 2015 hadoop enables enterprise data lake
Hadoop con 2015 hadoop enables enterprise data lake
James Chen
Cloudera企业数据中枢平台
Cloudera企业数据中枢平台
Jianwei Li
What's hot
(20)
数据库性能量化
数据库性能量化
Mesos-based Data Infrastructure @ Douban
Mesos-based Data Infrastructure @ Douban
艺龙旅行网架构案例分享-Qcon2011
艺龙旅行网架构案例分享-Qcon2011
Big Data Taiwan 2014 Track1-3: Big Data, Big Challenge — Splunk 幫你解決 Big Data...
Big Data Taiwan 2014 Track1-3: Big Data, Big Challenge — Splunk 幫你解決 Big Data...
阿里自研数据库 Ocean base实践
阿里自研数据库 Ocean base实践
2016-07-12 Introduction to Big Data Platform Security
2016-07-12 Introduction to Big Data Platform Security
Track A-3 Enterprise Data Lake in Action - 搭建「活」的企業 Big Data 生態架構
Track A-3 Enterprise Data Lake in Action - 搭建「活」的企業 Big Data 生態架構
Exadata那点事
Exadata那点事
豆瓣数据架构实践
豆瓣数据架构实践
OTN软硬件结合数据库解决方案
OTN软硬件结合数据库解决方案
Track A-1: Cloudera 大數據產品和技術最前沿資訊報告
Track A-1: Cloudera 大數據產品和技術最前沿資訊報告
Hadoop的典型应用与企业化之路 for HBTC 2012
Hadoop的典型应用与企业化之路 for HBTC 2012
GDG Taichung - Firebase Introduction 01
GDG Taichung - Firebase Introduction 01
Query store查詢調校新利器
Query store查詢調校新利器
Alibaba数据库运维最佳实践
Alibaba数据库运维最佳实践
Portfolio
Portfolio
Sql server 2014 新功能探索
Sql server 2014 新功能探索
給開發人員的資料庫效能建議
給開發人員的資料庫效能建議
Hadoop con 2015 hadoop enables enterprise data lake
Hadoop con 2015 hadoop enables enterprise data lake
Cloudera企业数据中枢平台
Cloudera企业数据中枢平台
Similar to Bigdata introduction
Hadoop 與 SQL 的甜蜜連結
Hadoop 與 SQL 的甜蜜連結
James Chen
高科技產業資料分析解決方案 Hare DB
高科技產業資料分析解決方案 Hare DB
Etu Solution
Sequoia db 技术概述_sacc
Sequoia db 技术概述_sacc
wangzhonnew
大數據
大數據
brian401777
HDInsight for Microsoft Users
HDInsight for Microsoft Users
Kuo-Chun Su
基于hbase的实时计算框架prom(20111114)
基于hbase的实时计算框架prom(20111114)
yiihsia
Easier and Faster for hbase in HadoopCon 2014
Easier and Faster for hbase in HadoopCon 2014
Hubert Fan Chiang
云梯的多Namenode和跨机房之路
云梯的多Namenode和跨机房之路
li luo
淘宝Hadoop数据分析实践
淘宝Hadoop数据分析实践
Min Zhou
Hadoop development in China Mobile Research Institute
Hadoop development in China Mobile Research Institute
Xu Wang
Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里
li luo
The Construction and Practice of Apache Pegasus in Offline and Online Scenari...
The Construction and Practice of Apache Pegasus in Offline and Online Scenari...
acelyc1112009
Etu DW Offload 解放資料倉儲的運算效能
Etu DW Offload 解放資料倉儲的運算效能
Etu Solution
IDF2013大会分享——《使用新浪移动云开发全平台应用》
IDF2013大会分享——《使用新浪移动云开发全平台应用》
easychen
深入淺出 AWS 大數據工具
深入淺出 AWS 大數據工具
Amazon Web Services
Top100summit东软 孙广宇-uni sdp基于html5构建的跨平台的统一智能设备解决方案
Top100summit东软 孙广宇-uni sdp基于html5构建的跨平台的统一智能设备解决方案
drewz lin
Azure Data Lake 簡介
Azure Data Lake 簡介
Herman Wu
Big Data Projet Management the Body of Knowledge (BDPMBOK)
Big Data Projet Management the Body of Knowledge (BDPMBOK)
Jazz Yao-Tsung Wang
開放原始碼 Ch2.4 app - oss - db (ver 1.0)
開放原始碼 Ch2.4 app - oss - db (ver 1.0)
My own sweet home!
Hdfs introduction
Hdfs introduction
baggioss
Similar to Bigdata introduction
(20)
Hadoop 與 SQL 的甜蜜連結
Hadoop 與 SQL 的甜蜜連結
高科技產業資料分析解決方案 Hare DB
高科技產業資料分析解決方案 Hare DB
Sequoia db 技术概述_sacc
Sequoia db 技术概述_sacc
大數據
大數據
HDInsight for Microsoft Users
HDInsight for Microsoft Users
基于hbase的实时计算框架prom(20111114)
基于hbase的实时计算框架prom(20111114)
Easier and Faster for hbase in HadoopCon 2014
Easier and Faster for hbase in HadoopCon 2014
云梯的多Namenode和跨机房之路
云梯的多Namenode和跨机房之路
淘宝Hadoop数据分析实践
淘宝Hadoop数据分析实践
Hadoop development in China Mobile Research Institute
Hadoop development in China Mobile Research Institute
Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里
The Construction and Practice of Apache Pegasus in Offline and Online Scenari...
The Construction and Practice of Apache Pegasus in Offline and Online Scenari...
Etu DW Offload 解放資料倉儲的運算效能
Etu DW Offload 解放資料倉儲的運算效能
IDF2013大会分享——《使用新浪移动云开发全平台应用》
IDF2013大会分享——《使用新浪移动云开发全平台应用》
深入淺出 AWS 大數據工具
深入淺出 AWS 大數據工具
Top100summit东软 孙广宇-uni sdp基于html5构建的跨平台的统一智能设备解决方案
Top100summit东软 孙广宇-uni sdp基于html5构建的跨平台的统一智能设备解决方案
Azure Data Lake 簡介
Azure Data Lake 簡介
Big Data Projet Management the Body of Knowledge (BDPMBOK)
Big Data Projet Management the Body of Knowledge (BDPMBOK)
開放原始碼 Ch2.4 app - oss - db (ver 1.0)
開放原始碼 Ch2.4 app - oss - db (ver 1.0)
Hdfs introduction
Hdfs introduction
Bigdata introduction
1.
IN
2.
3.
RDBMS Analytical DB NoSQL DB ERP/CRM SaaS Social
Media Web Analytics Log Files Call Data Records Sensors Machine-Generated
4.
• 每秒2300 tweets Velocity •
结构,本结构,无结构 Variety • Tera, Peta, Exa,Zetta Volume
5.
• 质量问题 Validation • 管理,集成 Complexity •
浏览,冲突分析,元数据存储 Lineage
6.
Hadoop HDFS M/R Pig, Hive,
Hbase, Zookeeper, Oozie
7.
—— HDFS documentation
8.
—— Talend
9.
Hadoop grid Node NodeNode RDBMS Analytical DB NoSQL DB ERP/CRM SaaS Social
Media Web Analytics Log Files Call Data Records Sensors Machine- Generated 挖掘,分析,搜索, 扩张 MDM Quality Integration
10.
11.
• 将作业直接生成编码,无须在集群进行安装 • MR代码完全契合Hadoop环境 直接部署于Hadoop平台 •
拖拽式开发 • 作业调度触发 可视化开发 • 支持Hive,Pig,Hbase,Sqoop,BigQuery,多 种NoSQL数据库的插接组件 • 支持连接目前所有主流的Hadoop发布版本—— Cloudera,Hortonworks,MapR,Amazon EMR 等 450多个插件 • 百分百得到Apache技术支持,完全融入Hadoop平 台 适用Apache许可
12.
13.
• 数据性能分析 • 数据去重 •
非结构化数据解析 • 数据标准化 • 数据补全 • 数据质量报表 功能概述 • 统一的元数据模型 • 统一的工作空间 • 统一的代码生成 • 统一的作业部署,运行及监控 与Talend ETL工具无缝衔接
14.
15.
16.
17.
• 基于Apache Hive
(一个运行于 Hadoop上的数据仓库系统) • 类似SQL的查询语句 • 用户无任何学习曲线 大数据质量分析 • 现有标准化组件介绍 • 实现将标准化过程Map Reduce 大数据的标准化 • 可进行大数据分簇 基于大数据的机器学习
18.
Hadoop Distributions Big Data
Partnerships & Supported Hadoop Distributions Talend Big Data Partners Democratize the market by working with the major Hadoop and Big Data solutions companies