SlideShare a Scribd company logo
1 of 19
Download to read offline
Etu DW Offload
解放資料倉儲的運算效能

 Etu
 Chris Lin
 Technical Consultant

 Dec. 20, 2012
自我介紹
林志樺 Chris – Etu 科技顧問
•   資料分析師及資料庫管理
•   ERP 系統管理及技術支援
•   ERP 系統導入顧問
•   CCDH (Cloudera Certified Developer for
    Hadoop)

                                             2
大綱
•   資料倉儲系統在企業的定位
•   資料倉儲系統面臨的問題與挑戰
•   Etu DW Offload 方案架構及效益
•   案例分享


                             3
資料倉儲系統在企業的定位
      SSAS                          S
                                    S
              BI 工具及平台              R
                                    S




              資料倉儲系統




ERP     CRM   LOB   APPs   Legacy   3rd party
              結構化資料來源

                                                4
資料倉儲系統面臨的問題
                                                     S
報表產出           SSAS
                                                     S
                                                     R
時間變長                    BI 工具及平台                     S
                                                                    非結構化
                                                                    資料導入



                                                                     Sensor

資料倉儲
系統擴充                                                                  Logs
                         資料倉儲系統

                                                                     Device

結構化      ERP     CRM     LOB     APPs      Legacy       3rd party
        ERP     CRM     LOB     APPs     Legacy      3rd party      非結構化
資料倍增   ERP     CRM     LOB     APPs     Legacy      3rd party
                                                                    資料來源
                       結構化資料來源
                                                                       5
資料倉儲系統的挑戰
• 時效:當日資料要數日後方可取得
• 儲存:保存原始資料需大量儲存空間
• 擴充:單位儲存運算成本高但效益低
• 彈性:對於大量、半/非結構化資料處理不易


                     6
Hadoop 系統特色
•   儲存並處理巨量多結構化資料
•   內建資料與任務的容錯機制
•   執行資料分析程式於分散式系統上
•   線性的擴充能力
•   運行於商用伺服器,無需高端硬體

                      7
資料處理方式比較                                      Scale Out (TB to PB)



                          關聯式     查詢應用   NoSQL       NoSQL       NoSQL
                          資料庫
 Scale Up (up to TB)




                        ETL 工具           平行         平行           平行
                                  資料處理
                           或             運算         運算           運算
                         Script




                                  原始數據    分散式      分散式          分散式
                        檔案系統
                                         檔案系統      檔案系統        檔案系統


                       資料倉儲系統                 Hadoop 系統

                                                                         8
資料倉儲系統卸載至 Hadoop
                           BI 工具及平台




         Hadoop                             資料倉儲系統



Sensor    Logs    Device              ERP     CRM     LOB
     非結構化資料來源                               結構化資料來源

                                                            9
資料倉儲系統卸載至 Hadoop 的好處
•   將資料接收及預處理作業移出,釋出資源
•   運用 Hadoop 平行運算的強大運算,提昇效能
•   透過 Hadoop 安全容錯的大量儲存,降低成本
•   藉由 Hadoop 保存完整的原始資料,拓展資料
    倉儲提供資訊的深度及廣度


                               10
Etu Appliance 特色
•   為 Hadoop 任務量身訂做及最佳化:
     高度整合、簡單佈署
     高效處理、簡化使用
     高度安全、簡易擴充
•   Hadoop 最佳作業平台

                           11
Etu DW Offload 方案架構
                                                Hive
                                              Connector
IMAGE
          Etu
                                                           BI Tools
        DataFlow
Web
Log                   ETL Languages

          FTP        Pig               Hive
Text


                   Data Processing Layer                     DW
ERP      Syslog
                           MapReduce

CRM
         Sqoop       Data Store Layer                     Aggregated
                                                           Dataset
                             HDFS
SCM



                                                                       12
Etu DW Offload 方案的效益
•   減少資料倉儲運算及儲存負荷
•   降低資料倉儲升級需求
•   提昇全程資料處理時間
•   加快企業策略反應速度


                       13
Etu DW Offload 方案的優勢
•   低學習曲線
    Etu Appliance 包含的 Pig 與 Hive 語言,是以資料分析師的經
    驗設計與開發,學習難度低。除 Java 外,應用程式亦可使用
    Python 等語言開發,適用範圍廣。

•   高企業整合性
    Etu Appliance 包含與各資料庫界接之 JDBC/ODBC,資料流動
    性佳。

•   高系統與資料可用度
    除了 Hadoop 容錯,Etu Appliance 還內建全系統 HA 機制,
    提供更完整的保障。
                                                14
Etu Appliance 系統與企業整合

Excel with Hive Connector   BI 工具




    Etu Appliance                   資料倉儲系統



                    結構化與非結構化資料      結構化資料來源

                                              15
案例分享(電信商)
•   問題
    話務資料在資料倉儲前的 ETL 處理耗時過長(數日),無
    法即時發現門號欠費、盜用、超量等問題,影響營收

•   挑戰
    當日資料於隔日上班前即可完成報表,以利即時提出反
    應對策

                               16
案例分享(電信商)
       效益
時間 – 數天->數小時
      ETL Tools                      BI
資料 - 減量 90%                          工具




 話務          話務   參照     彙總
 資料          資料   資料     資料

                  Etu Appliance 平台


                                          17
如果您只記得三件事
• Hadoop:Offload 資料倉儲的最佳平台

• Etu:最專業的 Hadoop 團隊;Etu Appliance:企業級
 Hadoop 首選平台

• Etu DW Offload:以 Etu Appliance 為平台的 End-to-
 End 資料倉儲卸載完整解決方案,協助您提昇資料倉儲工作
 的效率,並降低資料倉儲升級的成本

                                            18
聯絡 Etu
www.etusolution.com
info@etusolution.com

Taipei, Taiwan
318, Rueiguang Rd., Taipei 114, Taiwan
T: +886 2 7720 1888
F: +886 2 8798 6069

Beijing, China
Room B-26, Landgent Center,
No. 24, East Third Ring Middle Rd.,
Beijing, China 100022
T: +86 10 8441 7988
F: +86 10 8441 7227



                                         19

More Related Content

What's hot

大數據獲利模式 Ch 2
大數據獲利模式 Ch 2大數據獲利模式 Ch 2
大數據獲利模式 Ch 2Hans Shih
 
揭开数据虚拟化的神秘面纱
揭开数据虚拟化的神秘面纱揭开数据虚拟化的神秘面纱
揭开数据虚拟化的神秘面纱Denodo
 
How Enterprises Leverage Data to Overcome Business Challenges During Coronavirus
How Enterprises Leverage Data to Overcome Business Challenges During CoronavirusHow Enterprises Leverage Data to Overcome Business Challenges During Coronavirus
How Enterprises Leverage Data to Overcome Business Challenges During CoronavirusDenodo
 
如何快速实现数据编织架构
如何快速实现数据编织架构如何快速实现数据编织架构
如何快速实现数据编织架构Denodo
 
Etu Data Lake
Etu Data LakeEtu Data Lake
Etu Data LakeJudy Wu
 
数据科学运营:企业人工智能之旅
数据科学运营:企业人工智能之旅数据科学运营:企业人工智能之旅
数据科学运营:企业人工智能之旅Denodo
 
Hadoop Big Data 成功案例分享
Hadoop Big Data 成功案例分享Hadoop Big Data 成功案例分享
Hadoop Big Data 成功案例分享Etu Solution
 
Dtcc ibm big data platform 2012-final_cn
Dtcc ibm big data platform 2012-final_cnDtcc ibm big data platform 2012-final_cn
Dtcc ibm big data platform 2012-final_cnyp_fangdong
 
Data Leaders in Action - 資料價值領袖風範與關鍵行動
Data Leaders in Action - 資料價值領袖風範與關鍵行動Data Leaders in Action - 資料價值領袖風範與關鍵行動
Data Leaders in Action - 資料價值領袖風範與關鍵行動Etu Solution
 
Se shang hai_04_cloudybi
Se shang hai_04_cloudybiSe shang hai_04_cloudybi
Se shang hai_04_cloudybiTech2IPO
 
How to build data warehouse
How to build data warehouseHow to build data warehouse
How to build data warehousejasonfuoo
 
如何集中数据治理,摆脱安全性和合规性困扰
如何集中数据治理,摆脱安全性和合规性困扰如何集中数据治理,摆脱安全性和合规性困扰
如何集中数据治理,摆脱安全性和合规性困扰Denodo
 
Hyperion基础架构
Hyperion基础架构Hyperion基础架构
Hyperion基础架构Jack Wong
 
Azure Data Lake 簡介
Azure Data Lake 簡介Azure Data Lake 簡介
Azure Data Lake 簡介Herman Wu
 
翟艳堂:腾讯大规模Hadoop集群实践
翟艳堂:腾讯大规模Hadoop集群实践翟艳堂:腾讯大规模Hadoop集群实践
翟艳堂:腾讯大规模Hadoop集群实践hdhappy001
 
开源分布式数据库Tidb简介
开源分布式数据库Tidb简介开源分布式数据库Tidb简介
开源分布式数据库Tidb简介www.tujia.com
 
Exadata best practice on E-commerce area
Exadata best practice on E-commerce area Exadata best practice on E-commerce area
Exadata best practice on E-commerce area Louis liu
 
Mesos-based Data Infrastructure @ Douban
Mesos-based Data Infrastructure @ DoubanMesos-based Data Infrastructure @ Douban
Mesos-based Data Infrastructure @ DoubanZhong Bo Tian
 

What's hot (20)

大數據獲利模式 Ch 2
大數據獲利模式 Ch 2大數據獲利模式 Ch 2
大數據獲利模式 Ch 2
 
揭开数据虚拟化的神秘面纱
揭开数据虚拟化的神秘面纱揭开数据虚拟化的神秘面纱
揭开数据虚拟化的神秘面纱
 
How Enterprises Leverage Data to Overcome Business Challenges During Coronavirus
How Enterprises Leverage Data to Overcome Business Challenges During CoronavirusHow Enterprises Leverage Data to Overcome Business Challenges During Coronavirus
How Enterprises Leverage Data to Overcome Business Challenges During Coronavirus
 
如何快速实现数据编织架构
如何快速实现数据编织架构如何快速实现数据编织架构
如何快速实现数据编织架构
 
Emc keynote 1130 1200
Emc keynote 1130 1200Emc keynote 1130 1200
Emc keynote 1130 1200
 
Etu Data Lake
Etu Data LakeEtu Data Lake
Etu Data Lake
 
数据科学运营:企业人工智能之旅
数据科学运营:企业人工智能之旅数据科学运营:企业人工智能之旅
数据科学运营:企业人工智能之旅
 
Hadoop Big Data 成功案例分享
Hadoop Big Data 成功案例分享Hadoop Big Data 成功案例分享
Hadoop Big Data 成功案例分享
 
Dtcc ibm big data platform 2012-final_cn
Dtcc ibm big data platform 2012-final_cnDtcc ibm big data platform 2012-final_cn
Dtcc ibm big data platform 2012-final_cn
 
Data Leaders in Action - 資料價值領袖風範與關鍵行動
Data Leaders in Action - 資料價值領袖風範與關鍵行動Data Leaders in Action - 資料價值領袖風範與關鍵行動
Data Leaders in Action - 資料價值領袖風範與關鍵行動
 
Se shang hai_04_cloudybi
Se shang hai_04_cloudybiSe shang hai_04_cloudybi
Se shang hai_04_cloudybi
 
How to build data warehouse
How to build data warehouseHow to build data warehouse
How to build data warehouse
 
如何集中数据治理,摆脱安全性和合规性困扰
如何集中数据治理,摆脱安全性和合规性困扰如何集中数据治理,摆脱安全性和合规性困扰
如何集中数据治理,摆脱安全性和合规性困扰
 
商業智慧
商業智慧商業智慧
商業智慧
 
Hyperion基础架构
Hyperion基础架构Hyperion基础架构
Hyperion基础架构
 
Azure Data Lake 簡介
Azure Data Lake 簡介Azure Data Lake 簡介
Azure Data Lake 簡介
 
翟艳堂:腾讯大规模Hadoop集群实践
翟艳堂:腾讯大规模Hadoop集群实践翟艳堂:腾讯大规模Hadoop集群实践
翟艳堂:腾讯大规模Hadoop集群实践
 
开源分布式数据库Tidb简介
开源分布式数据库Tidb简介开源分布式数据库Tidb简介
开源分布式数据库Tidb简介
 
Exadata best practice on E-commerce area
Exadata best practice on E-commerce area Exadata best practice on E-commerce area
Exadata best practice on E-commerce area
 
Mesos-based Data Infrastructure @ Douban
Mesos-based Data Infrastructure @ DoubanMesos-based Data Infrastructure @ Douban
Mesos-based Data Infrastructure @ Douban
 

Similar to Etu DW Offload 解放資料倉儲的運算效能

Hadoop 與 SQL 的甜蜜連結
Hadoop 與 SQL 的甜蜜連結Hadoop 與 SQL 的甜蜜連結
Hadoop 與 SQL 的甜蜜連結James Chen
 
Hadoop con 2015 hadoop enables enterprise data lake
Hadoop con 2015   hadoop enables enterprise data lakeHadoop con 2015   hadoop enables enterprise data lake
Hadoop con 2015 hadoop enables enterprise data lakeJames Chen
 
選擇正確的Solution 來建置現代化的雲端資料倉儲
選擇正確的Solution 來建置現代化的雲端資料倉儲選擇正確的Solution 來建置現代化的雲端資料倉儲
選擇正確的Solution 來建置現代化的雲端資料倉儲Herman Wu
 
民间秘方
民间秘方民间秘方
民间秘方dynasty
 
Bdwf11 netezza james_zheng
Bdwf11 netezza james_zhengBdwf11 netezza james_zheng
Bdwf11 netezza james_zhengbigdatawf
 
高科技產業資料分析解決方案 Hare DB
高科技產業資料分析解決方案 Hare DB高科技產業資料分析解決方案 Hare DB
高科技產業資料分析解決方案 Hare DBEtu Solution
 
2016-07-12 Introduction to Big Data Platform Security
2016-07-12 Introduction to Big Data Platform Security2016-07-12 Introduction to Big Data Platform Security
2016-07-12 Introduction to Big Data Platform SecurityJazz Yao-Tsung Wang
 
Big Data World Forum
Big Data World ForumBig Data World Forum
Big Data World Forumbigdatawf
 
database
databasedatabase
databases06283
 
Oracle db 12c 加速企业转型之十大功能
Oracle db 12c 加速企业转型之十大功能Oracle db 12c 加速企业转型之十大功能
Oracle db 12c 加速企业转型之十大功能Ethan M. Liu
 
E tom ngoss规范及siebel系统在电信行业的应用 陈永林
E tom ngoss规范及siebel系统在电信行业的应用 陈永林E tom ngoss规范及siebel系统在电信行业的应用 陈永林
E tom ngoss规范及siebel系统在电信行业的应用 陈永林corlin chen
 
适应业务需求的甲骨文存储解决方案及产品演示
适应业务需求的甲骨文存储解决方案及产品演示适应业务需求的甲骨文存储解决方案及产品演示
适应业务需求的甲骨文存储解决方案及产品演示ITband
 
Track A-1: Cloudera 大數據產品和技術最前沿資訊報告
Track A-1: Cloudera 大數據產品和技術最前沿資訊報告Track A-1: Cloudera 大數據產品和技術最前沿資訊報告
Track A-1: Cloudera 大數據產品和技術最前沿資訊報告Etu Solution
 
《数据库发展研究报告-解读(2023年)》.pdf
《数据库发展研究报告-解读(2023年)》.pdf《数据库发展研究报告-解读(2023年)》.pdf
《数据库发展研究报告-解读(2023年)》.pdfmarkmind
 
华为软件定义存储架构分析
华为软件定义存储架构分析华为软件定义存储架构分析
华为软件定义存储架构分析Liang Ming
 
Paas研究介绍
Paas研究介绍Paas研究介绍
Paas研究介绍snakebbf
 
Big Data Taiwan 2014 Track1-3: Big Data, Big Challenge — Splunk 幫你解決 Big Data...
Big Data Taiwan 2014 Track1-3: Big Data, Big Challenge — Splunk 幫你解決 Big Data...Big Data Taiwan 2014 Track1-3: Big Data, Big Challenge — Splunk 幫你解決 Big Data...
Big Data Taiwan 2014 Track1-3: Big Data, Big Challenge — Splunk 幫你解決 Big Data...Etu Solution
 
Keynote: What Is the next Big Data?
Keynote: What Is the next Big Data?Keynote: What Is the next Big Data?
Keynote: What Is the next Big Data?Etu Solution
 
ESD 2012 Keynote: What Is the next Big Data?
ESD 2012 Keynote: What Is the next Big Data?ESD 2012 Keynote: What Is the next Big Data?
ESD 2012 Keynote: What Is the next Big Data?Fred Chiang
 
企业系统商务智能设计
企业系统商务智能设计企业系统商务智能设计
企业系统商务智能设计George Ang
 

Similar to Etu DW Offload 解放資料倉儲的運算效能 (20)

Hadoop 與 SQL 的甜蜜連結
Hadoop 與 SQL 的甜蜜連結Hadoop 與 SQL 的甜蜜連結
Hadoop 與 SQL 的甜蜜連結
 
Hadoop con 2015 hadoop enables enterprise data lake
Hadoop con 2015   hadoop enables enterprise data lakeHadoop con 2015   hadoop enables enterprise data lake
Hadoop con 2015 hadoop enables enterprise data lake
 
選擇正確的Solution 來建置現代化的雲端資料倉儲
選擇正確的Solution 來建置現代化的雲端資料倉儲選擇正確的Solution 來建置現代化的雲端資料倉儲
選擇正確的Solution 來建置現代化的雲端資料倉儲
 
民间秘方
民间秘方民间秘方
民间秘方
 
Bdwf11 netezza james_zheng
Bdwf11 netezza james_zhengBdwf11 netezza james_zheng
Bdwf11 netezza james_zheng
 
高科技產業資料分析解決方案 Hare DB
高科技產業資料分析解決方案 Hare DB高科技產業資料分析解決方案 Hare DB
高科技產業資料分析解決方案 Hare DB
 
2016-07-12 Introduction to Big Data Platform Security
2016-07-12 Introduction to Big Data Platform Security2016-07-12 Introduction to Big Data Platform Security
2016-07-12 Introduction to Big Data Platform Security
 
Big Data World Forum
Big Data World ForumBig Data World Forum
Big Data World Forum
 
database
databasedatabase
database
 
Oracle db 12c 加速企业转型之十大功能
Oracle db 12c 加速企业转型之十大功能Oracle db 12c 加速企业转型之十大功能
Oracle db 12c 加速企业转型之十大功能
 
E tom ngoss规范及siebel系统在电信行业的应用 陈永林
E tom ngoss规范及siebel系统在电信行业的应用 陈永林E tom ngoss规范及siebel系统在电信行业的应用 陈永林
E tom ngoss规范及siebel系统在电信行业的应用 陈永林
 
适应业务需求的甲骨文存储解决方案及产品演示
适应业务需求的甲骨文存储解决方案及产品演示适应业务需求的甲骨文存储解决方案及产品演示
适应业务需求的甲骨文存储解决方案及产品演示
 
Track A-1: Cloudera 大數據產品和技術最前沿資訊報告
Track A-1: Cloudera 大數據產品和技術最前沿資訊報告Track A-1: Cloudera 大數據產品和技術最前沿資訊報告
Track A-1: Cloudera 大數據產品和技術最前沿資訊報告
 
《数据库发展研究报告-解读(2023年)》.pdf
《数据库发展研究报告-解读(2023年)》.pdf《数据库发展研究报告-解读(2023年)》.pdf
《数据库发展研究报告-解读(2023年)》.pdf
 
华为软件定义存储架构分析
华为软件定义存储架构分析华为软件定义存储架构分析
华为软件定义存储架构分析
 
Paas研究介绍
Paas研究介绍Paas研究介绍
Paas研究介绍
 
Big Data Taiwan 2014 Track1-3: Big Data, Big Challenge — Splunk 幫你解決 Big Data...
Big Data Taiwan 2014 Track1-3: Big Data, Big Challenge — Splunk 幫你解決 Big Data...Big Data Taiwan 2014 Track1-3: Big Data, Big Challenge — Splunk 幫你解決 Big Data...
Big Data Taiwan 2014 Track1-3: Big Data, Big Challenge — Splunk 幫你解決 Big Data...
 
Keynote: What Is the next Big Data?
Keynote: What Is the next Big Data?Keynote: What Is the next Big Data?
Keynote: What Is the next Big Data?
 
ESD 2012 Keynote: What Is the next Big Data?
ESD 2012 Keynote: What Is the next Big Data?ESD 2012 Keynote: What Is the next Big Data?
ESD 2012 Keynote: What Is the next Big Data?
 
企业系统商务智能设计
企业系统商务智能设计企业系统商务智能设计
企业系统商务智能设计
 

More from Etu Solution

終歸:分群消費者x多元商機的實現
終歸:分群消費者x多元商機的實現終歸:分群消費者x多元商機的實現
終歸:分群消費者x多元商機的實現Etu Solution
 
歡迎回來:全面圖譜,金融 3.0 顧客行銷新視界
歡迎回來:全面圖譜,金融 3.0 顧客行銷新視界歡迎回來:全面圖譜,金融 3.0 顧客行銷新視界
歡迎回來:全面圖譜,金融 3.0 顧客行銷新視界Etu Solution
 
猜你喜歡:虛實並進,贏在全通路
猜你喜歡:虛實並進,贏在全通路猜你喜歡:虛實並進,贏在全通路
猜你喜歡:虛實並進,贏在全通路Etu Solution
 
投客所好:互聯內外,啟動投信藍海數據戰
投客所好:互聯內外,啟動投信藍海數據戰投客所好:互聯內外,啟動投信藍海數據戰
投客所好:互聯內外,啟動投信藍海數據戰Etu Solution
 
致詞歡迎:Big Data 無所不在,Data Technology 無 C 不歡
致詞歡迎:Big Data 無所不在,Data Technology 無 C 不歡致詞歡迎:Big Data 無所不在,Data Technology 無 C 不歡
致詞歡迎:Big Data 無所不在,Data Technology 無 C 不歡Etu Solution
 
啟程:Data Technology 的待客之道
啟程:Data Technology 的待客之道啟程:Data Technology 的待客之道
啟程:Data Technology 的待客之道Etu Solution
 
Track C-1 大數據時代的產品 ─ 創新與洞察決策
Track C-1 大數據時代的產品 ─ 創新與洞察決策Track C-1 大數據時代的產品 ─ 創新與洞察決策
Track C-1 大數據時代的產品 ─ 創新與洞察決策Etu Solution
 
Track C-3 Let's Play Marketing - 瘋創意 玩推薦 就該這樣搞行銷
Track C-3 Let's Play Marketing - 瘋創意 玩推薦 就該這樣搞行銷Track C-3 Let's Play Marketing - 瘋創意 玩推薦 就該這樣搞行銷
Track C-3 Let's Play Marketing - 瘋創意 玩推薦 就該這樣搞行銷Etu Solution
 
Track C-2 洞見未來 - Tableau 創造大數據新價值
Track C-2 洞見未來 - Tableau 創造大數據新價值Track C-2 洞見未來 - Tableau 創造大數據新價值
Track C-2 洞見未來 - Tableau 創造大數據新價值Etu Solution
 
Track B-3 解構大數據架構 - 大數據系統的伺服器與網路資源規劃
Track B-3 解構大數據架構 - 大數據系統的伺服器與網路資源規劃Track B-3 解構大數據架構 - 大數據系統的伺服器與網路資源規劃
Track B-3 解構大數據架構 - 大數據系統的伺服器與網路資源規劃Etu Solution
 
Track B-1 建構新世代的智慧數據平台
Track B-1 建構新世代的智慧數據平台Track B-1 建構新世代的智慧數據平台
Track B-1 建構新世代的智慧數據平台Etu Solution
 
Track A-3 Enterprise Data Lake in Action - 搭建「活」的企業 Big Data 生態架構
Track A-3 Enterprise Data Lake in Action - 搭建「活」的企業 Big Data 生態架構Track A-3 Enterprise Data Lake in Action - 搭建「活」的企業 Big Data 生態架構
Track A-3 Enterprise Data Lake in Action - 搭建「活」的企業 Big Data 生態架構Etu Solution
 
Track A-2 基於 Spark 的數據分析
Track A-2 基於 Spark 的數據分析Track A-2 基於 Spark 的數據分析
Track A-2 基於 Spark 的數據分析Etu Solution
 
Data without Boundaries - 圍繞第一方數據,找到商業驅動力
Data without Boundaries - 圍繞第一方數據,找到商業驅動力Data without Boundaries - 圍繞第一方數據,找到商業驅動力
Data without Boundaries - 圍繞第一方數據,找到商業驅動力Etu Solution
 
Big Data Tornado - 2015 台灣 Big Data 企業經典應用案例分享
Big Data Tornado - 2015 台灣 Big Data 企業經典應用案例分享Big Data Tornado - 2015 台灣 Big Data 企業經典應用案例分享
Big Data Tornado - 2015 台灣 Big Data 企業經典應用案例分享Etu Solution
 
Cloudera 助力台灣大數據產業的發展
Cloudera 助力台灣大數據產業的發展Cloudera 助力台灣大數據產業的發展
Cloudera 助力台灣大數據產業的發展Etu Solution
 
Opening: Big Data+
Opening: Big Data+Opening: Big Data+
Opening: Big Data+Etu Solution
 
數位媒體的客戶洞察行銷術
數位媒體的客戶洞察行銷術數位媒體的客戶洞察行銷術
數位媒體的客戶洞察行銷術Etu Solution
 
打造一個讓企業賣更多的「氣象大數據平台服務」
打造一個讓企業賣更多的「氣象大數據平台服務」打造一個讓企業賣更多的「氣象大數據平台服務」
打造一個讓企業賣更多的「氣象大數據平台服務」Etu Solution
 
那些你知道的,但還沒看過的 Big Data 風景
那些你知道的,但還沒看過的 Big Data 風景那些你知道的,但還沒看過的 Big Data 風景
那些你知道的,但還沒看過的 Big Data 風景Etu Solution
 

More from Etu Solution (20)

終歸:分群消費者x多元商機的實現
終歸:分群消費者x多元商機的實現終歸:分群消費者x多元商機的實現
終歸:分群消費者x多元商機的實現
 
歡迎回來:全面圖譜,金融 3.0 顧客行銷新視界
歡迎回來:全面圖譜,金融 3.0 顧客行銷新視界歡迎回來:全面圖譜,金融 3.0 顧客行銷新視界
歡迎回來:全面圖譜,金融 3.0 顧客行銷新視界
 
猜你喜歡:虛實並進,贏在全通路
猜你喜歡:虛實並進,贏在全通路猜你喜歡:虛實並進,贏在全通路
猜你喜歡:虛實並進,贏在全通路
 
投客所好:互聯內外,啟動投信藍海數據戰
投客所好:互聯內外,啟動投信藍海數據戰投客所好:互聯內外,啟動投信藍海數據戰
投客所好:互聯內外,啟動投信藍海數據戰
 
致詞歡迎:Big Data 無所不在,Data Technology 無 C 不歡
致詞歡迎:Big Data 無所不在,Data Technology 無 C 不歡致詞歡迎:Big Data 無所不在,Data Technology 無 C 不歡
致詞歡迎:Big Data 無所不在,Data Technology 無 C 不歡
 
啟程:Data Technology 的待客之道
啟程:Data Technology 的待客之道啟程:Data Technology 的待客之道
啟程:Data Technology 的待客之道
 
Track C-1 大數據時代的產品 ─ 創新與洞察決策
Track C-1 大數據時代的產品 ─ 創新與洞察決策Track C-1 大數據時代的產品 ─ 創新與洞察決策
Track C-1 大數據時代的產品 ─ 創新與洞察決策
 
Track C-3 Let's Play Marketing - 瘋創意 玩推薦 就該這樣搞行銷
Track C-3 Let's Play Marketing - 瘋創意 玩推薦 就該這樣搞行銷Track C-3 Let's Play Marketing - 瘋創意 玩推薦 就該這樣搞行銷
Track C-3 Let's Play Marketing - 瘋創意 玩推薦 就該這樣搞行銷
 
Track C-2 洞見未來 - Tableau 創造大數據新價值
Track C-2 洞見未來 - Tableau 創造大數據新價值Track C-2 洞見未來 - Tableau 創造大數據新價值
Track C-2 洞見未來 - Tableau 創造大數據新價值
 
Track B-3 解構大數據架構 - 大數據系統的伺服器與網路資源規劃
Track B-3 解構大數據架構 - 大數據系統的伺服器與網路資源規劃Track B-3 解構大數據架構 - 大數據系統的伺服器與網路資源規劃
Track B-3 解構大數據架構 - 大數據系統的伺服器與網路資源規劃
 
Track B-1 建構新世代的智慧數據平台
Track B-1 建構新世代的智慧數據平台Track B-1 建構新世代的智慧數據平台
Track B-1 建構新世代的智慧數據平台
 
Track A-3 Enterprise Data Lake in Action - 搭建「活」的企業 Big Data 生態架構
Track A-3 Enterprise Data Lake in Action - 搭建「活」的企業 Big Data 生態架構Track A-3 Enterprise Data Lake in Action - 搭建「活」的企業 Big Data 生態架構
Track A-3 Enterprise Data Lake in Action - 搭建「活」的企業 Big Data 生態架構
 
Track A-2 基於 Spark 的數據分析
Track A-2 基於 Spark 的數據分析Track A-2 基於 Spark 的數據分析
Track A-2 基於 Spark 的數據分析
 
Data without Boundaries - 圍繞第一方數據,找到商業驅動力
Data without Boundaries - 圍繞第一方數據,找到商業驅動力Data without Boundaries - 圍繞第一方數據,找到商業驅動力
Data without Boundaries - 圍繞第一方數據,找到商業驅動力
 
Big Data Tornado - 2015 台灣 Big Data 企業經典應用案例分享
Big Data Tornado - 2015 台灣 Big Data 企業經典應用案例分享Big Data Tornado - 2015 台灣 Big Data 企業經典應用案例分享
Big Data Tornado - 2015 台灣 Big Data 企業經典應用案例分享
 
Cloudera 助力台灣大數據產業的發展
Cloudera 助力台灣大數據產業的發展Cloudera 助力台灣大數據產業的發展
Cloudera 助力台灣大數據產業的發展
 
Opening: Big Data+
Opening: Big Data+Opening: Big Data+
Opening: Big Data+
 
數位媒體的客戶洞察行銷術
數位媒體的客戶洞察行銷術數位媒體的客戶洞察行銷術
數位媒體的客戶洞察行銷術
 
打造一個讓企業賣更多的「氣象大數據平台服務」
打造一個讓企業賣更多的「氣象大數據平台服務」打造一個讓企業賣更多的「氣象大數據平台服務」
打造一個讓企業賣更多的「氣象大數據平台服務」
 
那些你知道的,但還沒看過的 Big Data 風景
那些你知道的,但還沒看過的 Big Data 風景那些你知道的,但還沒看過的 Big Data 風景
那些你知道的,但還沒看過的 Big Data 風景
 

Etu DW Offload 解放資料倉儲的運算效能

  • 1. Etu DW Offload 解放資料倉儲的運算效能 Etu Chris Lin Technical Consultant Dec. 20, 2012
  • 2. 自我介紹 林志樺 Chris – Etu 科技顧問 • 資料分析師及資料庫管理 • ERP 系統管理及技術支援 • ERP 系統導入顧問 • CCDH (Cloudera Certified Developer for Hadoop) 2
  • 3. 大綱 • 資料倉儲系統在企業的定位 • 資料倉儲系統面臨的問題與挑戰 • Etu DW Offload 方案架構及效益 • 案例分享 3
  • 4. 資料倉儲系統在企業的定位 SSAS S S BI 工具及平台 R S 資料倉儲系統 ERP CRM LOB APPs Legacy 3rd party 結構化資料來源 4
  • 5. 資料倉儲系統面臨的問題 S 報表產出 SSAS S R 時間變長 BI 工具及平台 S 非結構化 資料導入 Sensor 資料倉儲 系統擴充 Logs 資料倉儲系統 Device 結構化 ERP CRM LOB APPs Legacy 3rd party ERP CRM LOB APPs Legacy 3rd party 非結構化 資料倍增 ERP CRM LOB APPs Legacy 3rd party 資料來源 結構化資料來源 5
  • 6. 資料倉儲系統的挑戰 • 時效:當日資料要數日後方可取得 • 儲存:保存原始資料需大量儲存空間 • 擴充:單位儲存運算成本高但效益低 • 彈性:對於大量、半/非結構化資料處理不易 6
  • 7. Hadoop 系統特色 • 儲存並處理巨量多結構化資料 • 內建資料與任務的容錯機制 • 執行資料分析程式於分散式系統上 • 線性的擴充能力 • 運行於商用伺服器,無需高端硬體 7
  • 8. 資料處理方式比較 Scale Out (TB to PB) 關聯式 查詢應用 NoSQL NoSQL NoSQL 資料庫 Scale Up (up to TB) ETL 工具 平行 平行 平行 資料處理 或 運算 運算 運算 Script 原始數據 分散式 分散式 分散式 檔案系統 檔案系統 檔案系統 檔案系統 資料倉儲系統 Hadoop 系統 8
  • 9. 資料倉儲系統卸載至 Hadoop BI 工具及平台 Hadoop 資料倉儲系統 Sensor Logs Device ERP CRM LOB 非結構化資料來源 結構化資料來源 9
  • 10. 資料倉儲系統卸載至 Hadoop 的好處 • 將資料接收及預處理作業移出,釋出資源 • 運用 Hadoop 平行運算的強大運算,提昇效能 • 透過 Hadoop 安全容錯的大量儲存,降低成本 • 藉由 Hadoop 保存完整的原始資料,拓展資料 倉儲提供資訊的深度及廣度 10
  • 11. Etu Appliance 特色 • 為 Hadoop 任務量身訂做及最佳化:  高度整合、簡單佈署  高效處理、簡化使用  高度安全、簡易擴充 • Hadoop 最佳作業平台 11
  • 12. Etu DW Offload 方案架構 Hive Connector IMAGE Etu BI Tools DataFlow Web Log ETL Languages FTP Pig Hive Text Data Processing Layer DW ERP Syslog MapReduce CRM Sqoop Data Store Layer Aggregated Dataset HDFS SCM 12
  • 13. Etu DW Offload 方案的效益 • 減少資料倉儲運算及儲存負荷 • 降低資料倉儲升級需求 • 提昇全程資料處理時間 • 加快企業策略反應速度 13
  • 14. Etu DW Offload 方案的優勢 • 低學習曲線 Etu Appliance 包含的 Pig 與 Hive 語言,是以資料分析師的經 驗設計與開發,學習難度低。除 Java 外,應用程式亦可使用 Python 等語言開發,適用範圍廣。 • 高企業整合性 Etu Appliance 包含與各資料庫界接之 JDBC/ODBC,資料流動 性佳。 • 高系統與資料可用度 除了 Hadoop 容錯,Etu Appliance 還內建全系統 HA 機制, 提供更完整的保障。 14
  • 15. Etu Appliance 系統與企業整合 Excel with Hive Connector BI 工具 Etu Appliance 資料倉儲系統 結構化與非結構化資料 結構化資料來源 15
  • 16. 案例分享(電信商) • 問題 話務資料在資料倉儲前的 ETL 處理耗時過長(數日),無 法即時發現門號欠費、盜用、超量等問題,影響營收 • 挑戰 當日資料於隔日上班前即可完成報表,以利即時提出反 應對策 16
  • 17. 案例分享(電信商) 效益 時間 – 數天->數小時 ETL Tools BI 資料 - 減量 90% 工具 話務 話務 參照 彙總 資料 資料 資料 資料 Etu Appliance 平台 17
  • 18. 如果您只記得三件事 • Hadoop:Offload 資料倉儲的最佳平台 • Etu:最專業的 Hadoop 團隊;Etu Appliance:企業級 Hadoop 首選平台 • Etu DW Offload:以 Etu Appliance 為平台的 End-to- End 資料倉儲卸載完整解決方案,協助您提昇資料倉儲工作 的效率,並降低資料倉儲升級的成本 18
  • 19. 聯絡 Etu www.etusolution.com info@etusolution.com Taipei, Taiwan 318, Rueiguang Rd., Taipei 114, Taiwan T: +886 2 7720 1888 F: +886 2 8798 6069 Beijing, China Room B-26, Landgent Center, No. 24, East Third Ring Middle Rd., Beijing, China 100022 T: +86 10 8441 7988 F: +86 10 8441 7227 19