SlideShare a Scribd company logo
1 of 46
楽天がHadoopを使う理由


                             Keisuke Kawamura | Development Unit Rakuten, Inc.
                                  Nikkei Computer Seminar 15th Dec. 2010         1




Tuesday, December 21, 2010                                                           1
自己紹介

     河村 圭介(かわむらけいすけ)
      楽天株式会社 Development Unit
      シニアアソフトウェアエンジニア
        - Webサービスの企画・開発
       - 大規模データ解析の処理基盤構築




                                    2




Tuesday, December 21, 2010              2
自己紹介
        課外活動
         楽天で行われる各種技術イベント 企画・運営
         Hadoopソースコードリーディング お手伝い
         事例記事の執筆などなど


        Contact :
         keisuke.kawamura@mail.rakuten.co.jp
         twitter @kkawamura



                                               3




Tuesday, December 21, 2010                         3
Hadoopと私

       ・2009年2月∼
        Hadoopでアプリケーション開発。
        (楽天市場向けレコメンダーシステム)

       ・2010年10月∼
        大規模データの解析インフラの構築が本業に。



                   アプリ開発者→データインフラ担当
                                        4




Tuesday, December 21, 2010                  4
本日お話しすること

                  1. 我々の課題
                  2. 楽天のデータへの取り組み
                  3. Hadoopの利用状況・事例
                  4.Web事業者から見たHadoop
                  5. 今後の展望とまとめ



                                         5




Tuesday, December 21, 2010                   5
我々が直面している課題



                                      6




Tuesday, December 21, 2010                6
楽天市場(らくてんいちば)
                              •日本最大のインターネットショッピングモール
              日本最大            •世界でも独特のビジネスモデル




                店舗数:34,642店
                商品数:6,899万点
                会員数:6,400万人
                流通総額:8,000億円※
                     (※2009年)

                                                       7




Tuesday, December 21, 2010                                 7
グループのビジョン

                                                Business
                                               Business
                                                EC
                                               Application
                                              Application


                                Business
                               Business                        Business
                                                              Business
                             クレジット
                               Application
                              Application                    トラベル
                                                              Application
                                                             Application




                                             会員データベース

                             ポータル/
                               Business
                              Business                         Business
                                                              Business
                             Application
                             Application
                                                               証券
                                                             Application
                                                             Application
                             コンテンツ
                                               Business
                                              Business
                                               金融
                                              Application
                                             Application




                生活に必要なサービス全てを提供する

Tuesday, December 21, 2010                                                  8
楽天グループの国際展開
            インターネット・ショッピングモールビジネス
            トラベル ビジネス
            パフォーマンスマーケティング ビジネス




         ヨーロッパ                                                   アメリカ
                                                   本社



   PriceMinister
                                          アジア   Rakuten Ichiba
                                                                 Buy.com
                                                Taiwan
                             TARAD.com

                                  Indonesia

              インターネット・ショッピングモールビジネス

                             [台湾] 台北                              [米国] カルフォルニア

                             [タイランド] バンコク                         [インドネシア] ジャカルタ

                             [中国] 北京                              [フランス] パリ      9




Tuesday, December 21, 2010                                                           9
インターネットの情報爆発

     2000年 6.2EB                   ZB(ゼッタバイト)
                             45倍
                                    1021
    2007年 281EB                     1,000,000,000,000,000,000,000
                             6倍

    2011年 1.8ZB



                                                              10




Tuesday, December 21, 2010                                         10
現在の楽天市場のサービス規模

       出店店舗   34,642店
       商品数    6,899万商品
       購入者数   919万人 (2010/3Q)
       注文数    32,92万件 (2010/3Q)
       会員数    6400万ID
        




                                        11




Tuesday, December 21, 2010                   11
増え続けるデータ

            会員数    20万ID/月 増加
            月間購入件数 1000万件
            ピークタイム購入件数 1000件 / 分
            PV      1億PV / 日 




                                        12




Tuesday, December 21, 2010                   12
Internet Traffic
                                  20
                                       02
                                            Ja




                                                      0
                                                 n.




Tuesday, December 21, 2010
                                  20
                                       02
                                            Ju
                                  20          l.
                                       03
                                            Ja
                                  20             n.
                                       03
                                            Ju
                                  20          l.
                                       04
                                            Ja
                                  20             n.
                                       04
                                            Ju
                                  20          l
                                       05
                                            Ja
                                  20             n.
                                       05
                                            Ju
                                  20          l.
                                       06
                                            Ja
                                  20             n.
                                       06
                                            Ju
                                                                              Network traffic is growing




                                  20          l.
                                                                             150 times in the last 8 years




                                       07
                                            Ja
                                  20             n.
                                       07
                                            Ju
                                  20          l.
                                       08
                                                                                                             トラフィックの推移




                                            Ja
                                  20             n.
                                       08
                                            Ju
                                  20          l.
                                       09
                                            Ja
                                  20             n.
                                       09
                                            Ju
                                              l.
                             13




13
データの重要性

       データはサービスに様々な価値をもたらす

                   例)Webサービスの場合
                     ・レコメンデーション
                     ・パーソナライゼーション
                     ・情報の提供精度向上
                    

                                       14




Tuesday, December 21, 2010                  14
ウェブサービスの裏側

          より便利なサービスを提供するために、
          バックエンドでは、さまざまなデータ
          分析が必要となる。


          しかし、規模が大きくなれば、データの
          管理も解析も容易ではなくなる。
          ...データは増え続ける。

                                          15




Tuesday, December 21, 2010                     15
各社の技術開発

       •「MapReduce」等は分散並列処理基盤
       •「GFS/BigTable」等は分散データストレージ、KVS

                    「処理」の分散                     「データ」の分散
                                                    GFS/BigTable
                             MapReduce
                                                    Dynamo
                             MapReduceのJava実装
                                                    Windows Azure
                                                    SQL Data Services


                                     fairy                 ROMA




Tuesday, December 21, 2010                                              16
楽天の大規模データへの取り組み

                              Rakuten SuperDB


                              独自プロダクトの開発

                             OSSを利用したデータ解析
                             (Hadoopの利用推進)


                                                17




Tuesday, December 21, 2010                           17
楽天スーパーDB



                                        18




Tuesday, December 21, 2010                   18
楽天スーパーDB
        •楽天には多様なビジネスがあり、様々なデータがある
        •堅牢・強固なDWHに集約し、サービス向上に役立てている

       データの集約                         データの分析・利用


          商品・サービスDB                   リコメンデーショ
                                      パーソナライズ
                                      ン
               顧客属性DB          楽天
                                      購買予測
                             スーパーDB
               購買履歴DB                 指標モニタリング
               閲覧履歴DB




                                                  19




Tuesday, December 21, 2010                             19
スーパーDBのデータ活用
                               サービス特性毎にリコメンドロジックをカスタマイズ可能な、
                TOHO
                                楽天経済圏のレコメンデーションプラットフォーム




         各種レコメンド
         ロジック
                                                レコメンデーション
              協調フィルタリング
               リターゲティング                         プラットフォーム
                     バスケット
                       画像処理

                                        スーパーDB

                             商品・サービスDB 顧客属性DB   購買履歴DB   閲覧履歴DB
                                                                  20




Tuesday, December 21, 2010                                             20
スーパーDBのデータ活用




                       ターゲティング広告などに利用中 
                                            21




Tuesday, December 21, 2010                       21
独自プロダクトの開発



                                          22




Tuesday, December 21, 2010                     22
分散プロダクトの独自開発
             ・Rakuten On-Memory Architecture
               ROMA is one of the data storing systems for
              distributed key-value stores.
               




                                                             23




Tuesday, December 21, 2010                                        23
ROMA: example.

                 Roma was used some services. (ex. Browse
                 History of Rakuten Ichiba and Rakuten Travel. )
                                [Browse History]

                                  Sharing data by
                                    Rakuten ID.




                【PC】                                  【Mobile】

                                                                   24




Tuesday, December 21, 2010                                              24
OSSを利用したデータ解析
                   (Hadoopの利用)


                                 25




Tuesday, December 21, 2010            25
楽天のHadoop環境
                     2008年4月∼
                      検証環境にて検証開始
                     2009年3月∼
                      プロダクション環境で運用開始
                      Hadoop 0.19.2
                      15台構成の小規模クラスタ
                     2010年8月∼
                      3つのクラスタを運用中
                      Hadoop 0.20.2
                      小規模なものが2つ、中規模が1つ
                      
                                           26




Tuesday, December 21, 2010                      26
利用例:商品/購買データ解析




                                              27




Tuesday, December 21, 2010                         27
楽天市場の商品の特徴
               - 楽天はショッピングモール。
               - 同一商品が楽天内に複数存在する。




                                          28




Tuesday, December 21, 2010                     28
楽天の商品データの特徴

           - 商品がユニークではない。商品ID≠製品ID。
           - 商品がコンテンツ。店舗様が独自編集可能。
           - 日々追加・編集される。


                要望:
                サービスのニーズに応じて、商品を解析・
                クラスタリングしたい。
                トライアンドエラーで最適解を探りたい。



                                           29




Tuesday, December 21, 2010                      29
集計処理はHadoop化を推進

                •入力データ
                 商品データ、カタログデータ、購買データ
                 

                •出力データ
                 類似商品クラスタ、製品ごとの商品リスト、
                 ジャンル・価格帯などのクラスタ


            当初はレコメンデーションだけで利用していたが
            利用用途を拡大中。

                                        30




Tuesday, December 21, 2010                   30
利用例:リアルタイムランキング




                                           31




Tuesday, December 21, 2010                      31
デイリーランキング




                                         32




Tuesday, December 21, 2010                    32
ランキング集計処理
          •ジャンルごとに販売数を集計。
          •ジャンルの数:6000。拡大傾向。
          • JavaMapReduceを使わず、Pigで実装している。

           
           •集計処理のコード量削減。
            数行で処理を実装。可読性向上。
           •今後のジャンルの拡大に容易に対応可能に。

            
                                         33




Tuesday, December 21, 2010                    33
現在の主な用途

                             • 購買・アクセスデータ解析
                             • ユーザの行動解析
                             • 商品データ解析
                             • 売れ筋ランキング集計
                             • その他各種データ解析に拡大中
                              
                             • eコマース事業
                             • ネット広告事業 


                                                34




Tuesday, December 21, 2010                           34
Hadoop導入による効果




                                             35




Tuesday, December 21, 2010                        35
以前のデータ解析・集計

              集計用バッチサーバ群で集計・分析
               ・用途ごとにバラバラに実装
               ・1台∼数台で自前の並列分散処理
               ・RDBへの依存
               ・運用が非常に煩雑




                                           36




Tuesday, December 21, 2010                      36
Hadoopがもたらしたもの


                               生産性

                             スケーラビリティ

                              耐障害性

                                          37




Tuesday, December 21, 2010                     37
生産性
      •Map Reduceでプログラムを書くのは容易ではない
          と言われるが、、、


       Map Reduceのフレームワークを理解していれば、
       開発者はビジネスロジックに集中でき、これは大きな
       利点といえる。


      • 開発者に多くの選択肢が提供されている
       - Hadoop StreamingでRubyなどから利用可能
       - 特性に応じてPig / Hiveなどの利用
                                         38




Tuesday, December 21, 2010                    38
スケーラビリティ

                  •増大するデータに対する対応能力
                        - Webでは容易にスケールすることが重要


                  •Webサービスのトラフィック
                        - 必ずしもコントロールできるものではない
                        - 突如数倍になることもある




                                                39




Tuesday, December 21, 2010                           39
耐障害性(運用効率の向上)

                  •Hadoop以前は運用が非常に煩雑
                        - 用途ごとにバラバラに実装
                        - 1台∼数台で自前の並列分散処理
                        - RDBへの依存


                  •Hadoop化により煩雑な運用から開放される




                                             40




Tuesday, December 21, 2010                        40
現在の課題

         環境の統合
               - 小規模∼中規模なクラスタを並行運用中
               - 環境の統合をすすめ、ナレッジの集約や
                効率化を図る


         利用範囲のさらなる拡大
               楽天グループ内のすべてのログデータを解析対象へ
          

                                         41




Tuesday, December 21, 2010                    41
今後の取り組み

           サービス、事業へのフィードバック
                 - ユーザや出店店舗様へのさらなる利便性の提供


                 - レコメンデーション・パーソナライゼーション
                  の強化の基盤としてHadoopを使い倒す


                 - 事業戦略、マーケティングへのデータ活用
            

                                           42




Tuesday, December 21, 2010                      42
まとめ



                                   43




Tuesday, December 21, 2010              43
まとめ
          楽天のデータ戦略
                - 独自プロダクトとOSS利用推進


          利用状況
                - 商品、売上データ、アクセスログなどの解析に利用。
                - 解析結果をサービスへフィードバック。
                - 今後さらに活用範囲をひろげていく。




                                        44




Tuesday, December 21, 2010                   44
まとめ

             Hadoopがもたらすもの
                   - これまで不可能(あきらめていた?)データ
                     解析が可能になる。
                   - バッチが多少早くなるだけではない、
                    不可能を可能する可能性が秘められている。


             アイディア次第
                   - 必ずしも規模が必要なわけではない。
                   - 使いようで小規模でも大きな価値を創出できる。

                                              45




Tuesday, December 21, 2010                         45
ご清聴ありがとうございました




                             46




Tuesday, December 21, 2010        46

More Related Content

What's hot

実践!DBベンチマークツールの使い方
実践!DBベンチマークツールの使い方実践!DBベンチマークツールの使い方
実践!DBベンチマークツールの使い方Fujishiro Takuya
 
[Aurora事例祭り]Amazon Aurora を使いこなすためのベストプラクティス
[Aurora事例祭り]Amazon Aurora を使いこなすためのベストプラクティス[Aurora事例祭り]Amazon Aurora を使いこなすためのベストプラクティス
[Aurora事例祭り]Amazon Aurora を使いこなすためのベストプラクティスAmazon Web Services Japan
 
ポスト・ラムダアーキテクチャの切り札? Apache Hudi(NTTデータ テクノロジーカンファレンス 2020 発表資料)
ポスト・ラムダアーキテクチャの切り札? Apache Hudi(NTTデータ テクノロジーカンファレンス 2020 発表資料)ポスト・ラムダアーキテクチャの切り札? Apache Hudi(NTTデータ テクノロジーカンファレンス 2020 発表資料)
ポスト・ラムダアーキテクチャの切り札? Apache Hudi(NTTデータ テクノロジーカンファレンス 2020 発表資料)NTT DATA Technology & Innovation
 
大規模データ活用向けストレージレイヤソフトのこれまでとこれから(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)
大規模データ活用向けストレージレイヤソフトのこれまでとこれから(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)大規模データ活用向けストレージレイヤソフトのこれまでとこれから(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)
大規模データ活用向けストレージレイヤソフトのこれまでとこれから(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)NTT DATA Technology & Innovation
 
AWS Black Belt Online Seminar 2017 Amazon Aurora with PostgreSQL Compatibility
AWS Black Belt Online Seminar 2017 Amazon Aurora with PostgreSQL CompatibilityAWS Black Belt Online Seminar 2017 Amazon Aurora with PostgreSQL Compatibility
AWS Black Belt Online Seminar 2017 Amazon Aurora with PostgreSQL CompatibilityAmazon Web Services Japan
 
Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~
Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~
Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~NTT DATA OSS Professional Services
 
分散システムについて語らせてくれ
分散システムについて語らせてくれ分散システムについて語らせてくれ
分散システムについて語らせてくれKumazaki Hiroki
 
スケールアウトするPostgreSQLを目指して!その第一歩!(NTTデータ テクノロジーカンファレンス 2020 発表資料)
スケールアウトするPostgreSQLを目指して!その第一歩!(NTTデータ テクノロジーカンファレンス 2020 発表資料)スケールアウトするPostgreSQLを目指して!その第一歩!(NTTデータ テクノロジーカンファレンス 2020 発表資料)
スケールアウトするPostgreSQLを目指して!その第一歩!(NTTデータ テクノロジーカンファレンス 2020 発表資料)NTT DATA Technology & Innovation
 
AWSのログ管理ベストプラクティス
AWSのログ管理ベストプラクティスAWSのログ管理ベストプラクティス
AWSのログ管理ベストプラクティスAkihiro Kuwano
 
Apache Hadoopに見るJavaミドルウェアのcompatibility(Open Developers Conference 2020 Onli...
Apache Hadoopに見るJavaミドルウェアのcompatibility(Open Developers Conference 2020 Onli...Apache Hadoopに見るJavaミドルウェアのcompatibility(Open Developers Conference 2020 Onli...
Apache Hadoopに見るJavaミドルウェアのcompatibility(Open Developers Conference 2020 Onli...NTT DATA Technology & Innovation
 
Presto on YARNの導入・運用
Presto on YARNの導入・運用Presto on YARNの導入・運用
Presto on YARNの導入・運用cyberagent
 
Awsでのsql高可用構成 Always On
Awsでのsql高可用構成 Always OnAwsでのsql高可用構成 Always On
Awsでのsql高可用構成 Always OnShinodaYukihiro
 
Hadoop -NameNode HAの仕組み-
Hadoop -NameNode HAの仕組み-Hadoop -NameNode HAの仕組み-
Hadoop -NameNode HAの仕組み-Yuki Gonda
 
Azure Database for PostgreSQL 入門 (PostgreSQL Conference Japan 2021)
Azure Database for PostgreSQL 入門 (PostgreSQL Conference Japan 2021)Azure Database for PostgreSQL 入門 (PostgreSQL Conference Japan 2021)
Azure Database for PostgreSQL 入門 (PostgreSQL Conference Japan 2021)Keisuke Takahashi
 

What's hot (20)

Apache Spark の紹介(前半:Sparkのキホン)
Apache Spark の紹介(前半:Sparkのキホン)Apache Spark の紹介(前半:Sparkのキホン)
Apache Spark の紹介(前半:Sparkのキホン)
 
実践!DBベンチマークツールの使い方
実践!DBベンチマークツールの使い方実践!DBベンチマークツールの使い方
実践!DBベンチマークツールの使い方
 
噛み砕いてKafka Streams #kafkajp
噛み砕いてKafka Streams #kafkajp噛み砕いてKafka Streams #kafkajp
噛み砕いてKafka Streams #kafkajp
 
AWS Black Belt - AWS Glue
AWS Black Belt - AWS GlueAWS Black Belt - AWS Glue
AWS Black Belt - AWS Glue
 
Azure Datalake 大全
Azure Datalake 大全Azure Datalake 大全
Azure Datalake 大全
 
[Aurora事例祭り]Amazon Aurora を使いこなすためのベストプラクティス
[Aurora事例祭り]Amazon Aurora を使いこなすためのベストプラクティス[Aurora事例祭り]Amazon Aurora を使いこなすためのベストプラクティス
[Aurora事例祭り]Amazon Aurora を使いこなすためのベストプラクティス
 
Hiveを高速化するLLAP
Hiveを高速化するLLAPHiveを高速化するLLAP
Hiveを高速化するLLAP
 
ポスト・ラムダアーキテクチャの切り札? Apache Hudi(NTTデータ テクノロジーカンファレンス 2020 発表資料)
ポスト・ラムダアーキテクチャの切り札? Apache Hudi(NTTデータ テクノロジーカンファレンス 2020 発表資料)ポスト・ラムダアーキテクチャの切り札? Apache Hudi(NTTデータ テクノロジーカンファレンス 2020 発表資料)
ポスト・ラムダアーキテクチャの切り札? Apache Hudi(NTTデータ テクノロジーカンファレンス 2020 発表資料)
 
大規模データ活用向けストレージレイヤソフトのこれまでとこれから(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)
大規模データ活用向けストレージレイヤソフトのこれまでとこれから(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)大規模データ活用向けストレージレイヤソフトのこれまでとこれから(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)
大規模データ活用向けストレージレイヤソフトのこれまでとこれから(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)
 
AWS Black Belt Online Seminar 2017 Amazon Aurora with PostgreSQL Compatibility
AWS Black Belt Online Seminar 2017 Amazon Aurora with PostgreSQL CompatibilityAWS Black Belt Online Seminar 2017 Amazon Aurora with PostgreSQL Compatibility
AWS Black Belt Online Seminar 2017 Amazon Aurora with PostgreSQL Compatibility
 
Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~
Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~
Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~
 
分散システムについて語らせてくれ
分散システムについて語らせてくれ分散システムについて語らせてくれ
分散システムについて語らせてくれ
 
スケールアウトするPostgreSQLを目指して!その第一歩!(NTTデータ テクノロジーカンファレンス 2020 発表資料)
スケールアウトするPostgreSQLを目指して!その第一歩!(NTTデータ テクノロジーカンファレンス 2020 発表資料)スケールアウトするPostgreSQLを目指して!その第一歩!(NTTデータ テクノロジーカンファレンス 2020 発表資料)
スケールアウトするPostgreSQLを目指して!その第一歩!(NTTデータ テクノロジーカンファレンス 2020 発表資料)
 
AWSのログ管理ベストプラクティス
AWSのログ管理ベストプラクティスAWSのログ管理ベストプラクティス
AWSのログ管理ベストプラクティス
 
Apache Hadoopに見るJavaミドルウェアのcompatibility(Open Developers Conference 2020 Onli...
Apache Hadoopに見るJavaミドルウェアのcompatibility(Open Developers Conference 2020 Onli...Apache Hadoopに見るJavaミドルウェアのcompatibility(Open Developers Conference 2020 Onli...
Apache Hadoopに見るJavaミドルウェアのcompatibility(Open Developers Conference 2020 Onli...
 
Raft
RaftRaft
Raft
 
Presto on YARNの導入・運用
Presto on YARNの導入・運用Presto on YARNの導入・運用
Presto on YARNの導入・運用
 
Awsでのsql高可用構成 Always On
Awsでのsql高可用構成 Always OnAwsでのsql高可用構成 Always On
Awsでのsql高可用構成 Always On
 
Hadoop -NameNode HAの仕組み-
Hadoop -NameNode HAの仕組み-Hadoop -NameNode HAの仕組み-
Hadoop -NameNode HAの仕組み-
 
Azure Database for PostgreSQL 入門 (PostgreSQL Conference Japan 2021)
Azure Database for PostgreSQL 入門 (PostgreSQL Conference Japan 2021)Azure Database for PostgreSQL 入門 (PostgreSQL Conference Japan 2021)
Azure Database for PostgreSQL 入門 (PostgreSQL Conference Japan 2021)
 

Similar to 楽天がHadoopを使う理由

E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐
E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐
E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐Rakuten Group, Inc.
 
ビジネスリテラシーとしての統計 ビッグデータと統計の活用
ビジネスリテラシーとしての統計 ビッグデータと統計の活用ビジネスリテラシーとしての統計 ビッグデータと統計の活用
ビジネスリテラシーとしての統計 ビッグデータと統計の活用Rakuten Group, Inc.
 
基調講演「データのグループウェア化」
基調講演「データのグループウェア化」基調講演「データのグループウェア化」
基調講演「データのグループウェア化」Cybozucommunity
 
【勉強会資料】採用とソーシャルメディアVer.20110426
【勉強会資料】採用とソーシャルメディアVer.20110426【勉強会資料】採用とソーシャルメディアVer.20110426
【勉強会資料】採用とソーシャルメディアVer.20110426ITmedia_HR(人事・採用)
 
【勉強会資料】採用とソーシャルメディアVer.20110426
【勉強会資料】採用とソーシャルメディアVer.20110426【勉強会資料】採用とソーシャルメディアVer.20110426
【勉強会資料】採用とソーシャルメディアVer.20110426URANO HEIYA
 
【17-C-4】「Axure RPによる画面プロトタイプを活用した要件定義の改善:野村総合研究所、NTTデータの事例紹介」細谷賢一氏
【17-C-4】「Axure RPによる画面プロトタイプを活用した要件定義の改善:野村総合研究所、NTTデータの事例紹介」細谷賢一氏【17-C-4】「Axure RPによる画面プロトタイプを活用した要件定義の改善:野村総合研究所、NTTデータの事例紹介」細谷賢一氏
【17-C-4】「Axure RPによる画面プロトタイプを活用した要件定義の改善:野村総合研究所、NTTデータの事例紹介」細谷賢一氏Developers Summit
 
【勉強会資料】ソーシャルメディア採用の設計と運用(基礎編)
【勉強会資料】ソーシャルメディア採用の設計と運用(基礎編)【勉強会資料】ソーシャルメディア採用の設計と運用(基礎編)
【勉強会資料】ソーシャルメディア採用の設計と運用(基礎編)ITmedia_HR(人事・採用)
 
【勉強会資料】ソーシャルメディア採用の設計と運用(基礎編)
【勉強会資料】ソーシャルメディア採用の設計と運用(基礎編)【勉強会資料】ソーシャルメディア採用の設計と運用(基礎編)
【勉強会資料】ソーシャルメディア採用の設計と運用(基礎編)URANO HEIYA
 
Developers Summit 2012 16-E-1
Developers Summit 2012 16-E-1Developers Summit 2012 16-E-1
Developers Summit 2012 16-E-1Kohei Kumazawa
 
データマイニングCROSS 2012 Opening Talk - データマイニングの実サービス・ビジネス適用と展望
データマイニングCROSS 2012 Opening Talk - データマイニングの実サービス・ビジネス適用と展望 データマイニングCROSS 2012 Opening Talk - データマイニングの実サービス・ビジネス適用と展望
データマイニングCROSS 2012 Opening Talk - データマイニングの実サービス・ビジネス適用と展望 Koichi Hamada
 
JPC2016: PUP-01 知って得する MPN 最新情報
JPC2016: PUP-01 知って得する MPN 最新情報JPC2016: PUP-01 知って得する MPN 最新情報
JPC2016: PUP-01 知って得する MPN 最新情報MPN Japan
 
デジタル時代の企業変革 - 2020
デジタル時代の企業変革 - 2020デジタル時代の企業変革 - 2020
デジタル時代の企業変革 - 2020Ikuo Misao
 
CMS時代のWeb制作におけるペルソナ戦略
CMS時代のWeb制作におけるペルソナ戦略CMS時代のWeb制作におけるペルソナ戦略
CMS時代のWeb制作におけるペルソナ戦略Katsumi Tazuke
 
受発注for製造業 概要資料.pdf
受発注for製造業 概要資料.pdf受発注for製造業 概要資料.pdf
受発注for製造業 概要資料.pdfssuserfea64a1
 
マッチングサービスにおけるKPIの話
マッチングサービスにおけるKPIの話マッチングサービスにおけるKPIの話
マッチングサービスにおけるKPIの話cyberagent
 
Jisa simposium 120614 selected slides
Jisa simposium 120614 selected slidesJisa simposium 120614 selected slides
Jisa simposium 120614 selected slidesTakayuki Hagihara
 
ユーザに価値を届けるためのデータプラットフォームの考え方
ユーザに価値を届けるためのデータプラットフォームの考え方ユーザに価値を届けるためのデータプラットフォームの考え方
ユーザに価値を届けるためのデータプラットフォームの考え方Daisuke Watanabe
 
ユーザに価値を届けるためのデータプラットフォームの考え方
ユーザに価値を届けるためのデータプラットフォームの考え方ユーザに価値を届けるためのデータプラットフォームの考え方
ユーザに価値を届けるためのデータプラットフォームの考え方Rakuten Group, Inc.
 
「オンラインの情報をオフラインで活用!~ECとリアル店舗のトータルの売上アップを実現するO2O施策とは?~」
「オンラインの情報をオフラインで活用!~ECとリアル店舗のトータルの売上アップを実現するO2O施策とは?~」「オンラインの情報をオフラインで活用!~ECとリアル店舗のトータルの売上アップを実現するO2O施策とは?~」
「オンラインの情報をオフラインで活用!~ECとリアル店舗のトータルの売上アップを実現するO2O施策とは?~」EC_Orange
 
Dyna traceによるuxマネジメント
Dyna traceによるuxマネジメントDyna traceによるuxマネジメント
Dyna traceによるuxマネジメント伸夫 森本
 

Similar to 楽天がHadoopを使う理由 (20)

E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐
E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐
E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐
 
ビジネスリテラシーとしての統計 ビッグデータと統計の活用
ビジネスリテラシーとしての統計 ビッグデータと統計の活用ビジネスリテラシーとしての統計 ビッグデータと統計の活用
ビジネスリテラシーとしての統計 ビッグデータと統計の活用
 
基調講演「データのグループウェア化」
基調講演「データのグループウェア化」基調講演「データのグループウェア化」
基調講演「データのグループウェア化」
 
【勉強会資料】採用とソーシャルメディアVer.20110426
【勉強会資料】採用とソーシャルメディアVer.20110426【勉強会資料】採用とソーシャルメディアVer.20110426
【勉強会資料】採用とソーシャルメディアVer.20110426
 
【勉強会資料】採用とソーシャルメディアVer.20110426
【勉強会資料】採用とソーシャルメディアVer.20110426【勉強会資料】採用とソーシャルメディアVer.20110426
【勉強会資料】採用とソーシャルメディアVer.20110426
 
【17-C-4】「Axure RPによる画面プロトタイプを活用した要件定義の改善:野村総合研究所、NTTデータの事例紹介」細谷賢一氏
【17-C-4】「Axure RPによる画面プロトタイプを活用した要件定義の改善:野村総合研究所、NTTデータの事例紹介」細谷賢一氏【17-C-4】「Axure RPによる画面プロトタイプを活用した要件定義の改善:野村総合研究所、NTTデータの事例紹介」細谷賢一氏
【17-C-4】「Axure RPによる画面プロトタイプを活用した要件定義の改善:野村総合研究所、NTTデータの事例紹介」細谷賢一氏
 
【勉強会資料】ソーシャルメディア採用の設計と運用(基礎編)
【勉強会資料】ソーシャルメディア採用の設計と運用(基礎編)【勉強会資料】ソーシャルメディア採用の設計と運用(基礎編)
【勉強会資料】ソーシャルメディア採用の設計と運用(基礎編)
 
【勉強会資料】ソーシャルメディア採用の設計と運用(基礎編)
【勉強会資料】ソーシャルメディア採用の設計と運用(基礎編)【勉強会資料】ソーシャルメディア採用の設計と運用(基礎編)
【勉強会資料】ソーシャルメディア採用の設計と運用(基礎編)
 
Developers Summit 2012 16-E-1
Developers Summit 2012 16-E-1Developers Summit 2012 16-E-1
Developers Summit 2012 16-E-1
 
データマイニングCROSS 2012 Opening Talk - データマイニングの実サービス・ビジネス適用と展望
データマイニングCROSS 2012 Opening Talk - データマイニングの実サービス・ビジネス適用と展望 データマイニングCROSS 2012 Opening Talk - データマイニングの実サービス・ビジネス適用と展望
データマイニングCROSS 2012 Opening Talk - データマイニングの実サービス・ビジネス適用と展望
 
JPC2016: PUP-01 知って得する MPN 最新情報
JPC2016: PUP-01 知って得する MPN 最新情報JPC2016: PUP-01 知って得する MPN 最新情報
JPC2016: PUP-01 知って得する MPN 最新情報
 
デジタル時代の企業変革 - 2020
デジタル時代の企業変革 - 2020デジタル時代の企業変革 - 2020
デジタル時代の企業変革 - 2020
 
CMS時代のWeb制作におけるペルソナ戦略
CMS時代のWeb制作におけるペルソナ戦略CMS時代のWeb制作におけるペルソナ戦略
CMS時代のWeb制作におけるペルソナ戦略
 
受発注for製造業 概要資料.pdf
受発注for製造業 概要資料.pdf受発注for製造業 概要資料.pdf
受発注for製造業 概要資料.pdf
 
マッチングサービスにおけるKPIの話
マッチングサービスにおけるKPIの話マッチングサービスにおけるKPIの話
マッチングサービスにおけるKPIの話
 
Jisa simposium 120614 selected slides
Jisa simposium 120614 selected slidesJisa simposium 120614 selected slides
Jisa simposium 120614 selected slides
 
ユーザに価値を届けるためのデータプラットフォームの考え方
ユーザに価値を届けるためのデータプラットフォームの考え方ユーザに価値を届けるためのデータプラットフォームの考え方
ユーザに価値を届けるためのデータプラットフォームの考え方
 
ユーザに価値を届けるためのデータプラットフォームの考え方
ユーザに価値を届けるためのデータプラットフォームの考え方ユーザに価値を届けるためのデータプラットフォームの考え方
ユーザに価値を届けるためのデータプラットフォームの考え方
 
「オンラインの情報をオフラインで活用!~ECとリアル店舗のトータルの売上アップを実現するO2O施策とは?~」
「オンラインの情報をオフラインで活用!~ECとリアル店舗のトータルの売上アップを実現するO2O施策とは?~」「オンラインの情報をオフラインで活用!~ECとリアル店舗のトータルの売上アップを実現するO2O施策とは?~」
「オンラインの情報をオフラインで活用!~ECとリアル店舗のトータルの売上アップを実現するO2O施策とは?~」
 
Dyna traceによるuxマネジメント
Dyna traceによるuxマネジメントDyna traceによるuxマネジメント
Dyna traceによるuxマネジメント
 

More from Rakuten Group, Inc.

コードレビュー改善のためにJenkinsとIntelliJ IDEAのプラグインを自作してみた話
コードレビュー改善のためにJenkinsとIntelliJ IDEAのプラグインを自作してみた話コードレビュー改善のためにJenkinsとIntelliJ IDEAのプラグインを自作してみた話
コードレビュー改善のためにJenkinsとIntelliJ IDEAのプラグインを自作してみた話Rakuten Group, Inc.
 
楽天における安全な秘匿情報管理への道のり
楽天における安全な秘匿情報管理への道のり楽天における安全な秘匿情報管理への道のり
楽天における安全な秘匿情報管理への道のりRakuten Group, Inc.
 
Simple and Effective Knowledge-Driven Query Expansion for QA-Based Product At...
Simple and Effective Knowledge-Driven Query Expansion for QA-Based Product At...Simple and Effective Knowledge-Driven Query Expansion for QA-Based Product At...
Simple and Effective Knowledge-Driven Query Expansion for QA-Based Product At...Rakuten Group, Inc.
 
DataSkillCultureを浸透させる楽天の取り組み
DataSkillCultureを浸透させる楽天の取り組みDataSkillCultureを浸透させる楽天の取り組み
DataSkillCultureを浸透させる楽天の取り組みRakuten Group, Inc.
 
大規模なリアルタイム監視の導入と展開
大規模なリアルタイム監視の導入と展開大規模なリアルタイム監視の導入と展開
大規模なリアルタイム監視の導入と展開Rakuten Group, Inc.
 
楽天における大規模データベースの運用
楽天における大規模データベースの運用楽天における大規模データベースの運用
楽天における大規模データベースの運用Rakuten Group, Inc.
 
楽天サービスを支えるネットワークインフラストラクチャー
楽天サービスを支えるネットワークインフラストラクチャー楽天サービスを支えるネットワークインフラストラクチャー
楽天サービスを支えるネットワークインフラストラクチャーRakuten Group, Inc.
 
楽天の規模とクラウドプラットフォーム統括部の役割
楽天の規模とクラウドプラットフォーム統括部の役割楽天の規模とクラウドプラットフォーム統括部の役割
楽天の規模とクラウドプラットフォーム統括部の役割Rakuten Group, Inc.
 
Rakuten Services and Infrastructure Team.pdf
Rakuten Services and Infrastructure Team.pdfRakuten Services and Infrastructure Team.pdf
Rakuten Services and Infrastructure Team.pdfRakuten Group, Inc.
 
The Data Platform Administration Handling the 100 PB.pdf
The Data Platform Administration Handling the 100 PB.pdfThe Data Platform Administration Handling the 100 PB.pdf
The Data Platform Administration Handling the 100 PB.pdfRakuten Group, Inc.
 
Supporting Internal Customers as Technical Account Managers.pdf
Supporting Internal Customers as Technical Account Managers.pdfSupporting Internal Customers as Technical Account Managers.pdf
Supporting Internal Customers as Technical Account Managers.pdfRakuten Group, Inc.
 
Making Cloud Native CI_CD Services.pdf
Making Cloud Native CI_CD Services.pdfMaking Cloud Native CI_CD Services.pdf
Making Cloud Native CI_CD Services.pdfRakuten Group, Inc.
 
How We Defined Our Own Cloud.pdf
How We Defined Our Own Cloud.pdfHow We Defined Our Own Cloud.pdf
How We Defined Our Own Cloud.pdfRakuten Group, Inc.
 
Travel & Leisure Platform Department's tech info
Travel & Leisure Platform Department's tech infoTravel & Leisure Platform Department's tech info
Travel & Leisure Platform Department's tech infoRakuten Group, Inc.
 
Travel & Leisure Platform Department's tech info
Travel & Leisure Platform Department's tech infoTravel & Leisure Platform Department's tech info
Travel & Leisure Platform Department's tech infoRakuten Group, Inc.
 
Introduction of GORA API Group technology
Introduction of GORA API Group technologyIntroduction of GORA API Group technology
Introduction of GORA API Group technologyRakuten Group, Inc.
 
100PBを越えるデータプラットフォームの実情
100PBを越えるデータプラットフォームの実情100PBを越えるデータプラットフォームの実情
100PBを越えるデータプラットフォームの実情Rakuten Group, Inc.
 
社内エンジニアを支えるテクニカルアカウントマネージャー
社内エンジニアを支えるテクニカルアカウントマネージャー社内エンジニアを支えるテクニカルアカウントマネージャー
社内エンジニアを支えるテクニカルアカウントマネージャーRakuten Group, Inc.
 

More from Rakuten Group, Inc. (20)

コードレビュー改善のためにJenkinsとIntelliJ IDEAのプラグインを自作してみた話
コードレビュー改善のためにJenkinsとIntelliJ IDEAのプラグインを自作してみた話コードレビュー改善のためにJenkinsとIntelliJ IDEAのプラグインを自作してみた話
コードレビュー改善のためにJenkinsとIntelliJ IDEAのプラグインを自作してみた話
 
楽天における安全な秘匿情報管理への道のり
楽天における安全な秘匿情報管理への道のり楽天における安全な秘匿情報管理への道のり
楽天における安全な秘匿情報管理への道のり
 
What Makes Software Green?
What Makes Software Green?What Makes Software Green?
What Makes Software Green?
 
Simple and Effective Knowledge-Driven Query Expansion for QA-Based Product At...
Simple and Effective Knowledge-Driven Query Expansion for QA-Based Product At...Simple and Effective Knowledge-Driven Query Expansion for QA-Based Product At...
Simple and Effective Knowledge-Driven Query Expansion for QA-Based Product At...
 
DataSkillCultureを浸透させる楽天の取り組み
DataSkillCultureを浸透させる楽天の取り組みDataSkillCultureを浸透させる楽天の取り組み
DataSkillCultureを浸透させる楽天の取り組み
 
大規模なリアルタイム監視の導入と展開
大規模なリアルタイム監視の導入と展開大規模なリアルタイム監視の導入と展開
大規模なリアルタイム監視の導入と展開
 
楽天における大規模データベースの運用
楽天における大規模データベースの運用楽天における大規模データベースの運用
楽天における大規模データベースの運用
 
楽天サービスを支えるネットワークインフラストラクチャー
楽天サービスを支えるネットワークインフラストラクチャー楽天サービスを支えるネットワークインフラストラクチャー
楽天サービスを支えるネットワークインフラストラクチャー
 
楽天の規模とクラウドプラットフォーム統括部の役割
楽天の規模とクラウドプラットフォーム統括部の役割楽天の規模とクラウドプラットフォーム統括部の役割
楽天の規模とクラウドプラットフォーム統括部の役割
 
Rakuten Services and Infrastructure Team.pdf
Rakuten Services and Infrastructure Team.pdfRakuten Services and Infrastructure Team.pdf
Rakuten Services and Infrastructure Team.pdf
 
The Data Platform Administration Handling the 100 PB.pdf
The Data Platform Administration Handling the 100 PB.pdfThe Data Platform Administration Handling the 100 PB.pdf
The Data Platform Administration Handling the 100 PB.pdf
 
Supporting Internal Customers as Technical Account Managers.pdf
Supporting Internal Customers as Technical Account Managers.pdfSupporting Internal Customers as Technical Account Managers.pdf
Supporting Internal Customers as Technical Account Managers.pdf
 
Making Cloud Native CI_CD Services.pdf
Making Cloud Native CI_CD Services.pdfMaking Cloud Native CI_CD Services.pdf
Making Cloud Native CI_CD Services.pdf
 
How We Defined Our Own Cloud.pdf
How We Defined Our Own Cloud.pdfHow We Defined Our Own Cloud.pdf
How We Defined Our Own Cloud.pdf
 
Travel & Leisure Platform Department's tech info
Travel & Leisure Platform Department's tech infoTravel & Leisure Platform Department's tech info
Travel & Leisure Platform Department's tech info
 
Travel & Leisure Platform Department's tech info
Travel & Leisure Platform Department's tech infoTravel & Leisure Platform Department's tech info
Travel & Leisure Platform Department's tech info
 
OWASPTop10_Introduction
OWASPTop10_IntroductionOWASPTop10_Introduction
OWASPTop10_Introduction
 
Introduction of GORA API Group technology
Introduction of GORA API Group technologyIntroduction of GORA API Group technology
Introduction of GORA API Group technology
 
100PBを越えるデータプラットフォームの実情
100PBを越えるデータプラットフォームの実情100PBを越えるデータプラットフォームの実情
100PBを越えるデータプラットフォームの実情
 
社内エンジニアを支えるテクニカルアカウントマネージャー
社内エンジニアを支えるテクニカルアカウントマネージャー社内エンジニアを支えるテクニカルアカウントマネージャー
社内エンジニアを支えるテクニカルアカウントマネージャー
 

Recently uploaded

スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムsugiuralab
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A surveyToru Tamaki
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...Toru Tamaki
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略Ryo Sasaki
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNetToru Tamaki
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdftaisei2219
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Yuma Ohgami
 

Recently uploaded (9)

スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
 

楽天がHadoopを使う理由

  • 1. 楽天がHadoopを使う理由 Keisuke Kawamura | Development Unit Rakuten, Inc. Nikkei Computer Seminar 15th Dec. 2010 1 Tuesday, December 21, 2010 1
  • 2. 自己紹介 河村 圭介(かわむらけいすけ)  楽天株式会社 Development Unit  シニアアソフトウェアエンジニア   - Webサービスの企画・開発  - 大規模データ解析の処理基盤構築 2 Tuesday, December 21, 2010 2
  • 3. 自己紹介 課外活動  楽天で行われる各種技術イベント 企画・運営  Hadoopソースコードリーディング お手伝い  事例記事の執筆などなど Contact :  keisuke.kawamura@mail.rakuten.co.jp  twitter @kkawamura 3 Tuesday, December 21, 2010 3
  • 4. Hadoopと私 ・2009年2月∼  Hadoopでアプリケーション開発。 (楽天市場向けレコメンダーシステム) ・2010年10月∼  大規模データの解析インフラの構築が本業に。 アプリ開発者→データインフラ担当 4 Tuesday, December 21, 2010 4
  • 5. 本日お話しすること 1. 我々の課題 2. 楽天のデータへの取り組み 3. Hadoopの利用状況・事例 4.Web事業者から見たHadoop 5. 今後の展望とまとめ 5 Tuesday, December 21, 2010 5
  • 6. 我々が直面している課題 6 Tuesday, December 21, 2010 6
  • 7. 楽天市場(らくてんいちば) •日本最大のインターネットショッピングモール 日本最大 •世界でも独特のビジネスモデル 店舗数:34,642店 商品数:6,899万点 会員数:6,400万人 流通総額:8,000億円※ (※2009年) 7 Tuesday, December 21, 2010 7
  • 8. グループのビジョン Business Business EC Application Application Business Business Business Business クレジット Application Application トラベル Application Application 会員データベース ポータル/ Business Business Business Business Application Application 証券 Application Application コンテンツ Business Business 金融 Application Application 生活に必要なサービス全てを提供する Tuesday, December 21, 2010 8
  • 9. 楽天グループの国際展開 インターネット・ショッピングモールビジネス トラベル ビジネス パフォーマンスマーケティング ビジネス ヨーロッパ アメリカ 本社 PriceMinister アジア Rakuten Ichiba Buy.com Taiwan TARAD.com Indonesia インターネット・ショッピングモールビジネス [台湾] 台北 [米国] カルフォルニア [タイランド] バンコク [インドネシア] ジャカルタ [中国] 北京 [フランス] パリ 9 Tuesday, December 21, 2010 9
  • 10. インターネットの情報爆発 2000年 6.2EB ZB(ゼッタバイト) 45倍 1021 2007年 281EB 1,000,000,000,000,000,000,000 6倍 2011年 1.8ZB 10 Tuesday, December 21, 2010 10
  • 11. 現在の楽天市場のサービス規模 出店店舗   34,642店 商品数    6,899万商品 購入者数   919万人 (2010/3Q) 注文数    32,92万件 (2010/3Q) 会員数    6400万ID   11 Tuesday, December 21, 2010 11
  • 12. 増え続けるデータ 会員数    20万ID/月 増加 月間購入件数 1000万件 ピークタイム購入件数 1000件 / 分 PV      1億PV / 日  12 Tuesday, December 21, 2010 12
  • 13. Internet Traffic 20 02 Ja 0 n. Tuesday, December 21, 2010 20 02 Ju 20 l. 03 Ja 20 n. 03 Ju 20 l. 04 Ja 20 n. 04 Ju 20 l 05 Ja 20 n. 05 Ju 20 l. 06 Ja 20 n. 06 Ju Network traffic is growing 20 l. 150 times in the last 8 years 07 Ja 20 n. 07 Ju 20 l. 08 トラフィックの推移 Ja 20 n. 08 Ju 20 l. 09 Ja 20 n. 09 Ju l. 13 13
  • 14. データの重要性 データはサービスに様々な価値をもたらす 例)Webサービスの場合   ・レコメンデーション   ・パーソナライゼーション   ・情報の提供精度向上   14 Tuesday, December 21, 2010 14
  • 15. ウェブサービスの裏側 より便利なサービスを提供するために、 バックエンドでは、さまざまなデータ 分析が必要となる。 しかし、規模が大きくなれば、データの 管理も解析も容易ではなくなる。 ...データは増え続ける。 15 Tuesday, December 21, 2010 15
  • 16. 各社の技術開発 •「MapReduce」等は分散並列処理基盤 •「GFS/BigTable」等は分散データストレージ、KVS 「処理」の分散 「データ」の分散 GFS/BigTable MapReduce Dynamo MapReduceのJava実装 Windows Azure SQL Data Services fairy ROMA Tuesday, December 21, 2010 16
  • 17. 楽天の大規模データへの取り組み Rakuten SuperDB 独自プロダクトの開発 OSSを利用したデータ解析 (Hadoopの利用推進) 17 Tuesday, December 21, 2010 17
  • 18. 楽天スーパーDB 18 Tuesday, December 21, 2010 18
  • 19. 楽天スーパーDB •楽天には多様なビジネスがあり、様々なデータがある •堅牢・強固なDWHに集約し、サービス向上に役立てている データの集約 データの分析・利用 商品・サービスDB リコメンデーショ パーソナライズ ン 顧客属性DB 楽天 購買予測 スーパーDB 購買履歴DB 指標モニタリング 閲覧履歴DB 19 Tuesday, December 21, 2010 19
  • 20. スーパーDBのデータ活用 サービス特性毎にリコメンドロジックをカスタマイズ可能な、 TOHO 楽天経済圏のレコメンデーションプラットフォーム 各種レコメンド ロジック レコメンデーション 協調フィルタリング リターゲティング プラットフォーム バスケット 画像処理 スーパーDB 商品・サービスDB 顧客属性DB 購買履歴DB 閲覧履歴DB 20 Tuesday, December 21, 2010 20
  • 21. スーパーDBのデータ活用 ターゲティング広告などに利用中  21 Tuesday, December 21, 2010 21
  • 22. 独自プロダクトの開発 22 Tuesday, December 21, 2010 22
  • 23. 分散プロダクトの独自開発 ・Rakuten On-Memory Architecture  ROMA is one of the data storing systems for distributed key-value stores.   23 Tuesday, December 21, 2010 23
  • 24. ROMA: example. Roma was used some services. (ex. Browse History of Rakuten Ichiba and Rakuten Travel. ) [Browse History] Sharing data by Rakuten ID. 【PC】 【Mobile】 24 Tuesday, December 21, 2010 24
  • 25. OSSを利用したデータ解析 (Hadoopの利用) 25 Tuesday, December 21, 2010 25
  • 26. 楽天のHadoop環境 2008年4月∼  検証環境にて検証開始 2009年3月∼ プロダクション環境で運用開始 Hadoop 0.19.2 15台構成の小規模クラスタ 2010年8月∼  3つのクラスタを運用中  Hadoop 0.20.2  小規模なものが2つ、中規模が1つ   26 Tuesday, December 21, 2010 26
  • 27. 利用例:商品/購買データ解析 27 Tuesday, December 21, 2010 27
  • 28. 楽天市場の商品の特徴 - 楽天はショッピングモール。 - 同一商品が楽天内に複数存在する。 28 Tuesday, December 21, 2010 28
  • 29. 楽天の商品データの特徴 - 商品がユニークではない。商品ID≠製品ID。 - 商品がコンテンツ。店舗様が独自編集可能。 - 日々追加・編集される。 要望: サービスのニーズに応じて、商品を解析・ クラスタリングしたい。 トライアンドエラーで最適解を探りたい。 29 Tuesday, December 21, 2010 29
  • 30. 集計処理はHadoop化を推進 •入力データ  商品データ、カタログデータ、購買データ   •出力データ  類似商品クラスタ、製品ごとの商品リスト、  ジャンル・価格帯などのクラスタ 当初はレコメンデーションだけで利用していたが 利用用途を拡大中。 30 Tuesday, December 21, 2010 30
  • 31. 利用例:リアルタイムランキング 31 Tuesday, December 21, 2010 31
  • 32. デイリーランキング 32 Tuesday, December 21, 2010 32
  • 33. ランキング集計処理 •ジャンルごとに販売数を集計。 •ジャンルの数:6000。拡大傾向。 • JavaMapReduceを使わず、Pigで実装している。   •集計処理のコード量削減。 数行で処理を実装。可読性向上。 •今後のジャンルの拡大に容易に対応可能に。   33 Tuesday, December 21, 2010 33
  • 34. 現在の主な用途 • 購買・アクセスデータ解析 • ユーザの行動解析 • 商品データ解析 • 売れ筋ランキング集計 • その他各種データ解析に拡大中   • eコマース事業 • ネット広告事業  34 Tuesday, December 21, 2010 34
  • 35. Hadoop導入による効果 35 Tuesday, December 21, 2010 35
  • 36. 以前のデータ解析・集計 集計用バッチサーバ群で集計・分析  ・用途ごとにバラバラに実装  ・1台∼数台で自前の並列分散処理  ・RDBへの依存  ・運用が非常に煩雑 36 Tuesday, December 21, 2010 36
  • 37. Hadoopがもたらしたもの 生産性 スケーラビリティ 耐障害性 37 Tuesday, December 21, 2010 37
  • 38. 生産性 •Map Reduceでプログラムを書くのは容易ではない と言われるが、、、  Map Reduceのフレームワークを理解していれば、  開発者はビジネスロジックに集中でき、これは大きな  利点といえる。 • 開発者に多くの選択肢が提供されている  - Hadoop StreamingでRubyなどから利用可能 - 特性に応じてPig / Hiveなどの利用   38 Tuesday, December 21, 2010 38
  • 39. スケーラビリティ •増大するデータに対する対応能力 - Webでは容易にスケールすることが重要 •Webサービスのトラフィック - 必ずしもコントロールできるものではない - 突如数倍になることもある 39 Tuesday, December 21, 2010 39
  • 40. 耐障害性(運用効率の向上) •Hadoop以前は運用が非常に煩雑 - 用途ごとにバラバラに実装 - 1台∼数台で自前の並列分散処理 - RDBへの依存 •Hadoop化により煩雑な運用から開放される 40 Tuesday, December 21, 2010 40
  • 41. 現在の課題 環境の統合 - 小規模∼中規模なクラスタを並行運用中 - 環境の統合をすすめ、ナレッジの集約や  効率化を図る 利用範囲のさらなる拡大 楽天グループ内のすべてのログデータを解析対象へ   41 Tuesday, December 21, 2010 41
  • 42. 今後の取り組み サービス、事業へのフィードバック - ユーザや出店店舗様へのさらなる利便性の提供 - レコメンデーション・パーソナライゼーション  の強化の基盤としてHadoopを使い倒す - 事業戦略、マーケティングへのデータ活用   42 Tuesday, December 21, 2010 42
  • 43. まとめ 43 Tuesday, December 21, 2010 43
  • 44. まとめ 楽天のデータ戦略 - 独自プロダクトとOSS利用推進 利用状況 - 商品、売上データ、アクセスログなどの解析に利用。 - 解析結果をサービスへフィードバック。 - 今後さらに活用範囲をひろげていく。 44 Tuesday, December 21, 2010 44
  • 45. まとめ Hadoopがもたらすもの - これまで不可能(あきらめていた?)データ 解析が可能になる。 - バッチが多少早くなるだけではない、  不可能を可能する可能性が秘められている。 アイディア次第 - 必ずしも規模が必要なわけではない。 - 使いようで小規模でも大きな価値を創出できる。 45 Tuesday, December 21, 2010 45
  • 46. ご清聴ありがとうございました 46 Tuesday, December 21, 2010 46