SlideShare a Scribd company logo
1 of 20
Download to read offline
大名古屋 #04
2010/08/22 You&I
• 2010/07/24(土)
  – 30数名が参加。
• 株式会社ロックオン 会議室
  – http://www.lockon.co.jp
  – 会社の入り口には役員の顔写真とか役員
    の一言が掲載されていた
  – 畳のある打ち合わせスペースがあったり
  – mixiとかの事務所のイメージ
  – 凄かった
(@tamagawa_ryuji)    (1/3)

• オープンソースのMapReduce/分散ストレージ
  実装、Hadoopの紹介
 – Hadoopを知らない人に向けたセッション
 – HadoopはToolkitと捉えると良いというお話があ
   った。
   •   Hadoopがやってくれる所は任せておいて、開発者は
       データ処理にのみ注力
(@tamagawa_ryuji)    (2/3)

– Hadoopの構成
 • JobTrackerはHDFSのデータ配置状況をみて
   タスクの分配を行う。
 • Hadoop本のデータ配分の説明(P.69~70)は
   現在の実装とは異なっている。
– Hadoopを使う上で優先して考慮すべき事
 • ネットワーク帯域
 • ディスク容量
(@tamagawa_ryuji)      (3/3)

– Hadoopについては、Hadoop Conference
  Japan 2009の資料が参考になる。
   • http://atnd.org/events/1848
– Hadoopは象本で全体像を掴み、各論は英
  語資料を参照せよ。
– ITエンジニアのTwitterでの情報交換は凄
  い。積極的に利用すべき。
– 環境作るならClouderaのパッケージを利用
  せよ。
   • http://www.cloudera.com/
(@karate405)                     (1/2)

• Hadoop上のデータを用いるBIシステムについ
  て
 – Pentaho社が開発しているBI(ビジネスインテリジ
   ェンス)ツールにHadoopが組み込まれ始めている
   事例について紹介。
 – BIツールの方はOSSとして公開されており、
   SourceForge.netで公開されている。
   •   http://sourceforge.net/projects/pentaho
       (GPL/LGPL/MPL 1.1)
(@karate405)                  (2/2)

– Pentaho社の取り組みは以下の通り。
  •   Hadoop上のデータに対する入出力する
      ETL(Extraction, Transformation and Loading)ツー
      ルを提供
  •   Hadoop上でETLを実行する為のツールを提供
  •   Hadoop Hiveユーザ向けにJDBCドライバーを提供
– HDFSのGUIツールのデモ。Eclipseプラグインと
  して提供されている?I/Fは日本語対応していた。
– ツールは現在βテスト参加者向けに公開されて
  おり、一般公開は9月頃を予定しているらしい。
(http://www.todo.ne.jp)   1(1/4)


• NTTデータにおけるHadoopへの取り組み
 – プロセス指向からデータ指向へ。
   •    とりあえずデータを溜め込んで、どう使うかは後で考
        える流れ。
   •    POSデータ等の今まで溜め込めなかったデータの活
        用。
 – NTTデータさんは、象さん好きの会社のようで、
   PostgreSQLをよく利用しており、今度は
   Hadoop。
1(2/4)

– NTTデータはBizXaaS Hadoop構築・運用ソリュ
  ーションの提供を開始。
  •   http://bizxaas.net/
– クラスタPCが故障して新しいPCを導入した場合、
  Hadoop環境を自動構築出来るようになってい
  る。以下の技術を利用している。
  •   Puppet
  •   RedHat Kickstart
  •   +α
      –   RPMのカスタマイズ
      –   スイッチの接続ポート位置からのホスト名の自動生成
1(3/4)

– NTTデータとしては、これらの自動構成ツールに
  ついてはいずれOSSとして公開したい。でも
  Adobeに先を越されてしまった。
 •   InfoQ > Adobe が Hadoop のための Puppet レシピ
     をリリース
 •   http://www.infoq.com/jp/news/2010/07/adobe-released-puppet-recipes
1(4/4)

– HDFSにおいてSPOF(Single point of failure:単
  一障害点)となるNameNodeの冗長化はどうす
  る?普通は・・・
  •   Heartbeat + DRBD(Distributed Replicated Block
      Device)
– NTTデータさんでは・・・
  •   XenによるFT(フォールトトレランス)
      –   見かけ上は1台に見えるが、2台構成でメモリ状態等を
          syncしている。
2(1/4)


• Hadoop Summit 2010の話
  –   http://developer.yahoo.com/events/hadoopsummit2010/
  – 米国Yahoo!主催のイベント。
  – 日本から参加していたのは、NTTデータさんだけ
    だった模様。またアジアからの参加は大陸系の方
    々が多かった模様。
  – 午前の部はビデオ公開されている。
2(2/4)


• 午前の部の要約
 – Yahoo!でのHadoopの利用
   •   Mass Technology, Mass Scale, Cloud Computing
   •   クリック解析
       –   個人の嗜好を分析
   •   spamフィルタリング
       –   GmailやHotmailよりもフィルタリング性能は良い(Yahoo!
           談)
       –   ※ あくまで米国向けサービスの話です。日本国内は別物で
           あるとお考え下さい。
2(3/4)

– Yahoo!のHadoopへの貢献
  •   セキュリティ対策としてKerberos認証の実装
  •   Oozie(濱野さんはウジーと表記。ウージーって聞こえ
      ました。)
– Facebookの事例
  •   80-90TB/day
  •   Hadoopのジョブの95%はHadoop Hiveを利用。
      –   HiPalというHiveラッパーというかHiveQLの作成ツールを利
          用。
      –   こういったツールは、RubyベースでHadoopを利用している
          Cookpadさんでも構築してますねー。
2(4/4)


• 午後の部で気になったもの
 – 天体画像処理へのHadoop適用
   •   画像のモザイク処理(複数画像を重ね合わせてパノラ
       マ画像を生成する)にHadoopを利用。
   •   FITS(The Flexible Image Transport System)ファイ
       ル形式をHadoopのSequenceFile形式に変換して利
       用しているらしい。
• Yahoo!色が強いイベントだったらしい。
(@sugipooh)

• いったいなんぼならHadoopできるねん?
 – aftercare
    •   http://lxs.jp/wordpress/?p=221
 – 発表資料
    •   http://www.slideshare.net/sugipooh/pdf-4898997
 – HadoopのHDFSのクラスタを構築する場合に備
   えて、Cloudera社が提唱しているH/Wスペックを
   参考に各種ブレードサーバーの見積を行ったお
   話。
    •   http://www.cloudera.
        com/blog/2010/03/clouderas-support-team-shares-some-bas
        ic-hardware-recommendations/
(@shot6)      (1/3)

• Hadoopソースリーディングの会の紹介
 – コミュニティ活動の紹介。
   •   イベント後にビアバスト(beer bust)を実施。
   •   毎回参加者数が大変な事になっている。(第2回の時
       は実参加者数が少なかったらしい)
   •   最近はベンチャーキャピタルにHadoopって言うだけ
       でお金が入ってくるらしい(※冗談です)
   •   毎回登壇者の熱の入ったお話で予定時間を超過しま
       くり。今回の関西勉強会でもそうでしたがw
   •   色々と分科会が立ち上がってきている。内容がマニア
       ック過ぎて参加者が静まりかえってしまい微妙な空気
       になる事も。
(@shot6)                     (2/3)

– 今後としては少し内容を絞って、連載ものと単発
  ものの組み合わせで活動。
– 現在の連載もの。
 •   Cloudera社のHadoopトレーニングに参加
     (@okachimachiorz1さん)
 •   HBase入門
– 今後予定している連載もの。
 •   Data-Intensive Text Processing with
     MapReduce本を読み解く
     –   http://www.amazon.co.jp/dp/1608453421
 •   Pig入門
 •   Oozie入門
(@shot6)                 (3/3)

– 近々発売のクラウドムック本にHadoopの記事を
  寄稿したので、みんな買ってね!
 •   http://d.hatena.ne.jp/shot6/20100802#1280713701
• 濱野さん、杉田さん、さくらインターネットの田
  中社長(@kunihirotanaka)の3人でのデータセ
  ンター話が凄かった!
 – さくらインターネットは石狩にデータセンターを建
   設中でそれに絡んで、直流電源とかの話で色々と
   盛り上がった。
    •   http://ishikari.sakura.ad.jp/

More Related Content

What's hot

Hadoopことはじめ
HadoopことはじめHadoopことはじめ
HadoopことはじめKatsunori Kanda
 
Hadoopことはじめ
HadoopことはじめHadoopことはじめ
Hadoopことはじめ均 津田
 
Apache Hadoop の現在と将来(Hadoop / Spark Conference Japan 2016 キーノート講演資料)
Apache Hadoop の現在と将来(Hadoop / Spark Conference Japan 2016 キーノート講演資料)Apache Hadoop の現在と将来(Hadoop / Spark Conference Japan 2016 キーノート講演資料)
Apache Hadoop の現在と将来(Hadoop / Spark Conference Japan 2016 キーノート講演資料)Hadoop / Spark Conference Japan
 
ただいまHadoop勉強中
ただいまHadoop勉強中ただいまHadoop勉強中
ただいまHadoop勉強中Satoshi Noto
 
Tuning maniax 2014 Hadoop編
Tuning maniax 2014 Hadoop編Tuning maniax 2014 Hadoop編
Tuning maniax 2014 Hadoop編ThinkIT_impress
 
Hadoop~Yahoo!Japanの活用について
Hadoop~Yahoo!Japanの活用についてHadoop~Yahoo!Japanの活用について
Hadoop~Yahoo!Japanの活用についてkaminashi
 
Hadoop Source Code Reading #17
Hadoop Source Code Reading #17Hadoop Source Code Reading #17
Hadoop Source Code Reading #17Shingo Furuyama
 
MapR と Vertica エンジニアが語る、なぜその組み合わせが最高なのか? - db tech showcase 大阪 2014 2014/06/19
MapR と Vertica エンジニアが語る、なぜその組み合わせが最高なのか? - db tech showcase 大阪 2014 2014/06/19MapR と Vertica エンジニアが語る、なぜその組み合わせが最高なのか? - db tech showcase 大阪 2014 2014/06/19
MapR と Vertica エンジニアが語る、なぜその組み合わせが最高なのか? - db tech showcase 大阪 2014 2014/06/19MapR Technologies Japan
 
MapReduce/Spark/Tezのフェアな性能比較に向けて (Cloudera World Tokyo 2014 LT講演)
MapReduce/Spark/Tezのフェアな性能比較に向けて (Cloudera World Tokyo 2014 LT講演)MapReduce/Spark/Tezのフェアな性能比較に向けて (Cloudera World Tokyo 2014 LT講演)
MapReduce/Spark/Tezのフェアな性能比較に向けて (Cloudera World Tokyo 2014 LT講演)Hadoop / Spark Conference Japan
 
Hadoop概要説明
Hadoop概要説明Hadoop概要説明
Hadoop概要説明Satoshi Noto
 
Windows Azure HDInsight サービスの紹介
Windows Azure HDInsight サービスの紹介Windows Azure HDInsight サービスの紹介
Windows Azure HDInsight サービスの紹介Kuninobu SaSaki
 
ATN No.1 MapReduceだけでない!? Hadoopとその仲間たち
ATN No.1 MapReduceだけでない!? Hadoopとその仲間たちATN No.1 MapReduceだけでない!? Hadoopとその仲間たち
ATN No.1 MapReduceだけでない!? Hadoopとその仲間たちAdvancedTechNight
 
Hadoopデータプラットフォーム #cwt2013
Hadoopデータプラットフォーム #cwt2013Hadoopデータプラットフォーム #cwt2013
Hadoopデータプラットフォーム #cwt2013Cloudera Japan
 

What's hot (20)

はやわかりHadoop
はやわかりHadoopはやわかりHadoop
はやわかりHadoop
 
Hadoopことはじめ
HadoopことはじめHadoopことはじめ
Hadoopことはじめ
 
Hadoop事始め
Hadoop事始めHadoop事始め
Hadoop事始め
 
OSC2014 Tokyo/Spring Hadoop
OSC2014 Tokyo/Spring HadoopOSC2014 Tokyo/Spring Hadoop
OSC2014 Tokyo/Spring Hadoop
 
Hadoopことはじめ
HadoopことはじめHadoopことはじめ
Hadoopことはじめ
 
Apache Hadoop の現在と将来(Hadoop / Spark Conference Japan 2016 キーノート講演資料)
Apache Hadoop の現在と将来(Hadoop / Spark Conference Japan 2016 キーノート講演資料)Apache Hadoop の現在と将来(Hadoop / Spark Conference Japan 2016 キーノート講演資料)
Apache Hadoop の現在と将来(Hadoop / Spark Conference Japan 2016 キーノート講演資料)
 
ただいまHadoop勉強中
ただいまHadoop勉強中ただいまHadoop勉強中
ただいまHadoop勉強中
 
Apache Hive 紹介
Apache Hive 紹介Apache Hive 紹介
Apache Hive 紹介
 
Tuning maniax 2014 Hadoop編
Tuning maniax 2014 Hadoop編Tuning maniax 2014 Hadoop編
Tuning maniax 2014 Hadoop編
 
Hadoop~Yahoo!Japanの活用について
Hadoop~Yahoo!Japanの活用についてHadoop~Yahoo!Japanの活用について
Hadoop~Yahoo!Japanの活用について
 
Hadoop Source Code Reading #17
Hadoop Source Code Reading #17Hadoop Source Code Reading #17
Hadoop Source Code Reading #17
 
MapR と Vertica エンジニアが語る、なぜその組み合わせが最高なのか? - db tech showcase 大阪 2014 2014/06/19
MapR と Vertica エンジニアが語る、なぜその組み合わせが最高なのか? - db tech showcase 大阪 2014 2014/06/19MapR と Vertica エンジニアが語る、なぜその組み合わせが最高なのか? - db tech showcase 大阪 2014 2014/06/19
MapR と Vertica エンジニアが語る、なぜその組み合わせが最高なのか? - db tech showcase 大阪 2014 2014/06/19
 
Hadoop loves H2
Hadoop loves H2Hadoop loves H2
Hadoop loves H2
 
MapReduce/Spark/Tezのフェアな性能比較に向けて (Cloudera World Tokyo 2014 LT講演)
MapReduce/Spark/Tezのフェアな性能比較に向けて (Cloudera World Tokyo 2014 LT講演)MapReduce/Spark/Tezのフェアな性能比較に向けて (Cloudera World Tokyo 2014 LT講演)
MapReduce/Spark/Tezのフェアな性能比較に向けて (Cloudera World Tokyo 2014 LT講演)
 
Hadoop概要説明
Hadoop概要説明Hadoop概要説明
Hadoop概要説明
 
FukuokaCloud_Azure
FukuokaCloud_AzureFukuokaCloud_Azure
FukuokaCloud_Azure
 
Windows Azure HDInsight サービスの紹介
Windows Azure HDInsight サービスの紹介Windows Azure HDInsight サービスの紹介
Windows Azure HDInsight サービスの紹介
 
ATN No.1 MapReduceだけでない!? Hadoopとその仲間たち
ATN No.1 MapReduceだけでない!? Hadoopとその仲間たちATN No.1 MapReduceだけでない!? Hadoopとその仲間たち
ATN No.1 MapReduceだけでない!? Hadoopとその仲間たち
 
Hadoopデータプラットフォーム #cwt2013
Hadoopデータプラットフォーム #cwt2013Hadoopデータプラットフォーム #cwt2013
Hadoopデータプラットフォーム #cwt2013
 
Spark shark
Spark sharkSpark shark
Spark shark
 

Viewers also liked

LT司会資料(わんくま同盟名古屋勉強会#16)
LT司会資料(わんくま同盟名古屋勉強会#16)LT司会資料(わんくま同盟名古屋勉強会#16)
LT司会資料(わんくま同盟名古屋勉強会#16)You&I
 
LT司会資料(わんくま同盟名古屋勉強会#14)
LT司会資料(わんくま同盟名古屋勉強会#14)LT司会資料(わんくま同盟名古屋勉強会#14)
LT司会資料(わんくま同盟名古屋勉強会#14)You&I
 
Xtextハンズオン(仮)
Xtextハンズオン(仮)Xtextハンズオン(仮)
Xtextハンズオン(仮)You&I
 
Fearless Journeyで組織パターンを学ぶワークショップ
Fearless Journeyで組織パターンを学ぶワークショップFearless Journeyで組織パターンを学ぶワークショップ
Fearless Journeyで組織パターンを学ぶワークショップYou&I
 
パターンを活用したチーム活動を体験しよう
パターンを活用したチーム活動を体験しようパターンを活用したチーム活動を体験しよう
パターンを活用したチーム活動を体験しようYou&I
 
LT司会資料(わんくま同盟名古屋勉強会#18)
LT司会資料(わんくま同盟名古屋勉強会#18)LT司会資料(わんくま同盟名古屋勉強会#18)
LT司会資料(わんくま同盟名古屋勉強会#18)You&I
 
アジャイル書籍の紹介
アジャイル書籍の紹介アジャイル書籍の紹介
アジャイル書籍の紹介You&I
 
LT司会資料(わんくま同盟名古屋勉強会#24)
LT司会資料(わんくま同盟名古屋勉強会#24)LT司会資料(わんくま同盟名古屋勉強会#24)
LT司会資料(わんくま同盟名古屋勉強会#24)You&I
 
LT司会資料(わんくま同盟名古屋勉強会#13)
LT司会資料(わんくま同盟名古屋勉強会#13)LT司会資料(わんくま同盟名古屋勉強会#13)
LT司会資料(わんくま同盟名古屋勉強会#13)You&I
 
Pivotal Trackerでアジャイルなプロジェクト管理
Pivotal Trackerでアジャイルなプロジェクト管理Pivotal Trackerでアジャイルなプロジェクト管理
Pivotal Trackerでアジャイルなプロジェクト管理You&I
 
「スクラムを活用したアジャイルなプロダクト管理」を読み解く為の「スクラム入門」入門
「スクラムを活用したアジャイルなプロダクト管理」を読み解く為の「スクラム入門」入門「スクラムを活用したアジャイルなプロダクト管理」を読み解く為の「スクラム入門」入門
「スクラムを活用したアジャイルなプロダクト管理」を読み解く為の「スクラム入門」入門You&I
 
リーン原則とソフトウェア開発
リーン原則とソフトウェア開発リーン原則とソフトウェア開発
リーン原則とソフトウェア開発You&I
 
どんな仕事もこわくない? チームの底力を見える化する 多能工訓練計画表ワークショップ
どんな仕事もこわくない?チームの底力を見える化する多能工訓練計画表ワークショップどんな仕事もこわくない?チームの底力を見える化する多能工訓練計画表ワークショップ
どんな仕事もこわくない? チームの底力を見える化する 多能工訓練計画表ワークショップYou&I
 
スキルマップでチームの能力を見える化しよう
スキルマップでチームの能力を見える化しようスキルマップでチームの能力を見える化しよう
スキルマップでチームの能力を見える化しようYou&I
 

Viewers also liked (15)

LT司会資料(わんくま同盟名古屋勉強会#16)
LT司会資料(わんくま同盟名古屋勉強会#16)LT司会資料(わんくま同盟名古屋勉強会#16)
LT司会資料(わんくま同盟名古屋勉強会#16)
 
LT司会資料(わんくま同盟名古屋勉強会#14)
LT司会資料(わんくま同盟名古屋勉強会#14)LT司会資料(わんくま同盟名古屋勉強会#14)
LT司会資料(わんくま同盟名古屋勉強会#14)
 
Xtextハンズオン(仮)
Xtextハンズオン(仮)Xtextハンズオン(仮)
Xtextハンズオン(仮)
 
Fearless Journeyで組織パターンを学ぶワークショップ
Fearless Journeyで組織パターンを学ぶワークショップFearless Journeyで組織パターンを学ぶワークショップ
Fearless Journeyで組織パターンを学ぶワークショップ
 
パターンを活用したチーム活動を体験しよう
パターンを活用したチーム活動を体験しようパターンを活用したチーム活動を体験しよう
パターンを活用したチーム活動を体験しよう
 
LT司会資料(わんくま同盟名古屋勉強会#18)
LT司会資料(わんくま同盟名古屋勉強会#18)LT司会資料(わんくま同盟名古屋勉強会#18)
LT司会資料(わんくま同盟名古屋勉強会#18)
 
アジャイル書籍の紹介
アジャイル書籍の紹介アジャイル書籍の紹介
アジャイル書籍の紹介
 
LT司会資料(わんくま同盟名古屋勉強会#24)
LT司会資料(わんくま同盟名古屋勉強会#24)LT司会資料(わんくま同盟名古屋勉強会#24)
LT司会資料(わんくま同盟名古屋勉強会#24)
 
LT司会資料(わんくま同盟名古屋勉強会#13)
LT司会資料(わんくま同盟名古屋勉強会#13)LT司会資料(わんくま同盟名古屋勉強会#13)
LT司会資料(わんくま同盟名古屋勉強会#13)
 
CCPMとわたし
CCPMとわたしCCPMとわたし
CCPMとわたし
 
Pivotal Trackerでアジャイルなプロジェクト管理
Pivotal Trackerでアジャイルなプロジェクト管理Pivotal Trackerでアジャイルなプロジェクト管理
Pivotal Trackerでアジャイルなプロジェクト管理
 
「スクラムを活用したアジャイルなプロダクト管理」を読み解く為の「スクラム入門」入門
「スクラムを活用したアジャイルなプロダクト管理」を読み解く為の「スクラム入門」入門「スクラムを活用したアジャイルなプロダクト管理」を読み解く為の「スクラム入門」入門
「スクラムを活用したアジャイルなプロダクト管理」を読み解く為の「スクラム入門」入門
 
リーン原則とソフトウェア開発
リーン原則とソフトウェア開発リーン原則とソフトウェア開発
リーン原則とソフトウェア開発
 
どんな仕事もこわくない? チームの底力を見える化する 多能工訓練計画表ワークショップ
どんな仕事もこわくない?チームの底力を見える化する多能工訓練計画表ワークショップどんな仕事もこわくない?チームの底力を見える化する多能工訓練計画表ワークショップ
どんな仕事もこわくない? チームの底力を見える化する 多能工訓練計画表ワークショップ
 
スキルマップでチームの能力を見える化しよう
スキルマップでチームの能力を見える化しようスキルマップでチームの能力を見える化しよう
スキルマップでチームの能力を見える化しよう
 

Similar to 第1回Hadoop関西勉強会参加レポート

NHN techcon-20120519-fujimoto
NHN techcon-20120519-fujimotoNHN techcon-20120519-fujimoto
NHN techcon-20120519-fujimotoMasaki Fujimoto
 
Cloudera大阪セミナー 20130219
Cloudera大阪セミナー 20130219Cloudera大阪セミナー 20130219
Cloudera大阪セミナー 20130219Cloudera Japan
 
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~Developers Summit
 
鹿駆動勉強会 青江発表資料
鹿駆動勉強会 青江発表資料鹿駆動勉強会 青江発表資料
鹿駆動勉強会 青江発表資料Takashi Aoe
 
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)NTT DATA OSS Professional Services
 
分散処理基盤Apache Hadoop入門とHadoopエコシステムの最新技術動向 (オープンソースカンファレンス 2015 Tokyo/Spring 講...
分散処理基盤Apache Hadoop入門とHadoopエコシステムの最新技術動向 (オープンソースカンファレンス 2015 Tokyo/Spring 講...分散処理基盤Apache Hadoop入門とHadoopエコシステムの最新技術動向 (オープンソースカンファレンス 2015 Tokyo/Spring 講...
分散処理基盤Apache Hadoop入門とHadoopエコシステムの最新技術動向 (オープンソースカンファレンス 2015 Tokyo/Spring 講...NTT DATA OSS Professional Services
 
MapReduce 初心者が Hadoop をさわってみた。もちろん C++ から。
MapReduce 初心者が Hadoop をさわってみた。もちろん C++ から。MapReduce 初心者が Hadoop をさわってみた。もちろん C++ から。
MapReduce 初心者が Hadoop をさわってみた。もちろん C++ から。You&I
 
Cloudera World Tokyo 2014 LTセッション「マイクロソフトとHadoop」
Cloudera World Tokyo 2014 LTセッション「マイクロソフトとHadoop」Cloudera World Tokyo 2014 LTセッション「マイクロソフトとHadoop」
Cloudera World Tokyo 2014 LTセッション「マイクロソフトとHadoop」Kuninobu SaSaki
 
[INSIGHT OUT 2011] b21 ひとつのデータベース技術では生き残れない part2 no sql, hadoop
[INSIGHT OUT 2011] b21 ひとつのデータベース技術では生き残れない part2 no sql, hadoop[INSIGHT OUT 2011] b21 ひとつのデータベース技術では生き残れない part2 no sql, hadoop
[INSIGHT OUT 2011] b21 ひとつのデータベース技術では生き残れない part2 no sql, hadoopInsight Technology, Inc.
 
大規模データ処理の定番OSS Hadoop / Spark 最新動向 - 2021秋 -(db tech showcase 2021 / ONLINE 発...
大規模データ処理の定番OSS Hadoop / Spark 最新動向 - 2021秋 -(db tech showcase 2021 / ONLINE 発...大規模データ処理の定番OSS Hadoop / Spark 最新動向 - 2021秋 -(db tech showcase 2021 / ONLINE 発...
大規模データ処理の定番OSS Hadoop / Spark 最新動向 - 2021秋 -(db tech showcase 2021 / ONLINE 発...NTT DATA Technology & Innovation
 
Dataworks Summit SJ QueryEngine - Hadoop Source Code Reading #23 #hadoopreading
Dataworks Summit SJ QueryEngine - Hadoop Source Code Reading #23 #hadoopreadingDataworks Summit SJ QueryEngine - Hadoop Source Code Reading #23 #hadoopreading
Dataworks Summit SJ QueryEngine - Hadoop Source Code Reading #23 #hadoopreadingYahoo!デベロッパーネットワーク
 
Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017
Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017
Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017Cloudera Japan
 
データ活用を効率化するHadoop WebUIと権限管理改善事例
データ活用を効率化するHadoop WebUIと権限管理改善事例データ活用を効率化するHadoop WebUIと権限管理改善事例
データ活用を効率化するHadoop WebUIと権限管理改善事例Masahiro Kiura
 
Hadoopの概念と基本的知識
Hadoopの概念と基本的知識Hadoopの概念と基本的知識
Hadoopの概念と基本的知識Ken SASAKI
 

Similar to 第1回Hadoop関西勉強会参加レポート (20)

Apache Big Data Miami 2017 - Hadoop Source Code Reading #23 #hadoopreading
Apache Big Data Miami 2017 - Hadoop Source Code Reading #23 #hadoopreadingApache Big Data Miami 2017 - Hadoop Source Code Reading #23 #hadoopreading
Apache Big Data Miami 2017 - Hadoop Source Code Reading #23 #hadoopreading
 
Hadoop - OSC2013 .Enterprise
Hadoop - OSC2013 .EnterpriseHadoop - OSC2013 .Enterprise
Hadoop - OSC2013 .Enterprise
 
NHN techcon-20120519-fujimoto
NHN techcon-20120519-fujimotoNHN techcon-20120519-fujimoto
NHN techcon-20120519-fujimoto
 
Hadoop ~Yahoo! JAPANの活用について~
Hadoop ~Yahoo! JAPANの活用について~Hadoop ~Yahoo! JAPANの活用について~
Hadoop ~Yahoo! JAPANの活用について~
 
Cloudera大阪セミナー 20130219
Cloudera大阪セミナー 20130219Cloudera大阪セミナー 20130219
Cloudera大阪セミナー 20130219
 
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
 
AI・HPC・ビッグデータで利用される分散ファイルシステムを知る
AI・HPC・ビッグデータで利用される分散ファイルシステムを知るAI・HPC・ビッグデータで利用される分散ファイルシステムを知る
AI・HPC・ビッグデータで利用される分散ファイルシステムを知る
 
鹿駆動勉強会 青江発表資料
鹿駆動勉強会 青江発表資料鹿駆動勉強会 青江発表資料
鹿駆動勉強会 青江発表資料
 
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
 
分散処理基盤Apache Hadoop入門とHadoopエコシステムの最新技術動向 (オープンソースカンファレンス 2015 Tokyo/Spring 講...
分散処理基盤Apache Hadoop入門とHadoopエコシステムの最新技術動向 (オープンソースカンファレンス 2015 Tokyo/Spring 講...分散処理基盤Apache Hadoop入門とHadoopエコシステムの最新技術動向 (オープンソースカンファレンス 2015 Tokyo/Spring 講...
分散処理基盤Apache Hadoop入門とHadoopエコシステムの最新技術動向 (オープンソースカンファレンス 2015 Tokyo/Spring 講...
 
Hadoop ecosystem NTTDATA osc15tk
Hadoop ecosystem NTTDATA osc15tkHadoop ecosystem NTTDATA osc15tk
Hadoop ecosystem NTTDATA osc15tk
 
MapReduce 初心者が Hadoop をさわってみた。もちろん C++ から。
MapReduce 初心者が Hadoop をさわってみた。もちろん C++ から。MapReduce 初心者が Hadoop をさわってみた。もちろん C++ から。
MapReduce 初心者が Hadoop をさわってみた。もちろん C++ から。
 
Cloudera World Tokyo 2014 LTセッション「マイクロソフトとHadoop」
Cloudera World Tokyo 2014 LTセッション「マイクロソフトとHadoop」Cloudera World Tokyo 2014 LTセッション「マイクロソフトとHadoop」
Cloudera World Tokyo 2014 LTセッション「マイクロソフトとHadoop」
 
[INSIGHT OUT 2011] b21 ひとつのデータベース技術では生き残れない part2 no sql, hadoop
[INSIGHT OUT 2011] b21 ひとつのデータベース技術では生き残れない part2 no sql, hadoop[INSIGHT OUT 2011] b21 ひとつのデータベース技術では生き残れない part2 no sql, hadoop
[INSIGHT OUT 2011] b21 ひとつのデータベース技術では生き残れない part2 no sql, hadoop
 
大規模データ処理の定番OSS Hadoop / Spark 最新動向 - 2021秋 -(db tech showcase 2021 / ONLINE 発...
大規模データ処理の定番OSS Hadoop / Spark 最新動向 - 2021秋 -(db tech showcase 2021 / ONLINE 発...大規模データ処理の定番OSS Hadoop / Spark 最新動向 - 2021秋 -(db tech showcase 2021 / ONLINE 発...
大規模データ処理の定番OSS Hadoop / Spark 最新動向 - 2021秋 -(db tech showcase 2021 / ONLINE 発...
 
Dataworks Summit SJ QueryEngine - Hadoop Source Code Reading #23 #hadoopreading
Dataworks Summit SJ QueryEngine - Hadoop Source Code Reading #23 #hadoopreadingDataworks Summit SJ QueryEngine - Hadoop Source Code Reading #23 #hadoopreading
Dataworks Summit SJ QueryEngine - Hadoop Source Code Reading #23 #hadoopreading
 
Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017
Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017
Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017
 
Hadoop基盤を知る
Hadoop基盤を知るHadoop基盤を知る
Hadoop基盤を知る
 
データ活用を効率化するHadoop WebUIと権限管理改善事例
データ活用を効率化するHadoop WebUIと権限管理改善事例データ活用を効率化するHadoop WebUIと権限管理改善事例
データ活用を効率化するHadoop WebUIと権限管理改善事例
 
Hadoopの概念と基本的知識
Hadoopの概念と基本的知識Hadoopの概念と基本的知識
Hadoopの概念と基本的知識
 

Recently uploaded

デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案sugiuralab
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)Hiroshi Tomioka
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NTT DATA Technology & Innovation
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 

Recently uploaded (9)

デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 

第1回Hadoop関西勉強会参加レポート

  • 2. • 2010/07/24(土) – 30数名が参加。 • 株式会社ロックオン 会議室 – http://www.lockon.co.jp – 会社の入り口には役員の顔写真とか役員 の一言が掲載されていた – 畳のある打ち合わせスペースがあったり – mixiとかの事務所のイメージ – 凄かった
  • 3. (@tamagawa_ryuji) (1/3) • オープンソースのMapReduce/分散ストレージ 実装、Hadoopの紹介 – Hadoopを知らない人に向けたセッション – HadoopはToolkitと捉えると良いというお話があ った。 • Hadoopがやってくれる所は任せておいて、開発者は データ処理にのみ注力
  • 4. (@tamagawa_ryuji) (2/3) – Hadoopの構成 • JobTrackerはHDFSのデータ配置状況をみて タスクの分配を行う。 • Hadoop本のデータ配分の説明(P.69~70)は 現在の実装とは異なっている。 – Hadoopを使う上で優先して考慮すべき事 • ネットワーク帯域 • ディスク容量
  • 5. (@tamagawa_ryuji) (3/3) – Hadoopについては、Hadoop Conference Japan 2009の資料が参考になる。 • http://atnd.org/events/1848 – Hadoopは象本で全体像を掴み、各論は英 語資料を参照せよ。 – ITエンジニアのTwitterでの情報交換は凄 い。積極的に利用すべき。 – 環境作るならClouderaのパッケージを利用 せよ。 • http://www.cloudera.com/
  • 6. (@karate405) (1/2) • Hadoop上のデータを用いるBIシステムについ て – Pentaho社が開発しているBI(ビジネスインテリジ ェンス)ツールにHadoopが組み込まれ始めている 事例について紹介。 – BIツールの方はOSSとして公開されており、 SourceForge.netで公開されている。 • http://sourceforge.net/projects/pentaho (GPL/LGPL/MPL 1.1)
  • 7. (@karate405) (2/2) – Pentaho社の取り組みは以下の通り。 • Hadoop上のデータに対する入出力する ETL(Extraction, Transformation and Loading)ツー ルを提供 • Hadoop上でETLを実行する為のツールを提供 • Hadoop Hiveユーザ向けにJDBCドライバーを提供 – HDFSのGUIツールのデモ。Eclipseプラグインと して提供されている?I/Fは日本語対応していた。 – ツールは現在βテスト参加者向けに公開されて おり、一般公開は9月頃を予定しているらしい。
  • 8. (http://www.todo.ne.jp) 1(1/4) • NTTデータにおけるHadoopへの取り組み – プロセス指向からデータ指向へ。 • とりあえずデータを溜め込んで、どう使うかは後で考 える流れ。 • POSデータ等の今まで溜め込めなかったデータの活 用。 – NTTデータさんは、象さん好きの会社のようで、 PostgreSQLをよく利用しており、今度は Hadoop。
  • 9. 1(2/4) – NTTデータはBizXaaS Hadoop構築・運用ソリュ ーションの提供を開始。 • http://bizxaas.net/ – クラスタPCが故障して新しいPCを導入した場合、 Hadoop環境を自動構築出来るようになってい る。以下の技術を利用している。 • Puppet • RedHat Kickstart • +α – RPMのカスタマイズ – スイッチの接続ポート位置からのホスト名の自動生成
  • 10. 1(3/4) – NTTデータとしては、これらの自動構成ツールに ついてはいずれOSSとして公開したい。でも Adobeに先を越されてしまった。 • InfoQ > Adobe が Hadoop のための Puppet レシピ をリリース • http://www.infoq.com/jp/news/2010/07/adobe-released-puppet-recipes
  • 11. 1(4/4) – HDFSにおいてSPOF(Single point of failure:単 一障害点)となるNameNodeの冗長化はどうす る?普通は・・・ • Heartbeat + DRBD(Distributed Replicated Block Device) – NTTデータさんでは・・・ • XenによるFT(フォールトトレランス) – 見かけ上は1台に見えるが、2台構成でメモリ状態等を syncしている。
  • 12. 2(1/4) • Hadoop Summit 2010の話 – http://developer.yahoo.com/events/hadoopsummit2010/ – 米国Yahoo!主催のイベント。 – 日本から参加していたのは、NTTデータさんだけ だった模様。またアジアからの参加は大陸系の方 々が多かった模様。 – 午前の部はビデオ公開されている。
  • 13. 2(2/4) • 午前の部の要約 – Yahoo!でのHadoopの利用 • Mass Technology, Mass Scale, Cloud Computing • クリック解析 – 個人の嗜好を分析 • spamフィルタリング – GmailやHotmailよりもフィルタリング性能は良い(Yahoo! 談) – ※ あくまで米国向けサービスの話です。日本国内は別物で あるとお考え下さい。
  • 14. 2(3/4) – Yahoo!のHadoopへの貢献 • セキュリティ対策としてKerberos認証の実装 • Oozie(濱野さんはウジーと表記。ウージーって聞こえ ました。) – Facebookの事例 • 80-90TB/day • Hadoopのジョブの95%はHadoop Hiveを利用。 – HiPalというHiveラッパーというかHiveQLの作成ツールを利 用。 – こういったツールは、RubyベースでHadoopを利用している Cookpadさんでも構築してますねー。
  • 15. 2(4/4) • 午後の部で気になったもの – 天体画像処理へのHadoop適用 • 画像のモザイク処理(複数画像を重ね合わせてパノラ マ画像を生成する)にHadoopを利用。 • FITS(The Flexible Image Transport System)ファイ ル形式をHadoopのSequenceFile形式に変換して利 用しているらしい。 • Yahoo!色が強いイベントだったらしい。
  • 16. (@sugipooh) • いったいなんぼならHadoopできるねん? – aftercare • http://lxs.jp/wordpress/?p=221 – 発表資料 • http://www.slideshare.net/sugipooh/pdf-4898997 – HadoopのHDFSのクラスタを構築する場合に備 えて、Cloudera社が提唱しているH/Wスペックを 参考に各種ブレードサーバーの見積を行ったお 話。 • http://www.cloudera. com/blog/2010/03/clouderas-support-team-shares-some-bas ic-hardware-recommendations/
  • 17. (@shot6) (1/3) • Hadoopソースリーディングの会の紹介 – コミュニティ活動の紹介。 • イベント後にビアバスト(beer bust)を実施。 • 毎回参加者数が大変な事になっている。(第2回の時 は実参加者数が少なかったらしい) • 最近はベンチャーキャピタルにHadoopって言うだけ でお金が入ってくるらしい(※冗談です) • 毎回登壇者の熱の入ったお話で予定時間を超過しま くり。今回の関西勉強会でもそうでしたがw • 色々と分科会が立ち上がってきている。内容がマニア ック過ぎて参加者が静まりかえってしまい微妙な空気 になる事も。
  • 18. (@shot6) (2/3) – 今後としては少し内容を絞って、連載ものと単発 ものの組み合わせで活動。 – 現在の連載もの。 • Cloudera社のHadoopトレーニングに参加 (@okachimachiorz1さん) • HBase入門 – 今後予定している連載もの。 • Data-Intensive Text Processing with MapReduce本を読み解く – http://www.amazon.co.jp/dp/1608453421 • Pig入門 • Oozie入門
  • 19. (@shot6) (3/3) – 近々発売のクラウドムック本にHadoopの記事を 寄稿したので、みんな買ってね! • http://d.hatena.ne.jp/shot6/20100802#1280713701
  • 20. • 濱野さん、杉田さん、さくらインターネットの田 中社長(@kunihirotanaka)の3人でのデータセ ンター話が凄かった! – さくらインターネットは石狩にデータセンターを建 設中でそれに絡んで、直流電源とかの話で色々と 盛り上がった。 • http://ishikari.sakura.ad.jp/