Silicon Valley x 日本 / Tech x Business Meetup #12 (2015/04/17)
『並列分散処理基盤Hadoopの紹介と、開発者が語るHadoopの使いどころ』
NTTデータ 基盤システム事業本部
システム方式技術事業部 OSSプロフェッショナルサービス
鯵坂 明
Silicon Valley x 日本 / Tech x Business Meetup #12 (2015/04/17)
『並列分散処理基盤Hadoopの紹介と、開発者が語るHadoopの使いどころ』
NTTデータ 基盤システム事業本部
システム方式技術事業部 OSSプロフェッショナルサービス
鯵坂 明
Big Data Developers Moscow Meetup 1 - sql on hadoopbddmoscow
This document summarizes a meetup about Big Data and SQL on Hadoop. The meetup included discussions on what Hadoop is, why SQL on Hadoop is useful, what Hive is, and introduced IBM's BigInsights software for running SQL on Hadoop with improved performance over other solutions. Key topics included HDFS file storage, MapReduce processing, Hive tables and metadata storage, and how BigInsights provides a massively parallel SQL engine instead of relying on MapReduce.
This document discusses filesystems, RPC, HDFS, and I/O schedulers. It provides an overview of Linux kernel I/O schedulers and how they optimize disk access. It then discusses the I/O stack in Linux, including the virtual filesystem (VFS) layer. It describes the NFS client-server model using RPC over TCP/IP and how HDFS uses a similar model with its own APIs. Finally, it outlines the write process in HDFS from the client to data nodes.
Red Hat Forum 2014 のIBMセッション資料です。
「ビッグデータの即時活用を実現するJava高速処理OpenStackプラットフォーム」
http://redhatforum2014.jp/
https://redhatmktg.smktg.jp/public/session/view/18