Submit Search
Upload
Google BigQueryについて 紹介と推測
•
24 likes
•
4,894 views
Ryuji Tamagawa
Follow
大阪のImpala meetup #1でのGoogle BigQueryの紹介資料です。
Read less
Read more
Technology
Report
Share
Report
Share
1 of 24
Download now
Download to read offline
Recommended
2015/04/20 LOUPE Study
Web APIを使って生活を便利にしたい件
Web APIを使って生活を便利にしたい件
Takuya Mukohira
Springの初心者が疑問に思ったり、おかしな使い方をしてしまいがちなところをピックアップして説明します。
これからSpringを使う開発者が知っておくべきこと
これからSpringを使う開発者が知っておくべきこと
土岐 孝平
座駆動LT大会20180630の登壇内容
ラズパイのおすすめレシピ
ラズパイのおすすめレシピ
ishikawa akira
長野で一番熱いスペースのはなし
長野で一番熱いスペースのはなし
Nakazawa Yuichi
GEEKLAB.NAGANOのご紹介です。
GEEKLAB.NAGANO ご紹介 ギークハウスデイ版
GEEKLAB.NAGANO ご紹介 ギークハウスデイ版
Nakazawa Yuichi
2014,06,21 プログラミング生放送
デザイナー視点から見たWeb開発する人々
デザイナー視点から見たWeb開発する人々
Miho Matsui
@ITが開始した新サービス「QA@IT」はHerokuで動いています。サービスと、Herokuの使い方についてユーザー会でお話させていただきました
QA@IT on Heroku
QA@IT on Heroku
Ken Nishimura
筑波大学 情報メディア創成学類 2019年度 大学説明会 学生体験談 発表資料
筑波大学 情報メディア創成 大学説明会 2019
筑波大学 情報メディア創成 大学説明会 2019
Takakura_Rei
Recommended
2015/04/20 LOUPE Study
Web APIを使って生活を便利にしたい件
Web APIを使って生活を便利にしたい件
Takuya Mukohira
Springの初心者が疑問に思ったり、おかしな使い方をしてしまいがちなところをピックアップして説明します。
これからSpringを使う開発者が知っておくべきこと
これからSpringを使う開発者が知っておくべきこと
土岐 孝平
座駆動LT大会20180630の登壇内容
ラズパイのおすすめレシピ
ラズパイのおすすめレシピ
ishikawa akira
長野で一番熱いスペースのはなし
長野で一番熱いスペースのはなし
Nakazawa Yuichi
GEEKLAB.NAGANOのご紹介です。
GEEKLAB.NAGANO ご紹介 ギークハウスデイ版
GEEKLAB.NAGANO ご紹介 ギークハウスデイ版
Nakazawa Yuichi
2014,06,21 プログラミング生放送
デザイナー視点から見たWeb開発する人々
デザイナー視点から見たWeb開発する人々
Miho Matsui
@ITが開始した新サービス「QA@IT」はHerokuで動いています。サービスと、Herokuの使い方についてユーザー会でお話させていただきました
QA@IT on Heroku
QA@IT on Heroku
Ken Nishimura
筑波大学 情報メディア創成学類 2019年度 大学説明会 学生体験談 発表資料
筑波大学 情報メディア創成 大学説明会 2019
筑波大学 情報メディア創成 大学説明会 2019
Takakura_Rei
合同勉強会 in 大都会岡山 -2015 Winter-の発表資料 https://gbdaitokai.doorkeeper.jp/events/31149 GitHub使ってますよね? GitHubに移行したものの以前の文化を引きずってしまっていた会社の昔話をしました
開発フローを改善した時の昔話
開発フローを改善した時の昔話
Makoto Henmi
LT駆動開発 23 - 懇親会 deLT https://ltdd.doorkeeper.jp/events/38389 ちょっと前に岡山のWeb系勉強会界隈で話題になっていた若者が勉強会に参加しない問題について自分なりに思ってる事を話してきた。 そういう若者はいるけど知らないだけな可能性もあるし、そういう若者たちがやっているイベントを知らないだけの可能性もある。 幅広くアンテナ広げることも大事なのかなと思う。
若者が勉強会に参加しない問題
若者が勉強会に参加しない問題
Makoto Henmi
anysense tyankatsu
マークアップのおまじないをしっかり理解する
マークアップのおまじないをしっかり理解する
anysense_ss
4月28日 第6回 BEAR.Sunday Meet Up LT資料
BEAR.Sundayに権限ライブラリを作成(?)して適用してみた
BEAR.Sundayに権限ライブラリを作成(?)して適用してみた
shiori koga
説明資料
20170401 #infrapre 自己紹介資料
20170401 #infrapre 自己紹介資料
ごろう 野村
社内発表会20120328
社内発表会20120328
Sumito Miyauchi
swift勉強会での発表資料 人に教えたいアプリ開発のすすめ
Swift勉強会2
Swift勉強会2
Hikari Yanagihara
KOILで開催するビジネスピッチ&マッチの発表資料 著書の紹介もさせていただきます。 今すぐ試したい!機械学習・深層学習(ディープラーニング)画像認識プログラミングレシピ
Pitch and Match20190809
Pitch and Match20190809
賢 川島
「スマスピ開発は、たーのしー!」 2018年9月14日(金曜) VUILT vol.5 @京都
Smart speaker development is fun!
Smart speaker development is fun!
hideg
swift勉強会用
Swiftvol.1
Swiftvol.1
Hikari Yanagihara
巨人の力で日曜Webサービス大工
巨人の力で日曜Webサービス大工
Takahiro Yamakoshi
Devsumi関西2015でのプレゼンテーションです。
足を地に着け落ち着いて考える
足を地に着け落ち着いて考える
Ryuji Tamagawa
このところ長崎とか博多とか神戸でしゃべったSparkの話の資料です。
Apache Sparkの紹介
Apache Sparkの紹介
Ryuji Tamagawa
2017/9/27 PyData.Tokyoでのプレゼンです。
20170927 pydata tokyo データサイエンスな皆様に送る分散処理の基礎の基礎、そしてPySparkの勘所
20170927 pydata tokyo データサイエンスな皆様に送る分散処理の基礎の基礎、そしてPySparkの勘所
Ryuji Tamagawa
4 月 24 日 、#bq_sushi での Jordan Tigani によるプレゼンテーションです。
Google BigQuery クエリの処理の流れ - #bq_sushi
Google BigQuery クエリの処理の流れ - #bq_sushi
Google Cloud Platform - Japan
4 月 24 日、#bq_sushi での Slava Chernyak によるプレゼンテーションです。
Google Cloud Dataflow を理解する - #bq_sushi
Google Cloud Dataflow を理解する - #bq_sushi
Google Cloud Platform - Japan
社内勉強会で発表するのに使った資料です。 google big queryが基本的な使い方が全て分かるようにまとめたもの ただし、続きはWebで(公式ドキュメントで)
これでBigQueryをドヤ顔で語れる!BigQueryの基本
これでBigQueryをドヤ顔で語れる!BigQueryの基本
Tomohiro Shinden
GCS2015 ゲームサーバー勉強会 セッションで発表した内容です。
Google bigquery導入記
Google bigquery導入記
Yugo Shimizu
GCPUG 大阪 BigQueryの課金、節約しませんか
BigQueryの課金、節約しませんか
BigQueryの課金、節約しませんか
Ryuji Tamagawa
https://mlops.connpass.com/event/305093/
Creative as Software Engineering for GenAI LT
Creative as Software Engineering for GenAI LT
yusuke shibui
DMTC 2nd プレゼンテーション
DMTC 2nd プレゼンテーション
真悟 平山
ログ分析勉強会vol.1(初心者のセキュリティログ分析〜開発者は見た!ログの重要性〜)
ログ勉 Vol.1
ログ勉 Vol.1
Kenji Kobayashi
More Related Content
What's hot
合同勉強会 in 大都会岡山 -2015 Winter-の発表資料 https://gbdaitokai.doorkeeper.jp/events/31149 GitHub使ってますよね? GitHubに移行したものの以前の文化を引きずってしまっていた会社の昔話をしました
開発フローを改善した時の昔話
開発フローを改善した時の昔話
Makoto Henmi
LT駆動開発 23 - 懇親会 deLT https://ltdd.doorkeeper.jp/events/38389 ちょっと前に岡山のWeb系勉強会界隈で話題になっていた若者が勉強会に参加しない問題について自分なりに思ってる事を話してきた。 そういう若者はいるけど知らないだけな可能性もあるし、そういう若者たちがやっているイベントを知らないだけの可能性もある。 幅広くアンテナ広げることも大事なのかなと思う。
若者が勉強会に参加しない問題
若者が勉強会に参加しない問題
Makoto Henmi
anysense tyankatsu
マークアップのおまじないをしっかり理解する
マークアップのおまじないをしっかり理解する
anysense_ss
4月28日 第6回 BEAR.Sunday Meet Up LT資料
BEAR.Sundayに権限ライブラリを作成(?)して適用してみた
BEAR.Sundayに権限ライブラリを作成(?)して適用してみた
shiori koga
説明資料
20170401 #infrapre 自己紹介資料
20170401 #infrapre 自己紹介資料
ごろう 野村
社内発表会20120328
社内発表会20120328
Sumito Miyauchi
swift勉強会での発表資料 人に教えたいアプリ開発のすすめ
Swift勉強会2
Swift勉強会2
Hikari Yanagihara
KOILで開催するビジネスピッチ&マッチの発表資料 著書の紹介もさせていただきます。 今すぐ試したい!機械学習・深層学習(ディープラーニング)画像認識プログラミングレシピ
Pitch and Match20190809
Pitch and Match20190809
賢 川島
「スマスピ開発は、たーのしー!」 2018年9月14日(金曜) VUILT vol.5 @京都
Smart speaker development is fun!
Smart speaker development is fun!
hideg
swift勉強会用
Swiftvol.1
Swiftvol.1
Hikari Yanagihara
巨人の力で日曜Webサービス大工
巨人の力で日曜Webサービス大工
Takahiro Yamakoshi
What's hot
(11)
開発フローを改善した時の昔話
開発フローを改善した時の昔話
若者が勉強会に参加しない問題
若者が勉強会に参加しない問題
マークアップのおまじないをしっかり理解する
マークアップのおまじないをしっかり理解する
BEAR.Sundayに権限ライブラリを作成(?)して適用してみた
BEAR.Sundayに権限ライブラリを作成(?)して適用してみた
20170401 #infrapre 自己紹介資料
20170401 #infrapre 自己紹介資料
社内発表会20120328
社内発表会20120328
Swift勉強会2
Swift勉強会2
Pitch and Match20190809
Pitch and Match20190809
Smart speaker development is fun!
Smart speaker development is fun!
Swiftvol.1
Swiftvol.1
巨人の力で日曜Webサービス大工
巨人の力で日曜Webサービス大工
Viewers also liked
Devsumi関西2015でのプレゼンテーションです。
足を地に着け落ち着いて考える
足を地に着け落ち着いて考える
Ryuji Tamagawa
このところ長崎とか博多とか神戸でしゃべったSparkの話の資料です。
Apache Sparkの紹介
Apache Sparkの紹介
Ryuji Tamagawa
2017/9/27 PyData.Tokyoでのプレゼンです。
20170927 pydata tokyo データサイエンスな皆様に送る分散処理の基礎の基礎、そしてPySparkの勘所
20170927 pydata tokyo データサイエンスな皆様に送る分散処理の基礎の基礎、そしてPySparkの勘所
Ryuji Tamagawa
4 月 24 日 、#bq_sushi での Jordan Tigani によるプレゼンテーションです。
Google BigQuery クエリの処理の流れ - #bq_sushi
Google BigQuery クエリの処理の流れ - #bq_sushi
Google Cloud Platform - Japan
4 月 24 日、#bq_sushi での Slava Chernyak によるプレゼンテーションです。
Google Cloud Dataflow を理解する - #bq_sushi
Google Cloud Dataflow を理解する - #bq_sushi
Google Cloud Platform - Japan
社内勉強会で発表するのに使った資料です。 google big queryが基本的な使い方が全て分かるようにまとめたもの ただし、続きはWebで(公式ドキュメントで)
これでBigQueryをドヤ顔で語れる!BigQueryの基本
これでBigQueryをドヤ顔で語れる!BigQueryの基本
Tomohiro Shinden
GCS2015 ゲームサーバー勉強会 セッションで発表した内容です。
Google bigquery導入記
Google bigquery導入記
Yugo Shimizu
GCPUG 大阪 BigQueryの課金、節約しませんか
BigQueryの課金、節約しませんか
BigQueryの課金、節約しませんか
Ryuji Tamagawa
Viewers also liked
(8)
足を地に着け落ち着いて考える
足を地に着け落ち着いて考える
Apache Sparkの紹介
Apache Sparkの紹介
20170927 pydata tokyo データサイエンスな皆様に送る分散処理の基礎の基礎、そしてPySparkの勘所
20170927 pydata tokyo データサイエンスな皆様に送る分散処理の基礎の基礎、そしてPySparkの勘所
Google BigQuery クエリの処理の流れ - #bq_sushi
Google BigQuery クエリの処理の流れ - #bq_sushi
Google Cloud Dataflow を理解する - #bq_sushi
Google Cloud Dataflow を理解する - #bq_sushi
これでBigQueryをドヤ顔で語れる!BigQueryの基本
これでBigQueryをドヤ顔で語れる!BigQueryの基本
Google bigquery導入記
Google bigquery導入記
BigQueryの課金、節約しませんか
BigQueryの課金、節約しませんか
Similar to Google BigQueryについて 紹介と推測
https://mlops.connpass.com/event/305093/
Creative as Software Engineering for GenAI LT
Creative as Software Engineering for GenAI LT
yusuke shibui
DMTC 2nd プレゼンテーション
DMTC 2nd プレゼンテーション
真悟 平山
ログ分析勉強会vol.1(初心者のセキュリティログ分析〜開発者は見た!ログの重要性〜)
ログ勉 Vol.1
ログ勉 Vol.1
Kenji Kobayashi
code testing for machine learning development
Testing machine learning development
Testing machine learning development
yusuke shibui
Pycon JP 2014発表資料です。 ピタゴラス勝率とBABIPについて、Django他で可視化しました。
Pythonではじめる野球プログラミング PyCon JP 2014 9/14 Talk Session
Pythonではじめる野球プログラミング PyCon JP 2014 9/14 Talk Session
Shinichi Nakagawa
Global Lab Sendai主催のUnity初心者講座
Global Lab Sendai主催 Unity初心者講座2018
Global Lab Sendai主催 Unity初心者講座2018
Jun Shimura
JANOG43 で登壇させていただき、また野良BoF を開催させていただき、多くの方と議論をすることができました。それをもとに、思ったことをつらつらと書いてみました。まだ ssmjp で登壇するかもわかりませんけど、とりあえず公開してしまいます。
20190531 「運用自動化」のモデルを考える
20190531 「運用自動化」のモデルを考える
Yoshikazu GOTO
2014/04/16に行われた、VSハッカソン特別編『今日から始めるGit & GitHub入門』での発表資料です。
Gitを使いこなしてみよう!
Gitを使いこなしてみよう!
Hiroshi Maekawa
2015/12/9 ゆるぷれ #6 発表資料. Go言語をはじめてモノにするまでの歴史です. なおやきうはテーマにしただけでやきうそのものは出てきません.
A Tour of やきう&Go - やきう民の私とGoの半年(実質3日間)
A Tour of やきう&Go - やきう民の私とGoの半年(実質3日間)
Shinichi Nakagawa
1 Aug, 2015 #agilesapporo の背景画像です。 当日は時間の都合で後半しか話せませんでしたが、資料はそのままで置いておきます。
リモートチームとふりかえり改善フレームワーク
リモートチームとふりかえり改善フレームワーク
Maehana Tsuyoshi
Agile Japan 2014神戸サテライトでの資料です。 よく分からんところ、不明点がありましたら、フィードバックいただけますとうれしいです。
はじめてみよう、アジャイル! Agile Japan 2014 神戸サテライト
はじめてみよう、アジャイル! Agile Japan 2014 神戸サテライト
Takahiro Kaihara
making of data search platform for rosbag
Rosbag search system
Rosbag search system
yusuke shibui
DevLove 2010/10/27 発表資料。
ビジネスロジック実装進化論 - An Evolution of Business Logic Implementation
ビジネスロジック実装進化論 - An Evolution of Business Logic Implementation
Tadayoshi Sato
JJUG2017発表資料
グラフデータベース入門
グラフデータベース入門
Masaya Dake
技術書典非公式アフター(10/08)で話した内容です https://techbook-and-ethanol.connpass.com/event/97154/
なぜか技術書典5で 3サークルの運営を同時にやった話
なぜか技術書典5で 3サークルの運営を同時にやった話
ota42y
DMTC 最終プレゼン
DMTC 最終プレゼン
真悟 平山
アジャイル札幌特別編で発表した読書会についてのスライド
アジャイルサムライ読書会@札幌道場 のこと
アジャイルサムライ読書会@札幌道場 のこと
irasally omuko
GDG DevFest Tokyo2018での発表資料
GDG2018 vision kit mahjong
GDG2018 vision kit mahjong
Rio Kurihara
2014.12.06にDevlove甲子園日本シリーズで喋った内容です。
#Devlove 甲子園日本シリーズ ku_suke
#Devlove 甲子園日本シリーズ ku_suke
Yusuke Kawabata
Mackerel UG × IDCFクラウド UG Meetup #1 でのLTスライドです。 https://mackerel-ug.connpass.com/event/99477/
続・Freeプランで緩く監視させてもらってる話など
続・Freeプランで緩く監視させてもらってる話など
Koichi Ota
Similar to Google BigQueryについて 紹介と推測
(20)
Creative as Software Engineering for GenAI LT
Creative as Software Engineering for GenAI LT
DMTC 2nd プレゼンテーション
DMTC 2nd プレゼンテーション
ログ勉 Vol.1
ログ勉 Vol.1
Testing machine learning development
Testing machine learning development
Pythonではじめる野球プログラミング PyCon JP 2014 9/14 Talk Session
Pythonではじめる野球プログラミング PyCon JP 2014 9/14 Talk Session
Global Lab Sendai主催 Unity初心者講座2018
Global Lab Sendai主催 Unity初心者講座2018
20190531 「運用自動化」のモデルを考える
20190531 「運用自動化」のモデルを考える
Gitを使いこなしてみよう!
Gitを使いこなしてみよう!
A Tour of やきう&Go - やきう民の私とGoの半年(実質3日間)
A Tour of やきう&Go - やきう民の私とGoの半年(実質3日間)
リモートチームとふりかえり改善フレームワーク
リモートチームとふりかえり改善フレームワーク
はじめてみよう、アジャイル! Agile Japan 2014 神戸サテライト
はじめてみよう、アジャイル! Agile Japan 2014 神戸サテライト
Rosbag search system
Rosbag search system
ビジネスロジック実装進化論 - An Evolution of Business Logic Implementation
ビジネスロジック実装進化論 - An Evolution of Business Logic Implementation
グラフデータベース入門
グラフデータベース入門
なぜか技術書典5で 3サークルの運営を同時にやった話
なぜか技術書典5で 3サークルの運営を同時にやった話
DMTC 最終プレゼン
DMTC 最終プレゼン
アジャイルサムライ読書会@札幌道場 のこと
アジャイルサムライ読書会@札幌道場 のこと
GDG2018 vision kit mahjong
GDG2018 vision kit mahjong
#Devlove 甲子園日本シリーズ ku_suke
#Devlove 甲子園日本シリーズ ku_suke
続・Freeプランで緩く監視させてもらってる話など
続・Freeプランで緩く監視させてもらってる話など
More from Ryuji Tamagawa
https://foundit-project.connpass.com/event/66468/ での発表資料です。
20171012 found IT #9 PySparkの勘所
20171012 found IT #9 PySparkの勘所
Ryuji Tamagawa
hbstudy #74 https://hbstudy.connpass.com/event/61687/ で話をさせていただいた、SREに関するスライドです。
hbstudy 74 Site Reliability Engineering
hbstudy 74 Site Reliability Engineering
Ryuji Tamagawa
2017年6月30日にインサイトテクノロジーさま主催のdb analytics showcaseでしゃべったPySparkの話のスライドです。
PySparkの勘所(20170630 sapporo db analytics showcase)
PySparkの勘所(20170630 sapporo db analytics showcase)
Ryuji Tamagawa
2017/2/10のインサイトテクノロジーさんのSapporo TechBarでお話しさせていただいたPyDataとSparkに関するスライドです。
20170210 sapporotechbar7
20170210 sapporotechbar7
Ryuji Tamagawa
2016/12/15 インサイトテクノロジーさんの三木会でお話しした内容のスライドです。PythonとかPandasとかSparkとか。
20161215 python pandas-spark四方山話
20161215 python pandas-spark四方山話
Ryuji Tamagawa
2016/10/04のDB Analytics Showcaseでのプレゼンです。
20161004 データ処理のプラットフォームとしてのpythonとpandas 東京
20161004 データ処理のプラットフォームとしてのpythonとpandas 東京
Ryuji Tamagawa
インサイトテクノロジーさん主催の[7月8日@札幌] Sapporo Tech Barでの発表スライドです。 http://www.db-tech-showcase.com/events-seminars/db-tech-salon/20160708_sapporo_tech_bar
20160708 データ処理のプラットフォームとしてのpython 札幌
20160708 データ処理のプラットフォームとしてのpython 札幌
Ryuji Tamagawa
インサイトテクノロジーさんの勉強会に呼んでいただいてお話しさせていただいた資料です。
20160127三木会 RDB経験者のためのspark
20160127三木会 RDB経験者のためのspark
Ryuji Tamagawa
RからSparkとParquetを使う話です。
20151205 Japan.R SparkRとParquet
20151205 Japan.R SparkRとParquet
Ryuji Tamagawa
Rakuten Technology Conference 2015@Sendai
Performant data processing with PySpark, SparkR and DataFrame API
Performant data processing with PySpark, SparkR and DataFrame API
Ryuji Tamagawa
「ヘルシープログラマ」刊行記念イベントでのプレゼンです。
ヘルシープログラマ・翻訳と実践
ヘルシープログラマ・翻訳と実践
Ryuji Tamagawa
Google Big Query
Google Big Query
Ryuji Tamagawa
My Talk at GCPUG-Taiwan on 2015/5/8. You use BigQuery with SQL, but the internal work of BigQuery is very different from traditional Relational Database systems you may familiar with. One of the way to understand how BigQuery works is to see it from the cost you pay for BigQuery. Knowing how to save money while using BigQuery is to know how BigQuery works to some extent. In this session, let’s talk about practical knowledge (saving money) and exciting technology (how BigQuery works)!
You might be paying too much for BigQuery
You might be paying too much for BigQuery
Ryuji Tamagawa
My impression from talking at Rakuten Technology conference.
lessons learned from talking at rakuten technology conference
lessons learned from talking at rakuten technology conference
Ryuji Tamagawa
丸の内MongoDB勉強会20でやったLTです。中身薄いですが、2.8のストレージエンジンWiredTigerのファーストインプレッションということで。
丸の内MongoDB勉強会#20LT 2.8のストレージエンジン動かしてみました
丸の内MongoDB勉強会#20LT 2.8のストレージエンジン動かしてみました
Ryuji Tamagawa
2014/10/20 DevLove関西 「MongoDBを知ろう」発表スライドです。
Mongo dbを知ろう devlove関西
Mongo dbを知ろう devlove関西
Ryuji Tamagawa
第2回Selenium勉強会の発表スライドです。
Seleniumをもっと知るための本の話
Seleniumをもっと知るための本の話
Ryuji Tamagawa
MongoDBの概要と、特にレプリカセットの耐障害性の話です。
データベース勉強会 In 広島 mongodb
データベース勉強会 In 広島 mongodb
Ryuji Tamagawa
My talk at Rakuten TechTalk 20140404.
Invitation to mongo db @ Rakuten TechTalk
Invitation to mongo db @ Rakuten TechTalk
Ryuji Tamagawa
MongoDB tuning on AWS
MongoDB tuning on AWS
Ryuji Tamagawa
More from Ryuji Tamagawa
(20)
20171012 found IT #9 PySparkの勘所
20171012 found IT #9 PySparkの勘所
hbstudy 74 Site Reliability Engineering
hbstudy 74 Site Reliability Engineering
PySparkの勘所(20170630 sapporo db analytics showcase)
PySparkの勘所(20170630 sapporo db analytics showcase)
20170210 sapporotechbar7
20170210 sapporotechbar7
20161215 python pandas-spark四方山話
20161215 python pandas-spark四方山話
20161004 データ処理のプラットフォームとしてのpythonとpandas 東京
20161004 データ処理のプラットフォームとしてのpythonとpandas 東京
20160708 データ処理のプラットフォームとしてのpython 札幌
20160708 データ処理のプラットフォームとしてのpython 札幌
20160127三木会 RDB経験者のためのspark
20160127三木会 RDB経験者のためのspark
20151205 Japan.R SparkRとParquet
20151205 Japan.R SparkRとParquet
Performant data processing with PySpark, SparkR and DataFrame API
Performant data processing with PySpark, SparkR and DataFrame API
ヘルシープログラマ・翻訳と実践
ヘルシープログラマ・翻訳と実践
Google Big Query
Google Big Query
You might be paying too much for BigQuery
You might be paying too much for BigQuery
lessons learned from talking at rakuten technology conference
lessons learned from talking at rakuten technology conference
丸の内MongoDB勉強会#20LT 2.8のストレージエンジン動かしてみました
丸の内MongoDB勉強会#20LT 2.8のストレージエンジン動かしてみました
Mongo dbを知ろう devlove関西
Mongo dbを知ろう devlove関西
Seleniumをもっと知るための本の話
Seleniumをもっと知るための本の話
データベース勉強会 In 広島 mongodb
データベース勉強会 In 広島 mongodb
Invitation to mongo db @ Rakuten TechTalk
Invitation to mongo db @ Rakuten TechTalk
MongoDB tuning on AWS
MongoDB tuning on AWS
Recently uploaded
YouTube nnabla channelの次の動画で利用したスライドです。 【AI論文解説】Consistency ModelとRectified Flow https://youtu.be/3IKCrAPe55k Consistency ModelとRectified Flowに関連する以下の論文を紹介しています。 Consistency models(解説編Part1で紹介) - “Consistency Models,” ICML 2023. - “Improved Techniques for Training Consistency Models,” ICLR 2024. - “Consistency Trajectory Models: Learning Probability Flow ODE Trajectory of Diffusion,” ICLR 2024. Rectified flow(解説編Part2で紹介) - “Flow Straight and Fast: Learning to Generate and Transfer Data with Rectified Flow,” ICLR 2023. - “InstaFlow: One Step is Enough for High-Quality Diffusion-Based Text-to-Image Generation,” ICLR 2024.
【AI論文解説】Consistency ModelとRectified Flow
【AI論文解説】Consistency ModelとRectified Flow
Sony - Neural Network Libraries
サイバーエージェントAI事業部の新卒研修で利用したスライドを公開します。
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
yassun7010
2024/05/24の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
iPride Co., Ltd.
Security-JAWS【第33回】 勉強会 https://s-jaws.doorkeeper.jp/events/173294
Amazon Cognitoで実装するパスキー (Security-JAWS【第33回】 勉強会)
Amazon Cognitoで実装するパスキー (Security-JAWS【第33回】 勉強会)
keikoitakurag
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
CRI Japan, Inc.
2024/05/25 serverless Meetup osaka
2024年5月25日Serverless Meetup大阪 アプリケーションをどこで動かすべきなのか.pptx
2024年5月25日Serverless Meetup大阪 アプリケーションをどこで動かすべきなのか.pptx
ssuserbefd24
This presentation introduces a paper about offline reinforcement learning.
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
atsushi061452
https://iotlt.connpass.com/event/318403/
20240523_IoTLT_vol111_kitazaki_v1___.pdf
20240523_IoTLT_vol111_kitazaki_v1___.pdf
Ayachika Kitazaki
This presentation introduces a paper about offline reinforcement learning.
論文紹介: Exploiting semantic segmentation to boost reinforcement learning in vid...
論文紹介: Exploiting semantic segmentation to boost reinforcement learning in vid...
atsushi061452
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料) 2024年4月24日(水) 株式会社NTTデータグループ 技術開発本部 笠原 辰仁
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
NTT DATA Technology & Innovation
Recently uploaded
(10)
【AI論文解説】Consistency ModelとRectified Flow
【AI論文解説】Consistency ModelとRectified Flow
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
Amazon Cognitoで実装するパスキー (Security-JAWS【第33回】 勉強会)
Amazon Cognitoで実装するパスキー (Security-JAWS【第33回】 勉強会)
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
2024年5月25日Serverless Meetup大阪 アプリケーションをどこで動かすべきなのか.pptx
2024年5月25日Serverless Meetup大阪 アプリケーションをどこで動かすべきなのか.pptx
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
20240523_IoTLT_vol111_kitazaki_v1___.pdf
20240523_IoTLT_vol111_kitazaki_v1___.pdf
論文紹介: Exploiting semantic segmentation to boost reinforcement learning in vid...
論文紹介: Exploiting semantic segmentation to boost reinforcement learning in vid...
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
Google BigQueryについて 紹介と推測
1.
Google BigQueryについて 紹介と推測 2015/01/19 #osaka_impala_meetup01 玉川竜司
2.
自己紹介 • 玉川竜司 • FB:
Ryuji Tamagawa • Twitter: @tamagawa_ryuji • 本業ソフト開発(Sky株式会社) • 兼業翻訳者(ほぼオライリー)
3.
Impalaのフリー電子書籍あります http://www.oreilly.co.jp/books/9784873116723/
4.
What s Next
• 著者の方が大変親切、かつBigQuery 愛が感じられます • 私:「ここ、動かないんだけど」 Tigani:「あ、書いた時にはそれ実装 される予定だったんだわ。結局ボツに なって実装されなかったんで、削って くれたらいいよ」 私:「さいですか」 • たぶん3月発売!!
5.
今日の内容 • BigQueryの概要 • BigQueryのいいところ •
BigQueryの気になるところ • BigQueryの特徴的な機能から推測する実装
6.
BigQueryの概要
7.
BigQueryの概要 • ビッグデータに対してSQLで分析を行うフルマネージドサービス • OLTPのためのものではなく、OLAPよりのサービス •
行を追記していくことはできるが、行の更新はできない • 基本的には、RDBと同じデータモデル。テーブルにデータを保存していく。 • ただし、repeated fieldやrecord fieldといった拡張機能もある。この辺は、 利便性とRDBとの互換性とのトレードオフ。
8.
BigQueryの概要 • WebのUIからインタラクティブにクエリを実行することも、APIを叩いてク エリを実行することもできる • コマンドラインツールやPython、Javaなどのクライアントライブラリが用意 されている •
データのインポートは、CSVもしくはJSONで。 Google Cloud Storageを経由するか、直接APIでインポート。 • AdSenseなど、Googleの他のサービスからは直接データを渡してもらえる ことも
9.
BigQueryの課金体系 • 課金は、保存ストレージとクエリでスキャンしたデータ量に対してかかる • ストレージ:$0.020(GB
単位/月)。 S3($0.0300 /GB)より安い • クエリ:$5(処理容量単位: TB) • dry-runでクエリがスキャンするデータ量を事前に確認できる • 特定のユーザーがデータセンターのリソースを食いつぶさないように、様々 な負荷制限あり
10.
BigQueryのいいところ
11.
BigQueryのいいところ • お手軽(RDB/SQLが分かっていれば、ほんとにすぐに使えます) • 速い(50GB/Secは出るらしい。インタラクティブではないけど) •
安い(バックエンドでは圧縮保存ですが) • Googleの強力なインフラがあって初めて上記が成り立つ
12.
BigQueryのいいところ(2) • 外部連携 • ODBCドライバあります •
http://www.simba.com/connectors/google-bigquery-odbc • Google Spreadsheet、Excel、Tableauなども連携容易 • 裏方を少し知っておくと、パフォーマンスやコスト面でメリット大
13.
BigQueryの気になるところ • アクセスの手段がBigQuery SQLに限定される •
1つのデータソースを多元的に活用したい場合はちょっと手間か も • 時々機嫌が悪くなる
14.
BigQueryの特徴的な機能から いろいろ推測 ※ あくまで私の個人的な推測ですので、なんの保障もありません
15.
トピック • クエリの実行から見るGoogleのインフラ • クエリと匿名テーブル •
列指向ストレージと圧縮 • ストレージのバックエンド更新とスナップショットデコレータ
16.
クエリの実行の様子 • 簡単に言えば、クエリの内容に応じてコンピュー トノードのツリーを動的に構成し、そこに大量 のディスクから一気にデータを流す • テーブルのデータは必ずフルスキャン •
単純に見えるものの、こうすることができるのは、 超高速なネットワーク、強力なストレージレイ ヤー、大量のリソースをバースト的に突っ込んで 動的に構成できるインフラがあるからこそ • この辺のインフラの細かいところはGoogleさん の藪の中 コンピュート ノード コンピュート ノード コンピュート ノード コンピュート ノード コンピュート ノード コンピュート ノード ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク
17.
クエリの実行の様子(2) • GROUP BYやJOINの処理は、コンピュート ノードのメモリ容量に制約を受ける •
コンピュートノードにデータが収まらなければ Resource Exceed Error • データの量や分布によって、EACHオプション を使い、シャッフルを強制しなければならない ケースもある。大きいテーブル同士のJOINなど • データの量、分布をユーザーが意識しなければ ならないケースは(今のところ)なくなってい ない コンピュート ノード コンピュート ノード コンピュート ノード コンピュート ノード コンピュート ノード コンピュート ノード ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク コンピュート ノード
18.
クエリの実行の様子(3) • デフォルトでは、クエリが最終的に返す結果 は、それほど大きくならないことが想定され ている • 大きなデータを返す場合、最終出力を複数の コンピュートノードから行ってパフォーマン スを上げることもできる (allow_large_result) •
この場合、保存先のテーブルを明示的に指定 する必要があり、保存先のストレージ容量に 対する課金も生ずる(destination_table) コンピュート ノード コンピュート ノード コンピュート ノード コンピュート ノード コンピュート ノード コンピュート ノード ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク コンピュート ノード コンピュート ノード ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク ディ スク
19.
クエリと匿名テーブル • クエリの実体は、テーブルからデータを 読み取り、データを加工し、その結果を 別のテーブルに出力するジョブ • デフォルトでは、クエリの結果は匿名テー ブルに出力されている。この匿名テーブル は7日間保存され、課金されない •
この匿名テーブルの名前は、クエリの文 字列、クエリが読み取るテーブルの最終 更新時刻から生成されている tablename:foo lastupdate:2015-01-20 Query: SELECT … tablename:f( foo, 2015-01-20, SELECT…)
20.
クエリと匿名テーブル(2) • クエリの実行時には、そのクエリの 結果が保存されている匿名テーブル がないかがまずチェックされる • ダッシュボードなど、頻繁に同じク エリが実行されるようなアプリケー ションでは、この機能をうまく使う と、コードを単純に保ったまま、高 速かつ低コストにできる tablename:foo lastupdate:2015-01-20 Query:
SELECT … tablename:xxxxxxxxxxx if exists f(foo, 2015-01-20, SELECT…) ?
21.
列指向ストレージと圧縮 • BigQueryのデータはColumnIOという列指向の フォーマットで保存される • データは列ごとに保存され、圧縮される。もちろ ん、1つの列も複数のディスクに分散配置されて いる •
データはバックグラウンドで再編成される。その ため、圧縮後のデータ容量はユーザーから見えな いところで変化しうる • そのため、課金は非圧縮状態の容量に対して行わ れるので、安い感じになる 001 Osaka Tamagawa 1234 002 Tokyo Shimauchi 4321 003 Tokyo Shimauchi 2323 003 Tokyo Kobayashi 0001 004 Sapporo Sato 5678 005 Sapporo Sato 7863
22.
スナップショットデコレータ • スナップショットデコレータを使うと、ある時刻のテーブル(過去7日以内) にアクセスできる。範囲指定も可能。 • SELECT
foo, bar from wikipedia@1386465812000 • SELECT foo, bar from wikipedia@1386465812000-1386465899999 • 行の挿入方法は2種類用意されている。バッチ処理とストリーミング。 • ここから想像するに、ユーザーの利便性、インフラに生ずる保存のコスト、ク エリのコストを最適化するために…
23.
Log Structured Merge
Treeみたいな ことをやっている? 2015/1/10 1:00時点 ∼2015/1/11 1:00 ∼2015/1/12 1:00 } 2015/1/12 1:00時点 ∼2015/1/13 1:00
24.
まとめ • とてもお手軽に使い始めることができるビッグデータの分析サービ ス • 裏方を少し学んでおくと、便利な仕掛けがたくさんあります •
Googleのインフラはすごいけど、ストレージデバイスやコンピュー トノードは、やはりコモディティ製品っぽい。どうなってるのかい ろいろ想像すると楽しいです
Download now