Submit Search
Upload
20150219 初めての「embulk」
•
Download as PPT, PDF
•
14 likes
•
8,358 views
Hideto Masuoka
Follow
20150219 初めての「embulk」
Read less
Read more
Report
Share
Report
Share
1 of 45
Download now
Recommended
DXとかDevOpsとかのなんかいい感じのやつ 富士通TechLive
DXとかDevOpsとかのなんかいい感じのやつ 富士通TechLive
Tokoroten Nakayama
2020/03/03 に富士通本社で行われた、富士通TechLiveに発表資料です。 コロナウィルスの影響で、リモート発表になりましたが、当日は800人以上の方に同時視聴していただきました
2021 DMM Tech Vision
2021 DMM Tech Vision
DMM.com
2021 DMM Tech Vision
Oss貢献超入門
Oss貢献超入門
Michihito Shigemura
builderscon2017の発表資料です。 https://builderscon.io/tokyo/2017/session/182ba13a-ccd5-4ddd-9565-c4e20df1d871
Dockerイメージ管理の内部構造
Dockerイメージ管理の内部構造
Etsuji Nakai
ver1.0 公開 ver1.1 ディスクイメージを直接操作する方法を追加 (2015/02/20)
OSS活動の活発さと評価の関係について
OSS活動の活発さと評価の関係について
Takuto Wada
「OSS活動の活発さと評価の関係について」 Feb 16, 2016 @ 日本OSS推進フォーラム
例外設計における大罪
例外設計における大罪
Takuto Wada
例外設計における大罪 Jun 27, 2012 @ java-ja
リーン開発の本質 公開用
リーン開発の本質 公開用
ESM SEC
2013/12/6に実施された「リーンな現場の実際 ~企画サイドと開発サイドからみる失敗と成功~」で使用した資料です。 公開用に一部修正をしています。
Cache-Oblivious データ構造入門 @DSIRNLP#5
Cache-Oblivious データ構造入門 @DSIRNLP#5
Takuya Akiba
Recommended
DXとかDevOpsとかのなんかいい感じのやつ 富士通TechLive
DXとかDevOpsとかのなんかいい感じのやつ 富士通TechLive
Tokoroten Nakayama
2020/03/03 に富士通本社で行われた、富士通TechLiveに発表資料です。 コロナウィルスの影響で、リモート発表になりましたが、当日は800人以上の方に同時視聴していただきました
2021 DMM Tech Vision
2021 DMM Tech Vision
DMM.com
2021 DMM Tech Vision
Oss貢献超入門
Oss貢献超入門
Michihito Shigemura
builderscon2017の発表資料です。 https://builderscon.io/tokyo/2017/session/182ba13a-ccd5-4ddd-9565-c4e20df1d871
Dockerイメージ管理の内部構造
Dockerイメージ管理の内部構造
Etsuji Nakai
ver1.0 公開 ver1.1 ディスクイメージを直接操作する方法を追加 (2015/02/20)
OSS活動の活発さと評価の関係について
OSS活動の活発さと評価の関係について
Takuto Wada
「OSS活動の活発さと評価の関係について」 Feb 16, 2016 @ 日本OSS推進フォーラム
例外設計における大罪
例外設計における大罪
Takuto Wada
例外設計における大罪 Jun 27, 2012 @ java-ja
リーン開発の本質 公開用
リーン開発の本質 公開用
ESM SEC
2013/12/6に実施された「リーンな現場の実際 ~企画サイドと開発サイドからみる失敗と成功~」で使用した資料です。 公開用に一部修正をしています。
Cache-Oblivious データ構造入門 @DSIRNLP#5
Cache-Oblivious データ構造入門 @DSIRNLP#5
Takuya Akiba
本当は恐ろしい分散システムの話
本当は恐ろしい分散システムの話
Kumazaki Hiroki
分散システムのFault Injectionの話 NTTデータテクノロジーカンファレンス2017で発表する際に用いたプレゼン資料 https://oss.nttdata.com/hadoop/event/201710/index.html
こわくない Git
こわくない Git
Kota Saito
「マージがなんとなく怖い」「リベースするなって怒られて怖い」「エラーが出て怖い」 Git 入門者にありがちな「Git 怖い」を解消するため、Git のお仕事(コミット、ブランチ、マージ、リベース)について解説します。
Hadoopの概念と基本的知識
Hadoopの概念と基本的知識
Ken SASAKI
社内勉強会資料。 Hadoopの概要について説明。
やはりお前らのMVCは間違っている
やはりお前らのMVCは間違っている
Koichi Tanaka
PHPカンファレンス2012 & WordCampTokyo2012 LT発表資料です。 タイトルの元ネタ: http://www.amazon.co.jp/dp/4094512624
Python 3.9からの新定番zoneinfoを使いこなそう
Python 3.9からの新定番zoneinfoを使いこなそう
Ryuji Tsutsui
PyCon JP 2021発表資料(https://2021.pycon.jp/time-table/?id=272565)
ネットワーク ゲームにおけるTCPとUDPの使い分け
ネットワーク ゲームにおけるTCPとUDPの使い分け
モノビット エンジン
2017年10月27日、モノビットエンジン勉強会inサイバーコネクトツーにて、中嶋謙互が講演しました「ネットワークゲームにおける TCPとUDPの使い分け」のスライドになります。ネットワークゲームを製作する際にご参考頂けますと幸いです。 登壇者: 株式会社モノビット 取締役 CTO 中嶋謙互
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
NTT DATA Technology & Innovation
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~ (映像情報メディア学会2021年冬季大会企画セッション 発表資料) 2021年12月16日 NTTデータ 山口 永
pg_dbms_statsの紹介
pg_dbms_statsの紹介
NTT DATA OSS Professional Services
pg_dbms_statsの紹介
Dockerの事例紹介
Dockerの事例紹介
Hiroki Endo
ネットストーカー御用達OSINTツールBlackBirdを触ってみた.pptx
ネットストーカー御用達OSINTツールBlackBirdを触ってみた.pptx
Shota Shinogi
SNSのアカウントを見つけてくれるツール「Blackbird」のレビュースライドです。
Ltの作成と実践~入門編~
Ltの作成と実践~入門編~
Daiji Okuno
EmbulkのGCS/BigQuery周りのプラグインについて
EmbulkのGCS/BigQuery周りのプラグインについて
Satoshi Akama
EmbulkのGCS/BigQuery周りのプラグインについて #bq_sushi
Fiberの使いどころ
Fiberの使いどころ
Tomoya Kawanishi
About the use case of Ruby Fiber
わかる!metadata.managedFields / Kubernetes Meetup Tokyo 48
わかる!metadata.managedFields / Kubernetes Meetup Tokyo 48
Preferred Networks
近頃 Server-Side Apply (SSA) の利用が広がっています。GitOps ツールである Flux2 は v0.18.0 でマニフェストの適用に SSA を使用するようになりました。そこで重要になってくるのが metadata.managedFields です。 このセッションでは、kubectl v1.21 まで kubectl get -o yaml で表示されていてめっちゃ邪魔だった metadata.managedFields が何のために存在しているのか紹介します。また SSA によりオブジェクトのフィールドを削除したはずが実際には削除されていないなんてこともおきます。なぜそんなことが発生するのか、またその状態をどのように解決するかも紹介します。 イベントサイト: https://k8sjp.connpass.com/event/237734/
Hadoop入門
Hadoop入門
Preferred Networks
Hadoop Conference Japan 2009 「Hadoop入門」の講演資料
ラボラトリーオートメーションのためのソフトウェア思想教育(非プログラマ―が知っておくべきプログラミングの本質)
ラボラトリーオートメーションのためのソフトウェア思想教育(非プログラマ―が知っておくべきプログラミングの本質)
Tokoroten Nakayama
非プログラマ―が知っておくべきプログラミングの本質 https://laboratoryautomation.connpass.com/event/224912/
[Cloud OnAir] GCP 上でストリーミングデータ処理基盤を構築してみよう! 2018年9月13日 放送
[Cloud OnAir] GCP 上でストリーミングデータ処理基盤を構築してみよう! 2018年9月13日 放送
Google Cloud Platform - Japan
これまでのセッションではデータ分析サービスを紹介して来ましたが、今回は Cloud Pub/Sub、Cloud Dataflow を利用したストリーミングデータ処理基盤のアーキテクチャーと構築プロセスを解説します。
Linux女子部 systemd徹底入門
Linux女子部 systemd徹底入門
Etsuji Nakai
Linux女子部 「Fedora最新技術情報&Systemd勉強会」 http://connpass.com/event/3859/ で使用した資料です。 変更履歴 2013/11/04 ver1.0 初版 2013/11/05 ver1.1 誤植修正、少し追記 2013/11/06 ver1.2 daemon-reload,mask,テンプレート機能を追記 2013/11/12 ver1.3 User/Groupオプションの説明追加 2013/11/24 ver1.4 誤植修正 2014/05/05 ver1.5 imjournalモジュールの説明追加
Mercari JPのモノリスサービスをKubernetesに移行した話 PHP Conference 2022 9/24
Mercari JPのモノリスサービスをKubernetesに移行した話 PHP Conference 2022 9/24
Shin Ohno
メルカリ社の創業時以来から存在しているモノリスサービスの Kubernetes 移行に関する話
Linuxにて複数のコマンドを並列実行(同時実行数の制限付き)
Linuxにて複数のコマンドを並列実行(同時実行数の制限付き)
Hiro H.
東海道らぐ 2017.10.7 名古屋オフ https://tokaidolug.connpass.com/event/67522/ での発表内容より
コピー自動生成プロダクトでDataflowを導入した話
コピー自動生成プロダクトでDataflowを導入した話
ShunyoKawamoto
第0回 Discovery DataScience Meet up (DsDS) にて https://scramble.connpass.com/event/171602/
Ec cube開発合宿 プラグインセミナー
Ec cube開発合宿 プラグインセミナー
Ayumu Kawaguchi
More Related Content
What's hot
本当は恐ろしい分散システムの話
本当は恐ろしい分散システムの話
Kumazaki Hiroki
分散システムのFault Injectionの話 NTTデータテクノロジーカンファレンス2017で発表する際に用いたプレゼン資料 https://oss.nttdata.com/hadoop/event/201710/index.html
こわくない Git
こわくない Git
Kota Saito
「マージがなんとなく怖い」「リベースするなって怒られて怖い」「エラーが出て怖い」 Git 入門者にありがちな「Git 怖い」を解消するため、Git のお仕事(コミット、ブランチ、マージ、リベース)について解説します。
Hadoopの概念と基本的知識
Hadoopの概念と基本的知識
Ken SASAKI
社内勉強会資料。 Hadoopの概要について説明。
やはりお前らのMVCは間違っている
やはりお前らのMVCは間違っている
Koichi Tanaka
PHPカンファレンス2012 & WordCampTokyo2012 LT発表資料です。 タイトルの元ネタ: http://www.amazon.co.jp/dp/4094512624
Python 3.9からの新定番zoneinfoを使いこなそう
Python 3.9からの新定番zoneinfoを使いこなそう
Ryuji Tsutsui
PyCon JP 2021発表資料(https://2021.pycon.jp/time-table/?id=272565)
ネットワーク ゲームにおけるTCPとUDPの使い分け
ネットワーク ゲームにおけるTCPとUDPの使い分け
モノビット エンジン
2017年10月27日、モノビットエンジン勉強会inサイバーコネクトツーにて、中嶋謙互が講演しました「ネットワークゲームにおける TCPとUDPの使い分け」のスライドになります。ネットワークゲームを製作する際にご参考頂けますと幸いです。 登壇者: 株式会社モノビット 取締役 CTO 中嶋謙互
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
NTT DATA Technology & Innovation
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~ (映像情報メディア学会2021年冬季大会企画セッション 発表資料) 2021年12月16日 NTTデータ 山口 永
pg_dbms_statsの紹介
pg_dbms_statsの紹介
NTT DATA OSS Professional Services
pg_dbms_statsの紹介
Dockerの事例紹介
Dockerの事例紹介
Hiroki Endo
ネットストーカー御用達OSINTツールBlackBirdを触ってみた.pptx
ネットストーカー御用達OSINTツールBlackBirdを触ってみた.pptx
Shota Shinogi
SNSのアカウントを見つけてくれるツール「Blackbird」のレビュースライドです。
Ltの作成と実践~入門編~
Ltの作成と実践~入門編~
Daiji Okuno
EmbulkのGCS/BigQuery周りのプラグインについて
EmbulkのGCS/BigQuery周りのプラグインについて
Satoshi Akama
EmbulkのGCS/BigQuery周りのプラグインについて #bq_sushi
Fiberの使いどころ
Fiberの使いどころ
Tomoya Kawanishi
About the use case of Ruby Fiber
わかる!metadata.managedFields / Kubernetes Meetup Tokyo 48
わかる!metadata.managedFields / Kubernetes Meetup Tokyo 48
Preferred Networks
近頃 Server-Side Apply (SSA) の利用が広がっています。GitOps ツールである Flux2 は v0.18.0 でマニフェストの適用に SSA を使用するようになりました。そこで重要になってくるのが metadata.managedFields です。 このセッションでは、kubectl v1.21 まで kubectl get -o yaml で表示されていてめっちゃ邪魔だった metadata.managedFields が何のために存在しているのか紹介します。また SSA によりオブジェクトのフィールドを削除したはずが実際には削除されていないなんてこともおきます。なぜそんなことが発生するのか、またその状態をどのように解決するかも紹介します。 イベントサイト: https://k8sjp.connpass.com/event/237734/
Hadoop入門
Hadoop入門
Preferred Networks
Hadoop Conference Japan 2009 「Hadoop入門」の講演資料
ラボラトリーオートメーションのためのソフトウェア思想教育(非プログラマ―が知っておくべきプログラミングの本質)
ラボラトリーオートメーションのためのソフトウェア思想教育(非プログラマ―が知っておくべきプログラミングの本質)
Tokoroten Nakayama
非プログラマ―が知っておくべきプログラミングの本質 https://laboratoryautomation.connpass.com/event/224912/
[Cloud OnAir] GCP 上でストリーミングデータ処理基盤を構築してみよう! 2018年9月13日 放送
[Cloud OnAir] GCP 上でストリーミングデータ処理基盤を構築してみよう! 2018年9月13日 放送
Google Cloud Platform - Japan
これまでのセッションではデータ分析サービスを紹介して来ましたが、今回は Cloud Pub/Sub、Cloud Dataflow を利用したストリーミングデータ処理基盤のアーキテクチャーと構築プロセスを解説します。
Linux女子部 systemd徹底入門
Linux女子部 systemd徹底入門
Etsuji Nakai
Linux女子部 「Fedora最新技術情報&Systemd勉強会」 http://connpass.com/event/3859/ で使用した資料です。 変更履歴 2013/11/04 ver1.0 初版 2013/11/05 ver1.1 誤植修正、少し追記 2013/11/06 ver1.2 daemon-reload,mask,テンプレート機能を追記 2013/11/12 ver1.3 User/Groupオプションの説明追加 2013/11/24 ver1.4 誤植修正 2014/05/05 ver1.5 imjournalモジュールの説明追加
Mercari JPのモノリスサービスをKubernetesに移行した話 PHP Conference 2022 9/24
Mercari JPのモノリスサービスをKubernetesに移行した話 PHP Conference 2022 9/24
Shin Ohno
メルカリ社の創業時以来から存在しているモノリスサービスの Kubernetes 移行に関する話
Linuxにて複数のコマンドを並列実行(同時実行数の制限付き)
Linuxにて複数のコマンドを並列実行(同時実行数の制限付き)
Hiro H.
東海道らぐ 2017.10.7 名古屋オフ https://tokaidolug.connpass.com/event/67522/ での発表内容より
What's hot
(20)
本当は恐ろしい分散システムの話
本当は恐ろしい分散システムの話
こわくない Git
こわくない Git
Hadoopの概念と基本的知識
Hadoopの概念と基本的知識
やはりお前らのMVCは間違っている
やはりお前らのMVCは間違っている
Python 3.9からの新定番zoneinfoを使いこなそう
Python 3.9からの新定番zoneinfoを使いこなそう
ネットワーク ゲームにおけるTCPとUDPの使い分け
ネットワーク ゲームにおけるTCPとUDPの使い分け
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
pg_dbms_statsの紹介
pg_dbms_statsの紹介
Dockerの事例紹介
Dockerの事例紹介
ネットストーカー御用達OSINTツールBlackBirdを触ってみた.pptx
ネットストーカー御用達OSINTツールBlackBirdを触ってみた.pptx
Ltの作成と実践~入門編~
Ltの作成と実践~入門編~
EmbulkのGCS/BigQuery周りのプラグインについて
EmbulkのGCS/BigQuery周りのプラグインについて
Fiberの使いどころ
Fiberの使いどころ
わかる!metadata.managedFields / Kubernetes Meetup Tokyo 48
わかる!metadata.managedFields / Kubernetes Meetup Tokyo 48
Hadoop入門
Hadoop入門
ラボラトリーオートメーションのためのソフトウェア思想教育(非プログラマ―が知っておくべきプログラミングの本質)
ラボラトリーオートメーションのためのソフトウェア思想教育(非プログラマ―が知っておくべきプログラミングの本質)
[Cloud OnAir] GCP 上でストリーミングデータ処理基盤を構築してみよう! 2018年9月13日 放送
[Cloud OnAir] GCP 上でストリーミングデータ処理基盤を構築してみよう! 2018年9月13日 放送
Linux女子部 systemd徹底入門
Linux女子部 systemd徹底入門
Mercari JPのモノリスサービスをKubernetesに移行した話 PHP Conference 2022 9/24
Mercari JPのモノリスサービスをKubernetesに移行した話 PHP Conference 2022 9/24
Linuxにて複数のコマンドを並列実行(同時実行数の制限付き)
Linuxにて複数のコマンドを並列実行(同時実行数の制限付き)
Similar to 20150219 初めての「embulk」
コピー自動生成プロダクトでDataflowを導入した話
コピー自動生成プロダクトでDataflowを導入した話
ShunyoKawamoto
第0回 Discovery DataScience Meet up (DsDS) にて https://scramble.connpass.com/event/171602/
Ec cube開発合宿 プラグインセミナー
Ec cube開発合宿 プラグインセミナー
Ayumu Kawaguchi
Intalio Cloud Workshop
Intalio Cloud Workshop
Daisuke Sugai
Ruby で ffmpeg の filter_complex と戯れる話
Ruby で ffmpeg の filter_complex と戯れる話
ssuser551c92
Ruby で ffmpeg の filter_complex と戯れる話
Ruby で ffmpeg の filter_complex と戯れる話
Ruby で ffmpeg の filter_complex と戯れる話
Yoshikazu Kawashima
Ruby で ffmpeg の filter_complex と戯れる話
HerokuからSalesforceを使ってみた
HerokuからSalesforceを使ってみた
masaoki_ohashi
StackStormを活用した運用自動化の実践
StackStormを活用した運用自動化の実践
Shu Sugimoto
昨今、あらゆる場面において「運用の自動化」が叫ばれるようになり、その重要性は日に日に増してきています。 しかし、実際に着手しようとしてみると、一筋縄ではいかないことが多いのではないでしょうか。その理由の一つに、既存の運用手順等が「自動化に向いていない」ことが挙げられると思います。既に運用しているものがあるところで、自動化を理由に「すっぱりと運用を変える」というのは、かなり難易度が高く、また時間を要するものです。 本プレゼンテーションでは、こういった「運用の自動化」に対する課題を、StackStormを活用することでどのように解決していけるのか、弊社インターネットマルチフィードにおけるJPNAPサービスの運用自動化での実例を交えながら、ご紹介いたします。
ネットワークコマンド入力に対応したツール事例
ネットワークコマンド入力に対応したツール事例
fumoto kazuhiro
Internet Explorer 11 概要
Internet Explorer 11 概要
Yoshihisa Ozaki
商用ミドルウェアのPuppet化で気を付けたい5つのこと
商用ミドルウェアのPuppet化で気を付けたい5つのこと
NTT DATA OSS Professional Services
商用ミドルウェアのPuppet化で気を付けたい5つのこと ~ Oracle製品(Weblogic、Oracle Client)編 ~
Ansible tower 構築方法と使い方
Ansible tower 構築方法と使い方
Hiroshi Okano
Ansible Tower のインストールから使い方までをハンズオン形式で説明した資料です。この資料をご覧いただくことにより、Ansible Towerのセットアップから、ジョブの実行、権限管理などを学ぶことができます。 なお、プレイブックの書き方についてはこの資料には含まれませんのであらかじめご了承ください。
Spring Integration 超入門
Spring Integration 超入門
Yasutaka Sugamura
Spring Integration 勉強会用資料
ドキュメントシステムはこれを使え2015年版
ドキュメントシステムはこれを使え2015年版
Keiichiro Shikano
Sphinx Con JP 2015での発表 目的からドキュメントシステムを選べるYes/Noチャートは33ページにあります。 (当初アップロードしたものはこのページにミスがあったので差し替えています。高橋さんありがとうございます。)
Omnibus731_overview_public20121215
Omnibus731_overview_public20121215
Yuhki Hanada
Netcool / Omnibus product overview
3分でサーバオペレーションコマンドを作る技術
3分でサーバオペレーションコマンドを作る技術
Kei IWASAKI
#pyconjp 2015 の LTで発表した際に利用した資料です https://pycon.jp/2015/ja/schedule/presentation/93/
Build 番号の自動更新スクリプトについて #cocoa_kansai
Build 番号の自動更新スクリプトについて #cocoa_kansai
Tomohiro Kumagai
ツイッターを眺めていたら Info.plist の書き換えについてのお話が流れてきました。 その話題の中心にあった agvtool と、そこから派生して Build 番号を Info.plist そのものは更新せずにビルド時に細工をしてバンドルに埋め込む方法に興味を惹かれ、それについて少し深追いしてみました。 特に Info.plist Preprocessor はなかなか面白い仕組みでした。どのような場面で便利に使えるかは別としまして。
XML と PHP のイケナイ関係 (セキュリティ的な意味で) -Introduction of XXE attack and XML Bomb with...
XML と PHP のイケナイ関係 (セキュリティ的な意味で) -Introduction of XXE attack and XML Bomb with...
Kousuke Ebihara
*English subtitles are available.* Web アプリ界隈、特に日本ではまだあまり知られていないと思われる XXE や XML Bomb (XML Entity Expansion) というセキュリティ脆弱性の概要、 PHP の機能と組み合わせた攻撃手法、主に PHP 周りでの発覚事例や、対策方法について説明します
HTML5を使うためのプログレッシブエンハンスメント 〜すべての人に確実に情報を届けるために〜SwapSkillsFreeEventProgressiv...
HTML5を使うためのプログレッシブエンハンスメント 〜すべての人に確実に情報を届けるために〜SwapSkillsFreeEventProgressiv...
SwapSkills
ぼく(たち)のかんがえた最新のJS開発環境 #scripty04
ぼく(たち)のかんがえた最新のJS開発環境 #scripty04
Yahoo!デベロッパーネットワーク
ぼく(たち)のかんがえた最新のJS開発環境 光野達朗, ヤフー株式会社 2015.12.15 SCRIPTY#04 http://scripty.connpass.com/event/22663/
TestFlight自動化でらくらくチームテスト
TestFlight自動化でらくらくチームテスト
Yoichiro Sakurai
2013/0303
Similar to 20150219 初めての「embulk」
(20)
コピー自動生成プロダクトでDataflowを導入した話
コピー自動生成プロダクトでDataflowを導入した話
Ec cube開発合宿 プラグインセミナー
Ec cube開発合宿 プラグインセミナー
Intalio Cloud Workshop
Intalio Cloud Workshop
Ruby で ffmpeg の filter_complex と戯れる話
Ruby で ffmpeg の filter_complex と戯れる話
Ruby で ffmpeg の filter_complex と戯れる話
Ruby で ffmpeg の filter_complex と戯れる話
HerokuからSalesforceを使ってみた
HerokuからSalesforceを使ってみた
StackStormを活用した運用自動化の実践
StackStormを活用した運用自動化の実践
ネットワークコマンド入力に対応したツール事例
ネットワークコマンド入力に対応したツール事例
Internet Explorer 11 概要
Internet Explorer 11 概要
商用ミドルウェアのPuppet化で気を付けたい5つのこと
商用ミドルウェアのPuppet化で気を付けたい5つのこと
Ansible tower 構築方法と使い方
Ansible tower 構築方法と使い方
Spring Integration 超入門
Spring Integration 超入門
ドキュメントシステムはこれを使え2015年版
ドキュメントシステムはこれを使え2015年版
Omnibus731_overview_public20121215
Omnibus731_overview_public20121215
3分でサーバオペレーションコマンドを作る技術
3分でサーバオペレーションコマンドを作る技術
Build 番号の自動更新スクリプトについて #cocoa_kansai
Build 番号の自動更新スクリプトについて #cocoa_kansai
XML と PHP のイケナイ関係 (セキュリティ的な意味で) -Introduction of XXE attack and XML Bomb with...
XML と PHP のイケナイ関係 (セキュリティ的な意味で) -Introduction of XXE attack and XML Bomb with...
HTML5を使うためのプログレッシブエンハンスメント 〜すべての人に確実に情報を届けるために〜SwapSkillsFreeEventProgressiv...
HTML5を使うためのプログレッシブエンハンスメント 〜すべての人に確実に情報を届けるために〜SwapSkillsFreeEventProgressiv...
ぼく(たち)のかんがえた最新のJS開発環境 #scripty04
ぼく(たち)のかんがえた最新のJS開発環境 #scripty04
TestFlight自動化でらくらくチームテスト
TestFlight自動化でらくらくチームテスト
More from Hideto Masuoka
日本語データの活用までの道のり
日本語データの活用までの道のり
Hideto Masuoka
https://techplay.jp/event/760252 の発表資料
20190827_AWS_Loft_LT
20190827_AWS_Loft_LT
Hideto Masuoka
以下のイベントで登壇 https://awsj-ml.connpass.com/event/144260/
ソフトウェアベンチャーのサポートエンジニア
ソフトウェアベンチャーのサポートエンジニア
Hideto Masuoka
サポートエンジニアnight#3の資料です
Chainer Community 活動
Chainer Community 活動
Hideto Masuoka
データ分析・機械学習LT会資料 https://daml.connpass.com/event/64155/
Chainerで知るdeep learning進化の歴史
Chainerで知るdeep learning進化の歴史
Hideto Masuoka
2017/6/25 DeepLearningオールスターズ
Chainerのcommunity活動の今までとこれから
Chainerのcommunity活動の今までとこれから
Hideto Masuoka
Chainerのcommunity活動の今までとこれから
「機械学習とは?」から始める Deep learning実践入門
「機械学習とは?」から始める Deep learning実践入門
Hideto Masuoka
「機械学習とは?」から始める Deep learning実践入門
数式がわからなくたってDeep Learningやってみたい!人集合- dots. DeepLearning部 発足!
数式がわからなくたってDeep Learningやってみたい!人集合- dots. DeepLearning部 発足!
Hideto Masuoka
数式がわからなくたってDeep Learningやってみたい!人集合- dots. DeepLearning部 発足! のオープニングとクロージング資料
基幹システムから学ぶ業務知識 ~販売業務を知る~
基幹システムから学ぶ業務知識 ~販売業務を知る~
Hideto Masuoka
2013のPFIセミナー
Aws io tとsoracomを 使ってiotの世界に触れてみる
Aws io tとsoracomを 使ってiotの世界に触れてみる
Hideto Masuoka
PFIセミナーで話しました!
非エンジニアのためのIt業界
非エンジニアのためのIt業界
Hideto Masuoka
C cleanerマニュアル
C cleanerマニュアル
Hideto Masuoka
C cleanerの使い方
自分のテンプレートを作ろう
自分のテンプレートを作ろう
Hideto Masuoka
PowerPointのデザインテンプレートの使用方法
More from Hideto Masuoka
(13)
日本語データの活用までの道のり
日本語データの活用までの道のり
20190827_AWS_Loft_LT
20190827_AWS_Loft_LT
ソフトウェアベンチャーのサポートエンジニア
ソフトウェアベンチャーのサポートエンジニア
Chainer Community 活動
Chainer Community 活動
Chainerで知るdeep learning進化の歴史
Chainerで知るdeep learning進化の歴史
Chainerのcommunity活動の今までとこれから
Chainerのcommunity活動の今までとこれから
「機械学習とは?」から始める Deep learning実践入門
「機械学習とは?」から始める Deep learning実践入門
数式がわからなくたってDeep Learningやってみたい!人集合- dots. DeepLearning部 発足!
数式がわからなくたってDeep Learningやってみたい!人集合- dots. DeepLearning部 発足!
基幹システムから学ぶ業務知識 ~販売業務を知る~
基幹システムから学ぶ業務知識 ~販売業務を知る~
Aws io tとsoracomを 使ってiotの世界に触れてみる
Aws io tとsoracomを 使ってiotの世界に触れてみる
非エンジニアのためのIt業界
非エンジニアのためのIt業界
C cleanerマニュアル
C cleanerマニュアル
自分のテンプレートを作ろう
自分のテンプレートを作ろう
Recently uploaded
NIST Cybersecurity Framework 2.0の変更点整理をしよう
NIST Cybersecurity Framework 2.0の変更点整理をしよう
You&I
今年2月に1.1→2.0に更新されたNIST CSFの変更内容について整理したいと思います。
アジャイルの30年(Tree Decades of Agileというブログ記事に関する要約)
アジャイルの30年(Tree Decades of Agileというブログ記事に関する要約)
You&I
Tree Decades of Agileというブログ記事が面白そうなので、これを読んでみたいと思います。 http://www.managecomplexity.dk/blog/2024/03/12/three-decades-of-agile/
CO2排出量見える化・削減・報告クラウド「アスエネ」サービス紹介_Saleshub.pdf
CO2排出量見える化・削減・報告クラウド「アスエネ」サービス紹介_Saleshub.pdf
yamamotominami
「ASUENE」は、複雑だったCO2排出量算出業務をカンタンにサポートする、CO2排出量見える化・削減・報告クラウドサービスです。温室効果ガス・CO2排出量の算出・可視化、削減・カーボンオフセット、Scope1-3* のサプライチェーン排出量の報告・情報開示を支援します。
Grokking Simplicity探訪
Grokking Simplicity探訪
Yoshitaka Kawashima
2024/6/5のアーキ部で話したスライドです。 Stratified Designの目的を中心に、そのメリットを考えてみます。
BitVisor Summit 10「3. Thin Hypervisor on AArch64」
BitVisor Summit 10「3. Thin Hypervisor on AArch64」
BitVisor
現在、理化学研究所で研究パートタイマーとしてAArch64向けThin Hypervisorの開発をしています。今回の発表では開発背景、設計、実装、及び進捗状況などをお話します。 https://bitvisor.connpass.com/event/229993/
FIWARE Orion Context Broker コンテキスト情報管理 (Orion 4.0.0対応)
FIWARE Orion Context Broker コンテキスト情報管理 (Orion 4.0.0対応)
fisuda
FIWARE Orion Context Broker の日本語の解説資料です。Orion Context Broker version 4.0.0 に対応しています。
受発注バスターズ説明資料 株式会社batton Saleshub掲載用.pdf
受発注バスターズ説明資料 株式会社batton Saleshub掲載用.pdf
ooishi1
受発注バスターズ説明資料
Recently uploaded
(7)
NIST Cybersecurity Framework 2.0の変更点整理をしよう
NIST Cybersecurity Framework 2.0の変更点整理をしよう
アジャイルの30年(Tree Decades of Agileというブログ記事に関する要約)
アジャイルの30年(Tree Decades of Agileというブログ記事に関する要約)
CO2排出量見える化・削減・報告クラウド「アスエネ」サービス紹介_Saleshub.pdf
CO2排出量見える化・削減・報告クラウド「アスエネ」サービス紹介_Saleshub.pdf
Grokking Simplicity探訪
Grokking Simplicity探訪
BitVisor Summit 10「3. Thin Hypervisor on AArch64」
BitVisor Summit 10「3. Thin Hypervisor on AArch64」
FIWARE Orion Context Broker コンテキスト情報管理 (Orion 4.0.0対応)
FIWARE Orion Context Broker コンテキスト情報管理 (Orion 4.0.0対応)
受発注バスターズ説明資料 株式会社batton Saleshub掲載用.pdf
受発注バスターズ説明資料 株式会社batton Saleshub掲載用.pdf
20150219 初めての「embulk」
1.
初めての「 Embulk 」 株式会社プリファードインフラストラクチャー
2.
自己紹介 舛岡英人( Masuoka
Hideto ) - Twitter アカウント hidetomasuoka 2012 年 - PFI に Join - 製品事業部 趣味 - フットサル - 旅行 2
3.
最近の業務 …契約、営業、導入支援、サポート等々 .
導入支援のときソフトウェアにデータを登録するのは結 …構大変 . 3
4.
アジェンダ Embulk とは
Embulk の使い方 Embulk プラグインとは 4
5.
Embulk とは
6.
Embulk とは Fluentd
のバッチ処理版のようなツール CSV データやアクセスログなどの構造化データを高い 信頼性で転送することができる Fluentd のコミッターである古橋さん等が開発している
7.
Embulk を開発した理由 Fluentd
では解決出来ない問題が発生 - ダウンロードしてきた『 CSV ファイル』を 1 回ロードして解析 してみたい - fluentd を導入したけど大量に残った過去データもロードして解 析したい - 日次のバッチ処理の一部にデータの転送処理がある - 異なるストレージにデータを同期したい 7
8.
Fluentd との違い Fluentd
と違いバルク処理に特化トランザクション制御 - 冪等性 - 高速性 - スキーマを使った validation 8
9.
Embulk の特徴 プラグインアーキテクチャ
高速な並列・分散処理 guess 機構 リトライとリジューム 9
10.
プラグインアーキテクチャ 入力、出力、フィルタ(データ加工)などのプラグイン を書くことが可能 - 足りない機能を補完し、現場で使えるツールに拡張可能
ありとあらゆるデータ処理に対応可能 - 壊れた値(例外データ)の扱い - エラー処理やリカバリ - 日付フォーマットの変換、 NULL 値の扱い - …リトライ、二重ロードを防ぐ冪等性の制御 などなど、 10
11.
Embulk のイメージ ※ 11
12.
高速な並列・分散処理 1 回の処理を複数のタスクに分割し、並列に実行する仕 組みを備えている -
これらのタスクを実行する Executor プラグインを追加すること で、 Hadoop や YARN 、あるいは Sun Grid や MPI などの分散 処理環境を使い、大規模データを高速にバルク処理することが 可能になり予定 Embulk のコア部分は Java で書かれているため、単一ス レッドの性能が高い。プラグインは、 Jruby だけでなく 、 Java で書くことも可能( v0.4 〜) 12
13.
guess 機構 Guess
( v0.1 〜。 v0.5 〜強化予定) - 1 度少しだけデータを読み込み、自動的に設定ファイルを生成 する。 - 設定を、必要なら少し手直ししてから使うことで、ゼロから設 定を書くよりもずっと素早くデータ処理をはじめることが可能 13
14.
リトライとリジューム Embulk では失敗したタスクだけを後からやり直すリジ ューム機能を備えている(
v0.3 〜) 14
15.
Embulk を使ってみる
16.
インストール (2015/2/19 現在
) $ wget https://bintray.com/artifact/download/embulk/maven/emb ulk-0.4.2.jar -O embulk.jar $ chmod 755 embulk.jar 16
17.
コマンド一覧 Example - Embulk
のチュートリアルファイルを指定したディレクトリにセ ットする - $ java -jar embulk.jar example ./try1 Guess - 簡単に記載した config を元に完全版の config を作成する - java -jar embulk.jar guess ./try1/example.yml -o config.yml 17
18.
コマンド一覧 Preview - データロードのみドライランを実行する -
$ java -jar embulk.jar preview config.yml Run - Bulk でのデータ登録を実行する - $ java -jar embulk.jar run config.yml 18
19.
Example $ java
-jar embulk.jar example ./try1 19 Creating ./try1 directory... Creating ./try1/ Creating ./try1/csv/ Creating ./try1/csv/sample_01.csv.gz Creating ./try1/example.yml Run following subcommands to try embulk: 1. guess ./try1/example.yml -o config.yml 2. preview config.yml 3. run config.yml
20.
guess in: type: file paths: ["/home/pfi/embulk/try1/csv"] out: type:
stdout exec: {} in: type: file paths: [/home/pfi/embulk/try1/csv] decoders: - {type: gzip} parser: charset: UTF-8 newline: CRLF type: csv delimiter: ',' quote: '"' header_line: true columns: - {name: id, type: long} - {name: account, type: long} - {name: time, type: timestamp, format: '%Y-%m-%d %H:%M: %S'} - {name: purchase, type: timestamp, format: '%Y%m%d'} - {name: comment, type: string} out: {type: stdout} 20 $ java -jar embulk.jar guess ./try1/example.yml -o config.yml guessguess
21.
preview $ ./embulk
preview config.yml 21
22.
run ./embulk run
config.yml -o config.yml 22
23.
Embulk の plugin
を作ってみる
24.
Embulk のプラグイン InputPlugin -
データを Embulk に input する際に使用する plug-in OutputPlugin データから output する際に使用する plug-in Filterplugin - データを加工する際に使用する plug-in
25.
Embulk のアーキテクチャー 25 Input Plugin
Output Plugin Embulk ( Fillter Plugin )
26.
Embulk のプラグインの種類 InputPlugin -
embulk-input-s3 - embulk-input-mysql - embulk-input-postgresql - embulk-input-redshift - embulk-input-jdbc - embulk-input-slack-history - embulk-plugin-input-jstat
27.
Embulk のプラグイン OutputPlugin -
embulk-output-mysql - embulk-output-postgresql - embulk-output-redshift - embulk-output-postgres-json - embulk-output-elasticsearch - embulk-output-jdbc - embulk-output-parquet
28.
Embulk の outputplugin
を作ってみる
29.
お詫び 2/17 現在
0.4.1 が Release され、プラグインの仕様等 が変更となりました。 準備していたものが、 0.3 系なので、今回はそちらで。 。。。
30.
OutputPlugin モジュールは Embulk -
クラスは任意の名前だが、 OutputPlugin を継承する
31.
実装メソッド 以下の3種類を実装する - self.transaction -
Initialize - add 31
32.
self.transaction Task に
config.yml で記載した内容など実行する際に必 要な情報を詰め、後続に渡します なお config.param の default 属性を付与しない場合は必 須項目となり、設定しない例外が発生します 32
33.
initialize 33 run 実行前の処理を行います。
34.
add データを追加先の登録方法を記載します 34
35.
Embulk の plugin
を使ってみる
36.
Plugin embulk-input-mysql - MySQL
からデータをダンプするプラグイン - embulk-output-mysql - MySQL にデータを投入するプラグイン 36
37.
インストール $ java
-jar embulk.jar gem install embulk-input-mysql embulk-output-mysql 37
38.
config.yml in: type: mysql user: embulk password:
embulk database: embulk table: test host: localhost select: "*" where: "editor != 'emacs'" out: type: mysql host: localhost user: embulk password: embulk database: embulk table: output mode: insert 38
39.
実行結果 $ java
-jar embulk.jar preview config_mysql.yml 39
40.
実行結果 $ java
-jar embulk.jar run config_mysql.yml 40
41.
使ってみた感想 プラグインがあれば、簡単な設定ファイルを書くだけで 、動くので楽だった。 Preview
や guess 機能があるので、色々実験するのは楽 にできた …ログが全然でないので、どこで失敗したか不明 41
42.
ロードマップ Add missing
JRuby Plugin APIs - ParserPlugin, FormatterPlugin - DecoderPlugin, EncoderPlugin Add Executor plugin SPI Add ssh distributed executor - embulk run —command ssh %host embulk run %task Add MapReduce executor 42 Java では対応済 み Java では対応済 み
43.
まとめ Embulk の使い方
プラグインの書き方 プラグインの使い方 43
44.
参考資料 Embulk repository -
https://github.com/embulk/embulk Blog by Sadayuki Furuhashi - http://frsyuki.hatenablog.com/entry/2015/01/19/100631 Qiita - http://qiita.com/tadOne/items/10ff992a3aaead142edb 44
45.
Copyright © 2006-2015 Preferred
Infrastructure All Right Reserved.
Download now