Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
Hiromasa Ohashi
PDF, PPTX
1,607 views
「深層学習」の本に出てきたデータセット達
「深層学習」の本に出てきたデータセット達の解説です
Data & Analytics
◦
Read more
0
Save
Share
Embed
Embed presentation
Download
Download as PDF, PPTX
1
/ 20
2
/ 20
3
/ 20
4
/ 20
5
/ 20
6
/ 20
7
/ 20
8
/ 20
9
/ 20
10
/ 20
11
/ 20
12
/ 20
13
/ 20
14
/ 20
15
/ 20
16
/ 20
17
/ 20
18
/ 20
19
/ 20
20
/ 20
More Related Content
PDF
Deep Learningハンズオン勉強会「Caffeで画像分類を試してみようの会」
by
Yasuyuki Sugai
PDF
Python 機械学習プログラミング データ分析ライブラリー解説編
by
Etsuji Nakai
PDF
Python 機械学習プログラミング データ分析演習編
by
Etsuji Nakai
PPTX
PythonとRによるデータ分析環境の構築と機械学習によるデータ認識
by
Katsuhiro Morishita
PPTX
Jupyter Notebookでscikit-learnを使った機械学習・画像処理の基本
by
Norihiko Nakabayashi
PPTX
SensorBeeのご紹介
by
Daisuke Tanaka
PPTX
SensorBeeでChainerをプラグインとして使う
by
Daisuke Tanaka
PDF
Jubakit の紹介
by
kmaehashi
Deep Learningハンズオン勉強会「Caffeで画像分類を試してみようの会」
by
Yasuyuki Sugai
Python 機械学習プログラミング データ分析ライブラリー解説編
by
Etsuji Nakai
Python 機械学習プログラミング データ分析演習編
by
Etsuji Nakai
PythonとRによるデータ分析環境の構築と機械学習によるデータ認識
by
Katsuhiro Morishita
Jupyter Notebookでscikit-learnを使った機械学習・画像処理の基本
by
Norihiko Nakabayashi
SensorBeeのご紹介
by
Daisuke Tanaka
SensorBeeでChainerをプラグインとして使う
by
Daisuke Tanaka
Jubakit の紹介
by
kmaehashi
What's hot
PDF
Rにおける大規模データ解析(第10回TokyoWebMining)
by
Shintaro Fukushima
PDF
捗るリコメンドシステムの裏事情(ハッカドール)
by
mosa siru
PDF
Jpug study-pq 20170121
by
Kosuke Kida
PDF
PostgreSQLとpython
by
Soudai Sone
PDF
PostgreSQLとPythonとSQL
by
Satoshi Yamada
PDF
[GTCJ2018] Optimizing Deep Learning with Chainer PFN得居誠也
by
Preferred Networks
PDF
Kerasで深層学習を実践する
by
Kazuaki Tanida
PDF
2013.07.15 はじパタlt scikit-learnで始める機械学習
by
Motoya Wakiyama
PDF
pg_bigm(ピージーバイグラム)を用いた全文検索のしくみ
by
Masahiko Sawada
PPTX
押さえておきたい、PostgreSQL 13 の新機能!! (PostgreSQL Conference Japan 2020講演資料)
by
NTT DATA Technology & Innovation
PDF
Lt ingaoho-jsonb+postgeres fdw
by
Toshi Harada
PDF
20120405 setsunaセミナー
by
Takahiro Iwase
PDF
Jubatusでマルウェア分類
by
Shuzo Kashihara
PDF
広告配信現場で使うSpark機械学習
by
x1 ichi
PPTX
Hadoop基盤上のETL構築実践例 ~多様なデータをどう扱う?~
by
Sotaro Kimura
PPTX
Jubatus使ってみた 作ってみたJubatus
by
JubatusOfficial
PDF
Introduction to Chainer and CuPy
by
Kenta Oono
PDF
Python東海Vol.5 IPythonをマスターしよう
by
Hiroshi Funai
PPTX
ストリーム処理とSensorBee
by
Daisuke Tanaka
PDF
SensorBeeの紹介
by
Shuzo Kashihara
Rにおける大規模データ解析(第10回TokyoWebMining)
by
Shintaro Fukushima
捗るリコメンドシステムの裏事情(ハッカドール)
by
mosa siru
Jpug study-pq 20170121
by
Kosuke Kida
PostgreSQLとpython
by
Soudai Sone
PostgreSQLとPythonとSQL
by
Satoshi Yamada
[GTCJ2018] Optimizing Deep Learning with Chainer PFN得居誠也
by
Preferred Networks
Kerasで深層学習を実践する
by
Kazuaki Tanida
2013.07.15 はじパタlt scikit-learnで始める機械学習
by
Motoya Wakiyama
pg_bigm(ピージーバイグラム)を用いた全文検索のしくみ
by
Masahiko Sawada
押さえておきたい、PostgreSQL 13 の新機能!! (PostgreSQL Conference Japan 2020講演資料)
by
NTT DATA Technology & Innovation
Lt ingaoho-jsonb+postgeres fdw
by
Toshi Harada
20120405 setsunaセミナー
by
Takahiro Iwase
Jubatusでマルウェア分類
by
Shuzo Kashihara
広告配信現場で使うSpark機械学習
by
x1 ichi
Hadoop基盤上のETL構築実践例 ~多様なデータをどう扱う?~
by
Sotaro Kimura
Jubatus使ってみた 作ってみたJubatus
by
JubatusOfficial
Introduction to Chainer and CuPy
by
Kenta Oono
Python東海Vol.5 IPythonをマスターしよう
by
Hiroshi Funai
ストリーム処理とSensorBee
by
Daisuke Tanaka
SensorBeeの紹介
by
Shuzo Kashihara
Similar to 「深層学習」の本に出てきたデータセット達
PDF
2018年01月27日 Keras/TesorFlowによるディープラーニング事始め
by
aitc_jp
PPTX
2018/6/26 deep learning Neural Network Console hands-on
by
Sony Network Communications Inc.
PPTX
2018/06/23 Sony"s deep learning software and the latest information
by
Sony Network Communications Inc.
PPTX
ディープラーニングハンズオン・レクチャー資料
by
Yoshihiro Ochi
PPTX
MNISTデータセットの画像分類器の実装
by
Hiroaki Matsumoto
PPTX
CG Image Recognition with Deep Learning
by
Kodai Takao
PDF
FPGAX2019
by
Hiroki Nakahara
PPTX
ディープラーニングゼミ TensorFlowで学ぶ理論と実践
by
Yota Ishida
2018年01月27日 Keras/TesorFlowによるディープラーニング事始め
by
aitc_jp
2018/6/26 deep learning Neural Network Console hands-on
by
Sony Network Communications Inc.
2018/06/23 Sony"s deep learning software and the latest information
by
Sony Network Communications Inc.
ディープラーニングハンズオン・レクチャー資料
by
Yoshihiro Ochi
MNISTデータセットの画像分類器の実装
by
Hiroaki Matsumoto
CG Image Recognition with Deep Learning
by
Kodai Takao
FPGAX2019
by
Hiroki Nakahara
ディープラーニングゼミ TensorFlowで学ぶ理論と実践
by
Yota Ishida
More from Hiromasa Ohashi
PDF
Streamlitを用いた音響信号処理ダッシュボードの開発
by
Hiromasa Ohashi
PDF
PRML読書会#4資料+補足
by
Hiromasa Ohashi
PDF
すごいHaskell楽しく学ぼう-第12章モノイド-
by
Hiromasa Ohashi
PDF
すごいHaskell読書会 第六章 発表資料
by
Hiromasa Ohashi
PDF
PRML読書会#2,#3資料
by
Hiromasa Ohashi
PDF
大阪PRML読書会#1資料
by
Hiromasa Ohashi
Streamlitを用いた音響信号処理ダッシュボードの開発
by
Hiromasa Ohashi
PRML読書会#4資料+補足
by
Hiromasa Ohashi
すごいHaskell楽しく学ぼう-第12章モノイド-
by
Hiromasa Ohashi
すごいHaskell読書会 第六章 発表資料
by
Hiromasa Ohashi
PRML読書会#2,#3資料
by
Hiromasa Ohashi
大阪PRML読書会#1資料
by
Hiromasa Ohashi
「深層学習」の本に出てきたデータセット達
1.
深層学習の本に 出てきたデータセット達 大橋 宏正
2.
THE MNIST DATABASE of
handwritten digits • http://yann.lecun.com/exdb/mnist/ • 手書き文字データNISTデータセットのサブセット • 60,000例の学習データと10,000例の評価データ、 およびそれらのラベルが存在 • サイトには既存の実験結果一覧が存在
3.
データの入手 #!/bin/bash # vim:fileencoding=utf-8 # wget wget
http://yann.lecun.com/exdb/mnist/train-images-idx3-ubyte.gz wget http://yann.lecun.com/exdb/mnist/train-labels-idx1-ubyte.gz wget http://yann.lecun.com/exdb/mnist/t10k-images-idx3-ubyte.gz wget http://yann.lecun.com/exdb/mnist/t10k-labels-idx1-ubyte.gz # gunzip gunzip train-images-idx3-ubyte.gz gunzip train-labels-idx1-ubyte.gz gunzip t10k-images-idx3-ubyte.gz gunzip t10k-labels-idx1-ubyte.gz
4.
ラベルのフォーマット • マジックナンバー(32bit)、画像の数(32bit) • 数字ラベルが符号なし8bitの値として羅列 •
学習、評価ともに共通のフォーマット • big endianで書いてある
5.
データのフォーマット • マジックナンバー、画像の数、行数、列数 • 全て32bit
integer • 画像のピクセル値(符号なし8bit)がrow-majorで並ぶ • これもbig endianで書いてある
6.
ラベル、データ共に IDXフォーマットという形式
7.
magic number • MNISTの場合データタイプは ラベル、データともに0x08なので unsigned
byte バイト 1 2 3 4 0 0 データ タイプ 次元数
8.
parserを書きました • githubに上げました • https://github.com/wrist/IDXFileParser
9.
scikit-learnのfetch_mldata • mldata.orgのレポジトリに登録されている データセットをダウンロード可能 • http://scikit-learn.org/stable/datasets/ •
MNISTもこちらを使ってダウンロードした方が圧 倒的に早い • http://mldata.org/repository/data/ viewslug/mnist-original/
10.
fetch_mldata In[1]: from sklearn.datasets
import fetch_mldata In[2]: mnist = fetch_mldata('MNIST original') In[3]: mnist.data.shape Out[3]: (70000, 784) In[4]: mnist.target.shape Out[4]: (70000,)
12.
CIFER-10 データセット • http://www.cs.toronto.edu/
kriz/cifar.html • 10クラスに分けられた32x32のカラー画像 • 全60000枚、クラスごとに6000枚存在 • 50000の学習データと10000の評価データ
13.
10クラス • airplane, automobile,
bird, cat, deer, dog, frog, horse, ship, truck
14.
pythonバージョン • http://www.cs.toronto.edu/ kriz/cifar-10- python.tar.gz •
matlabバージョン、binaryバージョンも存在 • pythonのpickleでシリアライズされたデータ が存在
15.
tar.gzの中身 • batches.meta • data_batch_1
data_batch_2 data_batch_3 data_batch_4 data_batch_5 • test_batch • readme.html • 全てcPickleで読める
16.
unpickle • HPに記載 def unpickle(file): import
cPickle fo = open(file, 'rb') dict = cPickle.load(fo) fo.close() return dict
17.
ざっくりとした使い方 In[1]: meta_data =
unpickle( ./batches.meta") In[2]: data_batch_1 = unpickle( ./data_batch_1") In[3]: import matplotlib.pyplot as plt In[4]: plt.imshow(data_batch_1[ data ][0].reshape((3, 32, 32)).transpose(1, 2, 0)) https://github.com/wrist/prml_ipynbs/blob/master/ deeplearning/CIFAR-10.ipynb
18.
CIFAR-100 データセット • 100クラスに分けられた32x32の画像 •
20のスーパークラスが存在 • 各クラス600枚ずつ存在 • 学習データ500枚、評価データ100枚
20.
ILSVRC • ImageNet Large
Scale Visual Recognition Challengeの略 • 毎年行われている画像認識のコンペ • 2012年はDNNが圧勝 • http://image-net.org/challenges/LSVRC/ 2012/
Download