Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
EN
Uploaded by
Hidekazu Tanaka
KEY, PPTX
3,183 views
データベースのお話
第24回R勉強会@東京(#TokyoR)で発表したスライド
Technology
◦
Read more
7
Save
Share
Embed
Embed presentation
Download
Download as KEY, PPTX
1
/ 30
2
/ 30
3
/ 30
4
/ 30
5
/ 30
6
/ 30
7
/ 30
8
/ 30
9
/ 30
10
/ 30
11
/ 30
12
/ 30
13
/ 30
14
/ 30
15
/ 30
16
/ 30
17
/ 30
18
/ 30
19
/ 30
20
/ 30
21
/ 30
22
/ 30
23
/ 30
24
/ 30
25
/ 30
26
/ 30
27
/ 30
28
/ 30
29
/ 30
30
/ 30
More Related Content
PDF
RとSQLiteで気軽にデータベース作成
by
弘毅 露崎
PDF
R以外の研究ツール
by
弘毅 露崎
PDF
20120913 nosql@hikarie(okuyama fuse)
by
Takahiro Iwase
KEY
カジュアルにバックアップ - MySQL Casual Talks 福岡
by
Aya Komuro
PDF
コード読経会報告書
by
Masahiko Toyoshi
PDF
カウチなやつら CouchDB in the room
by
Makoto Ohnami
KEY
カジュアルにソースコードリーディング
by
Akihiro Okuno
PDF
Bgworkerで簡易クラスタ管理
by
Masahiko Sawada
RとSQLiteで気軽にデータベース作成
by
弘毅 露崎
R以外の研究ツール
by
弘毅 露崎
20120913 nosql@hikarie(okuyama fuse)
by
Takahiro Iwase
カジュアルにバックアップ - MySQL Casual Talks 福岡
by
Aya Komuro
コード読経会報告書
by
Masahiko Toyoshi
カウチなやつら CouchDB in the room
by
Makoto Ohnami
カジュアルにソースコードリーディング
by
Akihiro Okuno
Bgworkerで簡易クラスタ管理
by
Masahiko Sawada
What's hot
ODP
Programming under capability mode
by
Yuichiro Naito
PDF
社内勉強会02 シリアライズ[公開用]
by
Keme Sato
PDF
MongoDB Configパラメータ解説
by
Shoken Fujisaki
PDF
DeclarativeSql
by
Takaaki Suzuki
PDF
CasualなMongoDBのサービス運用Tips
by
Naoki Sega
PDF
月間10億pvを支えるmongo db
by
Yuji Isobe
PDF
MySQL 初めてのチューニング
by
Craft works
PDF
MongoDBのアレをアレする
by
Akihiro Kuwano
PDF
仮想ネットワーク構築8枚slide
by
k009c1271
PDF
Pg14_sql_standard_function_body
by
kasaharatt
ODP
Custom Package Building with Poudriere
by
Yuichiro Naito
PDF
Redis Intro Osc2010 Tokyo Spring
by
Makoto Ohnami
PPTX
HDPをWindowsで動かしてみた
by
adachij2002
PDF
カジュアルにMongo dbのbackup機能説明
by
Masakazu Matsushita
PDF
MongoDBを用いたソーシャルアプリのログ解析 〜解析基盤構築からフロントUIまで、MongoDBを最大限に活用する〜
by
Takahiro Inoue
PDF
Postgre sql9.3 newlockmode_and_etc
by
kasaharatt
PDF
LastaFluteに移行したFessとElasticsearch+ESFluteによるDBFlute環境
by
Shinsuke Sugaya
PPTX
Ctb57 with god7
by
kingtomo
KEY
ソーシャルゲームログ解析基盤のMongoDB活用事例
by
知教 本間
Programming under capability mode
by
Yuichiro Naito
社内勉強会02 シリアライズ[公開用]
by
Keme Sato
MongoDB Configパラメータ解説
by
Shoken Fujisaki
DeclarativeSql
by
Takaaki Suzuki
CasualなMongoDBのサービス運用Tips
by
Naoki Sega
月間10億pvを支えるmongo db
by
Yuji Isobe
MySQL 初めてのチューニング
by
Craft works
MongoDBのアレをアレする
by
Akihiro Kuwano
仮想ネットワーク構築8枚slide
by
k009c1271
Pg14_sql_standard_function_body
by
kasaharatt
Custom Package Building with Poudriere
by
Yuichiro Naito
Redis Intro Osc2010 Tokyo Spring
by
Makoto Ohnami
HDPをWindowsで動かしてみた
by
adachij2002
カジュアルにMongo dbのbackup機能説明
by
Masakazu Matsushita
MongoDBを用いたソーシャルアプリのログ解析 〜解析基盤構築からフロントUIまで、MongoDBを最大限に活用する〜
by
Takahiro Inoue
Postgre sql9.3 newlockmode_and_etc
by
kasaharatt
LastaFluteに移行したFessとElasticsearch+ESFluteによるDBFlute環境
by
Shinsuke Sugaya
Ctb57 with god7
by
kingtomo
ソーシャルゲームログ解析基盤のMongoDB活用事例
by
知教 本間
Similar to データベースのお話
PDF
Tokyo r sqldf
by
Takashi Minoda
PDF
経済学のための実践的データ分析 4.SQL ことはじめ
by
Yasushi Hara
PDF
Japan.r 2データベース
by
sleipnir002
PPTX
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
by
yassun7010
PPTX
Effective DBMS (2018)
by
Kihyun Kim
PDF
Spider DeNA Technology Seminar #2
by
Kentoku
PDF
About NoSQL
by
hideaki honda
PDF
リレーショナルデータベースとの上手な付き合い方 long version
by
Mikiya Okuno
PPTX
Tokyo r28 1
by
Takashi Minoda
PDF
Cassandraとh baseの比較して入門するno sql
by
Yutuki r
PDF
Introducing Spider 20101206(DTT#7)
by
Kentoku
PDF
TAM 新人ディレクター システムスキルアップ プログラム 第6回 「データベース」
by
(株)TAM
PPTX
Rとデータベース 第61回 Tokyo.R
by
Takashi Minoda
PDF
[データマイニング+WEB勉強会][R勉強会] はじめてでもわかる 統計解析・データマイニング R言語入門
by
Koichi Hamada
PDF
Intoroduction of Pandas with Python
by
Atsushi Hayakawa
PPTX
RDBのインデックスについて.pptx
by
Tetsuro Nagae
PDF
ICDE 2015 Study (R24-4, R27-3)
by
Masafumi Oyamada
PDF
SIGMOD’12勉強会 -Session 7-
by
Takeshi Yamamuro
PDF
R入門(dplyrでデータ加工)-TokyoR42
by
Atsushi Hayakawa
PDF
データベース08 - 関係データモデルと関係代数
by
Kenta Oku
Tokyo r sqldf
by
Takashi Minoda
経済学のための実践的データ分析 4.SQL ことはじめ
by
Yasushi Hara
Japan.r 2データベース
by
sleipnir002
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
by
yassun7010
Effective DBMS (2018)
by
Kihyun Kim
Spider DeNA Technology Seminar #2
by
Kentoku
About NoSQL
by
hideaki honda
リレーショナルデータベースとの上手な付き合い方 long version
by
Mikiya Okuno
Tokyo r28 1
by
Takashi Minoda
Cassandraとh baseの比較して入門するno sql
by
Yutuki r
Introducing Spider 20101206(DTT#7)
by
Kentoku
TAM 新人ディレクター システムスキルアップ プログラム 第6回 「データベース」
by
(株)TAM
Rとデータベース 第61回 Tokyo.R
by
Takashi Minoda
[データマイニング+WEB勉強会][R勉強会] はじめてでもわかる 統計解析・データマイニング R言語入門
by
Koichi Hamada
Intoroduction of Pandas with Python
by
Atsushi Hayakawa
RDBのインデックスについて.pptx
by
Tetsuro Nagae
ICDE 2015 Study (R24-4, R27-3)
by
Masafumi Oyamada
SIGMOD’12勉強会 -Session 7-
by
Takeshi Yamamuro
R入門(dplyrでデータ加工)-TokyoR42
by
Atsushi Hayakawa
データベース08 - 関係データモデルと関係代数
by
Kenta Oku
More from Hidekazu Tanaka
KEY
ggplot2 に入門してみた
by
Hidekazu Tanaka
KEY
フォントのお話
by
Hidekazu Tanaka
KEY
フォントのお話
by
Hidekazu Tanaka
KEY
バギングで構築された各決定木
by
Hidekazu Tanaka
KEY
アンサンブル学習
by
Hidekazu Tanaka
KEY
RHadoop の紹介
by
Hidekazu Tanaka
KEY
Rの紹介
by
Hidekazu Tanaka
KEY
Rで解く最適化問題 線型計画問題編
by
Hidekazu Tanaka
KEY
R meets Hadoop
by
Hidekazu Tanaka
PDF
RでMapreduce
by
Hidekazu Tanaka
PDF
Rによるやさしい統計学 第16章 : 因子分析
by
Hidekazu Tanaka
ggplot2 に入門してみた
by
Hidekazu Tanaka
フォントのお話
by
Hidekazu Tanaka
フォントのお話
by
Hidekazu Tanaka
バギングで構築された各決定木
by
Hidekazu Tanaka
アンサンブル学習
by
Hidekazu Tanaka
RHadoop の紹介
by
Hidekazu Tanaka
Rの紹介
by
Hidekazu Tanaka
Rで解く最適化問題 線型計画問題編
by
Hidekazu Tanaka
R meets Hadoop
by
Hidekazu Tanaka
RでMapreduce
by
Hidekazu Tanaka
Rによるやさしい統計学 第16章 : 因子分析
by
Hidekazu Tanaka
データベースのお話
1.
データベースのお話 2012.07.07 Tokyo.R
#24 by @holidayworking
2.
自己紹介 • Hidekazu Tanaka •
システムエンジニア • 好きなもの • T-SQUARE • F1
3.
Rを使っていると
4.
こんな経験がありますよね?
5.
ファイルがたくさん
6.
どのファイルにデータが あるのか分からない
7.
そんな人に今回紹介するのは
8.
データベース
9.
データベースとは? • 大量のデータを一定の規則に従って蓄積し、一元 的に管理できるようにしたもの •
データベースを構築することによって、データの 重複や散逸を防ぎ、ある項目に着目して特定の データを抽出するといった、効率的なデータ利用 が可能になる
10.
データモデル • データベースに格納するデータをどのように配置 するか理論的・物理的な側面から規定するもの •
代表的なデータモデル • 階層型データモデル • ネットワーク型データモデル • 関係モデル • オブジェクトデータモデル
11.
データモデル • データベースに格納するデータをどのように配置 するか理論的・物理的な側面から規定するもの •
代表的なデータモデル • 階層型データモデル • ネットワーク型データモデル • 関係モデル • オブジェクトデータモデル
12.
関係モデル • E.F.Codd が集合論と述語理論に基づいて考案し
たモデル • 基本的な前提は、あらゆるデータは n 項の関係で 表現されるということ • 詳細は Wikipedia で!!
13.
RDBMS • 関係モデルに基づいて設計されたデータが格納さ れ、管理されるシステムのこと •
データは2次元の表として格納し、データ間の関連 をデータを使って表現される • データの操作や定義を行うためには SQL と呼ば れる言語を使うのが一般的
14.
RDBMS • 商用、オープンソースを含め様々な実装が存在 •
Oracle Database • Microsoft SQL Server • MySQL • PostgreSQL • SQLite
15.
SQL • RDBMS において、データの操作や定義を行うた
めの問い合わせ言語 • ISO で言語仕様の標準化が行われているため、異 なる RDBMS でも同じように使うことができる • 標準規格の対応の程度は RDBMS によって異な ることがあるため、特定の RDBMS では使えな い構文もあることもある
16.
SQL • DDL :
Data Definition Language • CREATE • DROP • ALTER • TRUNCATE
17.
SQL • DML :
Data Manipulation Language • SELECT • INSERT • UPDATE • DELETE
18.
Rから操作する方法 • R から
RDBMS を操作する方法は2種類存在 • RODBC パッケージ • DBI パッケージ
19.
RODBC パッケージ • ODBC
で RDBMS を操作するパッケージ • ODBC : Open Database Connectivity • Microsoft が提案した RDBMS にアクセス するための共通インターフェイス • Windows 環境で利用されることが多い • Windows で R を使っている場合は、このパッ ケージを使ったほうが良い
20.
DBI パッケージ • R
から RDBMS を操作するためのインターフェ イスを定義したパッケージ • RDBMS に対応したパッケージのインストールが 必要 • Mac OS X や Linux を使っている場合は、この パッケージを使ったほうが良い
21.
ドライバパッケージ • RMySQL • RPostgreSQL •
RSQLite • ROracle • RJDBC
22.
RDBMS への接続方法 # 接続 >
conn <- dbConnect(MySQL(), host = "localhost", user = "scott", password = "tiger", dbname = "ellison") # 接続情報の確認 > summary(conn) <MySQLConnection:(49423,0)> User: scott Host: localhost Dbname: ellison Connection type: localhost via TCP/IP No resultSet available # 切断 > dbDisconnect(conn)
23.
簡単な使用方法 # データフレームをテーブルに保存 > dbWriteTable(conn,
name="iris", value=iris) [1] TRUE # テーブルからデータフレームを作成 > data <- dbReadTable(conn, name="iris") > head(data) Sepal_Length Sepal_Width Petal_Length Petal_Width Species 1 5.1 3.5 1.4 0.2 setosa 2 4.9 3.0 1.4 0.2 setosa 3 4.7 3.2 1.3 0.2 setosa 4 4.6 3.1 1.5 0.2 setosa 5 5.0 3.6 1.4 0.2 setosa 6 5.4 3.9 1.7 0.4 setosa # テーブルの削除 > dbRemoveTable(conn, name="iris") [1] TRUE
24.
SQLの使用方法 # dbGetQuery 関数を使う方法 >
data <- dbGetQuery(conn, "select * from quakes") > dim(data) [1] 1000 6 # 大規模なデータを扱う場合は、クエリを分割して取得する dbSendQuery を使うのが安全 > rs <- dbSendQuery(conn, "select * from quakes") > data <- fetch(rs) > dim(data) [1] 500 6 # 残りの結果を全て取得 > data <- fetch(rs, n=-1) > dim(data) [1] 500 6 # 全て取得されているか > dbHasCompleted(rs) [1] TRUE
25.
実践編 • R と
RDBMS を組み合わせの例としてテキスト マイニングをやってみます • 「Rによるテキストマイニング入門」の第9章のテ キスト分類 • 上記の本では新聞記事をファイルに保存し解析し ているが、今回は RDBMS に保存し解析をする
26.
新聞記事収集スクリプト • 某新聞の RSS
から記事を取得、RDBMS に保存 • 収集スクリプトは Ruby で実装 • スクリプトは GitHub で公開 • http://github.com/holidayworking/ sankei
27.
テーブル構成
28.
テキスト分類 # 記事の取得 > news
<- dbGetQuery(conn, "select news.id, news.title, news.content, categories.name as category from news inner join categories on news.category_id = categories.id order by news.id") # ターム・文書行列の作成 > library(RMeCab) > res <- docMatrixDF(news[,"content"], pos=c("名詞","動詞","形容詞")) # クラスター分析 > hc <- hclust(dist(t(res))) > library(ggdendro) # デンドログラムの作成 > hcdata <- dendro_data(hc) > ggplot() + geom_segment(data=segment(hcdata), aes(x, y, xend=xend, yend=yend)) + geom_text(data=label(hcdata), aes(x, y, label=label, hjust=0), size=3) +coord_flip() + scale_y_reverse(expand=c(0.2, 0))
Editor's Notes
#2
\n
#3
\n
#4
\n
#5
\n
#6
\n
#7
\n
#8
\n
#9
\n
#10
\n
#11
\n
#12
\n
#13
\n
#14
\n
#15
\n
#16
\n
#17
\n
#18
\n
#19
\n
#20
\n
#21
\n
#22
\n
#23
\n
#24
\n
#25
\n
#26
\n
#27
\n
#28
\n
#29
\n
#30
\n
Download