SlideShare a Scribd company logo
1 of 20
データベースサーバ
現状報告
2015/05/30
@シナジーカフェ GMO YOURS
1
誰?
名前:宇谷有史
ID:@gennei
出身:鳥取の左側
趣味:読書
仕事:エンジニアの端くれ
言語:Python, C#, Ruby
2
論文
3
運行情報
4
参加する
きっかけ
5
きっかけ
•青空文庫の現状説明を聞いて
• エンジニアなしで5台のサーバーを運用
• DBサーバーが止まるとこれまでの青空文庫の
資産がなくなる
• エンジニアがいないので探している
6
なぜ参加するのか
•読書が好き
• 将来青空文庫があってほしい
•青空文庫にある資産は消えたら困る
• 文化資源として
• 研究用資源として
7
データベース
サーバーの現状
8
データベースサーバの中身
PostgreSQLだけではない
いろいろプログラムは存在している
全貌をつかめていない
なので、現在わかっている段階での
DBのお話をします
9
サーバーの現状
OS
Turbolinux Server 10.0
Database
PostgreSQL 8.0.12
PHP
version 4.4
10
Database
Name Encode 備考
aozora EUC_JP メインで利用されていると思われる
aozora2 UTF-8 UNICODE対応した時から
使われていると思われる
aozora_test EUC_JP テストなので必要ない?
aozora_test2 UTF-8 テストなので必要ない?
aozora_test3 UTF-8 テストなので必要ない?
11
Table
18テーブル存在する
10テーブルが作品に関連する情報
3テーブルが著者に関連する情報
残りは青空文庫に協力している方の情報など
本文データはDBに存在しない
12
ER図
13
BookTable
FileTable
底本テーブル
人物
ファイル形式
圧縮形式
関連サイト
以下の機能は使用されていない
View
PL/pgSQL
C言語関数
14
移行してみた
15
移行環境
サーバー
さくらインターネットVPS
OS
CentOS6.6
Database
PostgreSQL 9.4.1
16
移行手順
PostgreSQLのダンプツールを使用
1. pg_dumpall > output_file
2. psql template1 < output_file
上記手順でエラーなく取り込みできた
17
phpPgAdmin導入
18
今後の課題
データベースサーバー
移行に必要なものの洗い出し
移行先の確定
移行を手伝っていただける方の募集
19
? || /**/
20

More Related Content

What's hot

坪井創吾さん / "王子様本のRuby1.9対応を調べる"
坪井創吾さん / "王子様本のRuby1.9対応を調べる"坪井創吾さん / "王子様本のRuby1.9対応を調べる"
坪井創吾さん / "王子様本のRuby1.9対応を調べる"
toRuby
 

What's hot (14)

15分で知っとく卒論・修論のための文献収集最終チェック
15分で知っとく卒論・修論のための文献収集最終チェック15分で知っとく卒論・修論のための文献収集最終チェック
15分で知っとく卒論・修論のための文献収集最終チェック
 
15分で解決!ネットにないならILL
15分で解決!ネットにないならILL15分で解決!ネットにないならILL
15分で解決!ネットにないならILL
 
15分でナットク! KULINEから論文検索(2014)
15分でナットク! KULINEから論文検索(2014)15分でナットク! KULINEから論文検索(2014)
15分でナットク! KULINEから論文検索(2014)
 
坪井創吾さん / "王子様本のRuby1.9対応を調べる"
坪井創吾さん / "王子様本のRuby1.9対応を調べる"坪井創吾さん / "王子様本のRuby1.9対応を調べる"
坪井創吾さん / "王子様本のRuby1.9対応を調べる"
 
レポートを書くための文献をあつめよう 2019
レポートを書くための文献をあつめよう 2019レポートを書くための文献をあつめよう 2019
レポートを書くための文献をあつめよう 2019
 
言語学概論9回目
言語学概論9回目言語学概論9回目
言語学概論9回目
 
あみぐるみの歴史
あみぐるみの歴史あみぐるみの歴史
あみぐるみの歴史
 
Rでを作る
Rでを作るRでを作る
Rでを作る
 
よわよわエンジニアがde:code 2020に感化されて新しくコミュニティを立ち上げてみた話
よわよわエンジニアがde:code 2020に感化されて新しくコミュニティを立ち上げてみた話よわよわエンジニアがde:code 2020に感化されて新しくコミュニティを立ち上げてみた話
よわよわエンジニアがde:code 2020に感化されて新しくコミュニティを立ち上げてみた話
 
明解!15分でわかる「京大にない資料」の入手方法
明解!15分でわかる「京大にない資料」の入手方法明解!15分でわかる「京大にない資料」の入手方法
明解!15分でわかる「京大にない資料」の入手方法
 
20101211 #
20101211 #20101211 #
20101211 #
 
お前の逐モン、GETだぜ!
お前の逐モン、GETだぜ!お前の逐モン、GETだぜ!
お前の逐モン、GETだぜ!
 
サト研(仮) とは? - OSC 2013 Fukuoka 勉強会勉強会LT #satoken
サト研(仮) とは? - OSC 2013 Fukuoka 勉強会勉強会LT #satokenサト研(仮) とは? - OSC 2013 Fukuoka 勉強会勉強会LT #satoken
サト研(仮) とは? - OSC 2013 Fukuoka 勉強会勉強会LT #satoken
 
FWW_サイト研究会 (仮) の紹介
FWW_サイト研究会 (仮) の紹介FWW_サイト研究会 (仮) の紹介
FWW_サイト研究会 (仮) の紹介
 

Similar to 青空文庫構成管理サーバー現状報告

グラフデータベース「Neo4j」の 導入の導入
グラフデータベース「Neo4j」の 導入の導入グラフデータベース「Neo4j」の 導入の導入
グラフデータベース「Neo4j」の 導入の導入
Hisao Soyama
 

Similar to 青空文庫構成管理サーバー現状報告 (15)

bottleで始めるWEBアプリの最初の一歩
bottleで始めるWEBアプリの最初の一歩bottleで始めるWEBアプリの最初の一歩
bottleで始めるWEBアプリの最初の一歩
 
WordPress on PHP7 on CentOS7 on Saraku-VPS
WordPress on PHP7 on CentOS7 on Saraku-VPSWordPress on PHP7 on CentOS7 on Saraku-VPS
WordPress on PHP7 on CentOS7 on Saraku-VPS
 
AWSerにも知ってほしいDBの話
AWSerにも知ってほしいDBの話AWSerにも知ってほしいDBの話
AWSerにも知ってほしいDBの話
 
20160416 Azure Data Lakeのはまりどころ
20160416 Azure Data Lakeのはまりどころ20160416 Azure Data Lakeのはまりどころ
20160416 Azure Data Lakeのはまりどころ
 
Database on Kubernetes - HA,Replication and more -
Database on Kubernetes - HA,Replication and more -Database on Kubernetes - HA,Replication and more -
Database on Kubernetes - HA,Replication and more -
 
実践Excelスクレイピング
実践Excelスクレイピング実践Excelスクレイピング
実践Excelスクレイピング
 
なぜか技術書典5で 3サークルの運営を同時にやった話
なぜか技術書典5で 3サークルの運営を同時にやった話なぜか技術書典5で 3サークルの運営を同時にやった話
なぜか技術書典5で 3サークルの運営を同時にやった話
 
趣味でのCosmos DBとの付き合い方
趣味でのCosmos DBとの付き合い方趣味でのCosmos DBとの付き合い方
趣味でのCosmos DBとの付き合い方
 
Goodpatchに生息するbotたち
Goodpatchに生息するbotたちGoodpatchに生息するbotたち
Goodpatchに生息するbotたち
 
ちょっと分かった気になるAzure概要
ちょっと分かった気になるAzure概要ちょっと分かった気になるAzure概要
ちょっと分かった気になるAzure概要
 
ログ勉 Vol.1
ログ勉 Vol.1ログ勉 Vol.1
ログ勉 Vol.1
 
MF GeeksNight pplogの話
MF GeeksNight pplogの話MF GeeksNight pplogの話
MF GeeksNight pplogの話
 
グラフデータベース「Neo4j」の 導入の導入
グラフデータベース「Neo4j」の 導入の導入グラフデータベース「Neo4j」の 導入の導入
グラフデータベース「Neo4j」の 導入の導入
 
クローズドソースから始めるオープンソース
クローズドソースから始めるオープンソースクローズドソースから始めるオープンソース
クローズドソースから始めるオープンソース
 
本気でPythonで宛名書きした話
本気でPythonで宛名書きした話本気でPythonで宛名書きした話
本気でPythonで宛名書きした話
 

Recently uploaded

Recently uploaded (12)

新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 

青空文庫構成管理サーバー現状報告

Editor's Notes

  1. どんなことをやってきたか
  2. 3.11の震災について書いた論文です。 3.11の震災のために開発されたアプリを収集し、どのようなものが作られたか、どのように作られたかを調査した論文 これだけ通信インフラが発達した国で大きな災害が起きたことはなかったので海外からも興味を持たれました
  3. 震災のときにつくったアプリ Twitterの検索ウィジェットを利用して自分が利用する路線が止まっているかどうかつぶやきを見て判断できるようにした。 それなりにRTされ、初めて会った人に、「あの電車の人ですね」と声をかけられたりしました。 現在はTwitterのAPIのバージョンアップでうごかなくなってしまったので見ることはできません。
  4. 読書が好きなので、自分が未来読みたいと思ったものが登録されていてほしい。 物理的な本にアクセス出来ないような状況になった時(田舎など)ネットさえあればアクセスできたらうれしいから 文学研究や自然言語処理などの研究目的としても使用されているため、その人達の研究を手助けできればいいと思っているから。 あとはコードを書いてよりよい世界になればいいと思っているから
  5. OSの最新版は11。2007年に発売 10.0は2004年に発売されている Database 8.0.12 → 2005年ごろ 最新版は9.4.2
  6. 現在のPostgreSQL内のデータベースです 5つのデータベースが存在する 上2つが使わていると推測される。
  7. 本文データはhtmlと圧縮ファイルで存在している