Successfully reported this slideshow.
Your SlideShare is downloading. ×

青空文庫構成管理サーバー現状報告

Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad

Check these out next

1 of 20 Ad

More Related Content

Slideshows for you (14)

Similar to 青空文庫構成管理サーバー現状報告 (15)

Advertisement

Recently uploaded (20)

青空文庫構成管理サーバー現状報告

  1. 1. データベースサーバ 現状報告 2015/05/30 @シナジーカフェ GMO YOURS 1
  2. 2. 誰? 名前:宇谷有史 ID:@gennei 出身:鳥取の左側 趣味:読書 仕事:エンジニアの端くれ 言語:Python, C#, Ruby 2
  3. 3. 論文 3
  4. 4. 運行情報 4
  5. 5. 参加する きっかけ 5
  6. 6. きっかけ •青空文庫の現状説明を聞いて • エンジニアなしで5台のサーバーを運用 • DBサーバーが止まるとこれまでの青空文庫の 資産がなくなる • エンジニアがいないので探している 6
  7. 7. なぜ参加するのか •読書が好き • 将来青空文庫があってほしい •青空文庫にある資産は消えたら困る • 文化資源として • 研究用資源として 7
  8. 8. データベース サーバーの現状 8
  9. 9. データベースサーバの中身 PostgreSQLだけではない いろいろプログラムは存在している 全貌をつかめていない なので、現在わかっている段階での DBのお話をします 9
  10. 10. サーバーの現状 OS Turbolinux Server 10.0 Database PostgreSQL 8.0.12 PHP version 4.4 10
  11. 11. Database Name Encode 備考 aozora EUC_JP メインで利用されていると思われる aozora2 UTF-8 UNICODE対応した時から 使われていると思われる aozora_test EUC_JP テストなので必要ない? aozora_test2 UTF-8 テストなので必要ない? aozora_test3 UTF-8 テストなので必要ない? 11
  12. 12. Table 18テーブル存在する 10テーブルが作品に関連する情報 3テーブルが著者に関連する情報 残りは青空文庫に協力している方の情報など 本文データはDBに存在しない 12
  13. 13. ER図 13 BookTable FileTable 底本テーブル 人物 ファイル形式 圧縮形式 関連サイト
  14. 14. 以下の機能は使用されていない View PL/pgSQL C言語関数 14
  15. 15. 移行してみた 15
  16. 16. 移行環境 サーバー さくらインターネットVPS OS CentOS6.6 Database PostgreSQL 9.4.1 16
  17. 17. 移行手順 PostgreSQLのダンプツールを使用 1. pg_dumpall > output_file 2. psql template1 < output_file 上記手順でエラーなく取り込みできた 17
  18. 18. phpPgAdmin導入 18
  19. 19. 今後の課題 データベースサーバー 移行に必要なものの洗い出し 移行先の確定 移行を手伝っていただける方の募集 19
  20. 20. ? || /**/ 20

Editor's Notes

  • どんなことをやってきたか
  • 3.11の震災について書いた論文です。
    3.11の震災のために開発されたアプリを収集し、どのようなものが作られたか、どのように作られたかを調査した論文
    これだけ通信インフラが発達した国で大きな災害が起きたことはなかったので海外からも興味を持たれました
  • 震災のときにつくったアプリ
    Twitterの検索ウィジェットを利用して自分が利用する路線が止まっているかどうかつぶやきを見て判断できるようにした。
    それなりにRTされ、初めて会った人に、「あの電車の人ですね」と声をかけられたりしました。

    現在はTwitterのAPIのバージョンアップでうごかなくなってしまったので見ることはできません。
  • 読書が好きなので、自分が未来読みたいと思ったものが登録されていてほしい。
    物理的な本にアクセス出来ないような状況になった時(田舎など)ネットさえあればアクセスできたらうれしいから

    文学研究や自然言語処理などの研究目的としても使用されているため、その人達の研究を手助けできればいいと思っているから。

    あとはコードを書いてよりよい世界になればいいと思っているから
  • OSの最新版は11。2007年に発売
    10.0は2004年に発売されている

    Database
    8.0.12 → 2005年ごろ
    最新版は9.4.2
  • 現在のPostgreSQL内のデータベースです

    5つのデータベースが存在する
    上2つが使わていると推測される。

  • 本文データはhtmlと圧縮ファイルで存在している

×