Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
Ikki Ohmukai
PDF, PPTX
7,221 views
学術コンテンツサービスでの活用事例@Lucene/Solr勉強会(2015.5.13)
学術コンテンツサービスでの活用事例@Lucene/Solr勉強会(2015.5.13)
Internet
◦
Read more
11
Save
Share
Embed
Embed presentation
Download
Download as PDF, PPTX
1
/ 26
2
/ 26
3
/ 26
4
/ 26
5
/ 26
6
/ 26
7
/ 26
8
/ 26
9
/ 26
10
/ 26
11
/ 26
12
/ 26
13
/ 26
14
/ 26
15
/ 26
16
/ 26
17
/ 26
18
/ 26
19
/ 26
20
/ 26
21
/ 26
22
/ 26
23
/ 26
24
/ 26
25
/ 26
26
/ 26
More Related Content
PPTX
つながる目録、つながるサービス@図書館総合展(2015.11.12)
by
Ikki Ohmukai
PDF
オープンデータをつかう図書館、オープンデータをつくる図書館(完全版)@京都図書館大会(2015.8.17)
by
Ikki Ohmukai
PPTX
ビジネスで使えるオープンデータの技術@ビジネス活用のためのオープンデータセミナー(2016.01.22)
by
Ikki Ohmukai
PDF
オープンデータをつかう図書館、オープンデータをつくる図書館@京都図書館大会(2015.8.17)
by
Ikki Ohmukai
PPTX
2016年10月、神戸に LODの国際会議がやってくる!@神戸ITフェスティバル2015(2015.11.6)
by
Ikki Ohmukai
PPTX
図書館とLinked Open Data@大学図書館問題研究会全国大会(2014.8.24)
by
Ikki Ohmukai
PPTX
国立情報学研究所のオープンデータに関する取り組み@図書館総合展(2013.10.30)
by
Ikki Ohmukai
PDF
Linked Open Data入門@関西オープンデータEXPO(2015.2.11)
by
Ikki Ohmukai
つながる目録、つながるサービス@図書館総合展(2015.11.12)
by
Ikki Ohmukai
オープンデータをつかう図書館、オープンデータをつくる図書館(完全版)@京都図書館大会(2015.8.17)
by
Ikki Ohmukai
ビジネスで使えるオープンデータの技術@ビジネス活用のためのオープンデータセミナー(2016.01.22)
by
Ikki Ohmukai
オープンデータをつかう図書館、オープンデータをつくる図書館@京都図書館大会(2015.8.17)
by
Ikki Ohmukai
2016年10月、神戸に LODの国際会議がやってくる!@神戸ITフェスティバル2015(2015.11.6)
by
Ikki Ohmukai
図書館とLinked Open Data@大学図書館問題研究会全国大会(2014.8.24)
by
Ikki Ohmukai
国立情報学研究所のオープンデータに関する取り組み@図書館総合展(2013.10.30)
by
Ikki Ohmukai
Linked Open Data入門@関西オープンデータEXPO(2015.2.11)
by
Ikki Ohmukai
What's hot
PDF
ウィキペディアを介してまちと図書館をつなぐ試み「ウィキペディア・タウン」
by
Iwao KOBAYASHI
PDF
オープンデータ×データビジュアライズ〜地域課題を可視化するためのヒント〜
by
Iwao KOBAYASHI
PDF
オープンデータ技術概論〜オープンデータからLinked Open Dataへ〜
by
Iwao KOBAYASHI
PDF
自治体広報誌ネクストステップ
by
Iwao KOBAYASHI
PDF
オープンデータで起業するためのヒント
by
Iwao KOBAYASHI
PDF
ウィキペディアタウン: 市民による地域情報化の一手法
by
Fumihiro Kato
PDF
LODチャレンジのご紹介
by
Linked Open Dataチャレンジ実行委員会
PDF
シビックテック: インターネット時代の市民と行政の協働
by
Fumihiro Kato
PDF
ボトムアップで進む横浜のオープンデータ
by
Iwao KOBAYASHI
PPTX
オープンデータ推進の課題とポイント
by
National Institute of Informatics (NII)
PDF
Welcome to opendata world
by
Nobuo Kawaguchi
PPTX
なぜ5つ星オープンデータなのか ー リンクトオープンデータとオープンガバメント
by
Toru Takahashi
PDF
文化機関×オープンデータ
by
Iwao KOBAYASHI
PDF
Wikidata Edit-a-thon -Wikidataを編集してみよう!-
by
Kouji Kozaki
PDF
ともに考え、ともにつくる社会 オープンガバメントシンポジウム in 東京大学公共政策大学院
by
Hal Seki
PDF
行政と市民によるオープンデータ共創支援プラットフォーム LinkData.org
by
Sayoko Shimoyama
PDF
Osc2013北海道 opendata trend
by
Kentaro Hatori
PDF
LODとメディア ニューヨークタイムズ最新事情
by
Linked Open Dataチャレンジ実行委員会
PPTX
Review of International Open Data Day 2014 in Kyoto - OKFJ Open Data Talk 9
by
Toru Takahashi
PDF
オープンデータの広がりと今後の課題ー関西での活動を中心にー
by
Kouji Kozaki
ウィキペディアを介してまちと図書館をつなぐ試み「ウィキペディア・タウン」
by
Iwao KOBAYASHI
オープンデータ×データビジュアライズ〜地域課題を可視化するためのヒント〜
by
Iwao KOBAYASHI
オープンデータ技術概論〜オープンデータからLinked Open Dataへ〜
by
Iwao KOBAYASHI
自治体広報誌ネクストステップ
by
Iwao KOBAYASHI
オープンデータで起業するためのヒント
by
Iwao KOBAYASHI
ウィキペディアタウン: 市民による地域情報化の一手法
by
Fumihiro Kato
LODチャレンジのご紹介
by
Linked Open Dataチャレンジ実行委員会
シビックテック: インターネット時代の市民と行政の協働
by
Fumihiro Kato
ボトムアップで進む横浜のオープンデータ
by
Iwao KOBAYASHI
オープンデータ推進の課題とポイント
by
National Institute of Informatics (NII)
Welcome to opendata world
by
Nobuo Kawaguchi
なぜ5つ星オープンデータなのか ー リンクトオープンデータとオープンガバメント
by
Toru Takahashi
文化機関×オープンデータ
by
Iwao KOBAYASHI
Wikidata Edit-a-thon -Wikidataを編集してみよう!-
by
Kouji Kozaki
ともに考え、ともにつくる社会 オープンガバメントシンポジウム in 東京大学公共政策大学院
by
Hal Seki
行政と市民によるオープンデータ共創支援プラットフォーム LinkData.org
by
Sayoko Shimoyama
Osc2013北海道 opendata trend
by
Kentaro Hatori
LODとメディア ニューヨークタイムズ最新事情
by
Linked Open Dataチャレンジ実行委員会
Review of International Open Data Day 2014 in Kyoto - OKFJ Open Data Talk 9
by
Toru Takahashi
オープンデータの広がりと今後の課題ー関西での活動を中心にー
by
Kouji Kozaki
Similar to 学術コンテンツサービスでの活用事例@Lucene/Solr勉強会(2015.5.13)
PDF
学術情報システムの終わりとアカデミック・ワンダーランド 公開用
by
Taro misumi
PPTX
災害と知識インフラ@神戸高専産学官技術フォーラム(2013.11.20)
by
Ikki Ohmukai
PPTX
CiNii Booksに見る学術情報サービスの理想と現実@ku-librarians勉強会(2012.07.13)
by
Ikki Ohmukai
PDF
Esd21(20101002)
by
真 岡本
PDF
050830 openforum
by
Ikki Ohmukai
PPTX
知識インフラの本質と「未来の」ライブラリアンへの期待(2017.4.22)
by
Ikki Ohmukai
PPTX
Infosta実習 発表ver
by
skdmai
PDF
Organizing of Information Resources = 情報資源組織論.12
by
Hakudou Fukuda
PPTX
図書館データとLinked Open Data@国立国会図書館データベースフォーラム(2013.10.16)
by
Ikki Ohmukai
PDF
図書館総合展ネクスト主催フォーラム「アカデミックとリアルの谷を埋める道」基調講演 2011年11月11日
by
Yoji Kiyota
PPTX
司書セミナー@大阪府立中央図書館(プレゼン用・確認済み)
by
YoshiYuki Kanematsu
PDF
Infosta(20110121)
by
真 岡本
PDF
マイニング探検会#04
by
Yoji Kiyota
PPTX
土屋先生の還暦を祝う会
by
NPO CCC-TIES
PDF
20100801_図書館情報学若手の会(ALIS)第二回定例会
by
Tomomi Mitsuishi
PDF
20090827 ku-librarians勉強会 #114 : Wikipediaをいかに使いこなすか? ---知識抽出、情報ナビゲーション、そしてトピ...
by
kulibrarians
PDF
Ksws3rd nagao keynote(20101218)
by
真 岡本
PDF
AkitaLib(20111209)
by
真 岡本
PPT
2 i4
by
Takafumi Nakanishi
PPTX
オープンデータと「つながる社会」@オープンデータ京都勉強会(2013.04.20)
by
Ikki Ohmukai
学術情報システムの終わりとアカデミック・ワンダーランド 公開用
by
Taro misumi
災害と知識インフラ@神戸高専産学官技術フォーラム(2013.11.20)
by
Ikki Ohmukai
CiNii Booksに見る学術情報サービスの理想と現実@ku-librarians勉強会(2012.07.13)
by
Ikki Ohmukai
Esd21(20101002)
by
真 岡本
050830 openforum
by
Ikki Ohmukai
知識インフラの本質と「未来の」ライブラリアンへの期待(2017.4.22)
by
Ikki Ohmukai
Infosta実習 発表ver
by
skdmai
Organizing of Information Resources = 情報資源組織論.12
by
Hakudou Fukuda
図書館データとLinked Open Data@国立国会図書館データベースフォーラム(2013.10.16)
by
Ikki Ohmukai
図書館総合展ネクスト主催フォーラム「アカデミックとリアルの谷を埋める道」基調講演 2011年11月11日
by
Yoji Kiyota
司書セミナー@大阪府立中央図書館(プレゼン用・確認済み)
by
YoshiYuki Kanematsu
Infosta(20110121)
by
真 岡本
マイニング探検会#04
by
Yoji Kiyota
土屋先生の還暦を祝う会
by
NPO CCC-TIES
20100801_図書館情報学若手の会(ALIS)第二回定例会
by
Tomomi Mitsuishi
20090827 ku-librarians勉強会 #114 : Wikipediaをいかに使いこなすか? ---知識抽出、情報ナビゲーション、そしてトピ...
by
kulibrarians
Ksws3rd nagao keynote(20101218)
by
真 岡本
AkitaLib(20111209)
by
真 岡本
2 i4
by
Takafumi Nakanishi
オープンデータと「つながる社会」@オープンデータ京都勉強会(2013.04.20)
by
Ikki Ohmukai
More from Ikki Ohmukai
PPTX
CiNii Researchと大学図書館(2018.6.18)
by
Ikki Ohmukai
PPTX
情報の構造化@Linked Open Data連続講座(2014.6.2)
by
Ikki Ohmukai
PPTX
オープンデータとLinked Open Data@筑波大学研究談話会(2013.12.18)
by
Ikki Ohmukai
PPTX
オープンデータとは@芸術・文化情報とオープンデータ(2013.11.28)
by
Ikki Ohmukai
PPTX
地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)
by
Ikki Ohmukai
PPTX
CiNiiのメタデータ・デザイン@LinkedData勉強会(2012.01.18)
by
Ikki Ohmukai
PPT
セマンティック・ウェブと学術情報サービス@国立国会図書館講演会(2010.07.27)
by
Ikki Ohmukai
CiNii Researchと大学図書館(2018.6.18)
by
Ikki Ohmukai
情報の構造化@Linked Open Data連続講座(2014.6.2)
by
Ikki Ohmukai
オープンデータとLinked Open Data@筑波大学研究談話会(2013.12.18)
by
Ikki Ohmukai
オープンデータとは@芸術・文化情報とオープンデータ(2013.11.28)
by
Ikki Ohmukai
地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)
by
Ikki Ohmukai
CiNiiのメタデータ・デザイン@LinkedData勉強会(2012.01.18)
by
Ikki Ohmukai
セマンティック・ウェブと学術情報サービス@国立国会図書館講演会(2010.07.27)
by
Ikki Ohmukai
学術コンテンツサービスでの活用事例@Lucene/Solr勉強会(2015.5.13)
1.
学術コンテンツサービスでの活用事例 国立情報学研究所 大向 一輝 @i2k
2.
自己紹介 • 対象 • ソーシャルメディア:ブログ・SNS・Twitter… •
学術情報サービス・ビブリオメトリクス • 技術 • セマンティックウェブ・Linked Open Data(LOD) • ネットワーク分析・データマイニング • クラウドソーシング • オープンデータ • 内閣官房 電子行政オープンデータ実務者会議 公開支援WG • 経済産業省 IT融合フォーラム 公共データWG • オープン&ビッグデータ活用・地方創生推進機構 利活用・普及委員会 • NPOリンクト・オープン・データ・イニシアティブ
3.
自己紹介
4.
国立情報学研究所(NII)
5.
NIIの2つのミッション 学術基盤推進部 「研究と事業を車の両輪として情報学による未来価値を創成」
6.
NIIの略史 年 月 事 項 昭和51(1976)年5月 東京大学情報図書館学研究センター発足 昭和58(1983)年4月 東京大学文献情報センター設置(情報図書館学研究 センターを改組) 昭和61(1986)年4月
学術情報センター(NACSIS)設置 平成12(2000)年4月 国立情報学研究所(NII)設置(学術情報センターの 廃止・転換) 平成16(2004)年4月 大学共同利用機関法人 情報・システム研究機構 国立情報学研究所設置
7.
図書館文化と検索技術 • 少なくとも2000年以上の歴史 • 大量の情報を「探す」「見つける」不変のミッション •
コンピュータ以前の検索 • 冊子体目録(カタログ) • カード目録 • 1960s∼:電算化とOPAC • 専門技能としての検索 • 厳密な記述規則と組織化 • 教育システム 出典:ndl.go.jp
9.
図書館文化と検索技術 • 形態素解析?N-Gram? • 分かち書き •
分かち書きは、検索語となる自立語を対象とする。日 本語の場合は、日本語として不自然でない意味のまと まりで分かち書きを行う。 • 例外多数 • 地名に付属する「史」「誌」は地名との複合形をもっ て一語とする。また、地名に行政単位等を示す語が付 属する場合は、行政単位等を示す語と「史」「誌」と の複合形をもって一語とし、地名を分割する。 • 例:日本史 仙台史 愛知△県史
10.
図書館文化と検索技術 • かな漢字変換? • 読みの付与 •
ウェブらしさを考える本 • →ウェブ△ラシサ△ヲ△カンガエル△ホン • 三國志 • →サンゴクシ?san guo zhi? • 多言語対応 • 翻字と包摂 • ß→ss Д→d 谷→穀 • ローマ字入力:ヘボン式?訓令式?
11.
包摂の例
12.
図書館文化と検索技術 • 各言語の取り扱いは国ごと・言語圏ごとに大きく異なる • グローバルに1つの検索エンジンは可能か? •
初学者の存在 • 文化受容の歴史(和製英語・和製漢語) • 大学図書館・研究図書館における再現率の重視 • 引用・被引用関係に基づく確からしさの評価 • 見逃しは許されない • 情報システムとしての要求の変化 • 専門家のための道具から一般向けのサービスへ • インターネット・ウェブ
13.
NIIの学術コンテンツサービス 論文 CiNii Articles NII-ELS /
REO 図書・雑誌 CiNii Books NACSIS-CAT 報告書 KAKEN 機関リポジトリ JAIRO JAIRO Cloud
14.
2つのCiNii 1800万件の 日本語論文データを検索 800万件はダウンロード可能 大学図書館1200館の 1100万種類・1億2000万冊の 本のデータを検索 Articles Books
15.
Articles Books
16.
Articles API Books API OpenSearch 100,946,269 RDF 182,235,701 OpenSearch 9,902,483 RDF 8,512,362
17.
2つ(3つ)のCiNii • CiNiiArticles(2009∼)論文 • 検索エンジン:某社某パッケージ+Solr •
DB:PostgreSQL • CiNii Books(2011∼)図書 • 検索エンジン:Solr • DB:MySQL • CiNii Dissertations(2015∼)博士論文 • 検索・DB:ElasticSearch • UI/UXは統一、中身は別物 • データ構造の違い・潜在的ユーザ数の違い(A>>B>>D) • 適材適所の技術導入・楽しく開発!
18.
CiNii BooksとSolr • Articlesは2007年仕様策定、当時はOSS採用への抵抗感あり •
Booksは2009年開発開始、事例の増加と商用パッケージはエ ンタープライズ検索に特化傾向 • 図書館文化との親和性 • 多言語が同一フィールドに混在する • アルファベットはスペース区切り、他の文字はN-Gram としたい→CJKTokenizerの拡張 • 漢字統合を含む多段的な包摂・正規化処理が必要 • 業務で作られたルールセットをそのまま利用可能に • https://github.com/atware/lucene-tokenizers-for-multilang • ルールセットは未公開…
19.
CiNii BooksとSolr • 搭載データ •
書誌:11,055,402 • 著者:1,656,648 • 週次で全件を再投入(業務プロセス簡略化のため) • 安定稼働 • リリース以来Solr起因のトラブルは皆無 • 法定停電時はパブリッククラウドでサービス継続 • 継続的課題 • スケーラビリティ:大ヒットしてもコストがかけられない • 可用性:3.11の教訓・お役所的勤務体系 • ElasticSearchのテスト・KAKEN/SEIKAの挑戦
21.
KAKEN/SEIKA • KAKEN:科学研究費補助金の成果報告書データベース • 年間2000億円超の研究費の説明責任と成果のショーケース •
研究費獲得のための先行研究調査 • データ:課題78万件・報告書138万件 • アクセス:検索400万・詳細表示2200万・PDFダウン ロード80万 • 要求の変化 • 毎年変更される分類体系への追従 • 他省庁の補助金制度への対応 • 現行システムはHyper Estraier+MySQL • スケーラビリティ・可用性
22.
科研費の細目
25.
新KAKEN/SEIKA • Riakベース • 分散KVS •
分類体系の変更に追従しやすい • スケーラビリティ・可用性への配慮 • Version 2.0から検索エンジンにSolrを採用 • 疎結合のアーキテクチャにより責任分界とメンテナン スが容易 • Solrコミュニティの成果を生かしやすい • 10月リリース予定
26.
まとめ • 図書館文化と検索技術 • ウェブの母体 •
自然言語処理と意味処理の融合体 • 確率モデルとグラフモデルによる次世代の検索へ
Download