More Related Content Similar to より読まれるように、より読まれやすく するための技術的サポート
Similar to より読まれるように、より読まれやすく するための技術的サポート (20) More from Yuji Nonaka (18) より読まれるように、より読まれやすく するための技術的サポート8. ログの意味(ログからわかること)ログの意味(ログからわかること)
誰が いつ
133.87.26.171 - - [28/Sep/2009:20:36:28 +0900] "GET
/dspace/handle/2115/34975 HTTP/1 1" 200 14639/dspace/handle/2115/34975 HTTP/1.1 200 14639
"http://ci.nii.ac.jp/naid/110007005996" "Mozilla/5.0 (Windows;
U; Windows NT 5.1; ja; rv:1.9.1.3) Gecko/20090824
Firefox/3.5.3 GTB5 (.NET CLR 3.5.30729)"
どこから何を
Apache combined形式の場合
9. ただしただし
ボ トやク ラ と呼ばれる機械的な ク• ロボットやクローラーと呼ばれる機械的なアク
セスが多い
– 例えばHUSCAPの先月の場合は、Apacheのアク
セスログ中、約75%が機械的アクセス
• ただし、機械的アクセスを特定するのは困難
で完璧は難しい。で完璧は難しい。
極力人間がクリックしたものを抽出• 極力人間がクリックしたものを抽出
– ROATプロジェクト
11. アクセス経路分析(対象コンテンツ)アクセス経路分析(対象コンテンツ)
文献タイプ 言語 アイテム数 日本から 日本以外から
のアクセス のアクセス
雑誌論文 外国語 3,681 1,084 4,213雑誌論文 外国語 3,681 1,084 4,213
日本語 919 4,101 197
紀要 外国語 9,137 1,120 7,867
18 416 51 392 3 195日本語 18,416 51,392 3,195
学位論文 外国語 158 78 258学位論文 外国語 5 5
日本語 223 1,583 113
• 平成22年12月のログから
• 抽出条件等は「野中雄司. “HUSCAPのログ分析:真のアクセスログから”. 機関リポジトリアウトプッ
ト評価プロジェクト合同ワークショップ. 千葉, 2009‐10‐02, 千葉大学他, 2009.」と同様
13. 日本語の紀要論文
(日本からのアクセス)(日本からのアクセス)
JAIRO
1%
その他
サーチエンジン
CiNii
9%
1% 1%
サ チ ンジン
(google)
19007
サーチエンジン
(yahoo)
12750
サ チエンジン 1906
サーチエン
ジンGoogle
9% サーチエンジン 1906
Google Scholar 9474
CiNii 4588ジン
(google)
39%
Google
Scholar
20%
CiNii 4588
JAIRO 393
学術サーチ 162
サ チエン
学術サ チ 162
コミュニティサイト 213
研究者や講座のHP 104
サーチエン
ジン
(yahoo)
サーチエン
ジン(その
研究者や講座のHP 104
wikipedia 90
その他 67
26%
ジン(その
他)
4%
そ 他
ブログ 51
14. OCRは大切!大切
全て
サーチエンジン
経由経由
2008.10‐2009.3 70,440 24,564
2 3倍
2009.10‐2010.3 116,910 57,593
差分(増加分) 46 470 33 029
2.3倍
差分(増加分) 46,470 33,029
• HUSCAPの画像PDFに対して2009年9月に一括してOCR処理を行った。これらのうち、
2008年9月までに登録されたアイテム(21,019アイテム)を対象とし、2008/10~
2009/3までのダウンロード回数と2009/10~2010/3までのダウンロード回数を比
較較したもの。
• 増加分のうちサーチエンジン経由以外のほとんどはCiNiiからのアクセスであり、CiNii
連携を始めたことによる影響である。よって、増加分はほとんどOCR化による影響とと
らえることができるらえることができる
15. 読む人にも最低限の情報を読 人 最低限 情報
• 書誌情報や、バージョンなどをカバーページに記
載することによって、読む人にもやさしく、使いや
すく。すく。
– 特にサーチエンジン経由だと直接PDFダウンロードする
ケースが多いケ スが多い。
– カバーページがないともともと何に掲載されていたも
の(雑誌論文)なのか どこで発表された(学会会議発の(雑誌論文)なのか、どこで発表された(学会会議発
表資料など)ものなのかがわからない。(特に著者稿)
ダウン ドされた後もきちんと出典を表示して安心し– ダウンロードされた後もきちんと出典を表示して安心し
て読んでもらえるように。(HUSCAPカバーページ例、
適用方法(DS ))適用方法(DSpace))
17. 大きくは2つ大きくは2つ
1 サ チ ジ にク されやすく!1. サーチエンジンにクロールされやすく!
2 OAI-PMHのSPにハーベストしてもらう2. OAI PMHのSPにハ ベストしてもらう
• 紀要(電子ジャーナル)であれば紀要(電子ジャ ナル)であれば
– DOIを付与する
– リンクリゾルバのナレッジベースに登録してもらう– リンクリゾルバのナレッジベ スに登録してもらう
– DOAJに登録する
各種デ タベ スに直接リンクをはってもらう– 各種データベースに直接リンクをはってもらう
20. GoogleScholarGoogleScholar
重要!• 重要!
• ぜひ対応すべき
対応方法はDRF iki「G l S h l に採録し• 対応方法はDRF-wiki「Google Scholarに採録し
てもらうために」に記載(DSpace)
– ちなみに、2007年の調査で、国内の研究者がよく利
用する論文検索サービスを聞いたところ Google用する論文検索サービスを聞いたところ、Google
Scholarは、PubMed, WoS, CiNiiに次ぐ第4位の位置
に。(「学術情報の取得動向と電子ジャーナルの利用度に関する調査(電子
ジャ ナル等の利用動向に関する調査2007) 学術図書館研究委員会報告ジャーナル等の利用動向に関する調査2007)」学術図書館研究委員会報告,
2009)
– "PubMed"(34.9 %)、"Web of
K o l dg "(28 1%) "CiNii"(18 3%) "GooglKnowledge"(28.1%) 、"CiNii"(18.3%)、"Google
Scholar"(18.0%)
23. OAI-PMHとは?OAI-PMHとは?
複数リポジトリ デ タを収集し それに基づ• 複数リポジトリのデータを収集し,それに基づ
いたサービスを提供するために開発されたデー
提供 収集 プタ提供・収集用のプロトコル
• Open Archives Initiative によって開発Open Archives Initiative によって開発
– 仕様書(http://www.openarchives.org/OAI/openarchivesprotocol.html)
– 翻訳(http://www.nii.ac.jp/irp/archive/translation/oai-pmh2.0/)
• HTTP通信を使用するため アプリケーションに• HTTP通信を使用するため,アプリケーションに
依存しない
– 詳しくは平成22年度NIIのポータル研修「メタデー
タ概論 資料を参照タ概論」資料を参照
28. モデル比較モデル比較
NACSIS CAT OAI PMHNACSIS-CAT OAI-PMH
共同分担入力
利用者 サービス 利用者共同分担入力
DB
利用者 サ ビス
プロバイダ
利用者
ダウン
ロード
入力
これを実現するのが
OAI-PMH
入力
登録者ローカルDB リポジトリ
登録者
29. OAI-PMHに対応していることを
知ってもらう
• DRF-wikiを参照• DRF wikiを参照
– トップページ左メニュー→リポジトリを育てる→より
使われるために→可視性を高めるために
– OAIデータプロバイダリスト、Registry of Open
Access Repositories (ROAR)、Directory ofAccess Repositories (ROAR)、Directory of
Open Access Repositories (OpenDOAR)、NII学
術機関リポジトリ構築連携支援事業術機関リポジトリ構築連携支援事業
33. HUSCAPのメールの例
Subject: HUSCAPご提供文献の閲覧状況(詳細)(2010‐12)
Date: Sat, 1 Jan 2011 04:04:06 +0900 (JST)
From: Libaray HUSCAP Team <cnt@lib.hokudai.ac.jp>
■ ■先生■ ■先生
謹賀新年 本年もどうぞよろしくお願いいたします。
日頃より附属図書館の事業にご協力頂きまして誠にありがとうございます。
附属図書館では 「北海道大学学術成果 レクシ ン( ) に著作を提供下さ たみなさま 月1回 からのお知らせと閲覧状附属図書館では、「北海道大学学術成果コレクション(HUSCAP)」に著作を提供下さったみなさまへ、月1回、HUSCAPからのお知らせと閲覧状
況をお知らせしています。
============================================================
■ HUSCAPからのお知らせ ■
============================================================
1)Web統計画面に「組織別統計」情報を追加しました!
※中略
============================================================
■ 2010‐12 文献別被閲覧回数 ■
============================================================
#以下のURLからWeb画面上で閲覧回数を確認することもできます。(全期間閲
覧回数や参照元(どこを通 てきたか)等も確認できます )覧回数や参照元(どこを通ってきたか)等も確認できます。)
http://eprints.lib.hokudai.ac.jp/statistics/statslist.php?statsurl=uigwn
※中略
論文名:機関リポジトリへのアクセス経路
4ダウンロード:google.com
2ダウンロード:kiep.go.kr
1ダウンロード:tokynt01.ap.so‐net.ne.jp
1ダウンロード:googlebot.com
1ダウンロード:search msn com