Lucene Connector Framework(Lcf)

1,854
-1

Published on

Published in: Technology
0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
1,854
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
20
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

Lucene Connector Framework(Lcf)

  1. 1. LCFLuceneConnector Framework<br />株式会社 ロンウイット<br />RONDHUITCo., Ltd. ;Professional Search Engine Consulting Services for Lucene/Solr <br />アッタチョー トウンポン<br />ATTACHOT Tuangphon<br />Copyright (c) 2006-2010 RONDHUIT Co., Ltd. All Rights Reserved.<br />
  2. 2. Contents<br />Abstract<br />Introduction to LCF<br />Existing Connectors and Authorities<br />Key Points<br />Why LCF<br />Contribution<br />Copyright (c) 2006-2010 RONDHUIT Co., Ltd. All Rights Reserved.<br />
  3. 3. Abstract<br />Connector Frameworkは、5年近くMetaCarta Search Applianceとして開発され、使われてきた  <br />開発担当者は、Karl Wright<br />2010年1月12日に Lucene Connector Framework としてリリースされた<br />LCFはIncubatorプロジェクトを通して、公式にApache Software Foundationの一つのプロジェクトとして活動を行う<br />Copyright (c) 2006-2010 RONDHUIT Co., Ltd. All Rights Reserved.<br />
  4. 4. (参考)Apache Incubator<br />Incubatorプロジェクトとは、<br />外部企業や既存の外部プロジェクトがApache Software Foundationの一部として活動を展開していく為の入口である。<br />Apache Software Foundation<br />外部プロジェクト<br />Incubator<br />Solr<br />
  5. 5. (参考)Incubatorの役割<br />Apache Software Foundationのやり方に沿った新しいコミュニティを開発していくという役割<br />すべての寄贈がApache Software Foundationの法的基準に従っていることを保証するという役割<br />SolrでもIncubatorを通してApache Software Foundationに入った。<br />
  6. 6. Introduction to LCF<br />Connector Framework とは<br />  企業のレポジトリーに置かれたデータに<br />アクセスするSearch Engine/他のツールの為のフレームワークである<br />  <br />Lucene/Tools<br />LCF<br />企業のレポジトリー<br />Copyright (c) 2006-2010 RONDHUIT Co., Ltd. All Rights Reserved.<br />
  7. 7. Introduction to LCF<br />   フレームワークに問題を抽象化することにより、アプリケーションは、明確なインタフェースのセットにコード化することができる<br />Repo<br />Repo<br />Repo<br />Repo<br />Repo<br />Repo<br />Connector<br />Framework<br />Interface<br />Interface<br />Interface<br />Application<br />Application<br />Copyright (c) 2006-2010 RONDHUIT Co., Ltd. All Rights Reserved.<br />
  8. 8. Introduction to LCF<br />Connector Frameworkとは<br />   拡張可能な増分クローラーであり、構成とクロール履歴を管理する為にデータベースを使用する<br />   インデクシングを目的として、複数のレポジトリーにアクセスできる<br />LCF<br />企業のレポジトリー<br />Copyright (c) 2006-2010 RONDHUIT Co., Ltd. All Rights Reserved.<br />
  9. 9. Introduction to LCF<br />Connector Frameworkとは<br />   さらに、ユーザーのアイデンティティに基づいたレポジトリーコンテンツにユーザーの検索アクセスを制限できるようにレポジトリーごとのセキュリティモデルを確立する<br />セキュリティモデル<br />LCF<br />Repo1<br />Index<br />セキュリティモデル<br />Repo2<br />Copyright (c) 2006-2010 RONDHUIT Co., Ltd. All Rights Reserved.<br />
  10. 10. Existing Connectors & Authorities<br />Connector Frameworkは<br /> 多くのシステムの為にConnectorsとAuthoritiesをサポートしている。<br />File system<br />Windows shares<br />JDBC-supported databases<br />RSS feeds<br />General websites<br />LiveLink (From OpenText)<br />Copyright (c) 2006-2010 RONDHUIT Co., Ltd. All Rights Reserved.<br />
  11. 11. Existing Connectors & Authorities<br />Connector Frameworkは<br /> 多くのシステムの為にConnectorsとAuthoritiesをサポートしている。<br />Documentum (From EMC)<br />SharePoint (From Microsoft)<br />Meridio (From Meridio)<br />Memex (From Memex)<br />FileNet (From IBM)<br />Copyright (c) 2006-2010 RONDHUIT Co., Ltd. All Rights Reserved.<br />
  12. 12. Key Points<br />拡張性<br /><ul><li>新しいレポジトリーに新しいConnectorが追加できる機能
  13. 13. レポジトリーごとのセキュリティモデルに新しいAuthorityが追加できる機能</li></ul>Copyright (c) 2006-2010 RONDHUIT Co., Ltd. All Rights Reserved.<br />
  14. 14. Key Points<br />増分性<br /><ul><li>レポジトリーごとの作法において</li></ul> クローラースケジュール間に変更した物だけを処理する機能<br />レポジトリー<br />Word<br />Word<br />PowerPoint<br />Excel<br />Excel<br />クローラー<br />新しく作ったPowerPointのみを処理する<br />
  15. 15. Key Points<br />再起動性<br /><ul><li>処理中、プロセス中断またはマシンシャットダウン等が起きても再開できるように、データベースを使用する</li></ul>セキュリティ<br /><ul><li>Search Engineがレポジトリーのセキュリティモデルを継承できるようにするセキュリティトークンのモデルを確立する</li></ul>Copyright (c) 2006-2010 RONDHUIT Co., Ltd. All Rights Reserved.<br />
  16. 16. Key Points<br />省メモリ<br /><ul><li>構成を問わず、限られたプロセスメモリーで確実に動作する機能</li></ul>性能<br /><ul><li>全体の効率を最大化する為のコネクタ用の資源(HDD,Memory,CPU)を管理する機能</li></ul>透明性<br /><ul><li>全てのクローラーの活動とレポジトリー接続に関するレポートを生成する機能</li></ul>Copyright (c) 2006-2010 RONDHUIT Co., Ltd. All Rights Reserved.<br />
  17. 17. Why LCF!<br />LCFは・・・<br />Lucene, Solr, Nutch, Mahout, Tika等のレポジトリーに接続することが 簡単<br />オープンソース化することにより、<br />  1. ソフトウェアの品質を向上させる<br />  2. 維持する為のコストを減らすことができる<br />Copyright (c) 2006-2010 RONDHUIT Co., Ltd. All Rights Reserved.<br />
  18. 18. Contribution<br />詳しくは、ここに参考してください<br />Mailing lists <br />http://incubator.apache.org/connectors/mail.html<br />参考サイト <br />http://cwiki.apache.org/confluence/display/CONNECTORS/HowToContribute<br />Copyright (c) 2006-2010 RONDHUIT Co., Ltd. All Rights Reserved.<br />
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×