2009年4月8日セミナー 1.オープニング

2,448 views

Published on

2009年4月8日開催のセミナー「Extreme Search! 次世代検索エンジンSedue 24が実現する驚異のパフォーマンス」における、代表取締役社長 西川によるオープニングセッションの配布資料。

Published in: Technology
0 Comments
3 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
2,448
On SlideShare
0
From Embeds
0
Number of Embeds
961
Actions
Shares
0
Downloads
40
Comments
0
Likes
3
Embeds 0
No embeds

No notes for slide

2009年4月8日セミナー 1.オープニング

  1. 1. Sedue 次世代サーチプラットフォーム ミドルウェアとしての検索エンジンと、それを支えるPFIテクノロジー (株)プリファードインフラストラクチャー 代表取締役社長 西川 徹 1 ©2009 Preferred Infrastructure Inc.
  2. 2. 会社紹介とSedueの概要 2 ©2009 Preferred Infrastructure Inc.
  3. 3. 会社概要 社名 株式会社 Preferred Infrastructure (プリファード インフラストラクチャー) 設立 2006年3月 代表者 西川 徹 従業員数 14名 所在地 〒113-0033 東京都文京区本郷7-2-2 本郷ビル10F URL http://preferred.jp/ 事業内容 独自ソフトウェアの開発・販売 検索 推薦(レコメンド) 広告配信 アドネットワークの運営 独自技術を生かした顧客・パートナーとの共同研究・共同開発 3 ©2009 Preferred Infrastructure Inc.
  4. 4. メンバー • 代表取締役社長 西川 徹 – 東京大学情報理工学系研究科コンピュータ科学専攻 – 未踏ソフトウェア創造事業「抽象度の高いハードウェア記述言語」 – 第30回ACM/ICPC世界大会19位 • 最高技術責任者 太田 一樹 – 東京大学情報理工学系研究科コンピュータ科学専攻 – 未踏ソフトウェア創造事業 「組み込み環境向け日本語入力環境」 – 第32回ACM/ICPC世界大会13位 • 特別研究員 岡野原 大輔 – 東京大学情報理工学系研究科コンピュータ科学専攻 – 未踏ソフトウェア創造事業 「単語抽出法による次世代データ圧縮法の開発」 「汎用的データにおける確率的言語モデルの抽出及びその利用」 「文脈を利用した文書分類」(スーパークリエータ認定) • その他、IPA未踏ソフトウェア創造事業、プログラミングコンテスト 世界大会経験者が多数在籍 • アカデミック研究者とシステム開発エンジニアが共に技術を追求 4 ©2009 Preferred Infrastructure Inc.
  5. 5. 会社ビジョン 世の中に必要とされている技術の中でも、特に難しいミッ ションを選び抜き、それに対する解を提供する。 大量のデータをハンドリングする 情報流を把握・制御するための インフラ・システムテクノロジ アルゴリズム・コンセプト 情報の流れを加速する技術 5 ©2009 Preferred Infrastructure Inc.
  6. 6. 全文検索エンジン Sedue(既存バージョン) Sedueエンジンは、弊社のファーストプロダクトであり、 メインストリームプロダクトである。 スケーラブルで高速な分散型全文検索エンジン 圧縮接尾辞配列を利用した世界初の商用検索エンジン インデックスを圧縮し、高速にオンメモリ検索 検索漏れが発生しない リニアなスケールアップ Sunマシン上の検証で128スレッドまで線形にスケール 容易なスケールアウト インデックス作成、検索用ノードを無停止で追加 高い信頼性 カスタマイズ可能なランキング機能 6 ©2009 Preferred Infrastructure Inc.
  7. 7. Sedueが実現するPlatform 7 ©2009 Preferred Infrastructure Inc.
  8. 8. Sedueの実現する方向性 構造的なデータ 大規模データ処理 Enterprise Search データへの アクセシビリティ リアルタイム性 Sedue データベースとの 統合 ログ分析 Web Search 多種多様なデータ フォーマットへの対応 可用性 検索エンジンの概念を汎用化し、RDBMSのようなミドル ウェアとして確立させる 8 ©2009 Preferred Infrastructure Inc.
  9. 9. 汎用的なミドルウェアを目指すために データ・システムに合わせて最適な構成を可能に 柔軟なシステムアーキテクチャを実現するソフトウェア構成 ハードウェアの特性に最適化したインデックスエンジンの開発 文書集合・ユーザーログを扱う様々な用途に対応する 半構造化されたデータへの対応(次セッションで解説) レコメンデーションエンジンとの統合 PFIが所有する各種検索技術の取り込み 9 ©2009 Preferred Infrastructure Inc.
  10. 10. より洗練された検索エンジンアーキテクチャ システムアーキテクチャは、進化するハードウェア・検索手法を柔軟 に導入できるほどよく抽象化・階層化されていなければならない。 分散クエリ Scoring CSA SA N-gram DRAM SSD HDD Sedueスタック システムコンポーネント 10 ©2009 Preferred Infrastructure Inc.
  11. 11. PFIテクノロジとの統合推進 Internet 結果の選択 クエリ入力 インデクシング 検索 スコアリング 全コンテンツ インデックス 検索結果候補 検索結果ページ 11 ©2009 Preferred Infrastructure Inc.
  12. 12. PFIテクノロジとの統合推進 Internet 結果の選択 クエリ入力 インデクシング 検索 スコアリング 全コンテンツ インデックス 検索結果候補 検索結果ページ インデクシング レコメンデーションエンジンとの統合により、 データレポジトリの統合を実現する。 レコメンデーション用 インデックス 12 ©2009 Preferred Infrastructure Inc.
  13. 13. PFIテクノロジとの統合推進 Internet 結果の選択 クエリ入力 インデクシング 検索 スコアリング 全コンテンツ インデックス 検索結果候補 検索結果ページ 様々なリソースを活用し、 検索精度を高める。 ユーザーフィードバックの効果的な利用 13 ©2009 Preferred Infrastructure Inc.
  14. 14. より本質的な部分への投資を可能に データ・システムに合わせて最適な構成を可能に サービスの要求に合わせた最適なシステム構成 文書集合・ユーザーログを扱う様々な用途に対応す る 文書管理・ユーザーログを一元化し、 それに対し様々な操作を実現することができる。 インデックス保持・インフラ保持のコストを最小にし、 サービスの「質」にかかわる部分へ集中できるようにする。 14 ©2009 Preferred Infrastructure Inc.
  15. 15. 本日の流れ 13:20 – 14:00 全文検索エンジンSedue ~新機能の紹介~ 太田一樹(最高技術責任者) 14:00 – 14:15 休憩 14:15 – 14:45 SSD向け全文検索エンジン 田中英行(エンジニア・SSDエンジン開発者) 14:45 – 15:25 レコメンデーションQ&A 岡野原大輔(フェロー) 徳永拓之(エンジニア) 15 ©2009 Preferred Infrastructure Inc.

×