More Related Content
More from Preferred Networks (20)
PFI会社案内
- 3. 会社概要
社名 株式会社 Preferred Infrastructure
(プリファード インフラストラクチャー)
設立 2006年3月
代表者 西川 徹
従業員数 14名
所在地 〒113-0033
東京都文京区本郷7-2-2 本郷ビル10F
URL http://preferred.jp/
3
- 4. メンバー
代表取締役社長 西川 徹
東京大学情報理工学系研究科コンピュータ科学専攻
IPA未踏ソフトウェア創造事業「抽象度の高いハードウェア記述言語」
第30回ACM国際大学対抗プログラミングコンテスト世界大会19位
最高技術責任者 太田 一樹
東京大学情報理工学系研究科コンピュータ科学専攻
IPA未踏ソフトウェア創造事業 「組み込み環境向け日本語入力環境」
第32回ACM国際大学対抗プログラミングコンテスト世界大会13位
特別研究員 岡野原 大輔
東京大学情報理工学系研究科コンピュータ科学専攻
IPA未踏ソフトウェア創造事業
「単語抽出法による次世代データ圧縮法の開発」
「汎用的データにおける確率的言語モデルの抽出及びその利用」
「文脈を利用した文書分類」(スーパークリエータ認定)
その他、IPA未踏、プログラミングコンテスト世界大会経験者が
多数在籍
第一線のアカデミック研究者と、その成果を高いレベルで実装・
実用化できるエンジニア集団
4
- 6. 会社の目標
基礎技術 ソフトウェアプロダクト
学術研究 サービス
新しい技術・面白い技術をいち早く世の中に届けていきます
アカデミックな世界の最先端の研究を実用化
テクノロジーが持つポテンシャルを最大限に引き出す
世の中に必要とされている技術の中でも、特に難しいミッショ
ンを選び抜き、それに対する解を提供していきます。
6
- 9. 製品ラインアップ
Sedue 24 全文検索
検索 Sedue Flex 曖昧検索
reflexa 連想検索
推薦 Hotate 関連記事推薦
大鷹 大規模レコメンドエンジン
広告配信 UbiMatch モバイル向けアドネットワーク
9
- 10. 検索
Sedue 24
スケーラブルで高速な分散型全文検索エンジン
圧縮接尾辞配列を利用した世界初の商用検索エンジン
インデックスを圧縮し、高速にオンメモリ検索
検索漏れが発生しない
リニアなスケールアップ
Sunマシン上の検証で128スレッドまで線形にスケール
容易なスケールアウト
インデックス作成、検索用ノードを無停止で追加
高い信頼性
カスタマイズ可能なランキング機能
用途
Web検索、サイト内検索、ブログ検索
文献検索
テキストマイニング
10
- 11. 検索
Sedue 24
最新バージョンでSSDに対応!
SSD向けに最適化された新しいインデックスエンジ
ンを搭載
インデックスをSSD上に配置
SSDの特性やシステムバランスを考慮し、SSD
の性能をフル活用
数100GBのデータの高速検索を1台のPCサー
バーで実現
デモサイト
全言語のWikipedia(約50GB)を一括検索
http://demo.sedue.org/wikipediasearch/
11
- 12. 検索
Sedue 24導入事例
国内第3位のモバイル(携帯電話)向け検索
ポータルサイト
月間ユニークユーザー数 400万人
モバイルサイトの検索エンジンのバックエン
ドとしてSedue 24を導入
12
- 13. 検索
Sedue 24導入事例
国内最大のソーシャルブックマークサービス
登録ユーザー数 21万6千人
月間ユニークユーザー数 350万人
1日当たり790万ページビュー
ブックマークされたURL 1160万件
検索対象HTMLデータ量(タグ除去後) 50GB
ブックマーク数 3400万件
タグ数 4000万件
ブックマークされたWebページの全文検索
エンジンとしてSedue 24を採用
13
- 15. 検索
Sedue Flex
高速な曖昧全文検索
Sedue 24の完全マッチング技術を曖昧検索に拡張
ミスマッチ(一部が異なる)やギャップ(一部が欠落 or 挿
入)の許容
最新のアルゴリズムによる超高速処理
10%~20%の誤り許容で、ギガバイト級のデータを数
ミリ~数秒で検索
オプションのSedue Flex Plusを使うと、より多くのメモ
リを利用することで、10倍~30倍の高速化
用途
ゲノム解析(BLASTより高精度で数倍~数100倍高速)
ノイズを含むデータの解析(音声、動画など)
導入事例
大学系研究機関
医科系大学
15
- 16. 検索 推薦
reflexa
連想検索エンジン
ある単語から連想される単語を検索
適切なキーワードが思いつかない
探したい情報が何なのか明確でない
大量の文書を自動分析、単語間の関連度を高精度に計算
関連度情報は圧縮してメモリ上に保持し高速検索
単語以外の連想にも応用可能
購買履歴 → お勧め商品
Web閲覧履歴 → お勧めWebページ
用途
百科事典
ブレーンストーミングツール
デモサイト
http://labs.preferred.jp/reflexa/
16
- 17. 検索 推薦
reflexa導入事例
メディアインデックス社の横断型ブログ
足跡システム「あし@」の、類似性の高
いブログをレコメンドする「連想レコメン
ド」機能
はてなブックマークの「関連エントリー表
示機能」。
タグ情報を元に類似のWebページをお
勧め。
17
- 18. 検索 推薦
reflexa導入事例
Sedue 24による
全文検索
reflexaによる
関連エントリー検索
18
- 19. 推薦
Hotate
関連記事推薦エンジン
関連する文章を高速かつ高精度に検索
月間数千万アクセスを1台で処理可能
キーワードの自動抽出と高速なインデクシング
約2万記事のインデックス作成 ⇒ 10秒以内
容易なチューニング
関連度を示すスコアと、関連キーワードの表示
関連付けのマニュアル調整
• 訃報にお祭りの記事が関連付けられるのはNG
用途
ニュースサイト
文献検索
19
- 20. 推薦
Hotate導入事例
朝日新聞社の公式ニュースサイト
月間ユニークユーザー数 1050万人
月間4000万ページビュー
1万2000記事
Hotateを利用して、関連記事を表示する「こ
んな記事も」を実現
20
- 22. 推薦
Hotate導入事例
日経BP社のIT専門情報サイト
月間2000万ページビュー
Hotateを利用して、関連記事を表示する「
ITproレコメンド」を実現
Amazon EC2で構築
“Large Instance”($0.4 / hour)
2ECU×2コア (1ECU≒Intel Xeon 1.0~1.2GHz)
メモリ: 7.5GB
HDD: 850GB
OS: Fedora Core 6 (x86_64)
詳細は「実践! Amazon EC2」
http://itpro.nikkeibp.co.jp/article/COLUMN/20080925/3
15456/?ST=itproexpo
22
- 23. 推薦
大鷹
大規模レコメンド・レイティング予測エンジン
ユーザーからのフィードバックを加味したレコメンド
ユーザーの好みとアイテムの特徴を分析し、ユー
ザーが高く評価しそうなアイテムを予測
協調フィルタリングの一種
数百万単位のユーザー、アイテムを処理可能
用途
ECサイト:商品レコメンドサービス
口コミ、CGM系サービス:アイテム推薦機能
23
- 24. 広告配信
UbiMatch
モバイル向けアドネットワーク
自動的な広告配信の最適化
コンテンツベースの最適化と、行動履歴・ユーザー
プロファイル等によるパーソナライズ
Preferred Infrastructureの持つ検索、レコメンド、
機械学習技術を応用
広告・サイトに対する厳しい審査基準 → 安心
ユーザープライバシーの保護
ビジネスモデル
自社サービス運営
システムのOEM提供
24
Editor's Notes
- <number>
- <number>
- <number>
- <number>
- <number>
- <number>
- <number>
- <number>
- <number>
- <number>
- <number>
- <number>
- <number>
- <number>
- <number>
- <number>
- <number>
- <number>
- <number>
- <number>
- <number>
- <number>
- <number>