Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

検索サービス開発が絶対におもしろいと思う理由

3,363 views

Published on

builderscon2017にて登壇をした資料です。

Published in: Engineering
  • Sex in your area is here: ❶❶❶ http://bit.ly/2F7hN3u ❶❶❶
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here

検索サービス開発が絶対におもしろいと思う理由

  1. 1. 検索サービス開発が 絶対におもしろいと思う理由 Noriaki UTSUNOMIYA
  2. 2. 2 Syn.ホールディングス/Supership 会社概要 ■設立の背景 ■Supership株式会社について KDDI におけるオープン領域事業拡大を推進することを目的に それらの事業を束ねる持ち株会社としてSyn.ホールディングス (株)、その中心を担う企業としてSupership(株)を設立。 「すべてが相互につながる『よりよい世界』を実現する」という ビジョンのもと、広告事業・インターネットサービス事業・プラッ トフォーム事業等の事業基盤を活かした新たな価値の提供を目指し、 2015年11月1日にKDDI傘下の3社が合併して発足。 今後、スマートフォン最大規模の顧客接点とデータ利活用により、 お客様のご期待に応える新たなサービスの提供を目指していきます。 事業内容: インターネットサービス事業、広告事業、PF事業、その他 所在地: 東京都港区南青山5-4-35 たつむら青山ビル  全体概要 Syn.ホールディングス 5社合併 エンタメ メディア ママ向け メディア カレンダー アプリ ファッション アプリ 関連会社 2015年11月 2017年2月
  3. 3. 3 自己紹介 •宇都宮 紀陽 •アドバンストデータ事業本部 CTO •検索事業の統括 •事業本部内で展開しているサービス事業技術責任者
  4. 4. 4 日本最大級インターネットポータル検索サービスへの携わり •Yahoo! ブックマーク(全文検索エンジン搭 載)開発 •ウェブ検索プラグイン SearchMonkey 開発 •ウェブ検索エンジン切り替え (YST→Google) •エンジン切り替えに伴う検索プラグインV2 •ウェブ検索エンジンAPI 層メンテナ
  5. 5. 5 主戦場はスマートフォン市場へ •キャリアポータル(au) •ウェブ検索 •ニュース検索 •リアルタイム検索 •ショッピング検索 •動画検索 •and more.
  6. 6. 6 ポータルで培った技術をサイト内検索ソリューションへ •スマホシフトで起きたこと •ユーザは行間(スペース)を空けなくなった •ユーザは文字列を漢字変換しなくなった •ユーザはひらがなできーわーど検索するようになった •Google が圧倒的な技術力でその表記揺れを対応してしまった •ユーザはGoogle から提供される検索体験がどの検索窓からでも同じよう に体験できると思ってしまった
  7. 7. 7 ポータルで培った技術をサイト内検索ソリューションへ ユーザはGoogle から提供される 検索体験が どの検索窓からでも 同じように体験できると 思ってしまった
  8. 8. 8 検索サービス開発とは 実際 どんな事を しているのか
  9. 9. 9 検索サービス開発とは •全文検索エンジン •Apache Lucene ベース •辞書 •mecab-ipadic-neologd •ネットの情報 •Qiita
  10. 10. 10 検索サービス開発とは マッチングアルゴリズム のみでは 成立しません
  11. 11. 11 検索サービス開発とは マッチングアルゴリズムについての 施策例はまたの機会にてご紹介
  12. 12. 12 サービス開発の成立要素 自然/形式 言語処理 分散処理 統計 モデリング 全文検索 UI/UX 高速文字列 解析 クローリング スクレイピング データ解析 デザイン
  13. 13. 13 個人的におもしろいと思う技術的理由3選 •ランキングアルゴリズム設計 •データ解析 •システム設計
  14. 14. 14 ランキングアルゴリズム設計 •ニュースサイトにおけるサイ ト内検索結果並び順の考え方
  15. 15. 15 ランキングアルゴリズム設計 •そもそもニュースとは?
  16. 16. 16 ランキングアルゴリズム設計
  17. 17. 17 ランキングアルゴリズム設計 •新しい •珍しい
  18. 18. 18 ランキングアルゴリズム設計 基礎スコア 情報の鮮度 注目度 スコアリングのために有用な素性
  19. 19. 19 ランキングアルゴリズム設計 鮮度を ガウス関数で 表現
  20. 20. 20 ランキングアルゴリズム設計 •ニュースの配信時間に現在時刻が相対的に 近いほど鮮度という素性に対して重みをつ ける
  21. 21. 21 ランキングアルゴリズム設計 •具体的仕様例 •現在時刻(=検索した時刻)がニュースの配 信された時間に対して前後30 分間の範囲内 であれば基礎スコアをブースト
  22. 22. 22 ランキングアルゴリズム設計 •注目度は簡単に表現可能 •記事PV •SNS でのシェア率など
  23. 23. 23 ランキングアルゴリズム設計 •具体的仕様例 •観測範囲内における配信記事のPVを係数と して基礎スコアをブースト
  24. 24. 24 ランキングアルゴリズム設計 基礎スコア ニュース検索のスコアリングは 記事の鮮度と注目度 という素性を使って重み付け 情報の鮮度 注目度
  25. 25. 25 ランキングアルゴリズム設計がおもしろいと思う理由 •サイト内検索毎に組み合わせ る素性が異なる •考え方をお金稼ぎに転用でき る •ビジネスに直結する
  26. 26. 26 データ解析 •検索キーワード=知りたいコト、モノ
  27. 27. 27 データ解析 •知りたいコト、モノその欲求の背景を 探る
  28. 28. 28 データ解析 検索キーワード季節分類事例
  29. 29. 29 データ解析がおもしろいと思う理由 •なぜそのキーワードで検索し たのか?という背景を追うまで が純粋に楽しい •考え方をお金稼ぎに転用でき る •分析基盤の構築も重要
  30. 30. 30 データ解析がおもしろいと思う理由 分析基盤についての 施策例はまたの機会にてご紹介
  31. 31. 31 システム設計 •Shopzilla:6秒から1.2秒に高速化す ることによって12.0%↑の売上向上 •Bing:2.0秒高速化される毎に 5.0%↑の売上向上 •Amazon.com:0.1秒高速化される毎 に、1.0%↑の売り上げ向上 •「The performance business pitch」から引用
  32. 32. 32 システム設計 •Time is money. •時間はお金です。
  33. 33. 33 システム設計 •検索サービスでもレイテンシを下げる ためのキャパシティプランニングが 超重要
  34. 34. 34 システム設計 •検索エンジン •インデクシング •シャーディング •スキーママッピング •CPU •Memory •IOPS
  35. 35. 35 システム設計 •API レイヤ •マイクロサービス化 •プロセッサ(AES-NI) •エンジン間とのNW レイテンシ
  36. 36. 36 システム設計 •SERP (SearchEngineResultPages) •クライアントサイド •レンダリング •CacheControl •HTTP/2 •CSS Sprite •サーバサイド •プロセッサ(AES-NI) •API レイヤとのNW レイテンシ
  37. 37. 37 システム設計がおもしろいと思う理由 •検索対象が線形に増大しても安定したパフォーマンスを 発揮するために習得する知識が膨大 •アーキテクチャ •インフラストラクチャー •要素技術 •ネットワーク •プログラミング •制約条件がある中で試行錯誤するのが純粋に楽しい •予算 •時間 •物理的制限(Bandwidth, Clock Speed, Geo, Memory Size, Storage Size, and more.)
  38. 38. 38 検索サービス開発が絶対におもしろいと思う圧倒的理由 •ユーザに優れた検索体験提供 •クライアントに収益提供 •自社に売上提供
  39. 39. 39 検索サービス開発が絶対におもしろいと思う圧倒的理由 三方よし
  40. 40. 40 We're hiring. 世の中に存在する検索機能を 便利にしたい 検索サービスエンジニアを 募集しています
  41. 41. 41 We're hiring. https://recruit.supership.jp/job/

×