Home
Explore
Submit Search
Upload
Login
Signup
Advertisement
Check these out next
Nativ.team presentation2019
Nativ,inc
あるある定番施策見直し Ginzamarkets資料 20140416
DemandSphere
190515 tmh online_videomarketing_v13_slideshare
ikedanoriyuki
201410 12【媒体資料】bypass 20140929
Miho Marumo
人材紹介スキーム
ryuhei kasahara
2019年下半期アドバイザリーボードMTG資料
プロフェッショナル&パラレルキャリア・フリーランス協会
【アド部講演】スマートフォンアプリマネタイズのコツ
Tomohiro Mukoyama
Zgrow会社概要
豊嶋 孝太郎
1
of
26
Top clipped slide
自然言語処理の活用事例_オーディエンスの性別推定の仕組み
Jul. 16, 2020
•
0 likes
1 likes
×
Be the first to like this
Show More
•
679 views
views
×
Total views
0
On Slideshare
0
From embeds
0
Number of embeds
0
Download Now
Download to read offline
Report
Technology
2020/07/02 GMO Developers Night #12 【オンライン】アドテクノロジーの仕組みを知ろう! 〜ネット広告の仕組みや機械学習の活用事例をご紹介〜 での発表資料です。
GMOアドパートナーズ株式会社
Follow
GMOアドパートナーズ株式会社
Advertisement
Advertisement
Advertisement
Recommended
Spi講習会
Miwako Sasaki
401 views
•
88 slides
マザーコンテンツの創り手をいかをいかに育てるか
tkikuchi
1.1K views
•
9 slides
NLPでオンライン広告のオーディエンスの性別を推定する方法
GMOアドパートナーズ株式会社
1K views
•
20 slides
GMOSSPの開発現場!
GMOアドパートナーズ株式会社
483 views
•
27 slides
学生の時に知りたかった会社選びのウラ技
GMOアドパートナーズ株式会社
788 views
•
15 slides
アドフリナイト11 zucks村上資料 カジュアルゲーム 海外新展開
Zucks, Inc.
250 views
•
31 slides
More Related Content
Similar to 自然言語処理の活用事例_オーディエンスの性別推定の仕組み
(10)
Nativ.team presentation2019
Nativ,inc
•
1.2K views
あるある定番施策見直し Ginzamarkets資料 20140416
DemandSphere
•
1.1K views
190515 tmh online_videomarketing_v13_slideshare
ikedanoriyuki
•
5.1K views
201410 12【媒体資料】bypass 20140929
Miho Marumo
•
1.5K views
人材紹介スキーム
ryuhei kasahara
•
2K views
2019年下半期アドバイザリーボードMTG資料
プロフェッショナル&パラレルキャリア・フリーランス協会
•
271 views
【アド部講演】スマートフォンアプリマネタイズのコツ
Tomohiro Mukoyama
•
2.6K views
Zgrow会社概要
豊嶋 孝太郎
•
2K views
北米市場動向
gipwest
•
2.5K views
2020/02/14 code.org meetup
Yuta Tonegawa
•
887 views
More from GMOアドパートナーズ株式会社
(10)
機械学習を用いた広告配信での入札価格決定ロジック
GMOアドパートナーズ株式会社
•
338 views
スケールする広告配信システムの作り方
GMOアドパートナーズ株式会社
•
504 views
アドテクノロジー入門 〜歴史と概要を学ぼう〜
GMOアドパートナーズ株式会社
•
677 views
スクラムを半年間実践してみて
GMOアドパートナーズ株式会社
•
960 views
GMOアドマーケティング GCP勉強会 第2回
GMOアドパートナーズ株式会社
•
9.6K views
GMOアドマーケティングのインフラについて
GMOアドパートナーズ株式会社
•
570 views
未経験新卒入社でできること
GMOアドパートナーズ株式会社
•
473 views
リーダブルコードの必要性と活用事例
GMOアドパートナーズ株式会社
•
475 views
Okyu
GMOアドパートナーズ株式会社
•
1.4K views
Junk
GMOアドパートナーズ株式会社
•
1.4K views
Advertisement
Recently uploaded
(20)
量子論.pdf
hiro150493
•
7 views
3Dプリンタって いいね
infinite_loop
•
56 views
20230523_IoTLT_vol99_kitazaki_v1.pdf
Ayachika Kitazaki
•
110 views
【DL輪読会】DINOv2: Learning Robust Visual Features without Supervision
Deep Learning JP
•
34 views
Oracle Cloud Infrastructure:2023年5月度サービス・アップデート
オラクルエンジニア通信
•
31 views
ChatGPT触ってみた
infinite_loop
•
56 views
Windows ChatGPT Bing AI.pptx
Atomu Hidaka
•
6 views
Kubernetes超入門
Takashi Suzuki
•
5 views
《杨百翰大学毕业证|学位证书校内仿真版本》
d520dasw12
•
2 views
20230601_Visual_IoTLT_vol14_kitazaki_v1.pdf
Ayachika Kitazaki
•
57 views
SoftwareControl.pdf
ssusercd9928
•
6 views
Omnis
DaisukeFujita10
•
20 views
PCベース制御による集中制御.pdf
ssusercd9928
•
19 views
JSTQB_テストプロセスの概念モデル.pdf
akipii Oga
•
204 views
初学者のためのプロンプトエンジニアリング実践.pptx
Akifumi Niida
•
422 views
統計学の攻略_統計的仮説検定の9パターン.pdf
akipii Oga
•
200 views
TestSIP (1).pdf
DeependraSingh712859
•
2 views
モバイル・クラウド・コンピューティング-データを如何に格納し、組み合わせ、情報として引き出すか
Masahiko Funaki
•
2 views
【2023年5月】平成生まれのためのUNIX&IT歴史講座
法林浩之
•
16 views
ペンタエリスリトール市場.pdf
HinaMiyazu
•
3 views
自然言語処理の活用事例_オーディエンスの性別推定の仕組み
自然言語処理の活用事例 〜オーディエンスの性別推定の仕組み Developers Night #12
© 2019 GMO
AD Marketing Inc. 2 1. 自然言語処理の要約 2. 広告オーディエンスの性別推定の仕組みの紹介 今回の内容
© 2019 GMO
AD Marketing Inc. 3 自然言語処理の要約
© 2019 GMO
AD Marketing Inc. 4 自然言語処理とは 自然言語処理(NLP, Natural language processing)は人間が日常的に使っている自然言語をコン ピュータに処理させる一連の技術であり、人工知能と言語学の一分野です。 NLP Personal assistant 機械翻訳 検索エンジン 自然言語
© 2019 GMO
AD Marketing Inc. 5 自然言語処理の市場規模 ... 全世界で2019年では1兆円の規模でしたが、 2025年には見積もり5兆円(2018年のオンラン広告の市場規 模は1兆4480億円)の市場規模になる予想 (調査会社Tracticaより)
© 2019 GMO
AD Marketing Inc. 6 自然言語処理の一般的な処理の流れ 機械翻訳の例で説明します。 ... NLP日本語 英語
© 2019 GMO
AD Marketing Inc. 7 私は博多ラーメンが大好きです! 自然言語処理の一般的な処理の流れ 形態素解析 (* 中国語、日本語、タイ語な ど単語の分かち書きをしない 言語に必要の処理) 数値化する 私, は, 博多, ラーメン, が , 大好き , です 103, 120, 001,100, 110, 033, 221 機械学習のモデルでエンコー ドする (autoencoder) 日本語を入力 機械学習のモデルでデコード する (autoencoder) [1.3, 3.2, 4.3] I like Hakata Ramen very much 英語を出力
© 2019 GMO
AD Marketing Inc. 8 私は博多ラーメンが大好きです! 自然言語処理の一般的な処理の流れ 形態素解析 (* 中国語、日本語、タイ語な ど単語の分かち書きをしない 言語に必要の処理) 数値化する 私, は, 博多, ラーメン, が , 大好き , です 103, 120, 001,100, 110, 033, 221 機械学習のモデルでエンコー ドする (autoencoder) 日本語を入力 機械学習のモデルでデコード する (autoencoder) [1.3, 3.2, 4.3] I like Hakata Ramen very much 英語を出力
© 2019 GMO
AD Marketing Inc. 9 数値化手法の一つTF/IDFを紹介する
© 2019 GMO
AD Marketing Inc. 10 単語の出現頻度(TF) ... 単語 単語の出現頻度 一つの一番直感的な考えるのは指定された単語 の文書内で の出現回数を数字化の指標として使うことです。 よく出現する単語は、その文書の特徴を判別するのに有用! 数値化指標 単語 の文書内での出現回数 文書内単語の総数
© 2019 GMO
AD Marketing Inc. 11 単語の出現頻度(TF) ... 単語 単語の出現頻度 単語の出現頻度だけで数値化する指標にとして使うのは一つ 大きな欠点があります。 数値化指標 単語 の文書内での出現回数 文書内単語の総数
© 2019 GMO
AD Marketing Inc. 12 単語の出現頻度(TF)の欠点 ... 単語 単語の出現頻度 単語の出現頻度のみで scoreが高い単語は助詞になるかもし れません。 は: 300 が: 288 です: 100 … 数値化指標 単語 の文書内での出現回数 文書内単語の総数
© 2019 GMO
AD Marketing Inc. 13 逆文書頻度(IDF) ... 単語 逆文書頻度 単語 が出現する文書の数 文章の総数 色々な文書によく出現する単 語」なら低い値を示すもので す。 LOG( ) + 1
© 2019 GMO
AD Marketing Inc. 14 数値化する ... 単語 逆文書頻度 単語の出現 頻度 TF x IDF 色々な文書によく出現する単 語」なら高い値を示すもので す。 数値化指標 X 単語 が出現する文書の数 文章の総数 LOG( ) + 1 単語 の文書内での出現回数 文書内単語の総数
© 2019 GMO
AD Marketing Inc. 15 例 分析対象になる文章 : [文書A] 博多ラーメンは一番最高 ! [文書B] 札幌ラーメンは最高 ! TF(博多) = 1 / 4 = 0.25 TF(札幌) = 1 / 4 = 0.25 TF(ラーメン) = 2 / 4 = 0.5 IDF(博多) = log(2) + 1 = 1.3 IDF(札幌) = log(2) + 1 = 1.3 IDF(ラーメン) = log(2/2) + 1 = 1 [文書A] 博多, ラーメン [文書B] 札幌, ラーメン 形態素解析で名詞だけ抽出 TF/IDFを算出
© 2019 GMO
AD Marketing Inc. 16 オンライン広告業界で 自然言語処理の実用例
© 2019 GMO
AD Marketing Inc. 17 オンライン広告の男女予測問題 男性と女性が広告について好みが違うので、もし Webサイトをみっている 人の性別の情報が分かれば広告の施策を有利に行えます 化粧品の広告 競馬の広告 メディアサイド メディアサイド
© 2019 GMO
AD Marketing Inc. 18 機械学習問題の処理流れ 学習データの集計 機械学習モデルを訓練 機械学習モデルを運用
© 2019 GMO
AD Marketing Inc. 19 学習データの集計
© 2019 GMO
AD Marketing Inc. 20 オンライン広告を表示する際の簡単な流れ ❸ リクエストの情報をLogへ保存する ❹ 該当するオーディエンスに対する適切 な広告が決まる ユーザー Media Site( 例えば: NHK News) AD Network ❶ アクセス ❷ 広告リクエスト ❺ 広告のリンクを送る❻ 広告を表示する ● この五つのステップは数ミリセカンドで完了する。 ● AD Networkは複数の広告媒体( Webサイトやソーシャルメディ ア、ブログ等)を集めて広告配信ネットワークを作り、それらの 媒体に広告をまとめて配信する仕組みのことです ミリセカンド
© 2019 GMO
AD Marketing Inc. 21 学習データの集計 ❸ リクエストの情報をLogへ保存する。log にはmedia先のURL,直前にアクセスした URL,性別、アクセス時間など情報が含ま れている ❹ Logをもとに最適な広告を選ぶ ユーザー ユーザーの 性 別 の 情 報 を 持っているMedia Site AD network ❶ アクセス ❷ 広告リクエスト + ユーザーの性別 ❺ 広告のリンクを送る❻ 広告を表示する
© 2019 GMO
AD Marketing Inc. 22 機械学習モデルを訓練 &運用
© 2019 GMO
AD Marketing Inc. 23 オンライン広告業界でNLPの実用例 男性のオーディエンス群と女性のオーディエンス群は日々アクセスしているウェ ブサイトと時間が異なります。この相違に基づいて性別の情報を推定できるはず です。 男 女 URL NLPの処理 数 字 化 し た 特 徴 ? ❶ 学 習 URL NLPの処理 数 字 化 し た 特 徴 ❷入力 ❸予測 0.8 0.2 性別の情報 + アクセスしたURLの履 歴 アクセスしたURLの履 歴 機械学習の 分類モデル
© 2019 GMO
AD Marketing Inc. 24 今回紹介した方法において、AkaNe・ReeMoで 82%の正解度が得られました。(100回の予測に82回正解)
© 2019 GMO
AD Marketing Inc. 25 以上です ご清聴いただき ありがとうございました
© 2019 GMO
AD Marketing Inc. 26 ● 自然言語処理、 2018年6月22日、ウィキペディア日本語版、 https://ja.wikipedia.org/wiki/自然言語処理 ● Natural Language Processing Is a Key Engine of AI Market Growth, Enabling 44 Discrete Use Cases Across 17 Industries, https://www.tractica.com/newsroom/press-releases/natural-language-processing- is-a-key-engine-of-ai-market-growth-enabling-44-discrete-use-cases-across-17 -industries/ 参考文献
Advertisement