人工知能xファッション最前線
@TokyoWEBMINING53rd
kazukibs
自己紹介
・ID:kazukibs
過去 オークションの比較サイトで分析、データドリブンなツール作り
現在 ファッションx人工知能の人工知能とサーバーサイトの橋渡し部分
未来 データを活用したマーケット/マッチングプラットフォームを作りたい
バックグラウンド: 経済学 (博士課程単位取得退学)
- ゲーム理論、マーケットデザイン
- 産業組織論、特にオークション
- 限定合理性、行動経済学、実験経済学
2
3
目次
- 開発環境
- 画像解析
- 自然言語処理
- コーディネート
4
免責事項
・研究的なこと、理論的なことは他の回でもっと詳しい方が説明してくれてたり、
今後してくれたりしそうなのであまり触れるつもりはないです。
・画像の権利の関係を厳密に調べるとコストリーなのでアップする資料はイメー
ジ図になります。
5
開発環境(Python)
・Python
- Django/Flask
- Scrapy
- scikitlearn
- pyspark
- gensim
など(インフラ系も色々と)
6
開発環境(AWS)
AWS
- EC2 (汎用、コンピュテーション特化、GPUを中心に用途に合わせつつ)
- S3
- RDS (規模に応じてAuroraとMySQLを併用)
- SQS
- Dynamodb
- EMR
7
開発環境(その他)
- mecab+neologd
- elasticsearch
- Slack
- JIRA
- Qiita:Team
8
DeepLearningLibrarIes
- chainer
- caffe
- tensorflow
- Theano
どれを使うか?(検討中)
9
画像処理
ファッションでは一番重要な部分
・アイテムの分類
・特徴量の活用
・画像の前処理
などに活用。
10
画像処理
単品 スナップ 色違い込み
相対的に楽 ・どこが該当商品?
・モデルさんの権利は?
・UI上の問題は?
・どれが該当商品?
・色のバリエーションは?
・そもそもどの部分が商
品?
11
CNN(畳み込みニューラルネット)で分類器
・顔のあるなし判定
- コーデの画像が綺麗に見えるかどうか
- モデルさんを出していいか権利が曖昧な時
- 切り取るなどすれば色の特徴量がより正確に(完成されたセグメンテーション(後述)には劣る)
・ブランドのテイスト分類(20種類ほど)
- モール型のサイトを扱う時に
- ただし何が正解か結構わかりづらかったりする。
・カテゴリ判定
- 手法的にはvasilyさんのとおそらく同じ感じ
- 何故判定する必要があるか?:サイトによってはとても粗い分類されているので。(コーデで特に
重要)Tシャツ、シャツ、チュニックなどが一括りにトップスとなってたりする。
12
セグメンテーション
・物体検出
・コーデ分割
手法
矩形抽出の場合
・BING
・selective search
・edge boxes
13
セグメンテーションの例
https://ivi.fnwi.uva.nl/isis/publications/bibtexbrowser.php?k
ey=UijlingsIJCV2013&bib=all.bib
14
副産物
画像の色特徴量の中間生成物を使うとこんなことができます。
春物のシャツが欲しい
→
明るめに
15
制限なし
16
明るめ
17
自然言語処理
・ファションだと画像の補完的な役割
・ファッション以外の分野で上手くいったものを逆輸入して実験するなど
18
自然言語処理
word2vec
topicModel
19
分析対象
・レビュー
・商品説明文
20
ファッション特有の問題
・型番やスペック情報がはっきりしている家電などと違い
ふわっとしている。
・ロジカルというより感情を前面に出している感じ(私見)
・新しい言葉で既存の言葉を言い換えたがる
例:
デニム/ジーンズ
サロペット/オーバーオール
厳密には違うらしいが結構使われ方はいい加減
21
ファッションで自然言語処理するときの問題
(特有というよりはより顕著なもの)
辞書辛い(新ブランド)
名寄せ厳しすぎ(表記、偽物など)
SEOうざい(ctoc、モール系のところ)
22
ファッションで自然言語処理するときの問題
雑誌などは画像ありきでその説明などをしているので
自然言語処理単体だと結構難しい。
23
ブランドの距離
ブランドレベルで協調フィルタリング(ALS=Alternative Least Square)
してみる。
3次元にしてある面からみてみる。奥行きのせいでよくわからなくなる。
しかも男には感覚に近いのかわからない。
24
その他
メンズはアイテムが少ない。カテゴリによってはCNN用の教師データのサンプル
サイズを確保するのが大変だったりする。
25
ファッション統計
・アイテムに対する好き嫌い(好きと判断した回数/見られた回数)は数十倍レベ
ルで変わってくる。ブランドレベルでも変わってくる)
・金額に敏感な人と気にしない人がいる。(買うかどうかを念頭に入れているか
それともウインドウショッピング的に見ているかの違い?)
26
コーディネート
27
コーディネートのロジック
・色の組み合わせ
・目立つものの制限
などが使われている。
アルゴリズムは㊙︎
28
参考文献
- 深層学習 (機械学習プロフェッショナルシリーズ)
http://www.amazon.co.jp/dp/4061529021/
- トピックモデル (機械学習プロフェッショナルシリーズ)
http://www.amazon.co.jp/dp/4061529048/
- 最適化手法の基礎-力学モデルによる理解と実装
http://www.amazon.co.jp/dp/462704271X/
29

人工知能Xファッション最前線