SlideShare a Scribd company logo
1 of 21
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
北海道大学 大学院情報科学研究院
情報理工学部門 複合情報工学分野 調和系工学研究室
修士2年 右田 幹
Emotionally Intelligent Fashion Design Using
CNN and GAN
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
論文情報 2
• タイトル
– Emotionally Intelligent Fashion Design Using CNN and GAN
• 著者
– Cheng Yang, Yuliang Zhou, authors Lingang Wu
• 出典及び出典日
– Computer-Aided Design and Applications, 2021 03
• 論文URL
– http://cad-journal.net/files/vol_18/CAD_18(5)_2021_900-913.pdf
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
概要 3
・消費者の抱くイメージとファッション商品のマッチングを目的
・商品イメージを分類( Product Image Recognition model )、生成
( Intelligent Design Generation Model )するモデルを提案
・Product Image Recognition modelモデルは、CNNベースにより構築
・Intelligent Design Generation Modelモデルは、DCGANとConditinal GAN
を組み合わせたものにより構築
・今回は、靴の画像に照準を絞る
・実験結果から、提案手法の実現可能性と有効性が示せた
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
背景 4
本研究では靴を対象にして、商品イメージの設計手法を検討
 商品イメージの認識(Product Image Recognition model )、生成(Intelligent Design
Generation Model)を行う
製品性能が全体的に向上した
 選ぶ上で機能よりもイメージが先行
 消費者が望むイメージを把握することが重要に
機械学習により、消費者の感情を判断するモデルが登場
 Jaber : クラスタリングにより、女優を親密さに応じて分類
 Bell and Bala : CNNをもちいて、インテリアデザインに基づいて、配置する製品本体の
識別や類似製品の検索を実現
一方で、深層学習を利用して、ユーザーのイメージに基づいた
製品のデザイン分析に関する研究や開発はほとんどない
上記を実現することで、商品イメージの定義のみで
欲求通りの製品デザインを、容易かつ大量に取得可能
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Product Image Recognition model 5
①データセット作成
②使用するイメージ選択
③商品のイメージをラベル付け
④CNNによる学習実装
⑤結果
Product Image Recognition modelの概要
説明の流れ
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Product Image Recognition model 6
使用したデータセット:UT Zappos 50K
 複数ブランドの50,025枚の靴の写真が
含まれる
UT Zappos 50K データセットの一部
商品イメージ用語選出
・86個を選出(関連研究、雑誌、ECサイトなどを参考)
・同じ意味を持つものを削除し、63個残す
 例。 “publicized-introverted”、“publicized-understated”
・工業デザイン学科の大学院生・教員30名によりフィルタリング
 画像に対して、最も適したイメージ用語を選択してもらう
 15人以上によって正しく選択されたイメージ用語のみ。45個選出した
データセット
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Product Image Recognition model 7
クラスタリングの概要
商品イメージのクラスタリング
 工業デザイン学科の大学院生・教員22名が参加
データセット
・2乗和誤差の和(SSE)により最適なクラスタ数を決定。
 4クラスタに分けたとき、明らかな変曲点があったため、これに
・4つのクラスタについて、各代表の単語ペアを選択
 gorgeous-plain, modern-retro, casual-formal, and male-female.
・各自、45個を自らの判断でクラスタリング
 クラスタ数、各クラスタに含まれる個数など、
制限はなし
・同じグループに含まれる単語同士の出現回数
を計算(45×45の行列に記入)
Female Retro …
Female ☓ 2 2
Retro 2 ☓ 3
… 3 4 ☓
行列の例
・スペクトルクラスタリングによりクラスタをグループ化
データからグラフを生成。グラフの連結性に注目してクラスタリングする手法
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Product Image Recognition model 8
被検者の選定
・工業デザイン学科の大学教員と大学院生38名
 23歳から40歳の男性17名、女性21名
 一般消費者に比べ、商品イメージの知見がある
アンケート
・50,025枚のデータセットから無作為に1,200枚選出
・1200枚を無作為に12個のグループに分類。12種類のアンケートが出来上がる
アンケートの1例
商品イメージのラベル付け
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Product Image Recognition model 9
ラベル付け結果
・Positive:各商品に対して、全体のスコア平均が0より大きい
・Negative:各商品に対して、全体のスコア平均が0より小さい
・Neutral (扱わないため、非表示):各商品に対して、全体のスコア平均が0
各指標
(左側がPositive)
Positive Negative Total
Female - Male 426 503 929
Retro - Modern 525 398 923
Formal - Casual 778 200 978
Plain - Gorgeous 417 509 926
ラベル付け結果
商品イメージのラベル付け
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Product Image Recognition model 10
・CNNの入力に対応させるために、正方形に変換
 元々の画像サイズは136×102
 白Paddingを追加。歪みを回避
・データの分割
 Train data : 7割
 Test data : 3割
・RGB値の平均値を算出
 各画像の値から平均値を差し引き、これを用いる
・ Train dataに、画像を水平に反転させたものを追加
・224×224に変換。CNNに入力
UT Zappos 50K データセットの一部
前処理
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Product Image Recognition model 11
・靴の画像認識のために、VGG16を使用
・出力層は、ソフトマックス関数を採用
 各指標は、0~1の実数を取る
VGG16の概要
指標(p9)に合わせて
4次元に変更
・損失関数(weighted cross entropy)
𝑙𝑜𝑠𝑠 =
𝑖=1
𝑛
𝛼𝑖𝐶𝐸𝑖
𝑖=1
𝑛
𝛼𝑖
𝑛 ∶ 学習する画像の数
𝛼𝑖 ∶ 𝑖番目の商品イメージの平均スコア
𝐶𝐸𝑖: 𝑖番目の交差エントロピー誤差
実装
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Product Image Recognition model 12
・weight decayの使用(過学習対策)
 L2正則化とλ∑𝑤𝑖を損失関数に。(減衰率 λ=0.0005)
・パラメータ更新 : Momentum SGD
学習時の詳細設定
𝑊𝑡+1
= 𝑊𝑡
− 𝜂
𝜕𝐿 𝑊𝑡
𝜕𝑊𝑡 + 𝛽𝛥𝑊𝑡
𝐿 ∶ 損失関数
𝛽 ∶ 0.9
𝜂 : 0.0001(100epochごとに0.1倍)
・neutralは使用しない
 イメージが無いから
・学習の様子
実装
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Product Image Recognition model 13
・standard loss( standard cross entropy )と
weighted cross ( weighted cross entropy )で比較
 重みの導入と精度や学習効率の関係を確認するため
・weighted cross の方が精度が高い
・100epochのほうが低い
 オーバーフィッティングの影響
50 epoch 100 epoch
結果
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Intelligent Design Generation Model 14
Product Image Recognition Modelで用いたデータセットだけでは不十分
 UT Zappos 50Kから10240個の靴をランダムに選択
 Product Image Recognition Modelよりラベル付け。大規模なデータセットを作成
各指標
(左側がPositive)
Positive Negative Total
Female - Male 4807 5433 10240
Retro - Modern 5844 4396 10240
Formal - Casual 7689 2551 10240
Plain - Gorgeous 4995 5245 10240
ラベル付け結果
データの前処理
GANを用いて、想定するイメージかつ革新的な製品を生成する
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Intelligent Design Generation Model 15
・DCGANとConditional GANから成る
・Generator
 入力:100次元分の乱数、4次元(Female、Male、Formal、Casual)
の商品ラベルに関するone hot encodingの連結
⁃ 特徴を沢山持つのは稀だから
⁃ ユーザーは1~2個のスタイルを選ぶことが多い
 出力:画像を生成
Generator Discriminator
実装
・Discriminator
 入力:本物の画像、Discriminatorの出力
 出力:0~1の実数値(本物か偽物かを判定)
・収束するまで交互に学習
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Intelligent Design Generation Model 16
・ GeneratorとDiscriminatorを交互に更新
 Generatorを固定、 Discriminatorを2回更新
 Discriminatorを固定、 Generatorを1回更新
・batch size=32
・1 epochごとに320回学習。100epoch学習
・ GeneratorとDiscriminatorのパラメータ:正規分布(平均0, 標準偏差0.02)
・Adamによりパラメータ更新
・ Discriminatorの活性化関数:Leaky ReLU
学習時の詳細設定
学習時間に応じて、高品質な画像を生成
1 epoch 10 epoch 100 epoch
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Intelligent Design Generation Model 17
・右図は不適なサンプルも入っている
・イメージをもとに靴を生成できる
・生成された2000枚の画像のうち、不適なサンプルの割合は4.1%ほどあった
 プロのデザイナーの知見に基づいて評価
定性的な評価
100epochでの生成結果
不適なサンプルが生成された理由
・靴の色が複雑なものがある
・靴紐が細いものがある
 靴紐と本体の繋がりがわかりにくい
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Intelligent Design Generation Model 18
・アンケート実施
 生成された商品がイメージと合致しているか検証するため
・工業デザイン学科の大学院生・教員20名が被検者
 23歳から40歳までの男性7名、女性13名
・320枚のサンプルを作成
 4.1%の不適なサンプルを除去。各イメージごとに25枚選択(合計100枚)
・被検者は、1枚のサンプルごとにイメージを選択
 各自の経験をもとに選択
 「Male Casual」、「Male Formal」 、「Female Casual」、「Female Formal」、
「non-conformance(どれにも適さない)」から選択
定量的な評価
16人以上(8割以上)の被検者が正しい選択をした場合
その生成サンプルはイメージ通り(True)と判断
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Intelligent Design Generation Model 19
定量的な評価
誤ったパターンについて
結果
(例)Female Casual
・約半数のみがFemale Casualを選択したサンプルが2枚
 Female Casual以外では、多くの人がnon-conformanceを選択
・ non-conformanceを選択したうちの一人は、 Neutral Casual と判断した
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
考察 20
・ファッション以外でも、他分野の商品イメージに対して適応可能
Intelligent Design Generation Modelの応用
(例)自動車
 必要な準備
⁃ 自動車画像の用意
⁃ ユーザーによる、イメージ評価(「モダン-レトロ」、「流行り-伝統的」な
ど)をしてもらう
(例)人間への支援
 デザイナー
⁃ 生成された画像を参考に、改善が可能(労働時間削減、作業効率向上)
 ユーザー
⁃ 生成された画像をもとに、自分の好みの理解につながる(外観の形成)
・現段階での課題:労力がかかる
 画像は同じ視点から撮影
 人手により行われるラベル付け
 上記2つを満たしたラベル付き画像が大量にある
教師なし学習による商品イメージ認識を検討
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
結論 21
・消費者の抱くイメージとファッション商品のマッチングを目的
・Product Image Recognition modelは、ユーザーとデザイナーの認識の一
致のため
・Intelligent Design Generation Modelは、革新的な商品を生成できる
・今回は、靴の画像に照準を絞る
・実験結果から、提案手法の実現可能性と有効性が示せた

More Related Content

What's hot

SSII2021 [OS2-03] 自己教師あり学習における対照学習の基礎と応用
SSII2021 [OS2-03] 自己教師あり学習における対照学習の基礎と応用SSII2021 [OS2-03] 自己教師あり学習における対照学習の基礎と応用
SSII2021 [OS2-03] 自己教師あり学習における対照学習の基礎と応用SSII
 
ディープラーニングによる時系列データの異常検知
ディープラーニングによる時系列データの異常検知ディープラーニングによる時系列データの異常検知
ディープラーニングによる時系列データの異常検知Core Concept Technologies
 
モデルアーキテクチャ観点からのDeep Neural Network高速化
モデルアーキテクチャ観点からのDeep Neural Network高速化モデルアーキテクチャ観点からのDeep Neural Network高速化
モデルアーキテクチャ観点からのDeep Neural Network高速化Yusuke Uchida
 
【メタサーベイ】Video Transformer
 【メタサーベイ】Video Transformer 【メタサーベイ】Video Transformer
【メタサーベイ】Video Transformercvpaper. challenge
 
【論文調査】XAI技術の効能を ユーザ実験で評価する研究
【論文調査】XAI技術の効能を ユーザ実験で評価する研究【論文調査】XAI技術の効能を ユーザ実験で評価する研究
【論文調査】XAI技術の効能を ユーザ実験で評価する研究Satoshi Hara
 
Convolutionl Neural Network 入門
Convolutionl Neural Network 入門Convolutionl Neural Network 入門
Convolutionl Neural Network 入門maruyama097
 
第6回WBAシンポジウム:脳参照アーキテクチャ 駆動開発からの AGI構築ロードマップ
第6回WBAシンポジウム:脳参照アーキテクチャ 駆動開発からの AGI構築ロードマップ第6回WBAシンポジウム:脳参照アーキテクチャ 駆動開発からの AGI構築ロードマップ
第6回WBAシンポジウム:脳参照アーキテクチャ 駆動開発からの AGI構築ロードマップThe Whole Brain Architecture Initiative
 
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜SSII
 
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向SSII
 
[DL輪読会]Pixel2Mesh: Generating 3D Mesh Models from Single RGB Images
[DL輪読会]Pixel2Mesh: Generating 3D Mesh Models from Single RGB Images[DL輪読会]Pixel2Mesh: Generating 3D Mesh Models from Single RGB Images
[DL輪読会]Pixel2Mesh: Generating 3D Mesh Models from Single RGB ImagesDeep Learning JP
 
FineDiving: A Fine-grained Dataset for Procedure-aware Action Quality Assessm...
FineDiving: A Fine-grained Dataset for Procedure-aware Action Quality Assessm...FineDiving: A Fine-grained Dataset for Procedure-aware Action Quality Assessm...
FineDiving: A Fine-grained Dataset for Procedure-aware Action Quality Assessm...Shoki Miyagawa
 
ArcFace: Additive Angular Margin Loss for Deep Face Recognition
ArcFace: Additive Angular Margin Loss for Deep Face RecognitionArcFace: Additive Angular Margin Loss for Deep Face Recognition
ArcFace: Additive Angular Margin Loss for Deep Face Recognitionharmonylab
 
半教師あり学習
半教師あり学習半教師あり学習
半教師あり学習syou6162
 
MS COCO Dataset Introduction
MS COCO Dataset IntroductionMS COCO Dataset Introduction
MS COCO Dataset IntroductionShinagawa Seitaro
 
最新の多様な深層強化学習モデルとその応用(第40回強化学習アーキテクチャ講演資料)
最新の多様な深層強化学習モデルとその応用(第40回強化学習アーキテクチャ講演資料)最新の多様な深層強化学習モデルとその応用(第40回強化学習アーキテクチャ講演資料)
最新の多様な深層強化学習モデルとその応用(第40回強化学習アーキテクチャ講演資料)Shota Imai
 
SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​
SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​
SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​SSII
 
Domain Adaptation 発展と動向まとめ(サーベイ資料)
Domain Adaptation 発展と動向まとめ(サーベイ資料)Domain Adaptation 発展と動向まとめ(サーベイ資料)
Domain Adaptation 発展と動向まとめ(サーベイ資料)Yamato OKAMOTO
 
Sliced Wasserstein Distance for Learning Gaussian Mixture Models
Sliced Wasserstein Distance for Learning Gaussian Mixture ModelsSliced Wasserstein Distance for Learning Gaussian Mixture Models
Sliced Wasserstein Distance for Learning Gaussian Mixture ModelsFujimoto Keisuke
 

What's hot (20)

SSII2021 [OS2-03] 自己教師あり学習における対照学習の基礎と応用
SSII2021 [OS2-03] 自己教師あり学習における対照学習の基礎と応用SSII2021 [OS2-03] 自己教師あり学習における対照学習の基礎と応用
SSII2021 [OS2-03] 自己教師あり学習における対照学習の基礎と応用
 
ディープラーニングによる時系列データの異常検知
ディープラーニングによる時系列データの異常検知ディープラーニングによる時系列データの異常検知
ディープラーニングによる時系列データの異常検知
 
モデルアーキテクチャ観点からのDeep Neural Network高速化
モデルアーキテクチャ観点からのDeep Neural Network高速化モデルアーキテクチャ観点からのDeep Neural Network高速化
モデルアーキテクチャ観点からのDeep Neural Network高速化
 
【メタサーベイ】Video Transformer
 【メタサーベイ】Video Transformer 【メタサーベイ】Video Transformer
【メタサーベイ】Video Transformer
 
【論文調査】XAI技術の効能を ユーザ実験で評価する研究
【論文調査】XAI技術の効能を ユーザ実験で評価する研究【論文調査】XAI技術の効能を ユーザ実験で評価する研究
【論文調査】XAI技術の効能を ユーザ実験で評価する研究
 
Convolutionl Neural Network 入門
Convolutionl Neural Network 入門Convolutionl Neural Network 入門
Convolutionl Neural Network 入門
 
第6回WBAシンポジウム:脳参照アーキテクチャ 駆動開発からの AGI構築ロードマップ
第6回WBAシンポジウム:脳参照アーキテクチャ 駆動開発からの AGI構築ロードマップ第6回WBAシンポジウム:脳参照アーキテクチャ 駆動開発からの AGI構築ロードマップ
第6回WBAシンポジウム:脳参照アーキテクチャ 駆動開発からの AGI構築ロードマップ
 
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜
 
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
 
[DL輪読会]Pixel2Mesh: Generating 3D Mesh Models from Single RGB Images
[DL輪読会]Pixel2Mesh: Generating 3D Mesh Models from Single RGB Images[DL輪読会]Pixel2Mesh: Generating 3D Mesh Models from Single RGB Images
[DL輪読会]Pixel2Mesh: Generating 3D Mesh Models from Single RGB Images
 
Semantic segmentation
Semantic segmentationSemantic segmentation
Semantic segmentation
 
モデルベース協調フィルタリングにおける推薦の透明性に関する検討
モデルベース協調フィルタリングにおける推薦の透明性に関する検討モデルベース協調フィルタリングにおける推薦の透明性に関する検討
モデルベース協調フィルタリングにおける推薦の透明性に関する検討
 
FineDiving: A Fine-grained Dataset for Procedure-aware Action Quality Assessm...
FineDiving: A Fine-grained Dataset for Procedure-aware Action Quality Assessm...FineDiving: A Fine-grained Dataset for Procedure-aware Action Quality Assessm...
FineDiving: A Fine-grained Dataset for Procedure-aware Action Quality Assessm...
 
ArcFace: Additive Angular Margin Loss for Deep Face Recognition
ArcFace: Additive Angular Margin Loss for Deep Face RecognitionArcFace: Additive Angular Margin Loss for Deep Face Recognition
ArcFace: Additive Angular Margin Loss for Deep Face Recognition
 
半教師あり学習
半教師あり学習半教師あり学習
半教師あり学習
 
MS COCO Dataset Introduction
MS COCO Dataset IntroductionMS COCO Dataset Introduction
MS COCO Dataset Introduction
 
最新の多様な深層強化学習モデルとその応用(第40回強化学習アーキテクチャ講演資料)
最新の多様な深層強化学習モデルとその応用(第40回強化学習アーキテクチャ講演資料)最新の多様な深層強化学習モデルとその応用(第40回強化学習アーキテクチャ講演資料)
最新の多様な深層強化学習モデルとその応用(第40回強化学習アーキテクチャ講演資料)
 
SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​
SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​
SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​
 
Domain Adaptation 発展と動向まとめ(サーベイ資料)
Domain Adaptation 発展と動向まとめ(サーベイ資料)Domain Adaptation 発展と動向まとめ(サーベイ資料)
Domain Adaptation 発展と動向まとめ(サーベイ資料)
 
Sliced Wasserstein Distance for Learning Gaussian Mixture Models
Sliced Wasserstein Distance for Learning Gaussian Mixture ModelsSliced Wasserstein Distance for Learning Gaussian Mixture Models
Sliced Wasserstein Distance for Learning Gaussian Mixture Models
 

Similar to Emotionally Intelligent Fashion Design Using CNN and GAN

【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究harmonylab
 
Self-supervised Learning of Adversarial Example: Towards Good Generalizations...
Self-supervised Learning of Adversarial Example:Towards Good Generalizations...Self-supervised Learning of Adversarial Example:Towards Good Generalizations...
Self-supervised Learning of Adversarial Example: Towards Good Generalizations...harmonylab
 
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...harmonylab
 
Personalized Fashion Recommendation from Personal Social Media Data An Item t...
Personalized Fashion Recommendation from Personal Social Media Data An Item t...Personalized Fashion Recommendation from Personal Social Media Data An Item t...
Personalized Fashion Recommendation from Personal Social Media Data An Item t...harmonylab
 
Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...
Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...
Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...harmonylab
 
MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)
MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)
MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)harmonylab
 
MLP-Mixer: An all-MLP Architecture for Vision
MLP-Mixer: An all-MLP Architecture for VisionMLP-Mixer: An all-MLP Architecture for Vision
MLP-Mixer: An all-MLP Architecture for Visionharmonylab
 
All That’s ‘Human’ Is Not Gold Evaluating Human Evaluation of Generated Text
All That’s ‘Human’ Is Not Gold Evaluating Human Evaluation of Generated TextAll That’s ‘Human’ Is Not Gold Evaluating Human Evaluation of Generated Text
All That’s ‘Human’ Is Not Gold Evaluating Human Evaluation of Generated Textharmonylab
 
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...harmonylab
 
You Only Learn One Representation: Unified Network for Multiple Tasks
You Only Learn One Representation: Unified Network for Multiple TasksYou Only Learn One Representation: Unified Network for Multiple Tasks
You Only Learn One Representation: Unified Network for Multiple Tasksharmonylab
 
Fine Grained Fashion Similarity Prediction by Attribute Specific Embedding Le...
Fine Grained Fashion Similarity Prediction by Attribute Specific Embedding Le...Fine Grained Fashion Similarity Prediction by Attribute Specific Embedding Le...
Fine Grained Fashion Similarity Prediction by Attribute Specific Embedding Le...harmonylab
 
Towards Total Recall in Industrial Anomaly Detection
Towards Total Recall in Industrial Anomaly DetectionTowards Total Recall in Industrial Anomaly Detection
Towards Total Recall in Industrial Anomaly Detectionharmonylab
 
Semi-Supervised Neural Architecture Search
Semi-Supervised Neural Architecture SearchSemi-Supervised Neural Architecture Search
Semi-Supervised Neural Architecture Searchharmonylab
 
2021 09 29_dl_hirata
2021 09 29_dl_hirata2021 09 29_dl_hirata
2021 09 29_dl_hirataharmonylab
 
ロードヒーティング制御における深層学習を用いた路面画像認識に関する研究
ロードヒーティング制御における深層学習を用いた路面画像認識に関する研究ロードヒーティング制御における深層学習を用いた路面画像認識に関する研究
ロードヒーティング制御における深層学習を用いた路面画像認識に関する研究harmonylab
 
Outfit net fashion outfit recommendation with attention based multiple instan...
Outfit net fashion outfit recommendation with attention based multiple instan...Outfit net fashion outfit recommendation with attention based multiple instan...
Outfit net fashion outfit recommendation with attention based multiple instan...harmonylab
 
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose EstimationDLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimationharmonylab
 

Similar to Emotionally Intelligent Fashion Design Using CNN and GAN (20)

【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
 
Self-supervised Learning of Adversarial Example: Towards Good Generalizations...
Self-supervised Learning of Adversarial Example:Towards Good Generalizations...Self-supervised Learning of Adversarial Example:Towards Good Generalizations...
Self-supervised Learning of Adversarial Example: Towards Good Generalizations...
 
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
 
Personalized Fashion Recommendation from Personal Social Media Data An Item t...
Personalized Fashion Recommendation from Personal Social Media Data An Item t...Personalized Fashion Recommendation from Personal Social Media Data An Item t...
Personalized Fashion Recommendation from Personal Social Media Data An Item t...
 
Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...
Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...
Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...
 
MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)
MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)
MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)
 
MLP-Mixer: An all-MLP Architecture for Vision
MLP-Mixer: An all-MLP Architecture for VisionMLP-Mixer: An all-MLP Architecture for Vision
MLP-Mixer: An all-MLP Architecture for Vision
 
All That’s ‘Human’ Is Not Gold Evaluating Human Evaluation of Generated Text
All That’s ‘Human’ Is Not Gold Evaluating Human Evaluation of Generated TextAll That’s ‘Human’ Is Not Gold Evaluating Human Evaluation of Generated Text
All That’s ‘Human’ Is Not Gold Evaluating Human Evaluation of Generated Text
 
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...
 
You Only Learn One Representation: Unified Network for Multiple Tasks
You Only Learn One Representation: Unified Network for Multiple TasksYou Only Learn One Representation: Unified Network for Multiple Tasks
You Only Learn One Representation: Unified Network for Multiple Tasks
 
Fine Grained Fashion Similarity Prediction by Attribute Specific Embedding Le...
Fine Grained Fashion Similarity Prediction by Attribute Specific Embedding Le...Fine Grained Fashion Similarity Prediction by Attribute Specific Embedding Le...
Fine Grained Fashion Similarity Prediction by Attribute Specific Embedding Le...
 
Towards Total Recall in Industrial Anomaly Detection
Towards Total Recall in Industrial Anomaly DetectionTowards Total Recall in Industrial Anomaly Detection
Towards Total Recall in Industrial Anomaly Detection
 
2021 haizoku
2021 haizoku2021 haizoku
2021 haizoku
 
2021 haizoku
2021 haizoku2021 haizoku
2021 haizoku
 
Semi-Supervised Neural Architecture Search
Semi-Supervised Neural Architecture SearchSemi-Supervised Neural Architecture Search
Semi-Supervised Neural Architecture Search
 
2021 09 29_dl_hirata
2021 09 29_dl_hirata2021 09 29_dl_hirata
2021 09 29_dl_hirata
 
修士論文
修士論文修士論文
修士論文
 
ロードヒーティング制御における深層学習を用いた路面画像認識に関する研究
ロードヒーティング制御における深層学習を用いた路面画像認識に関する研究ロードヒーティング制御における深層学習を用いた路面画像認識に関する研究
ロードヒーティング制御における深層学習を用いた路面画像認識に関する研究
 
Outfit net fashion outfit recommendation with attention based multiple instan...
Outfit net fashion outfit recommendation with attention based multiple instan...Outfit net fashion outfit recommendation with attention based multiple instan...
Outfit net fashion outfit recommendation with attention based multiple instan...
 
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose EstimationDLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
 

More from harmonylab

【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也harmonylab
 
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究harmonylab
 
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...harmonylab
 
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究harmonylab
 
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile BackboneDLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile Backboneharmonylab
 
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat ModelsDLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Modelsharmonylab
 
Voyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language ModelsVoyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language Modelsharmonylab
 
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose EstimationDLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimationharmonylab
 
ReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language ModelsReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language Modelsharmonylab
 
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究harmonylab
 
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究harmonylab
 
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究harmonylab
 
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究harmonylab
 
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究harmonylab
 
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...harmonylab
 
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究harmonylab
 
A Study on Generation of Deformed Route Maps using Octilinear Grid
A Study on Generation of Deformed Route Maps using Octilinear GridA Study on Generation of Deformed Route Maps using Octilinear Grid
A Study on Generation of Deformed Route Maps using Octilinear Gridharmonylab
 
A Study on the Generation of Clothing Captions Highlighting the Differences b...
A Study on the Generation of Clothing Captions Highlighting the Differences b...A Study on the Generation of Clothing Captions Highlighting the Differences b...
A Study on the Generation of Clothing Captions Highlighting the Differences b...harmonylab
 
A Study on Clothing Recommendation Information Presentation System Based on C...
A Study on Clothing Recommendation Information Presentation System Based on C...A Study on Clothing Recommendation Information Presentation System Based on C...
A Study on Clothing Recommendation Information Presentation System Based on C...harmonylab
 
深層学習を用いたバス乗客画像の属性推定 に関する研究
深層学習を用いたバス乗客画像の属性推定 に関する研究深層学習を用いたバス乗客画像の属性推定 に関する研究
深層学習を用いたバス乗客画像の属性推定 に関する研究harmonylab
 

More from harmonylab (20)

【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
 
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
 
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
 
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
 
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile BackboneDLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
 
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat ModelsDLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
 
Voyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language ModelsVoyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language Models
 
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose EstimationDLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
 
ReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language ModelsReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language Models
 
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
 
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究
 
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
 
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
 
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
 
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
 
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
 
A Study on Generation of Deformed Route Maps using Octilinear Grid
A Study on Generation of Deformed Route Maps using Octilinear GridA Study on Generation of Deformed Route Maps using Octilinear Grid
A Study on Generation of Deformed Route Maps using Octilinear Grid
 
A Study on the Generation of Clothing Captions Highlighting the Differences b...
A Study on the Generation of Clothing Captions Highlighting the Differences b...A Study on the Generation of Clothing Captions Highlighting the Differences b...
A Study on the Generation of Clothing Captions Highlighting the Differences b...
 
A Study on Clothing Recommendation Information Presentation System Based on C...
A Study on Clothing Recommendation Information Presentation System Based on C...A Study on Clothing Recommendation Information Presentation System Based on C...
A Study on Clothing Recommendation Information Presentation System Based on C...
 
深層学習を用いたバス乗客画像の属性推定 に関する研究
深層学習を用いたバス乗客画像の属性推定 に関する研究深層学習を用いたバス乗客画像の属性推定 に関する研究
深層学習を用いたバス乗客画像の属性推定 に関する研究
 

Recently uploaded

TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案sugiuralab
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)Hiroshi Tomioka
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 

Recently uploaded (8)

TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 

Emotionally Intelligent Fashion Design Using CNN and GAN

  • 1. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 調和系工学研究室 修士2年 右田 幹 Emotionally Intelligent Fashion Design Using CNN and GAN
  • 2. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 論文情報 2 • タイトル – Emotionally Intelligent Fashion Design Using CNN and GAN • 著者 – Cheng Yang, Yuliang Zhou, authors Lingang Wu • 出典及び出典日 – Computer-Aided Design and Applications, 2021 03 • 論文URL – http://cad-journal.net/files/vol_18/CAD_18(5)_2021_900-913.pdf
  • 3. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 概要 3 ・消費者の抱くイメージとファッション商品のマッチングを目的 ・商品イメージを分類( Product Image Recognition model )、生成 ( Intelligent Design Generation Model )するモデルを提案 ・Product Image Recognition modelモデルは、CNNベースにより構築 ・Intelligent Design Generation Modelモデルは、DCGANとConditinal GAN を組み合わせたものにより構築 ・今回は、靴の画像に照準を絞る ・実験結果から、提案手法の実現可能性と有効性が示せた
  • 4. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 背景 4 本研究では靴を対象にして、商品イメージの設計手法を検討  商品イメージの認識(Product Image Recognition model )、生成(Intelligent Design Generation Model)を行う 製品性能が全体的に向上した  選ぶ上で機能よりもイメージが先行  消費者が望むイメージを把握することが重要に 機械学習により、消費者の感情を判断するモデルが登場  Jaber : クラスタリングにより、女優を親密さに応じて分類  Bell and Bala : CNNをもちいて、インテリアデザインに基づいて、配置する製品本体の 識別や類似製品の検索を実現 一方で、深層学習を利用して、ユーザーのイメージに基づいた 製品のデザイン分析に関する研究や開発はほとんどない 上記を実現することで、商品イメージの定義のみで 欲求通りの製品デザインを、容易かつ大量に取得可能
  • 5. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Product Image Recognition model 5 ①データセット作成 ②使用するイメージ選択 ③商品のイメージをラベル付け ④CNNによる学習実装 ⑤結果 Product Image Recognition modelの概要 説明の流れ
  • 6. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Product Image Recognition model 6 使用したデータセット:UT Zappos 50K  複数ブランドの50,025枚の靴の写真が 含まれる UT Zappos 50K データセットの一部 商品イメージ用語選出 ・86個を選出(関連研究、雑誌、ECサイトなどを参考) ・同じ意味を持つものを削除し、63個残す  例。 “publicized-introverted”、“publicized-understated” ・工業デザイン学科の大学院生・教員30名によりフィルタリング  画像に対して、最も適したイメージ用語を選択してもらう  15人以上によって正しく選択されたイメージ用語のみ。45個選出した データセット
  • 7. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Product Image Recognition model 7 クラスタリングの概要 商品イメージのクラスタリング  工業デザイン学科の大学院生・教員22名が参加 データセット ・2乗和誤差の和(SSE)により最適なクラスタ数を決定。  4クラスタに分けたとき、明らかな変曲点があったため、これに ・4つのクラスタについて、各代表の単語ペアを選択  gorgeous-plain, modern-retro, casual-formal, and male-female. ・各自、45個を自らの判断でクラスタリング  クラスタ数、各クラスタに含まれる個数など、 制限はなし ・同じグループに含まれる単語同士の出現回数 を計算(45×45の行列に記入) Female Retro … Female ☓ 2 2 Retro 2 ☓ 3 … 3 4 ☓ 行列の例 ・スペクトルクラスタリングによりクラスタをグループ化 データからグラフを生成。グラフの連結性に注目してクラスタリングする手法
  • 8. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Product Image Recognition model 8 被検者の選定 ・工業デザイン学科の大学教員と大学院生38名  23歳から40歳の男性17名、女性21名  一般消費者に比べ、商品イメージの知見がある アンケート ・50,025枚のデータセットから無作為に1,200枚選出 ・1200枚を無作為に12個のグループに分類。12種類のアンケートが出来上がる アンケートの1例 商品イメージのラベル付け
  • 9. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Product Image Recognition model 9 ラベル付け結果 ・Positive:各商品に対して、全体のスコア平均が0より大きい ・Negative:各商品に対して、全体のスコア平均が0より小さい ・Neutral (扱わないため、非表示):各商品に対して、全体のスコア平均が0 各指標 (左側がPositive) Positive Negative Total Female - Male 426 503 929 Retro - Modern 525 398 923 Formal - Casual 778 200 978 Plain - Gorgeous 417 509 926 ラベル付け結果 商品イメージのラベル付け
  • 10. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Product Image Recognition model 10 ・CNNの入力に対応させるために、正方形に変換  元々の画像サイズは136×102  白Paddingを追加。歪みを回避 ・データの分割  Train data : 7割  Test data : 3割 ・RGB値の平均値を算出  各画像の値から平均値を差し引き、これを用いる ・ Train dataに、画像を水平に反転させたものを追加 ・224×224に変換。CNNに入力 UT Zappos 50K データセットの一部 前処理
  • 11. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Product Image Recognition model 11 ・靴の画像認識のために、VGG16を使用 ・出力層は、ソフトマックス関数を採用  各指標は、0~1の実数を取る VGG16の概要 指標(p9)に合わせて 4次元に変更 ・損失関数(weighted cross entropy) 𝑙𝑜𝑠𝑠 = 𝑖=1 𝑛 𝛼𝑖𝐶𝐸𝑖 𝑖=1 𝑛 𝛼𝑖 𝑛 ∶ 学習する画像の数 𝛼𝑖 ∶ 𝑖番目の商品イメージの平均スコア 𝐶𝐸𝑖: 𝑖番目の交差エントロピー誤差 実装
  • 12. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Product Image Recognition model 12 ・weight decayの使用(過学習対策)  L2正則化とλ∑𝑤𝑖を損失関数に。(減衰率 λ=0.0005) ・パラメータ更新 : Momentum SGD 学習時の詳細設定 𝑊𝑡+1 = 𝑊𝑡 − 𝜂 𝜕𝐿 𝑊𝑡 𝜕𝑊𝑡 + 𝛽𝛥𝑊𝑡 𝐿 ∶ 損失関数 𝛽 ∶ 0.9 𝜂 : 0.0001(100epochごとに0.1倍) ・neutralは使用しない  イメージが無いから ・学習の様子 実装
  • 13. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Product Image Recognition model 13 ・standard loss( standard cross entropy )と weighted cross ( weighted cross entropy )で比較  重みの導入と精度や学習効率の関係を確認するため ・weighted cross の方が精度が高い ・100epochのほうが低い  オーバーフィッティングの影響 50 epoch 100 epoch 結果
  • 14. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Intelligent Design Generation Model 14 Product Image Recognition Modelで用いたデータセットだけでは不十分  UT Zappos 50Kから10240個の靴をランダムに選択  Product Image Recognition Modelよりラベル付け。大規模なデータセットを作成 各指標 (左側がPositive) Positive Negative Total Female - Male 4807 5433 10240 Retro - Modern 5844 4396 10240 Formal - Casual 7689 2551 10240 Plain - Gorgeous 4995 5245 10240 ラベル付け結果 データの前処理 GANを用いて、想定するイメージかつ革新的な製品を生成する
  • 15. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Intelligent Design Generation Model 15 ・DCGANとConditional GANから成る ・Generator  入力:100次元分の乱数、4次元(Female、Male、Formal、Casual) の商品ラベルに関するone hot encodingの連結 ⁃ 特徴を沢山持つのは稀だから ⁃ ユーザーは1~2個のスタイルを選ぶことが多い  出力:画像を生成 Generator Discriminator 実装 ・Discriminator  入力:本物の画像、Discriminatorの出力  出力:0~1の実数値(本物か偽物かを判定) ・収束するまで交互に学習
  • 16. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Intelligent Design Generation Model 16 ・ GeneratorとDiscriminatorを交互に更新  Generatorを固定、 Discriminatorを2回更新  Discriminatorを固定、 Generatorを1回更新 ・batch size=32 ・1 epochごとに320回学習。100epoch学習 ・ GeneratorとDiscriminatorのパラメータ:正規分布(平均0, 標準偏差0.02) ・Adamによりパラメータ更新 ・ Discriminatorの活性化関数:Leaky ReLU 学習時の詳細設定 学習時間に応じて、高品質な画像を生成 1 epoch 10 epoch 100 epoch
  • 17. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Intelligent Design Generation Model 17 ・右図は不適なサンプルも入っている ・イメージをもとに靴を生成できる ・生成された2000枚の画像のうち、不適なサンプルの割合は4.1%ほどあった  プロのデザイナーの知見に基づいて評価 定性的な評価 100epochでの生成結果 不適なサンプルが生成された理由 ・靴の色が複雑なものがある ・靴紐が細いものがある  靴紐と本体の繋がりがわかりにくい
  • 18. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Intelligent Design Generation Model 18 ・アンケート実施  生成された商品がイメージと合致しているか検証するため ・工業デザイン学科の大学院生・教員20名が被検者  23歳から40歳までの男性7名、女性13名 ・320枚のサンプルを作成  4.1%の不適なサンプルを除去。各イメージごとに25枚選択(合計100枚) ・被検者は、1枚のサンプルごとにイメージを選択  各自の経験をもとに選択  「Male Casual」、「Male Formal」 、「Female Casual」、「Female Formal」、 「non-conformance(どれにも適さない)」から選択 定量的な評価 16人以上(8割以上)の被検者が正しい選択をした場合 その生成サンプルはイメージ通り(True)と判断
  • 19. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Intelligent Design Generation Model 19 定量的な評価 誤ったパターンについて 結果 (例)Female Casual ・約半数のみがFemale Casualを選択したサンプルが2枚  Female Casual以外では、多くの人がnon-conformanceを選択 ・ non-conformanceを選択したうちの一人は、 Neutral Casual と判断した
  • 20. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 考察 20 ・ファッション以外でも、他分野の商品イメージに対して適応可能 Intelligent Design Generation Modelの応用 (例)自動車  必要な準備 ⁃ 自動車画像の用意 ⁃ ユーザーによる、イメージ評価(「モダン-レトロ」、「流行り-伝統的」な ど)をしてもらう (例)人間への支援  デザイナー ⁃ 生成された画像を参考に、改善が可能(労働時間削減、作業効率向上)  ユーザー ⁃ 生成された画像をもとに、自分の好みの理解につながる(外観の形成) ・現段階での課題:労力がかかる  画像は同じ視点から撮影  人手により行われるラベル付け  上記2つを満たしたラベル付き画像が大量にある 教師なし学習による商品イメージ認識を検討
  • 21. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 結論 21 ・消費者の抱くイメージとファッション商品のマッチングを目的 ・Product Image Recognition modelは、ユーザーとデザイナーの認識の一 致のため ・Intelligent Design Generation Modelは、革新的な商品を生成できる ・今回は、靴の画像に照準を絞る ・実験結果から、提案手法の実現可能性と有効性が示せた