SlideShare a Scribd company logo
1 of 21
CNNを用いた服飾画像に対する
アノテーションの学習に関する研究
北海道大学 工学部
情報エレクトロニクス学科 情報理工学コース
複雑系工学講座 調和系工学研究室
学部4年 神戸瑞樹
A study on Learning of annotation
for clothing images using CNN
steady. 2017年8月号, 宝島社, pg.20
2
服飾は「大人っぽい」「ガーリー」
などの印象的な語と
「ストライプ」「花柄」といった
形状的な語によって表現される
明確な定義がなく、受け手によって変わり得る
ものの一定の共通認識がある
non-no 2018年3月号, 集英社, pg.55
研究背景 主役級の甘め柄
こ
っ
く
り
甘
く
レ
ト
ロ
可
愛
く
大人ガーリー
研究目的
3
・調査できる範囲が狭い
(サンプル数百、影響を与える要因数個のみ)
・複数のアノテーションを学習する
にはモデルが複数必要
(段々と画像を直接扱うように)
万単位の服飾画像から複数のアノテーションを
定量的に抽出・評価する方法の確立
先行研究
・「パンツシルエット」[1]「プリーツ数とスカートの丈」[2]が服飾の印象に与え
る影響の調査
・重回帰[3]やニューラルネット[4],CNN[5]によるアノテーションの学習
何が売れてるかの分析から
何故売れてるかの分析に移行できる
[1]藤井 一枝. パンツシルエットが着装評価に及ぼす影響. 繊維機械学会誌,
Vol.52, No.11, pp. T255–T262, 1999
[2]李 正和, 丸田 直美, 廣川 妙子. プリーツ数とスカート丈の変化が年齢層
別プリーツスカートの視覚的イメージに及ぼす影響. 日本感性工学会論文
誌, Vol.11, No.3, pp. 397–406, 2012
[3]今村 亮介, 椎塚 久雄. 重回帰分析を用いた T シャツデザインの感性評価.
工学院大学研究報告, Vol. 101, pp. 135–139, 2006
[4]太田 茂, 竹之内 宏, 徳丸 正孝. 深層ニューラルネットワークによる特徴
抽出を用いた衣服の感性検索. 日本感性工学会論文誌, Vol.16, No.3, pp.
277–283, 2017
[5] Hossein Talebi and Peyman Milanfar. NIMA: Neural Image Assessment
アプローチ方法
4
ガーリー:0.6
CNN
…
アノテーションの付与
学習方法決定
印象的なもの、形状的なもの
カットソー
無地
ガーリー
結果の解釈
CNN
損失関数
最適化手法
評価方法
出力の可視化
ガーリー
大人っぽい
甘い
無地
花柄
カットソー
アノテーションの例
CNNの入力と出力例
カットソー:0.9
無地:0.8
10
可視化の例
CNNの出力(ガーリーと付与される確率)
ガ
ー
リ
ー
と
付
与
ア
ノ
テ
ー
シ
ョ
ン
ガ
ー
リ
ー
と
付
与
さ
れ
て
い
な
い
アノテーションについて
印象的なものと形状的なものが存在
5
印象的
4段階
バイナリ
6個
77個
{1.0, 0.66, 0.33, 0.0}
{1, 0}
形状的
65個バイナリ
10個カテゴリ 当てはまるもの1つを選択
データ提供元のアパレルメーカーが付与
一人の判断で付与している
一つの商品に対して色違いで複数枚の画像が存在
同じアノテーション
横一列は色違い商品数23852 、画像枚数71658
とても当てはまる
やや当てはまる
あまり当てはまらない
全く当てはまらない
ワンピース
パンツ
アノテーションの例(カテゴリ) 6
カットソー
ブラウス
ニット
コート
ジャケット
ブルゾン
スカート
パンツ
ワンピース
スーツ
カテゴリ一覧
スカート
アノテーションの例(バイナリ(形状的))
7
ふわふわ Aライン バンドカラー
ひらひら
コクーンシルエット、
丸みを帯びた
ノーカラー、
襟がない
もこもこ
ふんわり、
ふわっとしたシルエット
スキッパー
とろみ、テロテロした、
ツヤツヤした
ボックスシルエット カシュクール
さらりとした、
さらっとした
アシメントリー タートルネック
なめらか、しなやかな ボーイフレンド ボートネック
薄手の 無地 Vネック
厚手の 花柄
ハイネック、
モックネック
パステル ボーダー
袖コンシャス、
袖に特徴がある
ヴィヴィッド、鮮やか ストライプ バックコンシャス
ジャストサイズ ラメ ハイウエスト
ワイドシルエット チェック ウエストマーク
タイトシルエット ドット リボンが使われている
スキニーシルエット レース スリットが入っている
ショート丈 刺繍 ファー
ミディ丈 ボヘミアン フリル
ミモレ丈 アニマル柄 プリーツ
マキシ丈 ペイズリー柄 ギャザー
アンクル丈 星柄 デコルテ見せ
フレア ドロップショルダー リメイク調
Iライン オフショルダー ロゴ入り
オープンカラー 肌見せ
バイナリのアノテーション(形状的)一覧
付与 付与されていない
花柄
アノテーションの例(4段階評価)
8
4段階評価のアノテーション一覧
かわいい
きれい
かっこいい、クール
モテ服、モテる
セクシー
おしゃれ
とても当てはまる 全く当てはまらない
かわいい
アノテーションの例(バイナリ(印象的)) 9
光沢感がある
個性的、
個性の強い、独特の
季節を選ばず着られる、
シーズンレス
透け感があり 甘い
腕を細く見せられる、
二の腕カバー
落ち感がある 辛い
リラックスできる、
くつろげる
春らしい、春に着たい 可愛らしい
解放感のある、
自由な気分になれる
夏らしい、夏に着たい 大人っぽい ヘルシー、健康的に見える
秋らしい、秋に着たい 爽やか
体のラインを美しく見せて
くれる
冬らしい、冬に着たい 華やか ハレの日、人生のイベント
カジュアル 軽やか
高級感を感じさせる、高見
えする
定番、ベーシック、シンプル フレッシュな、若々しい 子どもの入学式
コンサバ 清潔感がある、きれいめ、上品 入社式
ナチュラル、飾らない、自然体の
清楚、清らか、
育ちが良さそうな
新生活、新しい職場での始
まりに
ストリート
きちんとしている、
仕事で着ていけそう
マリン、海、ビーチ
ガーリー
好感が持てる、
好感度アップする
お祭り、花火大会
フェミニン
親しみやすい、
親近感アップする
アウトドア
モード 優しい感じがする 美術館巡り、芸術鑑賞
クール、スタイリッシュ 周りから浮かない 紅葉
エレガント、優雅な 落ち着いた雰囲気 クリスマス
エスニック、異国風な 伸縮性がある 通勤、オフィス
クラシック、
トラディショナルな
通気性が良い 休日のお出かけに
マニッシュ、男性的な 着回しやすそう
オンオフ兼用(仕事でも休
日でも)
ボーイッシュ、男の子っぽい
着痩せしそう、
スタイルアップ
子どもの送り迎えに行ける
スポーティー 美脚に見えそう 合コン(異性ウケする)
元気、アクティブ、
活動的な、活発な
インパクト抜群、
インパクトが強い
女子会(同性ウケする)
都会的、アーバンな
スタイリングの
主役アイテムになる
デート
シックな、垢ぬけている、
洗練されている
着てインスタに投稿したくなる、
インスタ映え
パーティー
盛れる、自分を
よりよく見せてくれる
旅行
バイナリのアノテーション(印象的)一覧
ガーリー
付与 付与されていない
アノテーションのばらつき 10
印象的なアノテーションは似た服飾画像に付与されている場合
と付与されていない場合がある
形状的なアノテーションは似た服飾画像には同一のアノテー
ションが付与される場合が多い
ガーリー
付与 付与されていない
ワンピース
パンツ
スカート
CNNの構造
11
画像認識のデファクトスタンダードであるCNNを使用
ネットワーク構造
カテゴリ、4段階評価、バイナリ評価のものを
学習するため3つに枝分かれ
正解ラベル
カテゴリ:ワンホットラベル
4段階:マルチラベル
バイナリ:マルチラベル
出力
カテゴリ:アノテーションの付く確率
4段階:アノテーションの度合い
バイナリ:アノテーションの付く確率
予備実験でVGG16[1], Inception-v3[2],
Resnet[3]からResnetを選択
基本ユニットからなるブロックが複数存在
し、ブロックごとに次元数が異なる
[1]Karen Simonyan and Andrew Zisserman. Very Deep Convolutional
Networks for Large-Scale Image Recognition. Sep 2014.
[2] Christian Szegedy, Vincent Vanhoucke, Sergey Ioffe, Jonathon
Shlens, and Zbigniew Wojna. Rethinking the Inception Architecture
for Computer Vision. dec 2015.
[3] Kaiming He, Xiangyu Zhang, Shaoqing Ren, and Jian Sun. Deep
Residual Learning for Image Recognition. dec 2015.
損失関数
12
カテゴリ:クロスエントロピー
4段階:重み付きMSE
(各段階の数) × (各段階の重み) = const
スケールを合わせたものを全体の損失
重み付けしないとデータ数の影響が大きい
(各段階の数) × (各段階の重み) = const
バイナリ:重み付きシグモイドクロスエントロピー
各アノテーションに対して全て0と答えるだけで平均正解
率が87.9%となってしまい、学習が進まない
𝑙1 = −
𝑘=1
𝑁 𝑐
𝑥 𝑘 log 𝑧 𝑘
𝑥:CNNの出力 𝑧:正解ラベル
w 𝑘1 = 1 𝑙2 =
1
𝑛 𝑏𝑎𝑡𝑐ℎ
1
𝑁4
𝑚=0
𝑛 𝑏𝑎𝑡𝑐ℎ
𝑘=1
𝑁4
( 𝑥 𝑘𝑚 − 𝑧 𝑘𝑚 𝑤 𝑘𝑧 𝑘𝑚
)2
𝑤 𝑘𝑗 =
𝑛 𝑘1
𝑛 𝑘𝑗
, ,
𝑙3 =
1
𝑁2
𝑘=1
𝑁2
(−α 𝑘 𝑥 𝑘 log 𝑧 𝑘 − (1 − 𝛼 𝑘)(1 − 𝑥 𝑘) log(1 − 𝑧 𝑘))α 𝑘 =
𝑛 𝑘1
𝑛k1 + 𝑛 𝑘0
,
最適化手法
13
予備実験でAdadelta[1], Adam[2],
SGDR[3]からSGDRを選択
何度か学習率を0にしてから戻す段階で
鞍点を抜けると考えられ、
アンサンブル効果が期待できる
SGD+Momentumの学習率を
コサインアニーリングで変化させる
[1]Matthew D. Zeiler. ADADELTA: An Adaptive Learning Rate
Method. Dec 2012.
[2]DiederikP. Kingma and Jimmy Ba. Adam: A Method for
Stochastic Optimization. dec 2014.
[3] Ilya Loshchilov and Frank Hutter. SGDR: Stochastic Gradient
Descent with Warm Restarts. aug 2016.
実験
14
目的 アノテーションの学習に適した手法、
パラメータの探索
設定
・from scratch
・fine-tuning from block3
・fine-tuning from block4
の3つの方法
初期学習率はlr ={0.1, 0.05}の2通り
計6通りで学習、比較
赤で囲まれた部分を学習
・他はimagenetの学習済みモデル
の重みで固定
評価方法
カテゴリ:top1 accuracy
4段階:MAE
バイナリ:感度と特異度の平均
訓練 テスト
商品数 21466 2386
画像枚数 64462 7196
データ数
30, 70, 150エポックのアンサンブル
batch_size:50, epoch:150,
weight decay:0.0001, momentum:0.9
結果
15
MAE
(4段階)
感度と特異
度の平均
(バイナリ)
Top1
accuracy
(カテゴリ)
from scratch
(lr=0.1)
0.241 65.6% 89.6%
from scratch
(lr=0.0.5)
0.237 65.8% 89.8%
Fine-tuning
from block3
(lr=0.1)
0.241 67.7% 90.8%
Fine-tuning
from block3
(lr=0.05)
0.239 68.1% 91.3%
Fine-tuning
from block4
(lr=0.1)
0.242 68.1% 91.0%
Fine-tuning
from block4
(lr=0.05)
0.238 69.0% 91.4%
ファインチューニングの方が良い
・ゼロから学習する部分を増やすに
はデータ数が足りない
通常の正解率は全部0と答えれば8割超え
感度(1とついたものを当てられた確率)
特異度(0とついたものを当てられた確率)
平均を取るとチャンスレベルは50%
F値だとアノテーションごとにチャンスレ
ベルが変わってしまう
バイナリは最高でも69%だが、学習で
きていないのではなく、意見が別れる
ものを一人でつけたというデータの性
質によるものと考えられる
個別の結果を見て検証
印象的
4段階
バイナリ
6個
77個
形状的
65個バイナリ
10個カテゴリ
スーツと付与された画像群
カットソー ブラウス ニット
カットソーと認識した画像群
結果(カテゴリ)
16
スーツが低いのはアノテーション
に問題あり
カテゴリ
Top1
accuracy
商品数
①カットソー 83.2% 3291
②ブラウス 92.2% 3657
③ニット 93.5% 5172
④コート 88.3% 908
⑤ジャケット 75.0% 907
⑥ブルゾン 64.1% 449
⑦スカート 98.5% 3536
⑧パンツ 95.3% 2431
⑨ワンピース 96.4% 3424
⑩スーツ 7.41% 77
全体 91.4% 23852
カテゴリとTop1 accuracy
① ② ③ ④ ⑤ ⑥ ⑦ ⑧ ⑨ ⑩
① 858 85 58 6 5 1 0 0 18 0
② 52 997 14 0 0 0 2 0 16 0
③ 69 11 1785 9 7 1 9 3 16 0
④ 0 1 10 219 7 8 0 1 2 0
⑤ 5 1 5 14 174 31 0 0 2 0
⑥ 2 3 3 4 24 66 0 0 1 0
⑦ 0 0 1 0 0 0 912 13 0 0
⑧ 0 1 2 0 0 0 27 690 4 0
⑨ 5 10 11 2 0 0 1 0 877 4
⑩ 1 0 0 0 0 0 0 0 24 2
予測
トップスがボトムスと比べて低めなのは
違いがはっきりしていないから
ア
ノ
テ
ー
シ
ョ
ン
印象的
4段階
バイナリ
6個
77個
形状的
65個バイナリ
10個カテゴリ
結果(4段階評価のアノテーション)
17
1.0 0.66 0.33 0.0 ALL
かわいい 0.302 0.142 0.253 0.515 0.241
きれい 0.320 0.125 0.267 0.532 0.240
かっこいい、クール 0.449 0.226 0.169 0.330 0.257
モテ服、モテる 0.411 0.189 0.188 0.383 0.230
セクシー 0.509 0.266 0.136 0.305 0.237
おしゃれ 0.394 0.144 0.223 0.495 0.224
重みをつけたが、
未だに数の影響がある
4段階評価のアノテーションとMAE
どれだけ人に近いか検証
付与数が最小の段階
平均1734商品
付与数が最大の段階
平均9603商品
複数人でアノテーションを
付け、CNNの出力と比較
右側にかわいい服が多いこと
を専門家に確認してもらった
とても当
てはまる
(1.0)
ア
ノ
テ
ー
シ
ョ
ン
1.00.0 CNNの出力(かわいさの度合い)
やや当て
はまる
(0.66)
全く当て
はまらな
い(0.0)
あまり当
てはまら
ない(0.33)
印象的
4段階
バイナリ
6個
77個
形状的
65個バイナリ
10個カテゴリ
結果(バイナリのアノテーション)
18
無地 83.6%
花柄 89.3%
ボーダー 81.3%
甘い 61.7%
ハレの日、人生の
イベント
67.6%
お祭り、花火大会 69.8%
休日のお出かけに 57.4%
親しみやすい、親
近感アップする 59.0%
軽やか 59.2%
印象的なものは感度と特異度の平均が低く、
形状的なものは高い傾向
印象的なものの方が人の意見が分かれる
平均
印象的 65.2%
形状的 73.5%
全体 69.0%
印象的
4段階
バイナリ
6個
77個
形状的
65個バイナリ
10個カテゴリ
0
10
20
30
40
50
60
70
80
90
40~60% 60~70% 70~80% 80~90% 90%~
印象的 形状的 全体
CNNの出力とアノテーション
19
甘い(61.7%)
色は甘いけどトレンチコートなので甘くない
甘
い
と
付
与
ア
ノ
テ
ー
シ
ョ
ン
0 CNNの出力(甘いと付与される確率) 1
甘
い
と
付
与
さ
れ
て
い
な
い
CNNの出力とアノテーション
20
どれだけ人間に近いか検証が必要
夏らしい、夏に着たい (73.9%)
アノテーションは付いていないが半袖の
シャツ、ブラウスなので夏らしい
付いていたアノテーションにバラつきはあるが、
右側に夏らしい服が多いことを専門家に確認してもらった
10
複数人でアノテーションを付け、CNNの出力と比較
夏
ら
し
い
と
付
与
ア
ノ
テ
ー
シ
ョ
ン
CNNの出力(夏らしいと付与される確率)
夏
ら
し
い
と
付
与
さ
れ
て
い
な
い
まとめ
21
アノテーションの学習を行うために以下を行った
・23852商品にアノテーションを付与
・結果の解釈
印象的、形状的なアノテーション
・学習機構の決定
CNN構造の選択、損失関数の設定、最適化手法の選択
実用における有効性の検証
複数人でアノテーションを付与し、CNNの出力と比較
バイナリは69%の精度だった
形状的なものは73%で印象的なものは65%
一人の判断で付与したことを考慮すると学習できていると考えられる

More Related Content

More from harmonylab

DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat ModelsDLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Modelsharmonylab
 
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose EstimationDLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimationharmonylab
 
Voyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language ModelsVoyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language Modelsharmonylab
 
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose EstimationDLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimationharmonylab
 
ReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language ModelsReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language Modelsharmonylab
 
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究harmonylab
 
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究harmonylab
 
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究harmonylab
 
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究harmonylab
 
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究harmonylab
 
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究harmonylab
 
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...harmonylab
 
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究harmonylab
 
A Study on Generation of Deformed Route Maps using Octilinear Grid
A Study on Generation of Deformed Route Maps using Octilinear GridA Study on Generation of Deformed Route Maps using Octilinear Grid
A Study on Generation of Deformed Route Maps using Octilinear Gridharmonylab
 
A Study on the Generation of Clothing Captions Highlighting the Differences b...
A Study on the Generation of Clothing Captions Highlighting the Differences b...A Study on the Generation of Clothing Captions Highlighting the Differences b...
A Study on the Generation of Clothing Captions Highlighting the Differences b...harmonylab
 
A Study on Clothing Recommendation Information Presentation System Based on C...
A Study on Clothing Recommendation Information Presentation System Based on C...A Study on Clothing Recommendation Information Presentation System Based on C...
A Study on Clothing Recommendation Information Presentation System Based on C...harmonylab
 
深層学習を用いたバス乗客画像の属性推定 に関する研究
深層学習を用いたバス乗客画像の属性推定 に関する研究深層学習を用いたバス乗客画像の属性推定 に関する研究
深層学習を用いたバス乗客画像の属性推定 に関する研究harmonylab
 
Emotionally Intelligent Fashion Design Using CNN and GAN
Emotionally Intelligent Fashion Design Using CNN and GANEmotionally Intelligent Fashion Design Using CNN and GAN
Emotionally Intelligent Fashion Design Using CNN and GANharmonylab
 
Towards Total Recall in Industrial Anomaly Detection
Towards Total Recall in Industrial Anomaly DetectionTowards Total Recall in Industrial Anomaly Detection
Towards Total Recall in Industrial Anomaly Detectionharmonylab
 
Feature Erasing and Diffusion Network for Occluded Person Re-Identification
Feature Erasing and Diffusion Network for Occluded Person Re-IdentificationFeature Erasing and Diffusion Network for Occluded Person Re-Identification
Feature Erasing and Diffusion Network for Occluded Person Re-Identificationharmonylab
 

More from harmonylab (20)

DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat ModelsDLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
 
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose EstimationDLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
 
Voyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language ModelsVoyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language Models
 
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose EstimationDLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
 
ReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language ModelsReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language Models
 
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
 
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
 
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究
 
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
 
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
 
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
 
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
 
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
 
A Study on Generation of Deformed Route Maps using Octilinear Grid
A Study on Generation of Deformed Route Maps using Octilinear GridA Study on Generation of Deformed Route Maps using Octilinear Grid
A Study on Generation of Deformed Route Maps using Octilinear Grid
 
A Study on the Generation of Clothing Captions Highlighting the Differences b...
A Study on the Generation of Clothing Captions Highlighting the Differences b...A Study on the Generation of Clothing Captions Highlighting the Differences b...
A Study on the Generation of Clothing Captions Highlighting the Differences b...
 
A Study on Clothing Recommendation Information Presentation System Based on C...
A Study on Clothing Recommendation Information Presentation System Based on C...A Study on Clothing Recommendation Information Presentation System Based on C...
A Study on Clothing Recommendation Information Presentation System Based on C...
 
深層学習を用いたバス乗客画像の属性推定 に関する研究
深層学習を用いたバス乗客画像の属性推定 に関する研究深層学習を用いたバス乗客画像の属性推定 に関する研究
深層学習を用いたバス乗客画像の属性推定 に関する研究
 
Emotionally Intelligent Fashion Design Using CNN and GAN
Emotionally Intelligent Fashion Design Using CNN and GANEmotionally Intelligent Fashion Design Using CNN and GAN
Emotionally Intelligent Fashion Design Using CNN and GAN
 
Towards Total Recall in Industrial Anomaly Detection
Towards Total Recall in Industrial Anomaly DetectionTowards Total Recall in Industrial Anomaly Detection
Towards Total Recall in Industrial Anomaly Detection
 
Feature Erasing and Diffusion Network for Occluded Person Re-Identification
Feature Erasing and Diffusion Network for Occluded Person Re-IdentificationFeature Erasing and Diffusion Network for Occluded Person Re-Identification
Feature Erasing and Diffusion Network for Occluded Person Re-Identification
 

Recently uploaded

業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)Hiroshi Tomioka
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NTT DATA Technology & Innovation
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案sugiuralab
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 

Recently uploaded (9)

業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 

kambe