DEIM2022_根岸寛太.pptx

2022/03/02
根岸寛太，伊藤寛祥，松原正樹，森嶋厚行
1
結果品質と労働負荷分散を両立したタスク割当て手法
DEIM Forum 2021 E41-4

発表内容
2
【背景】過去実績のみでタスクを割当てると仕事を引き受けられる
ワーカが少なくなる
【仮説】タスク難易度とワーカ能力を考慮したタスク割り当て
により，結果品質を維持しながら多くの人々が仕事に従事できる
【RQ1】この仮説は正しいか？ => IRTを利用した割当て実験を
行い検証 => ポジティブな結果
【RQ2】タスクの難易度がわからない場合に推定をして，同様の
結果はどこまで可能か？=>ある程度可能なケースもあった
【関連研究】混同行列やドメインを考慮した割当てとは相補的な
関係にある

発表内容
3
関係にある

研究背景(1/2)
労働市場のプラットフォーム化が進んでいる
例: Amazon Mechanical Turk, Crowd Works
4
プラットフォーム
働き手
(ワーカ)
仕事
(タスク)
割当て
依頼者
(リクエスタ)
発注

研究背景：過去実績によるワーカ選択の問題点
-
過去実績によるタスク割り当ては労働負荷を集中させる
★：正解率, 評価
5
★★★★★
★☆☆☆☆ ★★★☆☆
ワーカ
タスク
・労働負荷が集中
・就労機会の制限

発表内容
6
【背景】クラウドソーシングのタスク割り当てをワーカの単純な
過去実績だけでやると仕事を引き受けられる人が少なくなる
【仮説】タスク難易度とワーカ能力を考慮したタスク割り当てに
より，結果品質を維持しながら多くの人々が仕事に従事できる
結果はどこまで可能か？=>予備的実験 => ある程度可能なケース
もあった
関係にある

仮説
7
【仮説】タスク難易度とワーカ能力を考慮したタスク割当てにより，
結果品質を維持しながら労働負荷分散を小さくできる
タスク難易度
ワーカ能力
【RQ1】この仮説は正しいか？
【RQ2】タスクの難易度がわからない場合, 難易度推定により
結果品質と労働負荷分散の両立はどこまで可能か？

提案手法
8
(2) 割当て用タスクの難易度推定
タスク難易度
(1) 項目反応理論(IRT)による
ワーカ能力推定
RQ1: ワーカの回答結果
を利用する
RQ2: AIモデルの回答結果
を利用する
ワーカ
テスト用タスク
割当て用タスク
✕
(3) タスク割当てを実行
能力と難易度に基づく割当て
ワーカ能力
✕
タスク

仮説検証のためのフレームワーク
9
タスク難易度
を利用する
を利用する
ワーカ
✕
ワーカ能力
✕
タスク

項目反応理論によるパラメータ推定
10
項目反応理論 (Item Response Theory)
・テストによる学習評価のモデル
・ワーカ能力，タスク困難度を1次元の尺度で推定可能
タスク難易度b
〇〇 ✕
✕ ✕ 〇
✕ 〇〇
ワーカ能力θ
P(correct) > threshold(%)
結果品質を保証

11
タスク難易度
を利用する
を利用する
ワーカ
✕
ワーカ能力
✕
タスク

割当て用タスクの困難度推定
12
RQ1: 「タスク難易度とワーカ能力を考慮したタスク割当てにより，結果品質を
維持しながら労働負荷を分散できるか? 」
RQ2: 「タスクの難易度がわからない場合, 難易度を推定し結果品質を維持
しながら労働負荷を分散できるか? 」
✕
✕
出力
・回答
・確信度
…
タスク難易度
タスク難易度
・ワーカのタスクへの回答が得られる:
IRTで難易度推定
・ワーカのタスク回答が得られない:
AIモデルの出力から難易度推定

13
タスク難易度
を利用する
を利用する
ワーカ
✕
ワーカ能力
✕
タスク

タスク割当てアルゴリズム
14
割当ての戦略
(1) 難易度の低いタスクから先に割当てる
(2) 能力の低いワーカを優先する
ワーカ能力
タスク難易度

15
割当ての戦略
ワーカ能力
タスク難易度

16
割当ての戦略
ワーカ能力
タスク難易度

17
割当ての戦略
ワーカ能力
タスク難易度

18
割当ての戦略
ワーカ能力
タスク難易度

19
割当ての戦略
ワーカ能力
タスク難易度

提案手法
20
タスク難易度
を利用する
を利用する
ワーカ
✕
ワーカ能力
✕
タスク

実験手続き: データ収集
21
・ニュース記事テキストの分類タスクを設計
- AIワーカの回答正誤を判定するタスク
- news-aggregator-dataset[1]
・Amazon Mechanical Turkで
タスクを依頼, 回答を集める
- 100タスク,ワーカ100人 Answer
fed official says weak data
caused by weather should not
slow taper
分類テキストの例：

実験手続き: タスク割当てシミュレーション
22
〇〇 ✕
✕ ✕ 〇
✕ 〇〇
(3)割当て結果の評価
・正解率
・労働負荷の分散
ワーカのタスク回答結果を使って割当てシミュレーション
・0.5, 0.51, … , 0.8 の正解率thresholdについて割当て
(1)入力:
ワーカのタスク回答
(2)割当ての実行
ワーカ20人, タスク40件
thresholdを更新

実験条件: ベースライン手法
23
名称割当て方式特徴
top
テストの平均正解率上位5人にのみ
割当てる
タスクの正解率: 高い
労働負荷分散: 大きい
random
ランダムにワーカを選択するタスクの正解率: 低い
労働負荷分散: 小さい
ours
能力と難易度に基づき，ワーカ間で
タスクを分担させる割当て
タスクの正解率: どれほど高いか?
労働負荷分散: どれほど小さいか?
比較ポイント: 提案手法は
(1) タスク割当て結果の正解率(Accuracy)を高く維持できるか?
(2) ワーカ間の労働負荷分散(Variance)を小さく抑えられるか?
提案手法と2つのベースライン手法を比較する

発表内容
24
関係にある

実験結果(RQ1)：
25
提案手法はtop割当てよりもタスク数
(労働負荷)分散を小さくできる
提案手法はrandom・top 割当て
以上の正解率を維持できる
タスク難易度とワーカ能力を考慮したタスク割当てにより，
結果品質を維持しながら労働負荷を分散できるか?

考察(RQ1):
26
正しいタスク難易度とワーカ能力による割当てでは品質を維持しな
がらより多くの人がタスクに従事可能
能力の低いワーカに簡単な
タスクを割当て可能
RQ1: ポジティブな結果が得られた
能力の高いワーカに難しい
タスクを割当て可能
タスク難易度とワーカ能力を考慮したタスク割当てにより，
結果品質を維持しながら労働負荷を分散できるか?

発表内容
27
関係にある

実験結果(RQ2)：
28
提案手法は上位ワーカのみへの割当て
よりも労働負荷(タスク数)分散を小さくで
きる
提案手法はランダム割当て
よりも高品質の結果を維持できる
タスクの難易度がわからない場合, 難易度を推定し結果品質
を維持しながら労働負荷を分散できるか?

考察(RQ2):
29
提案手法ではワーカとタスクのミスマッチが起こる
難しいタスクを能力の低い
ワーカに割当てている
=> 品質の低下
簡単なタスクを能力の高い
いワーカに割当てている
=> 労働負荷の集中
RQ2: AIモデルの回答による
タスク難易度の推定精度に課題がある
タスクの難易度がわからない場合, 難易度を推定し結果品質
を維持しながら労働負荷を分散できるか?

発表内容
30
関係にある

関連研究
31
・iCrowd: An adaptive framework for crowdsourcing [1]
目的: 結果品質と割当て効率の向上
手法: ワーカがタスクに正答できる確率を推定した上で割当てる,
→ 本研究では正解率とタスクの分担を両立を目的とする
・Hashimoto[2]
目的: 正解率とタスクの分担を両立
手法: ワーカ能力, タスクに必要な能力が与えられた状態で割当て
→ 本研究ではワーカ能力，タスク難易度を推定した上で
正解率とタスクの分担を両立させる手法を提案する

まとめ
1. タスクの特徴量を利用して難易度を推定するモデルの構築
2. 多次元のスキルを評価した割当て
3. 割当てタスク数以外の要素を考慮した労働負荷分散手法
- 労働時間, 報酬など
32
目的：タスクの結果品質を維持しつつワーカ間でタスクを
分担させる
提案手法：タスクの難易度を推定しワーカのスキルに
応じて割当てる
実験: 品質を維持しながらワーカ間でタスクを分担
できたがタスクの難易度推定に課題が見られた
今後の課題

参照文献
34
1) Baker Frank B., Kim Seock-Ho. Item response theory: Parameter estimation techniques. ,
CRC Press, 2004
2) Cheng Peng, Lian Xiang, Chen Lei, Han Jinsong, Zhao Jizhong. Task assignment on multi-
skill oriented spatial crowdsourcing. IEEE Tran.KDE. 2016, vol. 28, no. 8, p. 2201-2215.
3) Dawid Alexander Philip, Skene Allan M. Maximum likelihood estimation of observer error-
rates using the EM algorithm. Journal of the Royal Statistical Society: Series C (Applied
Statistics). 1979, vol. 28, no. 1, p. 20-28.
4) ICrowd: An Adaptive Crowdsourcing Framework, Ju FanGuoliang LiBeng Chin OoiKian-lee
TanJianhua Feng. 2015, p. 1015-1030.
5) An empirical study of the naive Bayes classifier, Irina and others Rish. 2001, p. 41-46.
6) 森嶋厚行, 喜連川優. クラウドソーシングが不可能を可能にする : 小さな力を集めて大きな力に変える
科学と方法. 共立出版, 2020
7) 鹿島久嗣, 小山聡, 馬場雪乃. ヒューマンコンピュテーションとクラウドソーシング = Human
computation and crowdsourcing. , 講談社, 2016

(補足スライド2)ワーカ未回答タスクの難易度推定
35
タスクの難易度はAIモデルの回答に依存すると仮定
(1) テストタスク結果から各タスクの
困難度をIRTで求める
(2) 各カテゴリごとにタスクの平均困難度を
計算する
(3) AIモデルによる回答(分類先カテゴリ)を
参照する
(4) そのカテゴリの平均困難度を
そのタスクの難易度とする

DEIM2022_根岸寛太.pptx

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Similar to DEIM2022_根岸寛太.pptx

Similar to DEIM2022_根岸寛太.pptx (8)

DEIM2022_根岸寛太.pptx

Editor's Notes