SlideShare a Scribd company logo
1 of 7
Download to read offline
圧縮率による著者推定法の
ニンジャスレイヤーへの応用
Applications of Authorship Attribution
Using Data Compression Program for “Ninja Slayer”
NJRecalls開発チーム @NJRecalls
2011
2012
2013
2014
2015
2016
NJRecalls開発チームについて
・ニンジャスレイヤー
 Twitter連載開始
・ニンジャヘッズ化
・NJRecallsリリース
・博士(生命科学)
・奈良県民になる
・Ninja Maskerリリース
日本分子生物学会
ショウジョウバエ研究会
・NJCollectorリリース
ニンジャ学会
・フラれる
マキモノ
戯画化された
ウサギ
圧縮率による著者推定法
「バカな……行き止
まりとは……!」ニ
ンジャスレイヤーが
「バカな……行き止
まりとは……!」蛇
矛を構えたスパルト
「バカな……行き止
まりとは……!」蛇
矛を構えたスパルト
「バカな……行き止
まりとは……!」ニ
ンジャスレイヤーが
100→60
100→50
200→90
圧縮プログラムはデータ内の繰り返し部分を一つにまとめることで圧縮
を行います。このため、似ていいる文章を二つ繋げてから圧縮すると、
単体で圧縮したものより圧縮率が向上します(安形 輝. 2005)。
圧縮改善係数を基にしたクラスタリング
12_B_BtFoS.txt
06_B_MNR.txt
18_B_DARD.txt
08_B_CHBtE.txt
29_B_tMWCtStR.txt
09_B_WfMN.txt
16_B_TDNB.txt
22_B_GwF.txt
17_M_CoEKotSoDNS.txt
24_M_RR.txt
28_M_TVA.txt
03_M_RDA.txt
07_M_GKSaH.txt
10_M_DfAS.txt
13_M_TMLC.txt
15_M_NEN.txt
0 2 4 6 8
タイトル クライアント コメント
ビヨンド・ザ・フスマ・オブ・サイレンス Tweetlogix ボンド
モータル・ニンジャ・レジスター Tweetlogix ボンド
ディフュージョン・アキュミュレイショ
ン・リボーン・ディストラクション
Tweetlogix ボンド
クライ・ハヴォック・ベンド・ジ・エンド
Tweetbot for
iOS
ボンド
ザ・マン・フー・カムズ・トゥ・スラム・
ザ・リジグネイション
TweetList Pro ボンド
ウェイティング・フォー・マイ・ニンジャ Tweetlogix ボンド
スリー・ダーティー・ニンジャボンド Tweetlogix ボンド
ガントレット・ウィズ・フューリー TweetList Pro ボンド
カース・オブ・エンシェント・カンジ、オ
ア・ザ・シークレット・オブ・ダークニン
Saezuri モーゼズ
リブート、レイヴン Saezuri モーゼズ
トビゲリ・ヴァーサス・アムニジア Saezuri モーゼズ
リキシャー・ディセント・アルゴリズム Saezuri モーゼズ
ゲイシャ・カラテ・シンカンセン・アン
ド・ヘル
Saezuri モーゼズ
デス・フロム・アバブ・セキバハラ Saezuri モーゼズ
チューブド・マグロ・ライフサイクル Saezuri モーゼズ
ナイト・エニグマティック・ナイト Saezuri モーゼズ
ボンド(担当チーム)
モーゼズ(担当チーム)
詳しくは論文で
論文の内容まとめ
今回の結果
• ある程度の長さの文字列を与えることで、ボンドと
モーゼズ(担当ユニット)を区別できた
• ニンジャスレイヤーとシャーロックホームズを区別
できた
• 第一部、第二部、第三部を通じてボンドとモーゼズ
(担当ユニット)を区別できた
• 翻訳チームの二次創作やオリジナル作品をどちらの
ユニットが書いているかも区別できた
• 上記結果は先行研究とも整合性がある
課題
手法的限界
• クラスタリングを使用するため、サンプルのうち多
数派に「引きずられる」
• ある程度の文字数を要するため、初期短編やアナウ
ンス等に適用できない
挑むべき謎
• Tantouの正体
• 翻訳チームの正体
ご清聴ありがとうございました
論文で使用した
アプリも公開中です
ニンジャが見えてくる
アプリも公開中です
NJCollector
(for Mac)
Ninja Masker
(for iPhone)

More Related Content

More from 誠 小林

Ruby で書く! Quine aa
Ruby で書く! Quine aaRuby で書く! Quine aa
Ruby で書く! Quine aa誠 小林
 
転職活動ふりかえり
転職活動ふりかえり転職活動ふりかえり
転職活動ふりかえり誠 小林
 
Unicodeの square era name から新元号を占う
Unicodeの square era name から新元号を占うUnicodeの square era name から新元号を占う
Unicodeの square era name から新元号を占う誠 小林
 
お仕事のコミュニケーションをスキルで解決
お仕事のコミュニケーションをスキルで解決お仕事のコミュニケーションをスキルで解決
お仕事のコミュニケーションをスキルで解決誠 小林
 
いかにしてバンデラスはうまれるか
いかにしてバンデラスはうまれるかいかにしてバンデラスはうまれるか
いかにしてバンデラスはうまれるか誠 小林
 
ニンジャは忍者か
ニンジャは忍者かニンジャは忍者か
ニンジャは忍者か誠 小林
 
人類にはまだ早いCSV
人類にはまだ早いCSV人類にはまだ早いCSV
人類にはまだ早いCSV誠 小林
 
サキブレの統計および 更新期間帯の予測
サキブレの統計および 更新期間帯の予測サキブレの統計および 更新期間帯の予測
サキブレの統計および 更新期間帯の予測誠 小林
 
ニンジャ学会のご紹介
ニンジャ学会のご紹介ニンジャ学会のご紹介
ニンジャ学会のご紹介誠 小林
 
Javascript を使ってみよう!!
Javascript を使ってみよう!!Javascript を使ってみよう!!
Javascript を使ってみよう!!誠 小林
 

More from 誠 小林 (10)

Ruby で書く! Quine aa
Ruby で書く! Quine aaRuby で書く! Quine aa
Ruby で書く! Quine aa
 
転職活動ふりかえり
転職活動ふりかえり転職活動ふりかえり
転職活動ふりかえり
 
Unicodeの square era name から新元号を占う
Unicodeの square era name から新元号を占うUnicodeの square era name から新元号を占う
Unicodeの square era name から新元号を占う
 
お仕事のコミュニケーションをスキルで解決
お仕事のコミュニケーションをスキルで解決お仕事のコミュニケーションをスキルで解決
お仕事のコミュニケーションをスキルで解決
 
いかにしてバンデラスはうまれるか
いかにしてバンデラスはうまれるかいかにしてバンデラスはうまれるか
いかにしてバンデラスはうまれるか
 
ニンジャは忍者か
ニンジャは忍者かニンジャは忍者か
ニンジャは忍者か
 
人類にはまだ早いCSV
人類にはまだ早いCSV人類にはまだ早いCSV
人類にはまだ早いCSV
 
サキブレの統計および 更新期間帯の予測
サキブレの統計および 更新期間帯の予測サキブレの統計および 更新期間帯の予測
サキブレの統計および 更新期間帯の予測
 
ニンジャ学会のご紹介
ニンジャ学会のご紹介ニンジャ学会のご紹介
ニンジャ学会のご紹介
 
Javascript を使ってみよう!!
Javascript を使ってみよう!!Javascript を使ってみよう!!
Javascript を使ってみよう!!
 

圧縮率による著者推定法の ニンジャスレイヤーへの応用