SlideShare a Scribd company logo
1 of 33
Download to read offline
長岡技術科学大学 自然言語処理研究室 高橋寛治 
2014/9/2 H26年度オープンハウス・アドバンストコース 1
 
講義と演習 
課題 
各自の 
発展課題 
本日のながれ 
2014/9/2 H26年度オープンハウス・アドバンストコース 2
 
翻訳システムって何? 
2014/9/2 H26年度オープンハウス・アドバンストコース 3
 
2014/9/2 H26年度オープンハウス・アドバンストコース 4
 
「Google翻訳」で翻訳させよう! 
翻訳システムに 触れてみよう 
2014/9/2 H26年度オープンハウス・アドバンストコース 5
 
演習で作成するのは 英日翻訳システム 
英語 
日本語 
翻訳システム 
2014/9/2 H26年度オープンハウス・アドバンストコース 6
 
英日翻訳システム 
英語 
日本語 
翻訳システム 
This is a pen 
これはペンです 
2014/9/2 H26年度オープンハウス・アドバンストコース 7
 
昨日覚えたプログラミング言語を用いてコンピュータ上で実現 
どう作るの? 
2014/9/2 H26年度オープンハウス・アドバンストコース 8
 
文を見る 
This is a pen. 
文型は何だろ 
SVCの文型だ 
日本語だと文型はどうなるのかな 
SCV 
This a pen is. 
単語を英語から日本語に直すと… 
これ(This)はペン(pen)です(is) 
人が日本語に訳す時の例 
2014/9/2 H26年度オープンハウス・アドバンストコース 9
 
文を見る 
This is a pen. 
文型は何だろ 
SVCの文型だ 
日本語だと文型はどうなるのかな 
SCV 
This a pen is. 
単語を英語から日本語に直すと… 
これ(This)はペン(pen)です(is) 
人が日本語に訳す時の例 
コンピュータに、同じことをさせよう! 2014/9/2 H26年度オープンハウス・アドバンストコース 10
 
英日辞書 
英語 
品詞 
日本語 
this 
名詞 
これは 
is 
動詞 
です 
a 
冠詞 
pen 
名詞 
ペン 
2014/9/2 H26年度オープンハウス・アドバンストコース 11
 
英文の解析 
This 
is 
a pen 
2014/9/2 H26年度オープンハウス・アドバンストコース 12
 
英文の解析 
This 
S 
is 
V 
a pen 
C 
2014/9/2 H26年度オープンハウス・アドバンストコース 13
 
構文変換 
This 
S 
is 
V 
a pen 
C 
2014/9/2 H26年度オープンハウス・アドバンストコース 14
 
構文変換 
This 
S 
is 
V 
a pen 
C 
This 
S 
is 
V 
a pen 
C 
2014/9/2 H26年度オープンハウス・アドバンストコース 15
 
語彙変換 
This 
S 
is 
V 
a pen 
C 
2014/9/2 H26年度オープンハウス・アドバンストコース 16
 
語彙変換 
This 
S 
is 
V 
a pen 
C 
これは 
S 
です 
V 
ペン 
C 
2014/9/2 H26年度オープンハウス・アドバンストコース 17
 
英日翻訳システム 
This is a pen 
これはペンです 
構文変換規則 
英日辞書 
翻訳システム 
2014/9/2 H26年度オープンハウス・アドバンストコース 18
 
英日翻訳システム 
This is a pen 
これはペンです 
構文変換規則 
英日辞書 
2014/9/2 H26年度オープンハウス・アドバンストコース 19
 
これから課題を解いてもらいます 
課題は2つです 
わからなければ、質問してください 
課題が解き終われば、自分でテーマを決めて解決してもらいます 
課題 
2014/9/2 H26年度オープンハウス・アドバンストコース 20
 
一緒に、This is a pen.を訳しましょう 
いろんな方法がありますが、そのうちの一つをやり ます 
と言っても、いきなり… 
2014/9/2 H26年度オープンハウス・アドバンストコース 21
 
辞書の用意 
英文解析 
構文変換 
語彙の変換 
おさらい 
2014/9/2 H26年度オープンハウス・アドバンストコース 22
 
Pythonの辞書型で記述 
noun = {“this”:”これは”, “pen”:”ペン”} 
verb = {“is”:”です”} 
冠詞はリストで記述 
article = [“a”] 
辞書の用意 
英語 
品詞 
日本語 
this 
名詞 
これは 
is 
動詞 
です 
a 
冠詞 
pen 
名詞 
ペン 
2014/9/2 H26年度オープンハウス・アドバンストコース 23
 
「This is a pen」 
「名詞is 名詞」ならSVCとする 
「This is a pen」をプログラムで判定 
input_sentence= “This is a pen” 
separated_sentence= input_sentence.split(“ “) 
冠詞を削除 
英文解析 
名詞 
動詞 
冠詞 
名詞 
This 
is 
a 
pen 
名詞 
動詞 
名詞 
This 
is 
pen 
2014/9/2 H26年度オープンハウス・アドバンストコース 24
 
「名詞is 名詞」なのでSVCと判定 
英文解析終わり 
英文解析 
名詞 
動詞 
名詞 
This 
is 
pen 
2014/9/2 H26年度オープンハウス・アドバンストコース 25
 
SVCをSCVに変換 
データの操作 
構文変換 
This 
S 
is 
V 
a pen 
C 
This 
S 
is 
V 
a pen 
C 
2014/9/2 H26年度オープンハウス・アドバンストコース 26
 
次のSVC 文型の各文を英日翻訳してください 
This is a pencil. 
They are professional baseball players 
課題1 
2014/9/2 H26年度オープンハウス・アドバンストコース 27
 
次のSVO 文型の各文を英日翻訳してください 
I have a car. 
He played tennis. 
She cooked lunch. 
課題2 
2014/9/2 H26年度オープンハウス・アドバンストコース 28
 
This fruit tastes bitter. 
He played tennis in the park. 
She cooked lunch at her house yesterday. 
応用課題(任意) 
2014/9/2 H26年度オープンハウス・アドバンストコース 29
 
テーマの例を示します 
テーマって? 何か分からない 
2014/9/2 H26年度オープンハウス・アドバンストコース 30
 
同じ動詞が使われる文をどう訳すか。 
He put on a coat 
He put on a hat 
He put on a shoes 
テーマ例 
2014/9/2 H26年度オープンハウス・アドバンストコース 31
 
疑問文を翻訳する 
Are you student? 
Do you play basketball? 
What do you play? 
テーマ例 
2014/9/2 H26年度オープンハウス・アドバンストコース 32
 
時制を考慮する 
I play tennis. 
I played tennis. 
I am playing tennis. 
テーマ例 
2014/9/2 H26年度オープンハウス・アドバンストコース 33

More Related Content

More from Kanji Takahashi

20161215Neural Machine Translation of Rare Words with Subword Units
20161215Neural Machine Translation of Rare Words with Subword Units20161215Neural Machine Translation of Rare Words with Subword Units
20161215Neural Machine Translation of Rare Words with Subword UnitsKanji Takahashi
 
Enriching Morphologically Poor Languages for Statistical Machine Translation
Enriching Morphologically Poor Languages for Statistical Machine TranslationEnriching Morphologically Poor Languages for Statistical Machine Translation
Enriching Morphologically Poor Languages for Statistical Machine TranslationKanji Takahashi
 
A Beam-Search Decoder for Normalization of Social Media Text with Application...
A Beam-Search Decoder for Normalization of Social Media Text with Application...A Beam-Search Decoder for Normalization of Social Media Text with Application...
A Beam-Search Decoder for Normalization of Social Media Text with Application...Kanji Takahashi
 
Reducing the Impact of Data Sparsity in Statistical Machine Translation
Reducing the Impact of Data Sparsity in Statistical Machine TranslationReducing the Impact of Data Sparsity in Statistical Machine Translation
Reducing the Impact of Data Sparsity in Statistical Machine TranslationKanji Takahashi
 
文献紹介:Morphological analysis for Statistical Machine Translation
文献紹介:Morphological analysis for Statistical Machine Translation文献紹介:Morphological analysis for Statistical Machine Translation
文献紹介:Morphological analysis for Statistical Machine TranslationKanji Takahashi
 
Distributed Representations of Words and Phrases and their Compositionally
Distributed Representations of Words and Phrases and their CompositionallyDistributed Representations of Words and Phrases and their Compositionally
Distributed Representations of Words and Phrases and their CompositionallyKanji Takahashi
 
Nlp2016参加報告(高橋)
Nlp2016参加報告(高橋)Nlp2016参加報告(高橋)
Nlp2016参加報告(高橋)Kanji Takahashi
 
Domain-spesific Paraphrase Extraction
Domain-spesific Paraphrase ExtractionDomain-spesific Paraphrase Extraction
Domain-spesific Paraphrase ExtractionKanji Takahashi
 
Vietnamese Word Segmentation with CRFs and SVMs: An Investigation
Vietnamese Word Segmentation with CRFs and SVMs: An InvestigationVietnamese Word Segmentation with CRFs and SVMs: An Investigation
Vietnamese Word Segmentation with CRFs and SVMs: An InvestigationKanji Takahashi
 
Improving vietnamese word segmentation and pos tagging using MEM with various...
Improving vietnamese word segmentation and pos tagging using MEM with various...Improving vietnamese word segmentation and pos tagging using MEM with various...
Improving vietnamese word segmentation and pos tagging using MEM with various...Kanji Takahashi
 
日本語機能表現の自動検出と統計的係り受け解析への応用
日本語機能表現の自動検出と統計的係り受け解析への応用日本語機能表現の自動検出と統計的係り受け解析への応用
日本語機能表現の自動検出と統計的係り受け解析への応用Kanji Takahashi
 
20150916How Far are We from Fully Automatic High Quality Grammatical Error Co...
20150916How Far are We from Fully Automatic High Quality Grammatical Error Co...20150916How Far are We from Fully Automatic High Quality Grammatical Error Co...
20150916How Far are We from Fully Automatic High Quality Grammatical Error Co...Kanji Takahashi
 
20150728So similar and yet incompatible: Toward automated identification of s...
20150728So similar and yet incompatible:Toward automated identification of s...20150728So similar and yet incompatible:Toward automated identification of s...
20150728So similar and yet incompatible: Toward automated identification of s...Kanji Takahashi
 
20150701 Improving SMT quality with morpho-syntactic analysis
20150701 Improving SMT quality with morpho-syntactic analysis20150701 Improving SMT quality with morpho-syntactic analysis
20150701 Improving SMT quality with morpho-syntactic analysisKanji Takahashi
 
文献紹介20150508 Paraphrasing Adaptation for Web Search Ranking
文献紹介20150508 Paraphrasing Adaptation for Web Search Ranking文献紹介20150508 Paraphrasing Adaptation for Web Search Ranking
文献紹介20150508 Paraphrasing Adaptation for Web Search RankingKanji Takahashi
 
20150415 automatic retirieval_and_clustering_of_similar_words
20150415 automatic retirieval_and_clustering_of_similar_words20150415 automatic retirieval_and_clustering_of_similar_words
20150415 automatic retirieval_and_clustering_of_similar_wordsKanji Takahashi
 
A baseline system for chinese near synonym choice
A baseline system for chinese near synonym choiceA baseline system for chinese near synonym choice
A baseline system for chinese near synonym choiceKanji Takahashi
 
20150225文献紹介 On WordNet Semantic Classes and Dependency Parsing
20150225文献紹介 On WordNet Semantic Classes and Dependency Parsing20150225文献紹介 On WordNet Semantic Classes and Dependency Parsing
20150225文献紹介 On WordNet Semantic Classes and Dependency ParsingKanji Takahashi
 
第5回文献紹介 用言と直前の格要素の組を単位とする格フレームの自動構築
第5回文献紹介 用言と直前の格要素の組を単位とする格フレームの自動構築第5回文献紹介 用言と直前の格要素の組を単位とする格フレームの自動構築
第5回文献紹介 用言と直前の格要素の組を単位とする格フレームの自動構築Kanji Takahashi
 
MT勉強会 第4回 換言事例の収集ー日英基本構文を対象としてー
MT勉強会 第4回 換言事例の収集ー日英基本構文を対象としてーMT勉強会 第4回 換言事例の収集ー日英基本構文を対象としてー
MT勉強会 第4回 換言事例の収集ー日英基本構文を対象としてーKanji Takahashi
 

More from Kanji Takahashi (20)

20161215Neural Machine Translation of Rare Words with Subword Units
20161215Neural Machine Translation of Rare Words with Subword Units20161215Neural Machine Translation of Rare Words with Subword Units
20161215Neural Machine Translation of Rare Words with Subword Units
 
Enriching Morphologically Poor Languages for Statistical Machine Translation
Enriching Morphologically Poor Languages for Statistical Machine TranslationEnriching Morphologically Poor Languages for Statistical Machine Translation
Enriching Morphologically Poor Languages for Statistical Machine Translation
 
A Beam-Search Decoder for Normalization of Social Media Text with Application...
A Beam-Search Decoder for Normalization of Social Media Text with Application...A Beam-Search Decoder for Normalization of Social Media Text with Application...
A Beam-Search Decoder for Normalization of Social Media Text with Application...
 
Reducing the Impact of Data Sparsity in Statistical Machine Translation
Reducing the Impact of Data Sparsity in Statistical Machine TranslationReducing the Impact of Data Sparsity in Statistical Machine Translation
Reducing the Impact of Data Sparsity in Statistical Machine Translation
 
文献紹介:Morphological analysis for Statistical Machine Translation
文献紹介:Morphological analysis for Statistical Machine Translation文献紹介:Morphological analysis for Statistical Machine Translation
文献紹介:Morphological analysis for Statistical Machine Translation
 
Distributed Representations of Words and Phrases and their Compositionally
Distributed Representations of Words and Phrases and their CompositionallyDistributed Representations of Words and Phrases and their Compositionally
Distributed Representations of Words and Phrases and their Compositionally
 
Nlp2016参加報告(高橋)
Nlp2016参加報告(高橋)Nlp2016参加報告(高橋)
Nlp2016参加報告(高橋)
 
Domain-spesific Paraphrase Extraction
Domain-spesific Paraphrase ExtractionDomain-spesific Paraphrase Extraction
Domain-spesific Paraphrase Extraction
 
Vietnamese Word Segmentation with CRFs and SVMs: An Investigation
Vietnamese Word Segmentation with CRFs and SVMs: An InvestigationVietnamese Word Segmentation with CRFs and SVMs: An Investigation
Vietnamese Word Segmentation with CRFs and SVMs: An Investigation
 
Improving vietnamese word segmentation and pos tagging using MEM with various...
Improving vietnamese word segmentation and pos tagging using MEM with various...Improving vietnamese word segmentation and pos tagging using MEM with various...
Improving vietnamese word segmentation and pos tagging using MEM with various...
 
日本語機能表現の自動検出と統計的係り受け解析への応用
日本語機能表現の自動検出と統計的係り受け解析への応用日本語機能表現の自動検出と統計的係り受け解析への応用
日本語機能表現の自動検出と統計的係り受け解析への応用
 
20150916How Far are We from Fully Automatic High Quality Grammatical Error Co...
20150916How Far are We from Fully Automatic High Quality Grammatical Error Co...20150916How Far are We from Fully Automatic High Quality Grammatical Error Co...
20150916How Far are We from Fully Automatic High Quality Grammatical Error Co...
 
20150728So similar and yet incompatible: Toward automated identification of s...
20150728So similar and yet incompatible:Toward automated identification of s...20150728So similar and yet incompatible:Toward automated identification of s...
20150728So similar and yet incompatible: Toward automated identification of s...
 
20150701 Improving SMT quality with morpho-syntactic analysis
20150701 Improving SMT quality with morpho-syntactic analysis20150701 Improving SMT quality with morpho-syntactic analysis
20150701 Improving SMT quality with morpho-syntactic analysis
 
文献紹介20150508 Paraphrasing Adaptation for Web Search Ranking
文献紹介20150508 Paraphrasing Adaptation for Web Search Ranking文献紹介20150508 Paraphrasing Adaptation for Web Search Ranking
文献紹介20150508 Paraphrasing Adaptation for Web Search Ranking
 
20150415 automatic retirieval_and_clustering_of_similar_words
20150415 automatic retirieval_and_clustering_of_similar_words20150415 automatic retirieval_and_clustering_of_similar_words
20150415 automatic retirieval_and_clustering_of_similar_words
 
A baseline system for chinese near synonym choice
A baseline system for chinese near synonym choiceA baseline system for chinese near synonym choice
A baseline system for chinese near synonym choice
 
20150225文献紹介 On WordNet Semantic Classes and Dependency Parsing
20150225文献紹介 On WordNet Semantic Classes and Dependency Parsing20150225文献紹介 On WordNet Semantic Classes and Dependency Parsing
20150225文献紹介 On WordNet Semantic Classes and Dependency Parsing
 
第5回文献紹介 用言と直前の格要素の組を単位とする格フレームの自動構築
第5回文献紹介 用言と直前の格要素の組を単位とする格フレームの自動構築第5回文献紹介 用言と直前の格要素の組を単位とする格フレームの自動構築
第5回文献紹介 用言と直前の格要素の組を単位とする格フレームの自動構築
 
MT勉強会 第4回 換言事例の収集ー日英基本構文を対象としてー
MT勉強会 第4回 換言事例の収集ー日英基本構文を対象としてーMT勉強会 第4回 換言事例の収集ー日英基本構文を対象としてー
MT勉強会 第4回 換言事例の収集ー日英基本構文を対象としてー
 

Recently uploaded

The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024koheioishi1
 
TokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentationTokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentationYukiTerazawa
 
ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学ssusere0a682
 
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学ssusere0a682
 
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2Tokyo Institute of Technology
 
UniProject Workshop Make a Discord Bot with JavaScript
UniProject Workshop Make a Discord Bot with JavaScriptUniProject Workshop Make a Discord Bot with JavaScript
UniProject Workshop Make a Discord Bot with JavaScriptyuitoakatsukijp
 

Recently uploaded (6)

The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024
 
TokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentationTokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentation
 
ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学
 
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
 
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
 
UniProject Workshop Make a Discord Bot with JavaScript
UniProject Workshop Make a Discord Bot with JavaScriptUniProject Workshop Make a Discord Bot with JavaScript
UniProject Workshop Make a Discord Bot with JavaScript
 

英日翻訳システムの作成の演習