SlideShare a Scribd company logo
1 of 59
Download to read offline
No SIREN 809158900 No SIRET 8091589000013
Call us
Our office phone number 00 33 (0) 5 59 43 55 85.
Our E-mail : info@word-connection.fr
WORD CONNECTION SARL
Like us on Facebook: facebook.com/wordconnection/
Follow us on LinkedIn: linkedin.com/company/word-connection---japalization/
Follow us on Twitter: twitter.com/wordconnection
Mine your term to be the best.
How to improve translation quality with
term extract and text mining
自然言語処理のコンセプト・翻訳ツール
を用いた用語抽出と構築・管理について
用語構築で翻訳の質を高めるには
Kaori Myatt
kaori@word-connection.fr
www.kaorimyatt.com
自己紹介 Kaori Myatt マイアットかおり
マイアットかおり
経歴:
日本生まれ・新潟県出身
慶応大学文学部 ポーツマス大学翻訳修士
滞在経験 日本・アメリカ・ニュージーランド・フランス (16年目)
半導体企業インハウス翻訳者、新聞社編集者を経験した後
フリーランス翻訳(産業翻訳・ローカライゼーション)(20年) を経て
現在欧州・米国・日本を含む約350社と契約・取引
Word Connection sarl (France) 取締役代表 (2015年創業) 品質管理
Word Connection JAPAN 取締役代表 (2017年創業)
専門分野・研究分野は翻訳理論と翻訳テクノロジー、自然言語処理(NLP)・
Phython プログラミングを使った翻訳処理技術研究
セッション内容紹介 Session contents
Twitter: @wordconnection
本セッションでは以下について話します
This session is focused on:
-用語の定義についての重要性 Importance of Terminology in industrial
translation setting
-用語の定義・構築の仕方について Ways to build terminology using NLP
会社紹介 Word Connection France /JAPAN
Word Connection sarl ビアリッツ・フランス
Word Connection JAPAN 東京
社是: 翻訳テクノロジーを用いて最高の翻訳を届ける
社員数: フランス 6名+1名(インターン)日本 2名
全員2~4カ国語を習得、翻訳修士所持者とライター・出版経験者
100万ワードを超える大規模翻訳 Twitter: @wordconnection
複雑なローカライゼーション
欧州言語ローカライゼーション
欧州各社とのコラボレーション
欧州各社との翻訳技術・システム開発
 Arle Lommel
Where we are
拠点
Biarritz
ビアリッツ
Golf
Surfing
サーフィン
品質 Quality is KING
SDL 2016 annual survey
ISO9000 でいうところの品質とは
「本来備わっている特性の集まり
が要求事項を満たす程度」
"The totality of features and characteristics of a
product or service that bear on its ability to
satisfy stated or implied needs“
ISO9000: 2005 Quality management systems 品質マネジメントシステム
品質指標の変遷
Quality standard current
品質指標の変遷
Linguistics and Literature Studies 5(2): 122-131, Glazychev (2017)
Year
Early 2000 “Verity” 事実性 (Suitable to locale, real world context) LISA 3.0 > 3.1
2002 “Accuracy” 正確性 (Transmission of meaning from source
to target)
“Fluency” 流暢性 (grammatically correct – target only)
SAE J2450
2012 “Adequacy” 適切性 (fit to purpose)
2013 Flexible framework
2015 Harmonized MQM/DFQ subset MQM / DFQ
MQM framework
includes 150+ issue
types
2017 “Holistic” 総体 vs “Atomistic” 原子レベル LQA Macro VS Micro
QA モデル
Frequently used QA models : よく使用されるQAモデル
LISA 3.1 : Localization Industry Standards Association (現在組織は廃止)
SAE J2450 : Society of Automotive Engineers
TMS Classic : SDL Translation Management System
Kilgray Model : Kilgray’s Own QA model
TAUS DFQ :Taus Dynamic Quality Framework (DQF)
MQM :Multidimensional Quality Metrics
その他 :自社製 Company’s Own QA model
QA Metrics = QA の数的指標
LISA 3.1 QA Metric LISA 3.1 QAモデ
ル
 Localization Industry Standards Association
Dynamic Quality Framework (DQF)
based on MQM
翻訳テクノロジー
と品質
用語とは
A term is, “a word or expression that has a precise
meaning in some uses or is peculiar to a science, a
profession, or subject.
“Term”. Merriam-Webster Dictionary. Retrieved
from 2018-06-25rt.
Terms are words and compound words or multi-word
expressions that in specific contexts are given specific
meanings—these may deviate from the meanings the
same words have in other contexts and in everyday
language.
特定の文脈で特定の意味が得られる、語と複合語、複数
の語から成る表現。特筆すべきは、同じ意味を持つ語が、
別の文脈や普段使う話し言葉とは異なる意味を持ち得る
点である。
Example: Translation Process
 翻訳プロセス > 翻訳産業において翻訳を管理する上での翻訳のワー
クフロー、行程などを指す
 In the translation Industry, it’s a workflow or process for translation.
 翻訳プロセス > mRNAを鋳型としてタンパク質がつくられる段階を翻
訳(translation)という。 分子生物学などにおいては、翻訳(ほんやく、
Translation)とは、mRNAの情報に基づいて、タンパク質を合成する反
応を指す。
 In molecular biology and genetics, translation is the process in which
ribosomes in the cytoplasm or ER synthesize proteins after
the process of transcription of DNA to RNA in the cell's nucleus.
なぜ用語を
定義するのか
法律用語
本契約において、次の語句は下記
の意味を有するものとする。
ソフトウェアはxxx とする
本商品は xxx とする
委託者は XXX とする
注文者は XXX とする
医学用語
内臓痛 Visceral pain
関連痛 Referred pain
突出痛 Breakthrough Pain
痛覚過敏 HyperAlgesia
痛覚鈍麻 Hypoalgesia
感覚鈍麻 Hypoesthesia
感覚過敏 Hyperstesia
電撃痛 Shooting Pain
灼熱痛 Burning Pain
麻酔科的鎮痛
異常感覚 Paresthesia
機械用語
穴あけ
アタッチメントヘッド
インターロック
円筒研削盤
送りネジ
オーバーライド
オプショナルストップ
外周削り
翻訳プロセス
と自然言語処
理(NLP)
Translation
Process and
NLP : Natural
Language
Processing
翻訳準備の段
階としての用
語抽出
Term extract
in the
process of
file
preparation
用語の定義・
構築
Terminology
define /
building
Good Translation starts with a good
Terminology building
よい翻訳は用語構築から
Natural Language Processing
+
Translation technology
データのモデリング
Data modeling
Terminology management requirements
用語管理の必須要件
 ● Concept orientation: One entry per concept
 コンセプト志向: ひとつのエントリーにつきひとつのコンセプト
 ● Data elementarity: One data element per field
 データの基本性: ひとつのフィールドにつきひとつのデータ要素
 ● Term autonomy: One term per entry
用語の自律性: ひとつのエントリにつきひとつの用語
In automobile construction, the workshop
documentation (for maintenance and repair)
for an average vehicle has more than
1.000.000 concepts
自動車の組み立てにおいては、一般的な車両
の工場における文書(メンテナンス・修理文
書含む)は、100万を超えるコンセプトを有す
る
 Frieda Steurs, KU Leuven, ECQA Certified Terminology Manager - Engineering
Driving
Defensive driving
Energy-efficient driving
Vehicle dynamics
Understeer and oversteer
Weight transfer
Road traffic safety
Safety barrier
Automobile safety
Active safety
Crash test
Crash test dummy
Crashworthiness
Side collision
Rollover
Traffic collision
Automobile safety rating
Concept
概念
SAE J2450
(2016)
Automotive Standard
自動車産業用の品質指標
http://standards.sae.org/j2450_200112/
Does not include style.
評価指標には「スタイル」が含まれない
QA Metrics 品質指標
標準 内容 組織
QTLP MQM (Quality
Translation
Launchpad –
Multidimensional
Quality Metrics
MQM is the basis for ASTM work item 46396,
which will include a standard hierarchy of
translation errors and a framework for
creating customized quality scorecards.
MQM
(http://www.qt21.eu/la
unchpad/content/multi
dimensional-quality-
metrics)
TAUS DQF
(Translation
Automation User
Society Dynamic
Quality
Evaluation
Framework)
TAUS "framework for selecting best fit
translation quality evaluation models, a
knowledgebase documenting industry best
practices" Focus: assessing MT output but can
also be used to assess human translation.
TAUS
(https://www.taus.net)
Logrus LQA
(Language Quality
Assurance)
ASTM WK 46397 will standardize the Logrus
approach to using crowdsourcing to assess
website localization quality.
ASTM F43.03
(www.astm.org)
Non-compliance and its Consequences
標準に従わなかったことによる手痛い結果
(製造業者の場合)
製造業者が負う賠償責任
 製品の再印刷 > 結果的にコストがかかる
 製品のリコール > 結果的にコストがかかる
 ユーザーの負傷・製品の破損
欧州の製造標準を守らないことによる結果
 責任制裁
 公的機関からの制裁
 裁判所からの指示・制裁
翻訳テクノロジー
(自然言語処理)
で
どんな用語管理が
できるのか
形態要素解析
用語抽出
ストップワード
単語書式の統一
数字の置き換え
文字種の統一
単語の正規化
翻訳対象外の設定
出典: 東北大学講義:先端技術の基礎と実践
Daisuke Okanohara, 大規模データ時代に求められる自然言語処理
自然言語処理の基本技術
Natural Language Processing Basics
Natural Language Processing Technology can be found everywhere
出典: 東北大学講義:先端技術の基礎と実践
Daisuke Okanohara, 大規模データ時代に求められる自然言語処理
自然言語処理の基本技術
Natural Language Processing Basics
Word Division Syntactic Analysis Semantic Analysis Dictionary Building
Document Classification Automatic Summarization Authorship Attribution
Machine Translation Speech Recognition Information Search Question Answering
Information Extraction
出典: 東北大学講義:先端技術の基礎と実践
Daisuke Okanohara, 大規模データ時代に求められる自然言語処理
翻訳との関連性
Application on Translation technology
用語を定義する理由
用語の構築によって得られる利点
Consistency : 一貫性が得られる
Semantics: 意味がクリアになる(明瞭な翻訳へ)
Conflict management: トラブルがなくなる
事前の用語についての合意を得ることでクライアントともめない)
Ease of translation: 翻訳作業が楽になる
Estabilishing translation strategies
翻訳方策の策定
https://textmining.userlocal.jp/
100,000文字までの解析が可能
Estabilishing translation strategies
翻訳方策の策定
Estabilishing translation strategies
翻訳方策の策定
専門用語(キーワード)自動抽出サービス
「言選Web」
 http://gensen.dl.itc.u-
tokyo.ac.jp/gensenweb.html
 日本語
 English French German Italian Spanish Finnis
h Swedish
 「専門用語自動抽出システム」は 東京大学情報基盤センター図書館電子化部門中
川裕志教授および 横浜国立大学環境情報研究院森辰則助教授の共同開発です
専門用語(キーワード)自動抽出サービス
「言選Web」
 Python ドキュメント:
 日本語
https://docs.python.jp/3/whatsnew/3.6.ht
ml
Estabilishing translation strategies
翻訳方策の策定
memoQ の用語集機能
Terminology functions in memoQ
Quality check tools help monitor progress
early on, they can detect:-
品質管理ツールでは、以下のようなエラーを
検出できます。
 Terminology errors 用語の一致・不一致
 Stop words ストップワードの登録
 Forbidden characters and words 使用禁止用語・翻訳対象外
 Numbers, date and time formats 数字、日付、時間
 Punctuation, Multiple spaces, Brackets check, capitalization, source and
target differences スペース、カッコ、大文字・小文字
 Spelling スペルチェック
 False positives 擬陽性・誤検出
Terminology Extraction with
memoQ
Terminology Extraction with
memoQ
SDL MultiTerm Extract
independent module
Quality is not
down to luck,
It’s a
systematic
engagement.
SDL 2016
Bibliography
 A Simple but Powerful Automatic Term Extraction Method (2002) Hiroshi Nakagawa
 Term Extraction and Automatic Indexing (2002) Christian Jacquemin and Didier
Bourigault
 Analysis of Efficiency of Translation Quality Assurance Tools (2014) Svetlana K.
Gurala , Yan R. Chemezovb *Social and Behavioral Sciences 154 ( 2014 ) 360 – 363
 Measuring QA to improve, Multilingual. Jul/Aug2009, Vol. 20 Issue 5, p48-50. 3p.e
translation cost and speed, Sonia Monahan
 Table of Emerging and Published International Standards re: T&I (updated July,
2015) FIT report
 LISA Best Practice Guide (2004)
 Linguistics and Literature Studies 5(2): 122-131, Glazychev (2017)
 Frieda Steurs, KU Leuven, ECQA Certified Terminology Manager - Engineering
Thanks for listening!
memoQ Discount Coupon
Co-IJET-20-JM
I-Jet Conference attendees can buy memoQ
at a 20% off
memoQ 20 % オフのクーポンをご利用ください
No SIREN 809158900 No SIRET 8091589000013
Call us
Our office phone number 00 33 (0) 5 59 43 55 85.
Our E-mail : info@word-connection.fr
WORD CONNECTION SARL
Like us on Facebook: facebook.com/wordconnection/
Follow us on LinkedIn: linkedin.com/company/word-connection---japalization/
Follow us on Twitter: twitter.com/wordconnection
Mine your term to be the best.

More Related Content

Similar to Mine your term to be the best.

Coding Guide
Coding GuideCoding Guide
Coding Guideohdreamer
 
アジャイル品質のパターンとメトリクス Agile Quality Patterns and Metrics (QA2AQ) 20240225
アジャイル品質のパターンとメトリクス Agile Quality Patterns and Metrics (QA2AQ) 20240225アジャイル品質のパターンとメトリクス Agile Quality Patterns and Metrics (QA2AQ) 20240225
アジャイル品質のパターンとメトリクス Agile Quality Patterns and Metrics (QA2AQ) 20240225Hironori Washizaki
 
Qua s tom-メトリクスによるソフトウェアの品質把握と改善
Qua s tom-メトリクスによるソフトウェアの品質把握と改善Qua s tom-メトリクスによるソフトウェアの品質把握と改善
Qua s tom-メトリクスによるソフトウェアの品質把握と改善Hironori Washizaki
 
継続的デリバリーとサービス仮想化で変わる、エンタープライズアジャイル開発
継続的デリバリーとサービス仮想化で変わる、エンタープライズアジャイル開発継続的デリバリーとサービス仮想化で変わる、エンタープライズアジャイル開発
継続的デリバリーとサービス仮想化で変わる、エンタープライズアジャイル開発Takashi Watanabe
 
サービス開発における工程
サービス開発における工程サービス開発における工程
サービス開発における工程Hidetoshi Mori
 
TensorFlowとは? ディープラーニング (深層学習) とは?
TensorFlowとは? ディープラーニング (深層学習) とは?TensorFlowとは? ディープラーニング (深層学習) とは?
TensorFlowとは? ディープラーニング (深層学習) とは?KSK Analytics Inc.
 
Jasst12九州 倉貫資料:アジャイル・Ruby・クラウド(ARC)を活用したビジネスにおけるテストの実践 #jasst12Q
Jasst12九州 倉貫資料:アジャイル・Ruby・クラウド(ARC)を活用したビジネスにおけるテストの実践 #jasst12QJasst12九州 倉貫資料:アジャイル・Ruby・クラウド(ARC)を活用したビジネスにおけるテストの実践 #jasst12Q
Jasst12九州 倉貫資料:アジャイル・Ruby・クラウド(ARC)を活用したビジネスにおけるテストの実践 #jasst12QYoshihito Kuranuki
 
社内スタートアップによる組織の成長に伴い発生する痛みとその解決策について(Rebuild) #devlove
社内スタートアップによる組織の成長に伴い発生する痛みとその解決策について(Rebuild) #devlove 社内スタートアップによる組織の成長に伴い発生する痛みとその解決策について(Rebuild) #devlove
社内スタートアップによる組織の成長に伴い発生する痛みとその解決策について(Rebuild) #devlove Itsuki Kuroda
 
13_B_5 Who is a architect?
13_B_5 Who is a architect?13_B_5 Who is a architect?
13_B_5 Who is a architect?Atsushi Fukui
 
機械学習 - MNIST の次のステップ
機械学習 - MNIST の次のステップ機械学習 - MNIST の次のステップ
機械学習 - MNIST の次のステップDaiyu Hatakeyama
 
ニューノーマルな働き方!?Teams投稿をセンチメント分析!
ニューノーマルな働き方!?Teams投稿をセンチメント分析!ニューノーマルな働き方!?Teams投稿をセンチメント分析!
ニューノーマルな働き方!?Teams投稿をセンチメント分析!Tsukasa Kato
 
Building Software Reliability through Distributed Tracing.pdf
Building Software Reliability through Distributed Tracing.pdfBuilding Software Reliability through Distributed Tracing.pdf
Building Software Reliability through Distributed Tracing.pdfShotaro Suzuki
 
クラウド事業者に求めるビジネス要件
クラウド事業者に求めるビジネス要件クラウド事業者に求めるビジネス要件
クラウド事業者に求めるビジネス要件雄哉 吉田
 
W&B webinar finetuning_配布用.pdf
W&B webinar finetuning_配布用.pdfW&B webinar finetuning_配布用.pdf
W&B webinar finetuning_配布用.pdfYuya Yamamoto
 

Similar to Mine your term to be the best. (20)

Coding Guide
Coding GuideCoding Guide
Coding Guide
 
SOE-Loc
SOE-LocSOE-Loc
SOE-Loc
 
SOE-LOC
SOE-LOCSOE-LOC
SOE-LOC
 
Localization in SOE
Localization in SOELocalization in SOE
Localization in SOE
 
アジャイル品質のパターンとメトリクス Agile Quality Patterns and Metrics (QA2AQ) 20240225
アジャイル品質のパターンとメトリクス Agile Quality Patterns and Metrics (QA2AQ) 20240225アジャイル品質のパターンとメトリクス Agile Quality Patterns and Metrics (QA2AQ) 20240225
アジャイル品質のパターンとメトリクス Agile Quality Patterns and Metrics (QA2AQ) 20240225
 
Qua s tom-メトリクスによるソフトウェアの品質把握と改善
Qua s tom-メトリクスによるソフトウェアの品質把握と改善Qua s tom-メトリクスによるソフトウェアの品質把握と改善
Qua s tom-メトリクスによるソフトウェアの品質把握と改善
 
継続的デリバリーとサービス仮想化で変わる、エンタープライズアジャイル開発
継続的デリバリーとサービス仮想化で変わる、エンタープライズアジャイル開発継続的デリバリーとサービス仮想化で変わる、エンタープライズアジャイル開発
継続的デリバリーとサービス仮想化で変わる、エンタープライズアジャイル開発
 
サービス開発における工程
サービス開発における工程サービス開発における工程
サービス開発における工程
 
TensorFlowとは? ディープラーニング (深層学習) とは?
TensorFlowとは? ディープラーニング (深層学習) とは?TensorFlowとは? ディープラーニング (深層学習) とは?
TensorFlowとは? ディープラーニング (深層学習) とは?
 
Force.com開発基礎
Force.com開発基礎Force.com開発基礎
Force.com開発基礎
 
Jasst12九州 倉貫資料:アジャイル・Ruby・クラウド(ARC)を活用したビジネスにおけるテストの実践 #jasst12Q
Jasst12九州 倉貫資料:アジャイル・Ruby・クラウド(ARC)を活用したビジネスにおけるテストの実践 #jasst12QJasst12九州 倉貫資料:アジャイル・Ruby・クラウド(ARC)を活用したビジネスにおけるテストの実践 #jasst12Q
Jasst12九州 倉貫資料:アジャイル・Ruby・クラウド(ARC)を活用したビジネスにおけるテストの実践 #jasst12Q
 
社内スタートアップによる組織の成長に伴い発生する痛みとその解決策について(Rebuild) #devlove
社内スタートアップによる組織の成長に伴い発生する痛みとその解決策について(Rebuild) #devlove 社内スタートアップによる組織の成長に伴い発生する痛みとその解決策について(Rebuild) #devlove
社内スタートアップによる組織の成長に伴い発生する痛みとその解決策について(Rebuild) #devlove
 
13_B_5 Who is a architect?
13_B_5 Who is a architect?13_B_5 Who is a architect?
13_B_5 Who is a architect?
 
機械学習 - MNIST の次のステップ
機械学習 - MNIST の次のステップ機械学習 - MNIST の次のステップ
機械学習 - MNIST の次のステップ
 
AIビジネスクリエーションワークショップ@東京
AIビジネスクリエーションワークショップ@東京AIビジネスクリエーションワークショップ@東京
AIビジネスクリエーションワークショップ@東京
 
ニューノーマルな働き方!?Teams投稿をセンチメント分析!
ニューノーマルな働き方!?Teams投稿をセンチメント分析!ニューノーマルな働き方!?Teams投稿をセンチメント分析!
ニューノーマルな働き方!?Teams投稿をセンチメント分析!
 
Building Software Reliability through Distributed Tracing.pdf
Building Software Reliability through Distributed Tracing.pdfBuilding Software Reliability through Distributed Tracing.pdf
Building Software Reliability through Distributed Tracing.pdf
 
クラウド事業者に求めるビジネス要件
クラウド事業者に求めるビジネス要件クラウド事業者に求めるビジネス要件
クラウド事業者に求めるビジネス要件
 
W&B webinar finetuning_配布用.pdf
W&B webinar finetuning_配布用.pdfW&B webinar finetuning_配布用.pdf
W&B webinar finetuning_配布用.pdf
 
Quality characteristics
Quality characteristicsQuality characteristics
Quality characteristics
 

Mine your term to be the best.

  • 1.
  • 2. No SIREN 809158900 No SIRET 8091589000013 Call us Our office phone number 00 33 (0) 5 59 43 55 85. Our E-mail : info@word-connection.fr WORD CONNECTION SARL Like us on Facebook: facebook.com/wordconnection/ Follow us on LinkedIn: linkedin.com/company/word-connection---japalization/ Follow us on Twitter: twitter.com/wordconnection
  • 3. Mine your term to be the best. How to improve translation quality with term extract and text mining 自然言語処理のコンセプト・翻訳ツール を用いた用語抽出と構築・管理について 用語構築で翻訳の質を高めるには Kaori Myatt kaori@word-connection.fr www.kaorimyatt.com
  • 4. 自己紹介 Kaori Myatt マイアットかおり マイアットかおり 経歴: 日本生まれ・新潟県出身 慶応大学文学部 ポーツマス大学翻訳修士 滞在経験 日本・アメリカ・ニュージーランド・フランス (16年目) 半導体企業インハウス翻訳者、新聞社編集者を経験した後 フリーランス翻訳(産業翻訳・ローカライゼーション)(20年) を経て 現在欧州・米国・日本を含む約350社と契約・取引 Word Connection sarl (France) 取締役代表 (2015年創業) 品質管理 Word Connection JAPAN 取締役代表 (2017年創業) 専門分野・研究分野は翻訳理論と翻訳テクノロジー、自然言語処理(NLP)・ Phython プログラミングを使った翻訳処理技術研究
  • 5. セッション内容紹介 Session contents Twitter: @wordconnection 本セッションでは以下について話します This session is focused on: -用語の定義についての重要性 Importance of Terminology in industrial translation setting -用語の定義・構築の仕方について Ways to build terminology using NLP
  • 6. 会社紹介 Word Connection France /JAPAN Word Connection sarl ビアリッツ・フランス Word Connection JAPAN 東京 社是: 翻訳テクノロジーを用いて最高の翻訳を届ける 社員数: フランス 6名+1名(インターン)日本 2名 全員2~4カ国語を習得、翻訳修士所持者とライター・出版経験者 100万ワードを超える大規模翻訳 Twitter: @wordconnection 複雑なローカライゼーション 欧州言語ローカライゼーション 欧州各社とのコラボレーション 欧州各社との翻訳技術・システム開発
  • 10.
  • 11. Golf
  • 12.
  • 14.
  • 16. SDL 2016 annual survey
  • 17. ISO9000 でいうところの品質とは 「本来備わっている特性の集まり が要求事項を満たす程度」 "The totality of features and characteristics of a product or service that bear on its ability to satisfy stated or implied needs“ ISO9000: 2005 Quality management systems 品質マネジメントシステム
  • 18.
  • 19. 品質指標の変遷 Quality standard current 品質指標の変遷 Linguistics and Literature Studies 5(2): 122-131, Glazychev (2017) Year Early 2000 “Verity” 事実性 (Suitable to locale, real world context) LISA 3.0 > 3.1 2002 “Accuracy” 正確性 (Transmission of meaning from source to target) “Fluency” 流暢性 (grammatically correct – target only) SAE J2450 2012 “Adequacy” 適切性 (fit to purpose) 2013 Flexible framework 2015 Harmonized MQM/DFQ subset MQM / DFQ MQM framework includes 150+ issue types 2017 “Holistic” 総体 vs “Atomistic” 原子レベル LQA Macro VS Micro
  • 20. QA モデル Frequently used QA models : よく使用されるQAモデル LISA 3.1 : Localization Industry Standards Association (現在組織は廃止) SAE J2450 : Society of Automotive Engineers TMS Classic : SDL Translation Management System Kilgray Model : Kilgray’s Own QA model TAUS DFQ :Taus Dynamic Quality Framework (DQF) MQM :Multidimensional Quality Metrics その他 :自社製 Company’s Own QA model QA Metrics = QA の数的指標
  • 21. LISA 3.1 QA Metric LISA 3.1 QAモデ ル  Localization Industry Standards Association
  • 22. Dynamic Quality Framework (DQF) based on MQM
  • 23. 翻訳テクノロジー と品質 用語とは A term is, “a word or expression that has a precise meaning in some uses or is peculiar to a science, a profession, or subject. “Term”. Merriam-Webster Dictionary. Retrieved from 2018-06-25rt. Terms are words and compound words or multi-word expressions that in specific contexts are given specific meanings—these may deviate from the meanings the same words have in other contexts and in everyday language. 特定の文脈で特定の意味が得られる、語と複合語、複数 の語から成る表現。特筆すべきは、同じ意味を持つ語が、 別の文脈や普段使う話し言葉とは異なる意味を持ち得る 点である。
  • 24. Example: Translation Process  翻訳プロセス > 翻訳産業において翻訳を管理する上での翻訳のワー クフロー、行程などを指す  In the translation Industry, it’s a workflow or process for translation.  翻訳プロセス > mRNAを鋳型としてタンパク質がつくられる段階を翻 訳(translation)という。 分子生物学などにおいては、翻訳(ほんやく、 Translation)とは、mRNAの情報に基づいて、タンパク質を合成する反 応を指す。  In molecular biology and genetics, translation is the process in which ribosomes in the cytoplasm or ER synthesize proteins after the process of transcription of DNA to RNA in the cell's nucleus.
  • 25. なぜ用語を 定義するのか 法律用語 本契約において、次の語句は下記 の意味を有するものとする。 ソフトウェアはxxx とする 本商品は xxx とする 委託者は XXX とする 注文者は XXX とする 医学用語 内臓痛 Visceral pain 関連痛 Referred pain 突出痛 Breakthrough Pain 痛覚過敏 HyperAlgesia 痛覚鈍麻 Hypoalgesia 感覚鈍麻 Hypoesthesia 感覚過敏 Hyperstesia 電撃痛 Shooting Pain 灼熱痛 Burning Pain 麻酔科的鎮痛 異常感覚 Paresthesia 機械用語 穴あけ アタッチメントヘッド インターロック 円筒研削盤 送りネジ オーバーライド オプショナルストップ 外周削り
  • 26. 翻訳プロセス と自然言語処 理(NLP) Translation Process and NLP : Natural Language Processing 翻訳準備の段 階としての用 語抽出 Term extract in the process of file preparation 用語の定義・ 構築 Terminology define / building
  • 27. Good Translation starts with a good Terminology building よい翻訳は用語構築から Natural Language Processing + Translation technology
  • 28. データのモデリング Data modeling Terminology management requirements 用語管理の必須要件  ● Concept orientation: One entry per concept  コンセプト志向: ひとつのエントリーにつきひとつのコンセプト  ● Data elementarity: One data element per field  データの基本性: ひとつのフィールドにつきひとつのデータ要素  ● Term autonomy: One term per entry 用語の自律性: ひとつのエントリにつきひとつの用語
  • 29. In automobile construction, the workshop documentation (for maintenance and repair) for an average vehicle has more than 1.000.000 concepts 自動車の組み立てにおいては、一般的な車両 の工場における文書(メンテナンス・修理文 書含む)は、100万を超えるコンセプトを有す る  Frieda Steurs, KU Leuven, ECQA Certified Terminology Manager - Engineering
  • 30. Driving Defensive driving Energy-efficient driving Vehicle dynamics Understeer and oversteer Weight transfer Road traffic safety Safety barrier Automobile safety Active safety Crash test Crash test dummy Crashworthiness Side collision Rollover Traffic collision Automobile safety rating Concept 概念
  • 31. SAE J2450 (2016) Automotive Standard 自動車産業用の品質指標 http://standards.sae.org/j2450_200112/ Does not include style. 評価指標には「スタイル」が含まれない
  • 32. QA Metrics 品質指標 標準 内容 組織 QTLP MQM (Quality Translation Launchpad – Multidimensional Quality Metrics MQM is the basis for ASTM work item 46396, which will include a standard hierarchy of translation errors and a framework for creating customized quality scorecards. MQM (http://www.qt21.eu/la unchpad/content/multi dimensional-quality- metrics) TAUS DQF (Translation Automation User Society Dynamic Quality Evaluation Framework) TAUS "framework for selecting best fit translation quality evaluation models, a knowledgebase documenting industry best practices" Focus: assessing MT output but can also be used to assess human translation. TAUS (https://www.taus.net) Logrus LQA (Language Quality Assurance) ASTM WK 46397 will standardize the Logrus approach to using crowdsourcing to assess website localization quality. ASTM F43.03 (www.astm.org)
  • 33.
  • 34. Non-compliance and its Consequences 標準に従わなかったことによる手痛い結果 (製造業者の場合) 製造業者が負う賠償責任  製品の再印刷 > 結果的にコストがかかる  製品のリコール > 結果的にコストがかかる  ユーザーの負傷・製品の破損 欧州の製造標準を守らないことによる結果  責任制裁  公的機関からの制裁  裁判所からの指示・制裁
  • 36. 出典: 東北大学講義:先端技術の基礎と実践 Daisuke Okanohara, 大規模データ時代に求められる自然言語処理 自然言語処理の基本技術 Natural Language Processing Basics
  • 37. Natural Language Processing Technology can be found everywhere 出典: 東北大学講義:先端技術の基礎と実践 Daisuke Okanohara, 大規模データ時代に求められる自然言語処理 自然言語処理の基本技術 Natural Language Processing Basics Word Division Syntactic Analysis Semantic Analysis Dictionary Building Document Classification Automatic Summarization Authorship Attribution Machine Translation Speech Recognition Information Search Question Answering Information Extraction
  • 38. 出典: 東北大学講義:先端技術の基礎と実践 Daisuke Okanohara, 大規模データ時代に求められる自然言語処理 翻訳との関連性 Application on Translation technology
  • 39. 用語を定義する理由 用語の構築によって得られる利点 Consistency : 一貫性が得られる Semantics: 意味がクリアになる(明瞭な翻訳へ) Conflict management: トラブルがなくなる 事前の用語についての合意を得ることでクライアントともめない) Ease of translation: 翻訳作業が楽になる
  • 42.
  • 45. 専門用語(キーワード)自動抽出サービス 「言選Web」  http://gensen.dl.itc.u- tokyo.ac.jp/gensenweb.html  日本語  English French German Italian Spanish Finnis h Swedish  「専門用語自動抽出システム」は 東京大学情報基盤センター図書館電子化部門中 川裕志教授および 横浜国立大学環境情報研究院森辰則助教授の共同開発です
  • 49. Quality check tools help monitor progress early on, they can detect:- 品質管理ツールでは、以下のようなエラーを 検出できます。  Terminology errors 用語の一致・不一致  Stop words ストップワードの登録  Forbidden characters and words 使用禁止用語・翻訳対象外  Numbers, date and time formats 数字、日付、時間  Punctuation, Multiple spaces, Brackets check, capitalization, source and target differences スペース、カッコ、大文字・小文字  Spelling スペルチェック  False positives 擬陽性・誤検出
  • 52.
  • 54. Quality is not down to luck, It’s a systematic engagement. SDL 2016
  • 55. Bibliography  A Simple but Powerful Automatic Term Extraction Method (2002) Hiroshi Nakagawa  Term Extraction and Automatic Indexing (2002) Christian Jacquemin and Didier Bourigault  Analysis of Efficiency of Translation Quality Assurance Tools (2014) Svetlana K. Gurala , Yan R. Chemezovb *Social and Behavioral Sciences 154 ( 2014 ) 360 – 363  Measuring QA to improve, Multilingual. Jul/Aug2009, Vol. 20 Issue 5, p48-50. 3p.e translation cost and speed, Sonia Monahan  Table of Emerging and Published International Standards re: T&I (updated July, 2015) FIT report  LISA Best Practice Guide (2004)  Linguistics and Literature Studies 5(2): 122-131, Glazychev (2017)  Frieda Steurs, KU Leuven, ECQA Certified Terminology Manager - Engineering
  • 57. memoQ Discount Coupon Co-IJET-20-JM I-Jet Conference attendees can buy memoQ at a 20% off memoQ 20 % オフのクーポンをご利用ください
  • 58. No SIREN 809158900 No SIRET 8091589000013 Call us Our office phone number 00 33 (0) 5 59 43 55 85. Our E-mail : info@word-connection.fr WORD CONNECTION SARL Like us on Facebook: facebook.com/wordconnection/ Follow us on LinkedIn: linkedin.com/company/word-connection---japalization/ Follow us on Twitter: twitter.com/wordconnection