SlideShare a Scribd company logo
1 of 18
Download to read offline
自然語言處理簡介	
  
By	
  Mark	
  Chang	
  
自然語言處理	
  
•  自然語言處理是人工智慧和語言學領域的分支	
  
–  探討如何處理及運用自然語言	
  
•  自然語言理解系統	
  
–  把自然語言轉化為電腦易於處理的形式。	
  
•  自然語言生成系統	
  
–  把電腦程式數據轉化為自然語言。	
  
•  h,ps://zh.wikipedia.org/wiki/%E8%87%AA
%E7%84%B6%E8%AF%AD
%E8%A8%80%E5%A4%84%E7%90%86
	
  
機器翻譯	
  
https://translate.google.com/	
  
	
  
問答系統
www.wolframalpha.com	
  
資訊檢索
https://www.google.com	
  
	
  
輸入法選字
https://www.ptt.cc/bbs/StupidClown/M.1423419065.A.AF8.html	
  
自然語言處理流程
純文字
斷詞 	
  
句法剖析
語意剖析
 小明 騎 機車	
  
詞性標記	
  
 小明騎機車	
  
 小明(Nb) 騎(VC) 機車(Na)	
  
 小明(Nb) 騎(VC) 機車(Na)	
  
 騎(	
  小明,	
  機車 )	
  
中文斷詞 &詞性標記	
  
	
  
	
  	
  
http://ckipsvr.iis.sinica.edu.tw/	
  
	
  
小明(Nb) 騎(VC) 機車(Na)	
  
Nb:專有名詞	
  
VC:及物動詞	
  
Na:普通名詞	
  
句法結構剖析	
  
h,p://rocling.iis.sinica.edu.tw/CKIP/parser.htm	
  
	
  
語意剖析
	
  

 騎( 小明,	
  機車	
  )	
  
h,p://www.let.rug.nl/bos/comsem/	
  
	
  
	
  

一階邏輯(First	
  Order	
  Logic)	
  
騎:Predicate	
  
小明、機車:Argument	
  
自然語言處理的困難
•  歧義(Ambiguity)	
  
發生於自然語言處理過程中的每個步驟	
  
– 斷詞歧義	
  
– 句法歧義	
  
– …
斷詞歧義
http://3rd.mafengwo.cn/travels/info_weibo.php?
id=2861280	
  
	
  
http://www.appledaily.com.tw/realtimenews/
article/new/20151006/705309/	
  
	
  
句法結構歧義
http://www.phil.uu.nl/~yoad/synsem/lecture1/lecture1.html	
  

Tina	
  is	
  not	
  tall	
  and	
  thin.	
  
一字多義
h,ps://www.moedict.tw	
  
	
  
代名詞指涉(Anaphora	
  Resolu.on)
http://web.iiit.ac.in/~sharada.mohanty/content/anaphora-resolution	
  
自然語言處理相關領域
•  語言學	
  
•  統計學	
  
•  機器學習(Machine	
  Learning)	
  
•  資訊檢索(InformaXon	
  Retrieval)	
  
•  資料探勘(Data	
  Mining)	
  
•  …	
  
相關課程
•  台大:	
  
– 資工系 陳信希 自然語言處理	
  
•  Coursera:	
  
– h,ps://www.coursera.org/course/nlp	
  
– h,ps://www.coursera.org/course/nlangp	
  
– h,ps://www.coursera.org/course/nlpintro	
  
講者資訊
•  Mark	
  Chang	
  
–  Blog	
  : h,p://cpmarkchang.logdown.com	
  
–  Slideshare : h,p://www.slideshare.net/ckmarkohchang	
  
–  Github	
  : h,p://github.com/ckmarkoh	
  
–  email	
  : ckmarkoh	
  at	
  gmail.com

More Related Content

What's hot

區塊鏈 (比特幣背後的關鍵技術) -- 十分鐘系列
區塊鏈  (比特幣背後的關鍵技術)   -- 十分鐘系列區塊鏈  (比特幣背後的關鍵技術)   -- 十分鐘系列
區塊鏈 (比特幣背後的關鍵技術) -- 十分鐘系列鍾誠 陳鍾誠
 
人工智慧與神經網路 (還有深度學習的進展)
人工智慧與神經網路  (還有深度學習的進展)人工智慧與神經網路  (還有深度學習的進展)
人工智慧與神經網路 (還有深度學習的進展)鍾誠 陳鍾誠
 
用十分鐘瞭解 新竹科學園區的發展史
用十分鐘瞭解  新竹科學園區的發展史用十分鐘瞭解  新竹科學園區的發展史
用十分鐘瞭解 新竹科學園區的發展史鍾誠 陳鍾誠
 
[系列活動] 無所不在的自然語言處理—基礎概念、技術與工具介紹
[系列活動] 無所不在的自然語言處理—基礎概念、技術與工具介紹[系列活動] 無所不在的自然語言處理—基礎概念、技術與工具介紹
[系列活動] 無所不在的自然語言處理—基礎概念、技術與工具介紹台灣資料科學年會
 
用十分鐘搞懂 《系統分析、軟體工程、專案管理與設計模式》
用十分鐘搞懂   《系統分析、軟體工程、專案管理與設計模式》用十分鐘搞懂   《系統分析、軟體工程、專案管理與設計模式》
用十分鐘搞懂 《系統分析、軟體工程、專案管理與設計模式》鍾誠 陳鍾誠
 
人工智慧與神經網路 (還有深度學習的進展)
人工智慧與神經網路  (還有深度學習的進展)人工智慧與神經網路  (還有深度學習的進展)
人工智慧與神經網路 (還有深度學習的進展)鍾誠 陳鍾誠
 
用十分鐘理解 《微分方程》
用十分鐘理解  《微分方程》用十分鐘理解  《微分方程》
用十分鐘理解 《微分方程》鍾誠 陳鍾誠
 
區塊鏈 (比特幣背後的關鍵技術) -- 十分鐘系列
區塊鏈  (比特幣背後的關鍵技術)   -- 十分鐘系列區塊鏈  (比特幣背後的關鍵技術)   -- 十分鐘系列
區塊鏈 (比特幣背後的關鍵技術) -- 十分鐘系列鍾誠 陳鍾誠
 
Dependency Parser, 의존 구조 분석기
Dependency Parser, 의존 구조 분석기Dependency Parser, 의존 구조 분석기
Dependency Parser, 의존 구조 분석기찬희 이
 
Attention Mechanism in Language Understanding and its Applications
Attention Mechanism in Language Understanding and its ApplicationsAttention Mechanism in Language Understanding and its Applications
Attention Mechanism in Language Understanding and its ApplicationsArtifacia
 
西洋史 (你或許不知道但卻影響現代教育的那些事)
西洋史  (你或許不知道但卻影響現代教育的那些事)西洋史  (你或許不知道但卻影響現代教育的那些事)
西洋史 (你或許不知道但卻影響現代教育的那些事)鍾誠 陳鍾誠
 
寫給資工系畢業生的工作面試指南
寫給資工系畢業生的工作面試指南寫給資工系畢業生的工作面試指南
寫給資工系畢業生的工作面試指南鍾誠 陳鍾誠
 
15分鐘的研究所推甄攻略
15分鐘的研究所推甄攻略15分鐘的研究所推甄攻略
15分鐘的研究所推甄攻略輝亮 游
 
用十分鐘瞭解 《電的歷史》
用十分鐘瞭解 《電的歷史》用十分鐘瞭解 《電的歷史》
用十分鐘瞭解 《電的歷史》鍾誠 陳鍾誠
 
言語と知識の深層学習@認知科学会サマースクール
言語と知識の深層学習@認知科学会サマースクール言語と知識の深層学習@認知科学会サマースクール
言語と知識の深層学習@認知科学会サマースクールYuya Unno
 
Kaggle&競プロ紹介 in 中田研究室
Kaggle&競プロ紹介 in 中田研究室Kaggle&競プロ紹介 in 中田研究室
Kaggle&競プロ紹介 in 中田研究室Takami Sato
 
Meaning Representations for Natural Languages: Design, Models and Applications
Meaning Representations for Natural Languages:  Design, Models and ApplicationsMeaning Representations for Natural Languages:  Design, Models and Applications
Meaning Representations for Natural Languages: Design, Models and ApplicationsYunyao Li
 

What's hot (20)

區塊鏈 (比特幣背後的關鍵技術) -- 十分鐘系列
區塊鏈  (比特幣背後的關鍵技術)   -- 十分鐘系列區塊鏈  (比特幣背後的關鍵技術)   -- 十分鐘系列
區塊鏈 (比特幣背後的關鍵技術) -- 十分鐘系列
 
人工智慧與神經網路 (還有深度學習的進展)
人工智慧與神經網路  (還有深度學習的進展)人工智慧與神經網路  (還有深度學習的進展)
人工智慧與神經網路 (還有深度學習的進展)
 
高橋流微積分
高橋流微積分高橋流微積分
高橋流微積分
 
用十分鐘瞭解 新竹科學園區的發展史
用十分鐘瞭解  新竹科學園區的發展史用十分鐘瞭解  新竹科學園區的發展史
用十分鐘瞭解 新竹科學園區的發展史
 
[系列活動] 無所不在的自然語言處理—基礎概念、技術與工具介紹
[系列活動] 無所不在的自然語言處理—基礎概念、技術與工具介紹[系列活動] 無所不在的自然語言處理—基礎概念、技術與工具介紹
[系列活動] 無所不在的自然語言處理—基礎概念、技術與工具介紹
 
用十分鐘搞懂 《系統分析、軟體工程、專案管理與設計模式》
用十分鐘搞懂   《系統分析、軟體工程、專案管理與設計模式》用十分鐘搞懂   《系統分析、軟體工程、專案管理與設計模式》
用十分鐘搞懂 《系統分析、軟體工程、專案管理與設計模式》
 
人工智慧與神經網路 (還有深度學習的進展)
人工智慧與神經網路  (還有深度學習的進展)人工智慧與神經網路  (還有深度學習的進展)
人工智慧與神經網路 (還有深度學習的進展)
 
用十分鐘理解 《微分方程》
用十分鐘理解  《微分方程》用十分鐘理解  《微分方程》
用十分鐘理解 《微分方程》
 
區塊鏈 (比特幣背後的關鍵技術) -- 十分鐘系列
區塊鏈  (比特幣背後的關鍵技術)   -- 十分鐘系列區塊鏈  (比特幣背後的關鍵技術)   -- 十分鐘系列
區塊鏈 (比特幣背後的關鍵技術) -- 十分鐘系列
 
Dependency Parser, 의존 구조 분석기
Dependency Parser, 의존 구조 분석기Dependency Parser, 의존 구조 분석기
Dependency Parser, 의존 구조 분석기
 
為何學數學?
為何學數學?為何學數學?
為何學數學?
 
Attention Mechanism in Language Understanding and its Applications
Attention Mechanism in Language Understanding and its ApplicationsAttention Mechanism in Language Understanding and its Applications
Attention Mechanism in Language Understanding and its Applications
 
西洋史 (你或許不知道但卻影響現代教育的那些事)
西洋史  (你或許不知道但卻影響現代教育的那些事)西洋史  (你或許不知道但卻影響現代教育的那些事)
西洋史 (你或許不知道但卻影響現代教育的那些事)
 
寫給資工系畢業生的工作面試指南
寫給資工系畢業生的工作面試指南寫給資工系畢業生的工作面試指南
寫給資工系畢業生的工作面試指南
 
15分鐘的研究所推甄攻略
15分鐘的研究所推甄攻略15分鐘的研究所推甄攻略
15分鐘的研究所推甄攻略
 
用十分鐘瞭解 《電的歷史》
用十分鐘瞭解 《電的歷史》用十分鐘瞭解 《電的歷史》
用十分鐘瞭解 《電的歷史》
 
言語と知識の深層学習@認知科学会サマースクール
言語と知識の深層学習@認知科学会サマースクール言語と知識の深層学習@認知科学会サマースクール
言語と知識の深層学習@認知科学会サマースクール
 
Kaggle&競プロ紹介 in 中田研究室
Kaggle&競プロ紹介 in 中田研究室Kaggle&競プロ紹介 in 中田研究室
Kaggle&競プロ紹介 in 中田研究室
 
自然言語処理向け データアノテーションとそのユースケース
自然言語処理向け データアノテーションとそのユースケース自然言語処理向け データアノテーションとそのユースケース
自然言語処理向け データアノテーションとそのユースケース
 
Meaning Representations for Natural Languages: Design, Models and Applications
Meaning Representations for Natural Languages:  Design, Models and ApplicationsMeaning Representations for Natural Languages:  Design, Models and Applications
Meaning Representations for Natural Languages: Design, Models and Applications
 

Similar to 自然語言處理簡介

Python in word cloud
Python in word cloudPython in word cloud
Python in word cloudFEG
 
2021《芝麻開門——語音的聲音開啟人類文明的無限空間》台大科學教育中心「探索科學講座」
2021《芝麻開門——語音的聲音開啟人類文明的無限空間》台大科學教育中心「探索科學講座」2021《芝麻開門——語音的聲音開啟人類文明的無限空間》台大科學教育中心「探索科學講座」
2021《芝麻開門——語音的聲音開啟人類文明的無限空間》台大科學教育中心「探索科學講座」linshanleearchive
 
第九章千年之際展望語料庫語言學 佩娟15
第九章千年之際展望語料庫語言學 佩娟15第九章千年之際展望語料庫語言學 佩娟15
第九章千年之際展望語料庫語言學 佩娟15ungian iunn
 
芝麻開門:語音技術的前世今生
芝麻開門:語音技術的前世今生芝麻開門:語音技術的前世今生
芝麻開門:語音技術的前世今生linshanleearchive
 
語音人機互動在各個運算時代下的發展 | Feb. 2018 威盛 OLAMI | 智慧家庭生活服務業交流會
語音人機互動在各個運算時代下的發展 | Feb. 2018 威盛 OLAMI | 智慧家庭生活服務業交流會語音人機互動在各個運算時代下的發展 | Feb. 2018 威盛 OLAMI | 智慧家庭生活服務業交流會
語音人機互動在各個運算時代下的發展 | Feb. 2018 威盛 OLAMI | 智慧家庭生活服務業交流會olami.ai
 
腾讯大讲堂49期 产品翻译面面谈
腾讯大讲堂49期 产品翻译面面谈腾讯大讲堂49期 产品翻译面面谈
腾讯大讲堂49期 产品翻译面面谈George Ang
 

Similar to 自然語言處理簡介 (7)

Python in word cloud
Python in word cloudPython in word cloud
Python in word cloud
 
Statistical computing 00
Statistical computing 00Statistical computing 00
Statistical computing 00
 
2021《芝麻開門——語音的聲音開啟人類文明的無限空間》台大科學教育中心「探索科學講座」
2021《芝麻開門——語音的聲音開啟人類文明的無限空間》台大科學教育中心「探索科學講座」2021《芝麻開門——語音的聲音開啟人類文明的無限空間》台大科學教育中心「探索科學講座」
2021《芝麻開門——語音的聲音開啟人類文明的無限空間》台大科學教育中心「探索科學講座」
 
第九章千年之際展望語料庫語言學 佩娟15
第九章千年之際展望語料庫語言學 佩娟15第九章千年之際展望語料庫語言學 佩娟15
第九章千年之際展望語料庫語言學 佩娟15
 
芝麻開門:語音技術的前世今生
芝麻開門:語音技術的前世今生芝麻開門:語音技術的前世今生
芝麻開門:語音技術的前世今生
 
語音人機互動在各個運算時代下的發展 | Feb. 2018 威盛 OLAMI | 智慧家庭生活服務業交流會
語音人機互動在各個運算時代下的發展 | Feb. 2018 威盛 OLAMI | 智慧家庭生活服務業交流會語音人機互動在各個運算時代下的發展 | Feb. 2018 威盛 OLAMI | 智慧家庭生活服務業交流會
語音人機互動在各個運算時代下的發展 | Feb. 2018 威盛 OLAMI | 智慧家庭生活服務業交流會
 
腾讯大讲堂49期 产品翻译面面谈
腾讯大讲堂49期 产品翻译面面谈腾讯大讲堂49期 产品翻译面面谈
腾讯大讲堂49期 产品翻译面面谈
 

More from Mark Chang

Modeling the Dynamics of SGD by Stochastic Differential Equation
Modeling the Dynamics of SGD by Stochastic Differential EquationModeling the Dynamics of SGD by Stochastic Differential Equation
Modeling the Dynamics of SGD by Stochastic Differential EquationMark Chang
 
Modeling the Dynamics of SGD by Stochastic Differential Equation
Modeling the Dynamics of SGD by Stochastic Differential EquationModeling the Dynamics of SGD by Stochastic Differential Equation
Modeling the Dynamics of SGD by Stochastic Differential EquationMark Chang
 
Information in the Weights
Information in the WeightsInformation in the Weights
Information in the WeightsMark Chang
 
Information in the Weights
Information in the WeightsInformation in the Weights
Information in the WeightsMark Chang
 
PAC Bayesian for Deep Learning
PAC Bayesian for Deep LearningPAC Bayesian for Deep Learning
PAC Bayesian for Deep LearningMark Chang
 
PAC-Bayesian Bound for Deep Learning
PAC-Bayesian Bound for Deep LearningPAC-Bayesian Bound for Deep Learning
PAC-Bayesian Bound for Deep LearningMark Chang
 
Domain Adaptation
Domain AdaptationDomain Adaptation
Domain AdaptationMark Chang
 
NTU ML TENSORFLOW
NTU ML TENSORFLOWNTU ML TENSORFLOW
NTU ML TENSORFLOWMark Chang
 
NTHU AI Reading Group: Improved Training of Wasserstein GANs
NTHU AI Reading Group: Improved Training of Wasserstein GANsNTHU AI Reading Group: Improved Training of Wasserstein GANs
NTHU AI Reading Group: Improved Training of Wasserstein GANsMark Chang
 
Generative Adversarial Networks
Generative Adversarial NetworksGenerative Adversarial Networks
Generative Adversarial NetworksMark Chang
 
Applied Deep Learning 11/03 Convolutional Neural Networks
Applied Deep Learning 11/03 Convolutional Neural NetworksApplied Deep Learning 11/03 Convolutional Neural Networks
Applied Deep Learning 11/03 Convolutional Neural NetworksMark Chang
 
The Genome Assembly Problem
The Genome Assembly ProblemThe Genome Assembly Problem
The Genome Assembly ProblemMark Chang
 
DRAW: Deep Recurrent Attentive Writer
DRAW: Deep Recurrent Attentive WriterDRAW: Deep Recurrent Attentive Writer
DRAW: Deep Recurrent Attentive WriterMark Chang
 
淺談深度學習
淺談深度學習淺談深度學習
淺談深度學習Mark Chang
 
Variational Autoencoder
Variational AutoencoderVariational Autoencoder
Variational AutoencoderMark Chang
 
TensorFlow 深度學習快速上手班--深度學習
 TensorFlow 深度學習快速上手班--深度學習 TensorFlow 深度學習快速上手班--深度學習
TensorFlow 深度學習快速上手班--深度學習Mark Chang
 
TensorFlow 深度學習快速上手班--電腦視覺應用
TensorFlow 深度學習快速上手班--電腦視覺應用TensorFlow 深度學習快速上手班--電腦視覺應用
TensorFlow 深度學習快速上手班--電腦視覺應用Mark Chang
 
TensorFlow 深度學習快速上手班--自然語言處理應用
TensorFlow 深度學習快速上手班--自然語言處理應用TensorFlow 深度學習快速上手班--自然語言處理應用
TensorFlow 深度學習快速上手班--自然語言處理應用Mark Chang
 
TensorFlow 深度學習快速上手班--機器學習
TensorFlow 深度學習快速上手班--機器學習TensorFlow 深度學習快速上手班--機器學習
TensorFlow 深度學習快速上手班--機器學習Mark Chang
 
Computational Linguistics week 10
 Computational Linguistics week 10 Computational Linguistics week 10
Computational Linguistics week 10Mark Chang
 

More from Mark Chang (20)

Modeling the Dynamics of SGD by Stochastic Differential Equation
Modeling the Dynamics of SGD by Stochastic Differential EquationModeling the Dynamics of SGD by Stochastic Differential Equation
Modeling the Dynamics of SGD by Stochastic Differential Equation
 
Modeling the Dynamics of SGD by Stochastic Differential Equation
Modeling the Dynamics of SGD by Stochastic Differential EquationModeling the Dynamics of SGD by Stochastic Differential Equation
Modeling the Dynamics of SGD by Stochastic Differential Equation
 
Information in the Weights
Information in the WeightsInformation in the Weights
Information in the Weights
 
Information in the Weights
Information in the WeightsInformation in the Weights
Information in the Weights
 
PAC Bayesian for Deep Learning
PAC Bayesian for Deep LearningPAC Bayesian for Deep Learning
PAC Bayesian for Deep Learning
 
PAC-Bayesian Bound for Deep Learning
PAC-Bayesian Bound for Deep LearningPAC-Bayesian Bound for Deep Learning
PAC-Bayesian Bound for Deep Learning
 
Domain Adaptation
Domain AdaptationDomain Adaptation
Domain Adaptation
 
NTU ML TENSORFLOW
NTU ML TENSORFLOWNTU ML TENSORFLOW
NTU ML TENSORFLOW
 
NTHU AI Reading Group: Improved Training of Wasserstein GANs
NTHU AI Reading Group: Improved Training of Wasserstein GANsNTHU AI Reading Group: Improved Training of Wasserstein GANs
NTHU AI Reading Group: Improved Training of Wasserstein GANs
 
Generative Adversarial Networks
Generative Adversarial NetworksGenerative Adversarial Networks
Generative Adversarial Networks
 
Applied Deep Learning 11/03 Convolutional Neural Networks
Applied Deep Learning 11/03 Convolutional Neural NetworksApplied Deep Learning 11/03 Convolutional Neural Networks
Applied Deep Learning 11/03 Convolutional Neural Networks
 
The Genome Assembly Problem
The Genome Assembly ProblemThe Genome Assembly Problem
The Genome Assembly Problem
 
DRAW: Deep Recurrent Attentive Writer
DRAW: Deep Recurrent Attentive WriterDRAW: Deep Recurrent Attentive Writer
DRAW: Deep Recurrent Attentive Writer
 
淺談深度學習
淺談深度學習淺談深度學習
淺談深度學習
 
Variational Autoencoder
Variational AutoencoderVariational Autoencoder
Variational Autoencoder
 
TensorFlow 深度學習快速上手班--深度學習
 TensorFlow 深度學習快速上手班--深度學習 TensorFlow 深度學習快速上手班--深度學習
TensorFlow 深度學習快速上手班--深度學習
 
TensorFlow 深度學習快速上手班--電腦視覺應用
TensorFlow 深度學習快速上手班--電腦視覺應用TensorFlow 深度學習快速上手班--電腦視覺應用
TensorFlow 深度學習快速上手班--電腦視覺應用
 
TensorFlow 深度學習快速上手班--自然語言處理應用
TensorFlow 深度學習快速上手班--自然語言處理應用TensorFlow 深度學習快速上手班--自然語言處理應用
TensorFlow 深度學習快速上手班--自然語言處理應用
 
TensorFlow 深度學習快速上手班--機器學習
TensorFlow 深度學習快速上手班--機器學習TensorFlow 深度學習快速上手班--機器學習
TensorFlow 深度學習快速上手班--機器學習
 
Computational Linguistics week 10
 Computational Linguistics week 10 Computational Linguistics week 10
Computational Linguistics week 10
 

自然語言處理簡介