SlideShare a Scribd company logo
BERT for Question Answering
On SQuAD 2.0
1
Question Answering (QA)
2
Question Answering (QA)
• Là một trong những nhiệm vụ lâu đời nhất của NLP (1961)
• Liên quan đến việc xây dựng các hệ thống tự động trả lời các câu
hỏi do con người đặt ra bằng ngôn ngữ tự nhiên.
3
Types of Questions in Modern Systems
• Câu hỏi sự thật (Factoid questions)
• Thủ đô của Việt Nam là gì?
• Khoảng cách từ mặt trăng đến trái đất bao nhiêu?
• Mèo thích bắt chuột không?
• Câu hỏi phức tạp (Complex questions)
• Trẻ em cần được chăm sóc thế nào để phát triển
toàn diện?
• Người dân Việt Nam nghĩ gì về việc đi du lịch?
4
Paradigms for QA
• IR-based approaches
• TREC; IBM Watson; Google
• Knowledge-based and Hybrid approaches
• IBM Watson; Apple Siri; Wolfram Alpha; True Knowledge Evi
5
IR-based Factoid QA
Document
DocumentDocument
Docume
ntDocume
ntDocume
ntDocume
ntDocume
nt
Question
Processing
Passage
Retrieval
Query
Formulation
Answer Type
Detection
Question
Passage
Retrieval
Document
Retrieval
Answer
Processing
Answer
passages
Indexing
Relevant
Docs
Document
DocumentDocument
6
Knowledge-based approaches (Siri)
• Xây dựng semantic representation cho việc truy vấn
• Giờ, Ngày, Vi trí, Thực thể, Số lượng…
• Ánh xạ từ ngữ nghĩa này để truy vấn dữ liệu hoặc tài
nguyên có cấu trúc
• Geospatial databases
• Ontologies (Wikipedia infoboxes, dbPedia, WordNet, Yago)
• Restaurant review sources and reservation services
• Scientific databases
7
Hybrid approaches (IBM Watson)
• Xây dựng shallow semantic representation cho việc
truy vấn
• Sử dụng các phương thức của IR để tạo ra các câu trả
lời ứng viên
• Chấm điểm mỗi câu trả lời ứng viên dựa vào các
nguồn kiến thức phong phú hơn
• Geospatial databases
• Temporal reasoning
• Taxonomical classification
8
SQuAD 2.0
9
SQuAD
• Stanford Question Answering Dataset (SQuAD)
• Là bộ gồm nhiều câu hỏi và câu trả lời dựa trên các bài viết trên
Wikipedia
• Câu trả lời cho một câu hỏi có thể là 1 đoạn văn bản, 1 khoảng văn
bản hoăc câu hỏi không trả lời được
10
SQuAD 2.0
• SQuAD2.0 Kết hợp 100,000 câu hỏi trong SQuAD1.1 và trên 50,000
câu hỏi mới, những câu hỏi không có câu trả lời.
11
12
{
"version": "v2.0",
"data": [
{
"title": "Normans",
"paragraphs": [
{
"qas": [
{
"question": "In what country is Normandy located?",
"id": "56ddde6b9a695914005b9628",
"answers": [
{
"text": "France",
"answer_start": 159
}
],
"is_impossible": false
}
],
"context": "The Normans (Norman: Nourmands; French: Normands; Latin: Normanni) were the
people who in the 10th and 11th centuries gave their name to Normandy, a region in France.
They were descended from Norse ("Norman" comes from "Norseman") raiders and pirates from
Denmark, Iceland and Norway who, under their leader Rollo, agreed to swear fealty to King
Charles III of West Francia. Through generations of assimilation and mixing with the native
Frankish and Roman-Gaulish populations, their descendants would gradually merge with the
Carolingian-based cultures of West Francia. The distinct cultural and ethnic identity of the
Normans emerged initially in the first half of the 10th century, and it continued to evolve
over the succeeding centuries."
}
]
}
]
}
JSON Structure
13
BERT: Bidirectional Encoder
Representations from
Transformers
14
BERT, OpenAI GPT, and ELMo
15
• Các model trước đây thường chỉ dùng ngữ cảnh trái (left context)
hoặc ngữ cảnh phải (right context), nhưng ngôn ngữ cần cả 2 ngữ
cảnh.
• => BERT ra đời
Model architecture
• Gồm nhiều lớp bidirectional Transformer encoder
• 2 Model cơ bản
• BERTBASE: L=12, H=768, A=12, Total Parameters=110M
• BERTLARGE: L=24, H=1024, A=16, Total Parameters=340M
• L: Số layers (Transformer blocks)
• H: Kích thước lớp ẩn
• A: Số lượng self-attention heads
16
Pre-training BERT
• Masked Language Model (MLM)
• Input:
my dog is hairy
• sẽ được chuyển thành
my dog is [MASK]
• sau đó [MASK] sẽ được thay thế bằng một từ ngẫu nhiên, ví dụ
my dog is apple
• Giữ lại câu gốc và tính độ lệch so với từ dự đoán thông qua hàm mất
mát cross entropy
17
Pre-training BERT
• Next Sentence Prediction (NSP)
Input = [CLS] the man went to [MASK] store [SEP]
he bought a gallon [MASK] milk SEP]
Label = IsNext
Input = [CLS] the man [MASK] to the store [SEP]
penguin [MASK] are flight ##less birds [SEP]
Label = NotNext
18
Fine-tuning BERT
• Câu A - B từ quá trình tiền huấn luyện
được trở thành:
• Những cặp câu trong paraphrasing task
• Những cặp giả thiết – tiền đề trong
entailment task
• Những cặp câu hỏi – đoạn văn trong
question answering task
• Một cặp degenerate text - <rỗng> trong
text classicfication hoặc sequence
tagging task
19
Input Representation
• Token Embeddings: sử dụng pretrained WordPiece embeddings
• Position Embeddings: sử dụng learned Position Embeddings
• Sử dụng [SEP] để phân tách các câu
• Sử dụng [CLS] để phân tách các lớp (gồm nhiều câu)
20
Transformer Encoders
• Transformer là một kiến trúc dựa vào
Attention trong NLP
• BERT là một bidirectional Transformer
encoder nhiều lớp
• BERT không sử dụng lớp decoder như
các kiến trúc Transformer khác.
21
Inside an Encoder Block
• Có khoảng 12-14 khối encoder liên tiếp
22
Inside an Encoder Block
• Input Embedding
• Hello, how are you?”
• → [“Hello”, “,” , “how”, “are”, “you”, “?”]
• → [34, 90, 15, 684, 55, 193]
23
Inside an Encoder Block
• Posotional Encoding
• Tạo ma trận P với:
• X = Z + P
24
Inside an Encoder Block
• Multi-Head Attention
25
Inside an Encoder Block
• Feed forward Network
• Add & Norm
26
Reesult
27
SQuAD 1.1
28
SQuAD v2.0
29
nbest_predictions.json{
"56ddde6b9a695914005b9628": [
{
"text": "mands; French: Normands; Latin: Normanni) were the
people who in the 10th and 11th centuries gave their",
"probability": 0.05308649383291742,
"start_logit": 0.36476194858551025,
"end_logit": 0.7789570689201355
},
{
"text": "based",
"probability": 0.05172724203669382,
"start_logit": 0.4540586471557617,
"end_logit": 0.6637223958969116
}
]
}
30
References
• Slide “Question Answering” of Standford university
• BERT for Question Answering on SQuAD 2.0, Yuwen Zhang, Zhaozhuo
Xu
• BERT: Pre-training of Deep Bidirectional Transformers for Language
Understanding, Google AI Language
• Attention Is All You Need, Ashish Vaswani
31

More Related Content

What's hot

Slide Báo Cáo Đồ Án Tốt Nghiệp CNTT
Slide Báo Cáo Đồ Án Tốt Nghiệp CNTTSlide Báo Cáo Đồ Án Tốt Nghiệp CNTT
Slide Báo Cáo Đồ Án Tốt Nghiệp CNTT
Hiệu Nguyễn
 
Lý thuyết độ phức tạp
Lý thuyết độ phức tạp Lý thuyết độ phức tạp
Lý thuyết độ phức tạp
Tran Thom
 
Khóa luận nghiên cứu bài toán phân tích cảm xúc của người hùng 9166421
Khóa luận nghiên cứu bài toán phân tích cảm xúc của người hùng 9166421Khóa luận nghiên cứu bài toán phân tích cảm xúc của người hùng 9166421
Khóa luận nghiên cứu bài toán phân tích cảm xúc của người hùng 9166421
jackjohn45
 
Phương pháp nhánh cận
Phương pháp nhánh cậnPhương pháp nhánh cận
Phương pháp nhánh cận
Diên Vĩ
 
Slide đồ án tốt nghiệp
Slide đồ án tốt nghiệpSlide đồ án tốt nghiệp
Slide đồ án tốt nghiệp
Toan Pham
 
Kiem thu phan mem
Kiem thu phan memKiem thu phan mem
Kiem thu phan mem
TIen Le
 
Giới thiệu cơ bản về Big Data và các ứng dụng thực tiễn
Giới thiệu cơ bản về Big Data và các ứng dụng thực tiễnGiới thiệu cơ bản về Big Data và các ứng dụng thực tiễn
Giới thiệu cơ bản về Big Data và các ứng dụng thực tiễn
Trieu Nguyen
 
Bài giảng bảo mật hệ thống thông tin
Bài giảng bảo mật hệ thống thông tinBài giảng bảo mật hệ thống thông tin
Bài giảng bảo mật hệ thống thông tinTran Tien
 
Bài 2: Các khái niệm trong CSDL quan hệ - Giáo trình FPT
Bài 2: Các khái niệm trong CSDL quan hệ - Giáo trình FPTBài 2: Các khái niệm trong CSDL quan hệ - Giáo trình FPT
Bài 2: Các khái niệm trong CSDL quan hệ - Giáo trình FPT
MasterCode.vn
 
Thuật toán K mean
Thuật toán K meanThuật toán K mean
Thuật toán K mean
Haokillboom Aăâ
 
PHÂN CỤM DỮ LIỆU ỨNG DỤNG TRONG PHÂN TÍCH DỮ LIỆU CÔNG THỨC DƯỢC PHẨM
PHÂN CỤM DỮ LIỆU ỨNG DỤNG TRONG PHÂN TÍCH DỮ LIỆU CÔNG THỨC DƯỢC PHẨMPHÂN CỤM DỮ LIỆU ỨNG DỤNG TRONG PHÂN TÍCH DỮ LIỆU CÔNG THỨC DƯỢC PHẨM
PHÂN CỤM DỮ LIỆU ỨNG DỤNG TRONG PHÂN TÍCH DỮ LIỆU CÔNG THỨC DƯỢC PHẨM
SoM
 
KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU PTIT
KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU PTITKHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU PTIT
KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU PTIT
Popping Khiem - Funky Dance Crew PTIT
 
Bài giảng cơ sở dữ liệu
Bài giảng cơ sở dữ liệuBài giảng cơ sở dữ liệu
Bài giảng cơ sở dữ liệutrieulongweb
 
Thuật toán mã hóa rsa
Thuật toán mã hóa rsaThuật toán mã hóa rsa
Thuật toán mã hóa rsa
Bảo Điệp
 
Báo Cáo Đồ Án 2 : Thiết Kế Web Bán Đồng Hồ
Báo Cáo Đồ Án 2 : Thiết Kế Web Bán Đồng HồBáo Cáo Đồ Án 2 : Thiết Kế Web Bán Đồng Hồ
Báo Cáo Đồ Án 2 : Thiết Kế Web Bán Đồng HồzDollz Lovez
 
Network security (Mã hóa hiện đại)
Network security (Mã hóa hiện đại)Network security (Mã hóa hiện đại)
Network security (Mã hóa hiện đại)
Khoa Nguyen
 
Bai tap va loi giai sql
Bai tap va loi giai sqlBai tap va loi giai sql
Bai tap va loi giai sql. .
 
TỔNG QUAN VỀ DỮ LIỆU LỚN (BIGDATA)
TỔNG QUAN VỀ DỮ LIỆU LỚN (BIGDATA)TỔNG QUAN VỀ DỮ LIỆU LỚN (BIGDATA)
TỔNG QUAN VỀ DỮ LIỆU LỚN (BIGDATA)
Trieu Nguyen
 
Do an xay_dung_website_thuong_mai_dien_tu
Do an xay_dung_website_thuong_mai_dien_tuDo an xay_dung_website_thuong_mai_dien_tu
Do an xay_dung_website_thuong_mai_dien_tu
ThiênĐàng CôngDân
 

What's hot (20)

Slide Báo Cáo Đồ Án Tốt Nghiệp CNTT
Slide Báo Cáo Đồ Án Tốt Nghiệp CNTTSlide Báo Cáo Đồ Án Tốt Nghiệp CNTT
Slide Báo Cáo Đồ Án Tốt Nghiệp CNTT
 
Lý thuyết độ phức tạp
Lý thuyết độ phức tạp Lý thuyết độ phức tạp
Lý thuyết độ phức tạp
 
Khóa luận nghiên cứu bài toán phân tích cảm xúc của người hùng 9166421
Khóa luận nghiên cứu bài toán phân tích cảm xúc của người hùng 9166421Khóa luận nghiên cứu bài toán phân tích cảm xúc của người hùng 9166421
Khóa luận nghiên cứu bài toán phân tích cảm xúc của người hùng 9166421
 
Phương pháp nhánh cận
Phương pháp nhánh cậnPhương pháp nhánh cận
Phương pháp nhánh cận
 
Slide đồ án tốt nghiệp
Slide đồ án tốt nghiệpSlide đồ án tốt nghiệp
Slide đồ án tốt nghiệp
 
Kiem thu phan mem
Kiem thu phan memKiem thu phan mem
Kiem thu phan mem
 
Giới thiệu cơ bản về Big Data và các ứng dụng thực tiễn
Giới thiệu cơ bản về Big Data và các ứng dụng thực tiễnGiới thiệu cơ bản về Big Data và các ứng dụng thực tiễn
Giới thiệu cơ bản về Big Data và các ứng dụng thực tiễn
 
Bài giảng bảo mật hệ thống thông tin
Bài giảng bảo mật hệ thống thông tinBài giảng bảo mật hệ thống thông tin
Bài giảng bảo mật hệ thống thông tin
 
Bài 2: Các khái niệm trong CSDL quan hệ - Giáo trình FPT
Bài 2: Các khái niệm trong CSDL quan hệ - Giáo trình FPTBài 2: Các khái niệm trong CSDL quan hệ - Giáo trình FPT
Bài 2: Các khái niệm trong CSDL quan hệ - Giáo trình FPT
 
Thuật toán K mean
Thuật toán K meanThuật toán K mean
Thuật toán K mean
 
Các mô hình dữ liệu
Các mô hình dữ liệuCác mô hình dữ liệu
Các mô hình dữ liệu
 
PHÂN CỤM DỮ LIỆU ỨNG DỤNG TRONG PHÂN TÍCH DỮ LIỆU CÔNG THỨC DƯỢC PHẨM
PHÂN CỤM DỮ LIỆU ỨNG DỤNG TRONG PHÂN TÍCH DỮ LIỆU CÔNG THỨC DƯỢC PHẨMPHÂN CỤM DỮ LIỆU ỨNG DỤNG TRONG PHÂN TÍCH DỮ LIỆU CÔNG THỨC DƯỢC PHẨM
PHÂN CỤM DỮ LIỆU ỨNG DỤNG TRONG PHÂN TÍCH DỮ LIỆU CÔNG THỨC DƯỢC PHẨM
 
KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU PTIT
KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU PTITKHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU PTIT
KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU PTIT
 
Bài giảng cơ sở dữ liệu
Bài giảng cơ sở dữ liệuBài giảng cơ sở dữ liệu
Bài giảng cơ sở dữ liệu
 
Thuật toán mã hóa rsa
Thuật toán mã hóa rsaThuật toán mã hóa rsa
Thuật toán mã hóa rsa
 
Báo Cáo Đồ Án 2 : Thiết Kế Web Bán Đồng Hồ
Báo Cáo Đồ Án 2 : Thiết Kế Web Bán Đồng HồBáo Cáo Đồ Án 2 : Thiết Kế Web Bán Đồng Hồ
Báo Cáo Đồ Án 2 : Thiết Kế Web Bán Đồng Hồ
 
Network security (Mã hóa hiện đại)
Network security (Mã hóa hiện đại)Network security (Mã hóa hiện đại)
Network security (Mã hóa hiện đại)
 
Bai tap va loi giai sql
Bai tap va loi giai sqlBai tap va loi giai sql
Bai tap va loi giai sql
 
TỔNG QUAN VỀ DỮ LIỆU LỚN (BIGDATA)
TỔNG QUAN VỀ DỮ LIỆU LỚN (BIGDATA)TỔNG QUAN VỀ DỮ LIỆU LỚN (BIGDATA)
TỔNG QUAN VỀ DỮ LIỆU LỚN (BIGDATA)
 
Do an xay_dung_website_thuong_mai_dien_tu
Do an xay_dung_website_thuong_mai_dien_tuDo an xay_dung_website_thuong_mai_dien_tu
Do an xay_dung_website_thuong_mai_dien_tu
 

Similar to Bert for question answering on SQuAD 2.0

Modern block cipher
Modern block cipherModern block cipher
Modern block cipher
Hoang Nguyen
 
Học lập trình cơ bản - Giới thiệu các thuật ngữ trong lập trình
Học lập trình cơ bản - Giới thiệu các thuật ngữ trong lập trìnhHọc lập trình cơ bản - Giới thiệu các thuật ngữ trong lập trình
Học lập trình cơ bản - Giới thiệu các thuật ngữ trong lập trình
CodeGym Đà Nẵng
 
TÀI LIỆU ĐÁP ÁN VÀ CÂU HỎI KIỂM TRA, SÁT HẠCH KIẾN THỨC CHUYÊN NGÀNH.Tuyển dụ...
TÀI LIỆU ĐÁP ÁN VÀ CÂU HỎI KIỂM TRA, SÁT HẠCH KIẾN THỨC CHUYÊN NGÀNH.Tuyển dụ...TÀI LIỆU ĐÁP ÁN VÀ CÂU HỎI KIỂM TRA, SÁT HẠCH KIẾN THỨC CHUYÊN NGÀNH.Tuyển dụ...
TÀI LIỆU ĐÁP ÁN VÀ CÂU HỎI KIỂM TRA, SÁT HẠCH KIẾN THỨC CHUYÊN NGÀNH.Tuyển dụ...
nataliej4
 
OOP_02_Java can ban.pdf
OOP_02_Java can ban.pdfOOP_02_Java can ban.pdf
OOP_02_Java can ban.pdf
ssuserd01a5c
 
LTJAVA_TV_Slides.ppt
LTJAVA_TV_Slides.pptLTJAVA_TV_Slides.ppt
LTJAVA_TV_Slides.ppt
ssuserf603dc1
 
Giáo trình vb.net
Giáo trình vb.netGiáo trình vb.net
Giáo trình vb.netHung Pham
 
Giao an trinh_pascal_bai_tap_co_dap_an_huong_dan
Giao an trinh_pascal_bai_tap_co_dap_an_huong_danGiao an trinh_pascal_bai_tap_co_dap_an_huong_dan
Giao an trinh_pascal_bai_tap_co_dap_an_huong_dan
Văn Võ Ntn
 
Giới thiệu, tập huấn GV về iQB, Cùng học và iCloudTest.
Giới thiệu, tập huấn GV về iQB, Cùng học và iCloudTest.Giới thiệu, tập huấn GV về iQB, Cùng học và iCloudTest.
Giới thiệu, tập huấn GV về iQB, Cùng học và iCloudTest.
Bùi Việt Hà
 
Giới thiệu giải pháp phần mềm Ngân hàng câu hỏi iQB 8.0
Giới thiệu giải pháp phần mềm Ngân hàng câu hỏi iQB 8.0Giới thiệu giải pháp phần mềm Ngân hàng câu hỏi iQB 8.0
Giới thiệu giải pháp phần mềm Ngân hàng câu hỏi iQB 8.0
Bùi Việt Hà
 
[Cntt] bài giảng lập trình java bkhcm
[Cntt] bài giảng lập trình java   bkhcm[Cntt] bài giảng lập trình java   bkhcm
[Cntt] bài giảng lập trình java bkhcm
Hong Phuoc Nguyen
 
Giao an trinh_pascal_bai_tap_co_dap_an_huong_dan
Giao an trinh_pascal_bai_tap_co_dap_an_huong_danGiao an trinh_pascal_bai_tap_co_dap_an_huong_dan
Giao an trinh_pascal_bai_tap_co_dap_an_huong_dan
Võ Tâm Long
 
Giới thiệu và tập huấn phần mềm iQB Lion 8.0 và giải pháp Ngân hàng câu hỏi c...
Giới thiệu và tập huấn phần mềm iQB Lion 8.0 và giải pháp Ngân hàng câu hỏi c...Giới thiệu và tập huấn phần mềm iQB Lion 8.0 và giải pháp Ngân hàng câu hỏi c...
Giới thiệu và tập huấn phần mềm iQB Lion 8.0 và giải pháp Ngân hàng câu hỏi c...
Bùi Việt Hà
 
Pbc day-01-introduction
Pbc day-01-introductionPbc day-01-introduction
Pbc day-01-introduction
Khánh Nguyễn
 
Lap trinh pascal
Lap trinh pascalLap trinh pascal
Lap trinh pascal
Loan Nguyen
 
Slides Lập trình mạng
Slides Lập trình mạngSlides Lập trình mạng
Slides Lập trình mạngasakebigone
 
Nhập môn Mạch số, Hà Lê Hoài Trung
Nhập môn Mạch số, Hà Lê Hoài TrungNhập môn Mạch số, Hà Lê Hoài Trung
Nhập môn Mạch số, Hà Lê Hoài Trung
Man_Ebook
 
Ky thuat l.trinh_java
Ky thuat l.trinh_javaKy thuat l.trinh_java
Ky thuat l.trinh_javaLam Man
 
[Cntt] all java
[Cntt] all java[Cntt] all java
[Cntt] all java
Hong Phuoc Nguyen
 
chương1.pdf
chương1.pdfchương1.pdf
chương1.pdf
DiemTran75
 

Similar to Bert for question answering on SQuAD 2.0 (20)

Modern block cipher
Modern block cipherModern block cipher
Modern block cipher
 
Học lập trình cơ bản - Giới thiệu các thuật ngữ trong lập trình
Học lập trình cơ bản - Giới thiệu các thuật ngữ trong lập trìnhHọc lập trình cơ bản - Giới thiệu các thuật ngữ trong lập trình
Học lập trình cơ bản - Giới thiệu các thuật ngữ trong lập trình
 
TÀI LIỆU ĐÁP ÁN VÀ CÂU HỎI KIỂM TRA, SÁT HẠCH KIẾN THỨC CHUYÊN NGÀNH.Tuyển dụ...
TÀI LIỆU ĐÁP ÁN VÀ CÂU HỎI KIỂM TRA, SÁT HẠCH KIẾN THỨC CHUYÊN NGÀNH.Tuyển dụ...TÀI LIỆU ĐÁP ÁN VÀ CÂU HỎI KIỂM TRA, SÁT HẠCH KIẾN THỨC CHUYÊN NGÀNH.Tuyển dụ...
TÀI LIỆU ĐÁP ÁN VÀ CÂU HỎI KIỂM TRA, SÁT HẠCH KIẾN THỨC CHUYÊN NGÀNH.Tuyển dụ...
 
OOP_02_Java can ban.pdf
OOP_02_Java can ban.pdfOOP_02_Java can ban.pdf
OOP_02_Java can ban.pdf
 
Phan 1 sv
Phan 1   svPhan 1   sv
Phan 1 sv
 
LTJAVA_TV_Slides.ppt
LTJAVA_TV_Slides.pptLTJAVA_TV_Slides.ppt
LTJAVA_TV_Slides.ppt
 
Giáo trình vb.net
Giáo trình vb.netGiáo trình vb.net
Giáo trình vb.net
 
Giao an trinh_pascal_bai_tap_co_dap_an_huong_dan
Giao an trinh_pascal_bai_tap_co_dap_an_huong_danGiao an trinh_pascal_bai_tap_co_dap_an_huong_dan
Giao an trinh_pascal_bai_tap_co_dap_an_huong_dan
 
Giới thiệu, tập huấn GV về iQB, Cùng học và iCloudTest.
Giới thiệu, tập huấn GV về iQB, Cùng học và iCloudTest.Giới thiệu, tập huấn GV về iQB, Cùng học và iCloudTest.
Giới thiệu, tập huấn GV về iQB, Cùng học và iCloudTest.
 
Giới thiệu giải pháp phần mềm Ngân hàng câu hỏi iQB 8.0
Giới thiệu giải pháp phần mềm Ngân hàng câu hỏi iQB 8.0Giới thiệu giải pháp phần mềm Ngân hàng câu hỏi iQB 8.0
Giới thiệu giải pháp phần mềm Ngân hàng câu hỏi iQB 8.0
 
[Cntt] bài giảng lập trình java bkhcm
[Cntt] bài giảng lập trình java   bkhcm[Cntt] bài giảng lập trình java   bkhcm
[Cntt] bài giảng lập trình java bkhcm
 
Giao an trinh_pascal_bai_tap_co_dap_an_huong_dan
Giao an trinh_pascal_bai_tap_co_dap_an_huong_danGiao an trinh_pascal_bai_tap_co_dap_an_huong_dan
Giao an trinh_pascal_bai_tap_co_dap_an_huong_dan
 
Giới thiệu và tập huấn phần mềm iQB Lion 8.0 và giải pháp Ngân hàng câu hỏi c...
Giới thiệu và tập huấn phần mềm iQB Lion 8.0 và giải pháp Ngân hàng câu hỏi c...Giới thiệu và tập huấn phần mềm iQB Lion 8.0 và giải pháp Ngân hàng câu hỏi c...
Giới thiệu và tập huấn phần mềm iQB Lion 8.0 và giải pháp Ngân hàng câu hỏi c...
 
Pbc day-01-introduction
Pbc day-01-introductionPbc day-01-introduction
Pbc day-01-introduction
 
Lap trinh pascal
Lap trinh pascalLap trinh pascal
Lap trinh pascal
 
Slides Lập trình mạng
Slides Lập trình mạngSlides Lập trình mạng
Slides Lập trình mạng
 
Nhập môn Mạch số, Hà Lê Hoài Trung
Nhập môn Mạch số, Hà Lê Hoài TrungNhập môn Mạch số, Hà Lê Hoài Trung
Nhập môn Mạch số, Hà Lê Hoài Trung
 
Ky thuat l.trinh_java
Ky thuat l.trinh_javaKy thuat l.trinh_java
Ky thuat l.trinh_java
 
[Cntt] all java
[Cntt] all java[Cntt] all java
[Cntt] all java
 
chương1.pdf
chương1.pdfchương1.pdf
chương1.pdf
 

Bert for question answering on SQuAD 2.0

  • 1. BERT for Question Answering On SQuAD 2.0 1
  • 3. Question Answering (QA) • Là một trong những nhiệm vụ lâu đời nhất của NLP (1961) • Liên quan đến việc xây dựng các hệ thống tự động trả lời các câu hỏi do con người đặt ra bằng ngôn ngữ tự nhiên. 3
  • 4. Types of Questions in Modern Systems • Câu hỏi sự thật (Factoid questions) • Thủ đô của Việt Nam là gì? • Khoảng cách từ mặt trăng đến trái đất bao nhiêu? • Mèo thích bắt chuột không? • Câu hỏi phức tạp (Complex questions) • Trẻ em cần được chăm sóc thế nào để phát triển toàn diện? • Người dân Việt Nam nghĩ gì về việc đi du lịch? 4
  • 5. Paradigms for QA • IR-based approaches • TREC; IBM Watson; Google • Knowledge-based and Hybrid approaches • IBM Watson; Apple Siri; Wolfram Alpha; True Knowledge Evi 5
  • 6. IR-based Factoid QA Document DocumentDocument Docume ntDocume ntDocume ntDocume ntDocume nt Question Processing Passage Retrieval Query Formulation Answer Type Detection Question Passage Retrieval Document Retrieval Answer Processing Answer passages Indexing Relevant Docs Document DocumentDocument 6
  • 7. Knowledge-based approaches (Siri) • Xây dựng semantic representation cho việc truy vấn • Giờ, Ngày, Vi trí, Thực thể, Số lượng… • Ánh xạ từ ngữ nghĩa này để truy vấn dữ liệu hoặc tài nguyên có cấu trúc • Geospatial databases • Ontologies (Wikipedia infoboxes, dbPedia, WordNet, Yago) • Restaurant review sources and reservation services • Scientific databases 7
  • 8. Hybrid approaches (IBM Watson) • Xây dựng shallow semantic representation cho việc truy vấn • Sử dụng các phương thức của IR để tạo ra các câu trả lời ứng viên • Chấm điểm mỗi câu trả lời ứng viên dựa vào các nguồn kiến thức phong phú hơn • Geospatial databases • Temporal reasoning • Taxonomical classification 8
  • 10. SQuAD • Stanford Question Answering Dataset (SQuAD) • Là bộ gồm nhiều câu hỏi và câu trả lời dựa trên các bài viết trên Wikipedia • Câu trả lời cho một câu hỏi có thể là 1 đoạn văn bản, 1 khoảng văn bản hoăc câu hỏi không trả lời được 10
  • 11. SQuAD 2.0 • SQuAD2.0 Kết hợp 100,000 câu hỏi trong SQuAD1.1 và trên 50,000 câu hỏi mới, những câu hỏi không có câu trả lời. 11
  • 12. 12
  • 13. { "version": "v2.0", "data": [ { "title": "Normans", "paragraphs": [ { "qas": [ { "question": "In what country is Normandy located?", "id": "56ddde6b9a695914005b9628", "answers": [ { "text": "France", "answer_start": 159 } ], "is_impossible": false } ], "context": "The Normans (Norman: Nourmands; French: Normands; Latin: Normanni) were the people who in the 10th and 11th centuries gave their name to Normandy, a region in France. They were descended from Norse ("Norman" comes from "Norseman") raiders and pirates from Denmark, Iceland and Norway who, under their leader Rollo, agreed to swear fealty to King Charles III of West Francia. Through generations of assimilation and mixing with the native Frankish and Roman-Gaulish populations, their descendants would gradually merge with the Carolingian-based cultures of West Francia. The distinct cultural and ethnic identity of the Normans emerged initially in the first half of the 10th century, and it continued to evolve over the succeeding centuries." } ] } ] } JSON Structure 13
  • 15. BERT, OpenAI GPT, and ELMo 15 • Các model trước đây thường chỉ dùng ngữ cảnh trái (left context) hoặc ngữ cảnh phải (right context), nhưng ngôn ngữ cần cả 2 ngữ cảnh. • => BERT ra đời
  • 16. Model architecture • Gồm nhiều lớp bidirectional Transformer encoder • 2 Model cơ bản • BERTBASE: L=12, H=768, A=12, Total Parameters=110M • BERTLARGE: L=24, H=1024, A=16, Total Parameters=340M • L: Số layers (Transformer blocks) • H: Kích thước lớp ẩn • A: Số lượng self-attention heads 16
  • 17. Pre-training BERT • Masked Language Model (MLM) • Input: my dog is hairy • sẽ được chuyển thành my dog is [MASK] • sau đó [MASK] sẽ được thay thế bằng một từ ngẫu nhiên, ví dụ my dog is apple • Giữ lại câu gốc và tính độ lệch so với từ dự đoán thông qua hàm mất mát cross entropy 17
  • 18. Pre-training BERT • Next Sentence Prediction (NSP) Input = [CLS] the man went to [MASK] store [SEP] he bought a gallon [MASK] milk SEP] Label = IsNext Input = [CLS] the man [MASK] to the store [SEP] penguin [MASK] are flight ##less birds [SEP] Label = NotNext 18
  • 19. Fine-tuning BERT • Câu A - B từ quá trình tiền huấn luyện được trở thành: • Những cặp câu trong paraphrasing task • Những cặp giả thiết – tiền đề trong entailment task • Những cặp câu hỏi – đoạn văn trong question answering task • Một cặp degenerate text - <rỗng> trong text classicfication hoặc sequence tagging task 19
  • 20. Input Representation • Token Embeddings: sử dụng pretrained WordPiece embeddings • Position Embeddings: sử dụng learned Position Embeddings • Sử dụng [SEP] để phân tách các câu • Sử dụng [CLS] để phân tách các lớp (gồm nhiều câu) 20
  • 21. Transformer Encoders • Transformer là một kiến trúc dựa vào Attention trong NLP • BERT là một bidirectional Transformer encoder nhiều lớp • BERT không sử dụng lớp decoder như các kiến trúc Transformer khác. 21
  • 22. Inside an Encoder Block • Có khoảng 12-14 khối encoder liên tiếp 22
  • 23. Inside an Encoder Block • Input Embedding • Hello, how are you?” • → [“Hello”, “,” , “how”, “are”, “you”, “?”] • → [34, 90, 15, 684, 55, 193] 23
  • 24. Inside an Encoder Block • Posotional Encoding • Tạo ma trận P với: • X = Z + P 24
  • 25. Inside an Encoder Block • Multi-Head Attention 25
  • 26. Inside an Encoder Block • Feed forward Network • Add & Norm 26
  • 30. nbest_predictions.json{ "56ddde6b9a695914005b9628": [ { "text": "mands; French: Normands; Latin: Normanni) were the people who in the 10th and 11th centuries gave their", "probability": 0.05308649383291742, "start_logit": 0.36476194858551025, "end_logit": 0.7789570689201355 }, { "text": "based", "probability": 0.05172724203669382, "start_logit": 0.4540586471557617, "end_logit": 0.6637223958969116 } ] } 30
  • 31. References • Slide “Question Answering” of Standford university • BERT for Question Answering on SQuAD 2.0, Yuwen Zhang, Zhaozhuo Xu • BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding, Google AI Language • Attention Is All You Need, Ashish Vaswani 31

Editor's Notes

  1. Các hệ thống hiện tại chủ yếu giải quyết Factoid questions
  2. IR: Information Retrieval: Truy xuất thông itin
  3. QUESTION PROCESSING: Xác định loại câu hỏi, loại câu trả lời, chủ đề, mối quan hệ Công thức hóa truy vấn (Formulate queries) và gởi đến search engine PASSAGE RETRIEVAL Retrieve ranked documents Break into suitable passages and rerank ANSWER PROCESSING Xuất ra và xếp hạng các câu trả lời ứng viên
  4. Semantic representation is an abstract (formal) language in which meanings can be represented.
  5. BERT uses a bidirectional Transformer. OpenAI GPT uses a left-to-right Transformer. ELMo uses the concatenation of independently trained left-to-right and right-toleft LSTMs to generate features for downstream tasks. Among the three, only BERT representations are jointly conditioned on both left and right context in all layers. In addition to the architecture differences, BERT and OpenAI GPT are fine-tuning approaches, while ELMo is a feature-based approach Downstream tasks is what the field calls those supervised-learning tasks that utilize a pre-trained model or component
  6. Token Embeddings: sử dụng pretrained WordPiece embeddings * bài báo: Google’s Neural Machine Translation System: Bridging the Gap between Human and Machine Translation Position Embeddings: sử dụng learned Position Embeddings bài báo Convolutional Sequence to Sequence Learning