SlideShare a Scribd company logo
Automatic Text Summarization
TextRank
布丁布丁吃布丁
2022
2
Classification of the Automatic Text
Summarization Systems
(El-Kassas, Salama, Rafea, & Mohamed, 2021)
3
Text Summarization Approaches
● Generate a summary
by understanding the
main concepts in the
input document
● Paraphrasing the
text to express those
concepts in fewer
words
● Using a clear
language
● Extraction of the
most important
sentences from the
input document
● Higher accuracy: the
summary with the
exact terminologies
that exist in the
original text
● Faster and simpler
Extractive (萃取式) Abstractive (重寫式)
(El-Kassas, Salama, Rafea, & Mohamed, 2021)
4
Graph-Based Extractive Text Summarization
TextRank
● TextRank algorithm is a graph-based approach
inspired by the methodology of PageRank.
○ The PageRank algorithm of Google is a ranking
algorithm for web pages available online based on the
search results.
● TextRank is a widely used method as no prior
requirements of linguistic or domain knowledge.
● TextRank is an unsupervised approach for text
summarization to generate extraction based
summaries.
5
The Graph-Based Ranking Model
PageRank
(1998)
TextRank
(2004)
6
TextRank algorithm
1. Segment document into sentences.
2. Create representation of each sentences.
3. Score sentences.
a. Create a similarity matrix: measure similarity of
sentences by Cosine Similarity.
b. Run the graph-based algorithm to calculate the
score of sentences.
4. Select the top ranked sentences as the summary.
7
Step 1. Segmentation
“Hi world! Hello
world! This is
Tim.”
[
“Hi world!”,
“Hello world!”,
“This is Tim.”
]
8
Step 2. Representation
[
“Hi world!”,
“Hello world!”,
“This is Tim.”
]
Sen Word Index Word
0 0 hi
0 1 world
1 2 hello
1 1 world
2 3 this
2 4 is
2 5 tim
Representation
9
Step 3a. Creating a similarity matrix:
Sen Word Index
0 0
0 1
1 2
1 1
2 3
2 4
2 5
0 1 2
0 1 0.366 0
1 0.366 1 0
2 0 0 1
Similarity Matrix
Representation
10
Step 3b. Graph-based algorithm (1/2)
(Nenkova & McKeown, 2012)
● Iteration 0:
● Iteration 1:
Run on the graph for several iterations until it converges…
11
Step 3b. Graph-based algorithm (1/2)
(Nenkova & McKeown, 2012)
● Iteration 0:
● Iteration 1:
Run on the graph for several iterations until it converges…
12
Step 3b. Graph-based algorithm (2/2)
(Mihalcea, & Tarau, 2004)
13
Step 4. Select sentences
● [9] Hurricane Gilbert swept
toward the Dominican Republic
Sunday, and the Civil …
● [16] The National Hurricane
Center in Miami reported its
position at 2 a.m. Sunday at
latitude 16.1 north…
● [15] The National Weather
Service in San Juan, Puerto
Rico, said Gilbert was moving
westward at 15 mph…
(Mihalcea, & Tarau, 2004)
14
TextRank Practice
input.txt output.txt
colab
15
Reference
● Mihalcea, R., & Tarau, P. (2004). Textrank:
Bringing order into text. Proceedings of the 2004
Conference on Empirical Methods in Natural
Language Processing, 404–411.
● El-Kassas, W. S., Salama, C. R., Rafea, A. A., &
Mohamed, H. K. (2021). Automatic text
summarization: A comprehensive survey. Expert
Systems with Applications, 165, 113679.
https://doi.org/10.1016/j.eswa.2020.113679
● PyTextRank. (2022). [Python]. derwen.ai.
https://github.com/DerwenAI/pytextrank (Original
work published 2016)
16
● 布丁布丁吃什麼?
https://blog.pulipuli.info/
● pulipuli.chen@gmail.com
Thank You
for Your Attention

More Related Content

What's hot

การเขียนเซต
การเขียนเซตการเขียนเซต
การเขียนเซตAon Narinchoti
 
5.2 พรบ.ระเบียบบริหารราชการกระทรวง
5.2 พรบ.ระเบียบบริหารราชการกระทรวง5.2 พรบ.ระเบียบบริหารราชการกระทรวง
5.2 พรบ.ระเบียบบริหารราชการกระทรวงกองพัน ตะวันแดง
 
เฉลยแบบทดสอบหนังสือเลขเรียกหนังสือ
เฉลยแบบทดสอบหนังสือเลขเรียกหนังสือเฉลยแบบทดสอบหนังสือเลขเรียกหนังสือ
เฉลยแบบทดสอบหนังสือเลขเรียกหนังสือSupaporn Khiewwan
 
เล่มที่ 10 พระยาพิชัยดาบหัก
เล่มที่ 10  พระยาพิชัยดาบหักเล่มที่ 10  พระยาพิชัยดาบหัก
เล่มที่ 10 พระยาพิชัยดาบหักChoengchai Rattanachai
 
การพูดแสดงทรรศนะ
การพูดแสดงทรรศนะการพูดแสดงทรรศนะ
การพูดแสดงทรรศนะsasithorn woralee
 
ใบงานที่ 1 เซต
ใบงานที่ 1 เซต ใบงานที่ 1 เซต
ใบงานที่ 1 เซต pairtean
 
บทที่ 2 การวางแผนและการตัดสินใจ copy
บทที่ 2 การวางแผนและการตัดสินใจ copyบทที่ 2 การวางแผนและการตัดสินใจ copy
บทที่ 2 การวางแผนและการตัดสินใจ copyWatcharin Chongkonsatit
 
งานแก้วิชาคณิตศาสตร์ เพิ่มเติม ค32201
งานแก้วิชาคณิตศาสตร์ เพิ่มเติม ค32201 งานแก้วิชาคณิตศาสตร์ เพิ่มเติม ค32201
งานแก้วิชาคณิตศาสตร์ เพิ่มเติม ค32201 Tawan Thongsan
 
ตัวอย่างคู่มือค่ายคณิตศาสตร์
ตัวอย่างคู่มือค่ายคณิตศาสตร์ตัวอย่างคู่มือค่ายคณิตศาสตร์
ตัวอย่างคู่มือค่ายคณิตศาสตร์ทับทิม เจริญตา
 
บทปฏิบัติการที่ 6 การไหลสม่ำเสมอในทางน้ำเปิด (Open Channel Flow) + คลิป
บทปฏิบัติการที่ 6 การไหลสม่ำเสมอในทางน้ำเปิด (Open Channel Flow) + คลิป บทปฏิบัติการที่ 6 การไหลสม่ำเสมอในทางน้ำเปิด (Open Channel Flow) + คลิป
บทปฏิบัติการที่ 6 การไหลสม่ำเสมอในทางน้ำเปิด (Open Channel Flow) + คลิป AJ. Tor วิศวกรรมแหล่งนํา้
 
แบบฝึกหัดเรื่องสมการเชิงเส้นตัวแปรเดียว
แบบฝึกหัดเรื่องสมการเชิงเส้นตัวแปรเดียวแบบฝึกหัดเรื่องสมการเชิงเส้นตัวแปรเดียว
แบบฝึกหัดเรื่องสมการเชิงเส้นตัวแปรเดียวJirathorn Buenglee
 
คณิตศาสตร์ ม.2 เลขยกกำลัง
คณิตศาสตร์ ม.2 เลขยกกำลังคณิตศาสตร์ ม.2 เลขยกกำลัง
คณิตศาสตร์ ม.2 เลขยกกำลังพัน พัน
 
บทที่ 1 ที่มาและความสำคัญ
บทที่ 1 ที่มาและความสำคัญบทที่ 1 ที่มาและความสำคัญ
บทที่ 1 ที่มาและความสำคัญneeranuch wongkom
 
วิธีการสร้างตารางสำเร็จรูปใน Word
วิธีการสร้างตารางสำเร็จรูปใน Wordวิธีการสร้างตารางสำเร็จรูปใน Word
วิธีการสร้างตารางสำเร็จรูปใน Wordพัน พัน
 
สรุปสาระสำคัญ พรบ.บริหารราชการแผ่นดิน พ.ศ. 2534 และที่แก้ไขเพิ่มเติม
สรุปสาระสำคัญ พรบ.บริหารราชการแผ่นดิน พ.ศ. 2534 และที่แก้ไขเพิ่มเติมสรุปสาระสำคัญ พรบ.บริหารราชการแผ่นดิน พ.ศ. 2534 และที่แก้ไขเพิ่มเติม
สรุปสาระสำคัญ พรบ.บริหารราชการแผ่นดิน พ.ศ. 2534 และที่แก้ไขเพิ่มเติมเจ้าชาย แห่งบ้านนา
 
ข้อสอบ Pre test สวนกุหลาบ2559
ข้อสอบ Pre test สวนกุหลาบ2559ข้อสอบ Pre test สวนกุหลาบ2559
ข้อสอบ Pre test สวนกุหลาบ2559Math and Brain @Bangbon3
 

What's hot (20)

การเขียนเซต
การเขียนเซตการเขียนเซต
การเขียนเซต
 
5.2 พรบ.ระเบียบบริหารราชการกระทรวง
5.2 พรบ.ระเบียบบริหารราชการกระทรวง5.2 พรบ.ระเบียบบริหารราชการกระทรวง
5.2 พรบ.ระเบียบบริหารราชการกระทรวง
 
เฉลยแบบทดสอบหนังสือเลขเรียกหนังสือ
เฉลยแบบทดสอบหนังสือเลขเรียกหนังสือเฉลยแบบทดสอบหนังสือเลขเรียกหนังสือ
เฉลยแบบทดสอบหนังสือเลขเรียกหนังสือ
 
วรรณกรรม
วรรณกรรมวรรณกรรม
วรรณกรรม
 
เล่มที่ 10 พระยาพิชัยดาบหัก
เล่มที่ 10  พระยาพิชัยดาบหักเล่มที่ 10  พระยาพิชัยดาบหัก
เล่มที่ 10 พระยาพิชัยดาบหัก
 
02 เซต ตอนที่1_ความหมายของเซต
02 เซต ตอนที่1_ความหมายของเซต02 เซต ตอนที่1_ความหมายของเซต
02 เซต ตอนที่1_ความหมายของเซต
 
การพูดแสดงทรรศนะ
การพูดแสดงทรรศนะการพูดแสดงทรรศนะ
การพูดแสดงทรรศนะ
 
ใบงานที่ 1 เซต
ใบงานที่ 1 เซต ใบงานที่ 1 เซต
ใบงานที่ 1 เซต
 
แผนเศรษฐกิจพอเพียง
แผนเศรษฐกิจพอเพียงแผนเศรษฐกิจพอเพียง
แผนเศรษฐกิจพอเพียง
 
Add m5-1-chapter3
Add m5-1-chapter3Add m5-1-chapter3
Add m5-1-chapter3
 
บทที่ 2 การวางแผนและการตัดสินใจ copy
บทที่ 2 การวางแผนและการตัดสินใจ copyบทที่ 2 การวางแผนและการตัดสินใจ copy
บทที่ 2 การวางแผนและการตัดสินใจ copy
 
งานแก้วิชาคณิตศาสตร์ เพิ่มเติม ค32201
งานแก้วิชาคณิตศาสตร์ เพิ่มเติม ค32201 งานแก้วิชาคณิตศาสตร์ เพิ่มเติม ค32201
งานแก้วิชาคณิตศาสตร์ เพิ่มเติม ค32201
 
ตัวอย่างคู่มือค่ายคณิตศาสตร์
ตัวอย่างคู่มือค่ายคณิตศาสตร์ตัวอย่างคู่มือค่ายคณิตศาสตร์
ตัวอย่างคู่มือค่ายคณิตศาสตร์
 
บทปฏิบัติการที่ 6 การไหลสม่ำเสมอในทางน้ำเปิด (Open Channel Flow) + คลิป
บทปฏิบัติการที่ 6 การไหลสม่ำเสมอในทางน้ำเปิด (Open Channel Flow) + คลิป บทปฏิบัติการที่ 6 การไหลสม่ำเสมอในทางน้ำเปิด (Open Channel Flow) + คลิป
บทปฏิบัติการที่ 6 การไหลสม่ำเสมอในทางน้ำเปิด (Open Channel Flow) + คลิป
 
แบบฝึกหัดเรื่องสมการเชิงเส้นตัวแปรเดียว
แบบฝึกหัดเรื่องสมการเชิงเส้นตัวแปรเดียวแบบฝึกหัดเรื่องสมการเชิงเส้นตัวแปรเดียว
แบบฝึกหัดเรื่องสมการเชิงเส้นตัวแปรเดียว
 
คณิตศาสตร์ ม.2 เลขยกกำลัง
คณิตศาสตร์ ม.2 เลขยกกำลังคณิตศาสตร์ ม.2 เลขยกกำลัง
คณิตศาสตร์ ม.2 เลขยกกำลัง
 
บทที่ 1 ที่มาและความสำคัญ
บทที่ 1 ที่มาและความสำคัญบทที่ 1 ที่มาและความสำคัญ
บทที่ 1 ที่มาและความสำคัญ
 
วิธีการสร้างตารางสำเร็จรูปใน Word
วิธีการสร้างตารางสำเร็จรูปใน Wordวิธีการสร้างตารางสำเร็จรูปใน Word
วิธีการสร้างตารางสำเร็จรูปใน Word
 
สรุปสาระสำคัญ พรบ.บริหารราชการแผ่นดิน พ.ศ. 2534 และที่แก้ไขเพิ่มเติม
สรุปสาระสำคัญ พรบ.บริหารราชการแผ่นดิน พ.ศ. 2534 และที่แก้ไขเพิ่มเติมสรุปสาระสำคัญ พรบ.บริหารราชการแผ่นดิน พ.ศ. 2534 และที่แก้ไขเพิ่มเติม
สรุปสาระสำคัญ พรบ.บริหารราชการแผ่นดิน พ.ศ. 2534 และที่แก้ไขเพิ่มเติม
 
ข้อสอบ Pre test สวนกุหลาบ2559
ข้อสอบ Pre test สวนกุหลาบ2559ข้อสอบ Pre test สวนกุหลาบ2559
ข้อสอบ Pre test สวนกุหลาบ2559
 

Similar to Introduction to TextRank - 22.pptx

Enhanced Retrieval of Web Pages using Improved Page Rank Algorithm
Enhanced Retrieval of Web Pages using Improved Page Rank AlgorithmEnhanced Retrieval of Web Pages using Improved Page Rank Algorithm
Enhanced Retrieval of Web Pages using Improved Page Rank Algorithmijnlc
 
Enhanced Retrieval of Web Pages using Improved Page Rank Algorithm
Enhanced Retrieval of Web Pages using Improved Page Rank AlgorithmEnhanced Retrieval of Web Pages using Improved Page Rank Algorithm
Enhanced Retrieval of Web Pages using Improved Page Rank Algorithmkevig
 
Natural Language Generation / Stanford cs224n 2019w lecture 15 Review
Natural Language Generation / Stanford cs224n 2019w lecture 15 ReviewNatural Language Generation / Stanford cs224n 2019w lecture 15 Review
Natural Language Generation / Stanford cs224n 2019w lecture 15 Reviewchangedaeoh
 
Offline Reinforcement Learning for Informal Summarization in Online Domains.pdf
Offline Reinforcement Learning for Informal Summarization in Online Domains.pdfOffline Reinforcement Learning for Informal Summarization in Online Domains.pdf
Offline Reinforcement Learning for Informal Summarization in Online Domains.pdfPo-Chuan Chen
 
5_RNN_LSTM.pdf
5_RNN_LSTM.pdf5_RNN_LSTM.pdf
5_RNN_LSTM.pdfFEG
 
ICFHR 2014 Competition on Handwritten KeyWord Spotting (H-KWS 2014)
ICFHR 2014 Competition on Handwritten KeyWord Spotting (H-KWS 2014)ICFHR 2014 Competition on Handwritten KeyWord Spotting (H-KWS 2014)
ICFHR 2014 Competition on Handwritten KeyWord Spotting (H-KWS 2014)Konstantinos Zagoris
 
IA3_presentation.pptx
IA3_presentation.pptxIA3_presentation.pptx
IA3_presentation.pptxKtonNguyn2
 
Monotonic Multihead Attention review
Monotonic Multihead Attention reviewMonotonic Multihead Attention review
Monotonic Multihead Attention reviewJune-Woo Kim
 
Let Android dream electric sheep: Making emotion model for chat-bot with Pyth...
Let Android dream electric sheep: Making emotion model for chat-bot with Pyth...Let Android dream electric sheep: Making emotion model for chat-bot with Pyth...
Let Android dream electric sheep: Making emotion model for chat-bot with Pyth...Jeongkyu Shin
 
Automatic keyword extraction.pptx
Automatic keyword extraction.pptxAutomatic keyword extraction.pptx
Automatic keyword extraction.pptxBiswarupDas18
 
Comparative Study of Abstractive Text Summarization Techniques
Comparative Study of Abstractive Text Summarization TechniquesComparative Study of Abstractive Text Summarization Techniques
Comparative Study of Abstractive Text Summarization TechniquesIRJET Journal
 
Making Mashups with Marmite, at CHI 2007
Making Mashups with Marmite, at CHI 2007Making Mashups with Marmite, at CHI 2007
Making Mashups with Marmite, at CHI 2007Jason Hong
 
An in-depth exploration of Bangla blog post classification
An in-depth exploration of Bangla blog post classificationAn in-depth exploration of Bangla blog post classification
An in-depth exploration of Bangla blog post classificationjournalBEEI
 
SEMANTIC PROCESSING MECHANISM FOR LISTENING AND COMPREHENSION IN VNSCALENDAR ...
SEMANTIC PROCESSING MECHANISM FOR LISTENING AND COMPREHENSION IN VNSCALENDAR ...SEMANTIC PROCESSING MECHANISM FOR LISTENING AND COMPREHENSION IN VNSCALENDAR ...
SEMANTIC PROCESSING MECHANISM FOR LISTENING AND COMPREHENSION IN VNSCALENDAR ...ijnlc
 
Semantic Processing Mechanism for Listening and Comprehension in VNScalendar ...
Semantic Processing Mechanism for Listening and Comprehension in VNScalendar ...Semantic Processing Mechanism for Listening and Comprehension in VNScalendar ...
Semantic Processing Mechanism for Listening and Comprehension in VNScalendar ...kevig
 
Text Summarization of Food Reviews using AbstractiveSummarization and Recurre...
Text Summarization of Food Reviews using AbstractiveSummarization and Recurre...Text Summarization of Food Reviews using AbstractiveSummarization and Recurre...
Text Summarization of Food Reviews using AbstractiveSummarization and Recurre...IRJET Journal
 
Deep Learning, Where Are You Going?
Deep Learning, Where Are You Going?Deep Learning, Where Are You Going?
Deep Learning, Where Are You Going?NAVER Engineering
 

Similar to Introduction to TextRank - 22.pptx (20)

Enhanced Retrieval of Web Pages using Improved Page Rank Algorithm
Enhanced Retrieval of Web Pages using Improved Page Rank AlgorithmEnhanced Retrieval of Web Pages using Improved Page Rank Algorithm
Enhanced Retrieval of Web Pages using Improved Page Rank Algorithm
 
Enhanced Retrieval of Web Pages using Improved Page Rank Algorithm
Enhanced Retrieval of Web Pages using Improved Page Rank AlgorithmEnhanced Retrieval of Web Pages using Improved Page Rank Algorithm
Enhanced Retrieval of Web Pages using Improved Page Rank Algorithm
 
Natural Language Generation / Stanford cs224n 2019w lecture 15 Review
Natural Language Generation / Stanford cs224n 2019w lecture 15 ReviewNatural Language Generation / Stanford cs224n 2019w lecture 15 Review
Natural Language Generation / Stanford cs224n 2019w lecture 15 Review
 
Offline Reinforcement Learning for Informal Summarization in Online Domains.pdf
Offline Reinforcement Learning for Informal Summarization in Online Domains.pdfOffline Reinforcement Learning for Informal Summarization in Online Domains.pdf
Offline Reinforcement Learning for Informal Summarization in Online Domains.pdf
 
5_RNN_LSTM.pdf
5_RNN_LSTM.pdf5_RNN_LSTM.pdf
5_RNN_LSTM.pdf
 
ICFHR 2014 Competition on Handwritten KeyWord Spotting (H-KWS 2014)
ICFHR 2014 Competition on Handwritten KeyWord Spotting (H-KWS 2014)ICFHR 2014 Competition on Handwritten KeyWord Spotting (H-KWS 2014)
ICFHR 2014 Competition on Handwritten KeyWord Spotting (H-KWS 2014)
 
IA3_presentation.pptx
IA3_presentation.pptxIA3_presentation.pptx
IA3_presentation.pptx
 
Monotonic Multihead Attention review
Monotonic Multihead Attention reviewMonotonic Multihead Attention review
Monotonic Multihead Attention review
 
resume
resumeresume
resume
 
Let Android dream electric sheep: Making emotion model for chat-bot with Pyth...
Let Android dream electric sheep: Making emotion model for chat-bot with Pyth...Let Android dream electric sheep: Making emotion model for chat-bot with Pyth...
Let Android dream electric sheep: Making emotion model for chat-bot with Pyth...
 
Automatic keyword extraction.pptx
Automatic keyword extraction.pptxAutomatic keyword extraction.pptx
Automatic keyword extraction.pptx
 
Comparative Study of Abstractive Text Summarization Techniques
Comparative Study of Abstractive Text Summarization TechniquesComparative Study of Abstractive Text Summarization Techniques
Comparative Study of Abstractive Text Summarization Techniques
 
NARA EVM Case Study Presentation For MPA
NARA EVM Case Study Presentation For MPANARA EVM Case Study Presentation For MPA
NARA EVM Case Study Presentation For MPA
 
Source Code Summarization
Source Code SummarizationSource Code Summarization
Source Code Summarization
 
Making Mashups with Marmite, at CHI 2007
Making Mashups with Marmite, at CHI 2007Making Mashups with Marmite, at CHI 2007
Making Mashups with Marmite, at CHI 2007
 
An in-depth exploration of Bangla blog post classification
An in-depth exploration of Bangla blog post classificationAn in-depth exploration of Bangla blog post classification
An in-depth exploration of Bangla blog post classification
 
SEMANTIC PROCESSING MECHANISM FOR LISTENING AND COMPREHENSION IN VNSCALENDAR ...
SEMANTIC PROCESSING MECHANISM FOR LISTENING AND COMPREHENSION IN VNSCALENDAR ...SEMANTIC PROCESSING MECHANISM FOR LISTENING AND COMPREHENSION IN VNSCALENDAR ...
SEMANTIC PROCESSING MECHANISM FOR LISTENING AND COMPREHENSION IN VNSCALENDAR ...
 
Semantic Processing Mechanism for Listening and Comprehension in VNScalendar ...
Semantic Processing Mechanism for Listening and Comprehension in VNScalendar ...Semantic Processing Mechanism for Listening and Comprehension in VNScalendar ...
Semantic Processing Mechanism for Listening and Comprehension in VNScalendar ...
 
Text Summarization of Food Reviews using AbstractiveSummarization and Recurre...
Text Summarization of Food Reviews using AbstractiveSummarization and Recurre...Text Summarization of Food Reviews using AbstractiveSummarization and Recurre...
Text Summarization of Food Reviews using AbstractiveSummarization and Recurre...
 
Deep Learning, Where Are You Going?
Deep Learning, Where Are You Going?Deep Learning, Where Are You Going?
Deep Learning, Where Are You Going?
 

More from Yung-Ting Chen

讓AI繪圖成為你的教學利器 Stable Diffusion 工作坊 - 2024 - blog
讓AI繪圖成為你的教學利器 Stable Diffusion 工作坊 - 2024 - blog讓AI繪圖成為你的教學利器 Stable Diffusion 工作坊 - 2024 - blog
讓AI繪圖成為你的教學利器 Stable Diffusion 工作坊 - 2024 - blogYung-Ting Chen
 
文本探勘實作 - 2020 - blog.pptx
文本探勘實作 - 2020 - blog.pptx文本探勘實作 - 2020 - blog.pptx
文本探勘實作 - 2020 - blog.pptxYung-Ting Chen
 
大數據時代下的文本分析 - 2020 - blog.pptx
大數據時代下的文本分析 - 2020 - blog.pptx大數據時代下的文本分析 - 2020 - blog.pptx
大數據時代下的文本分析 - 2020 - blog.pptxYung-Ting Chen
 
比較性分析:關聯規則 - 2020 - blog.pptx
比較性分析:關聯規則 - 2020 - blog.pptx比較性分析:關聯規則 - 2020 - blog.pptx
比較性分析:關聯規則 - 2020 - blog.pptxYung-Ting Chen
 
預測性分析:分類 - 2020 - blog.pptx
預測性分析:分類 - 2020 - blog.pptx預測性分析:分類 - 2020 - blog.pptx
預測性分析:分類 - 2020 - blog.pptxYung-Ting Chen
 
探索性分析:分群與異常偵測 - 2020 - blog.pptx
探索性分析:分群與異常偵測 - 2020 - blog.pptx探索性分析:分群與異常偵測 - 2020 - blog.pptx
探索性分析:分群與異常偵測 - 2020 - blog.pptxYung-Ting Chen
 
3. 洞悉未來:時間序列預測 - 2021.pptx
3. 洞悉未來:時間序列預測 - 2021.pptx3. 洞悉未來:時間序列預測 - 2021.pptx
3. 洞悉未來:時間序列預測 - 2021.pptxYung-Ting Chen
 
2. 看穿因果:熱點分析 - 2021.pptx
2. 看穿因果:熱點分析 - 2021.pptx2. 看穿因果:熱點分析 - 2021.pptx
2. 看穿因果:熱點分析 - 2021.pptxYung-Ting Chen
 
1. 神鳥領航:初識Weka - 2021.pptx
1. 神鳥領航:初識Weka - 2021.pptx1. 神鳥領航:初識Weka - 2021.pptx
1. 神鳥領航:初識Weka - 2021.pptxYung-Ting Chen
 
論文神器+ChatGPT - blog - 2023.pptx
論文神器+ChatGPT - blog - 2023.pptx論文神器+ChatGPT - blog - 2023.pptx
論文神器+ChatGPT - blog - 2023.pptxYung-Ting Chen
 
大數據時代下的文本分析 - 22 dils text.pptx
大數據時代下的文本分析 - 22 dils text.pptx大數據時代下的文本分析 - 22 dils text.pptx
大數據時代下的文本分析 - 22 dils text.pptxYung-Ting Chen
 
人工智慧的可解釋性 - blog - 2023.pptx
人工智慧的可解釋性 - blog - 2023.pptx人工智慧的可解釋性 - blog - 2023.pptx
人工智慧的可解釋性 - blog - 2023.pptxYung-Ting Chen
 
Subgroup-Discovery-2021.pptx
Subgroup-Discovery-2021.pptxSubgroup-Discovery-2021.pptx
Subgroup-Discovery-2021.pptxYung-Ting Chen
 
1. introduction of weka
1. introduction of weka1. introduction of weka
1. introduction of wekaYung-Ting Chen
 
3. classification and regression
3. classification and regression3. classification and regression
3. classification and regressionYung-Ting Chen
 
2. clustering and association rule mining
2. clustering and association rule mining2. clustering and association rule mining
2. clustering and association rule miningYung-Ting Chen
 
Word專業文件排版:第8堂面授 (20151223) blog
Word專業文件排版:第8堂面授 (20151223) blogWord專業文件排版:第8堂面授 (20151223) blog
Word專業文件排版:第8堂面授 (20151223) blogYung-Ting Chen
 

More from Yung-Ting Chen (20)

讓AI繪圖成為你的教學利器 Stable Diffusion 工作坊 - 2024 - blog
讓AI繪圖成為你的教學利器 Stable Diffusion 工作坊 - 2024 - blog讓AI繪圖成為你的教學利器 Stable Diffusion 工作坊 - 2024 - blog
讓AI繪圖成為你的教學利器 Stable Diffusion 工作坊 - 2024 - blog
 
文本探勘實作 - 2020 - blog.pptx
文本探勘實作 - 2020 - blog.pptx文本探勘實作 - 2020 - blog.pptx
文本探勘實作 - 2020 - blog.pptx
 
大數據時代下的文本分析 - 2020 - blog.pptx
大數據時代下的文本分析 - 2020 - blog.pptx大數據時代下的文本分析 - 2020 - blog.pptx
大數據時代下的文本分析 - 2020 - blog.pptx
 
比較性分析:關聯規則 - 2020 - blog.pptx
比較性分析:關聯規則 - 2020 - blog.pptx比較性分析:關聯規則 - 2020 - blog.pptx
比較性分析:關聯規則 - 2020 - blog.pptx
 
預測性分析:分類 - 2020 - blog.pptx
預測性分析:分類 - 2020 - blog.pptx預測性分析:分類 - 2020 - blog.pptx
預測性分析:分類 - 2020 - blog.pptx
 
探索性分析:分群與異常偵測 - 2020 - blog.pptx
探索性分析:分群與異常偵測 - 2020 - blog.pptx探索性分析:分群與異常偵測 - 2020 - blog.pptx
探索性分析:分群與異常偵測 - 2020 - blog.pptx
 
3. 洞悉未來:時間序列預測 - 2021.pptx
3. 洞悉未來:時間序列預測 - 2021.pptx3. 洞悉未來:時間序列預測 - 2021.pptx
3. 洞悉未來:時間序列預測 - 2021.pptx
 
2. 看穿因果:熱點分析 - 2021.pptx
2. 看穿因果:熱點分析 - 2021.pptx2. 看穿因果:熱點分析 - 2021.pptx
2. 看穿因果:熱點分析 - 2021.pptx
 
1. 神鳥領航:初識Weka - 2021.pptx
1. 神鳥領航:初識Weka - 2021.pptx1. 神鳥領航:初識Weka - 2021.pptx
1. 神鳥領航:初識Weka - 2021.pptx
 
論文神器+ChatGPT - blog - 2023.pptx
論文神器+ChatGPT - blog - 2023.pptx論文神器+ChatGPT - blog - 2023.pptx
論文神器+ChatGPT - blog - 2023.pptx
 
大數據時代下的文本分析 - 22 dils text.pptx
大數據時代下的文本分析 - 22 dils text.pptx大數據時代下的文本分析 - 22 dils text.pptx
大數據時代下的文本分析 - 22 dils text.pptx
 
人工智慧的可解釋性 - blog - 2023.pptx
人工智慧的可解釋性 - blog - 2023.pptx人工智慧的可解釋性 - blog - 2023.pptx
人工智慧的可解釋性 - blog - 2023.pptx
 
Subgroup-Discovery-2021.pptx
Subgroup-Discovery-2021.pptxSubgroup-Discovery-2021.pptx
Subgroup-Discovery-2021.pptx
 
1. introduction of weka
1. introduction of weka1. introduction of weka
1. introduction of weka
 
4. applications
4. applications4. applications
4. applications
 
3. classification and regression
3. classification and regression3. classification and regression
3. classification and regression
 
2. clustering and association rule mining
2. clustering and association rule mining2. clustering and association rule mining
2. clustering and association rule mining
 
20180518 pbl
20180518 pbl20180518 pbl
20180518 pbl
 
20180518 kals
20180518 kals20180518 kals
20180518 kals
 
Word專業文件排版:第8堂面授 (20151223) blog
Word專業文件排版:第8堂面授 (20151223) blogWord專業文件排版:第8堂面授 (20151223) blog
Word專業文件排版:第8堂面授 (20151223) blog
 

Recently uploaded

Democratizing Fuzzing at Scale by Abhishek Arya
Democratizing Fuzzing at Scale by Abhishek AryaDemocratizing Fuzzing at Scale by Abhishek Arya
Democratizing Fuzzing at Scale by Abhishek Aryaabh.arya
 
Digital Signal Processing Lecture notes n.pdf
Digital Signal Processing Lecture notes n.pdfDigital Signal Processing Lecture notes n.pdf
Digital Signal Processing Lecture notes n.pdfAbrahamGadissa
 
School management system project report.pdf
School management system project report.pdfSchool management system project report.pdf
School management system project report.pdfKamal Acharya
 
Hall booking system project report .pdf
Hall booking system project report  .pdfHall booking system project report  .pdf
Hall booking system project report .pdfKamal Acharya
 
ENERGY STORAGE DEVICES INTRODUCTION UNIT-I
ENERGY STORAGE DEVICES  INTRODUCTION UNIT-IENERGY STORAGE DEVICES  INTRODUCTION UNIT-I
ENERGY STORAGE DEVICES INTRODUCTION UNIT-IVigneshvaranMech
 
İTÜ CAD and Reverse Engineering Workshop
İTÜ CAD and Reverse Engineering WorkshopİTÜ CAD and Reverse Engineering Workshop
İTÜ CAD and Reverse Engineering WorkshopEmre Günaydın
 
Construction method of steel structure space frame .pptx
Construction method of steel structure space frame .pptxConstruction method of steel structure space frame .pptx
Construction method of steel structure space frame .pptxwendy cai
 
CFD Simulation of By-pass Flow in a HRSG module by R&R Consult.pptx
CFD Simulation of By-pass Flow in a HRSG module by R&R Consult.pptxCFD Simulation of By-pass Flow in a HRSG module by R&R Consult.pptx
CFD Simulation of By-pass Flow in a HRSG module by R&R Consult.pptxR&R Consult
 
retail automation billing system ppt.pptx
retail automation billing system ppt.pptxretail automation billing system ppt.pptx
retail automation billing system ppt.pptxfaamieahmd
 
ONLINE CAR SERVICING SYSTEM PROJECT REPORT.pdf
ONLINE CAR SERVICING SYSTEM PROJECT REPORT.pdfONLINE CAR SERVICING SYSTEM PROJECT REPORT.pdf
ONLINE CAR SERVICING SYSTEM PROJECT REPORT.pdfKamal Acharya
 
Quality defects in TMT Bars, Possible causes and Potential Solutions.
Quality defects in TMT Bars, Possible causes and Potential Solutions.Quality defects in TMT Bars, Possible causes and Potential Solutions.
Quality defects in TMT Bars, Possible causes and Potential Solutions.PrashantGoswami42
 
The Benefits and Techniques of Trenchless Pipe Repair.pdf
The Benefits and Techniques of Trenchless Pipe Repair.pdfThe Benefits and Techniques of Trenchless Pipe Repair.pdf
The Benefits and Techniques of Trenchless Pipe Repair.pdfPipe Restoration Solutions
 
Scaling in conventional MOSFET for constant electric field and constant voltage
Scaling in conventional MOSFET for constant electric field and constant voltageScaling in conventional MOSFET for constant electric field and constant voltage
Scaling in conventional MOSFET for constant electric field and constant voltageRCC Institute of Information Technology
 
Furniture showroom management system project.pdf
Furniture showroom management system project.pdfFurniture showroom management system project.pdf
Furniture showroom management system project.pdfKamal Acharya
 
KIT-601 Lecture Notes-UNIT-4.pdf Frequent Itemsets and Clustering
KIT-601 Lecture Notes-UNIT-4.pdf Frequent Itemsets and ClusteringKIT-601 Lecture Notes-UNIT-4.pdf Frequent Itemsets and Clustering
KIT-601 Lecture Notes-UNIT-4.pdf Frequent Itemsets and ClusteringDr. Radhey Shyam
 
Halogenation process of chemical process industries
Halogenation process of chemical process industriesHalogenation process of chemical process industries
Halogenation process of chemical process industriesMuhammadTufail242431
 
Arduino based vehicle speed tracker project
Arduino based vehicle speed tracker projectArduino based vehicle speed tracker project
Arduino based vehicle speed tracker projectRased Khan
 
2024 DevOps Pro Europe - Growing at the edge
2024 DevOps Pro Europe - Growing at the edge2024 DevOps Pro Europe - Growing at the edge
2024 DevOps Pro Europe - Growing at the edgePaco Orozco
 
Introduction to Machine Learning Unit-5 Notes for II-II Mechanical Engineering
Introduction to Machine Learning Unit-5 Notes for II-II Mechanical EngineeringIntroduction to Machine Learning Unit-5 Notes for II-II Mechanical Engineering
Introduction to Machine Learning Unit-5 Notes for II-II Mechanical EngineeringC Sai Kiran
 
Introduction to Machine Learning Unit-4 Notes for II-II Mechanical Engineering
Introduction to Machine Learning Unit-4 Notes for II-II Mechanical EngineeringIntroduction to Machine Learning Unit-4 Notes for II-II Mechanical Engineering
Introduction to Machine Learning Unit-4 Notes for II-II Mechanical EngineeringC Sai Kiran
 

Recently uploaded (20)

Democratizing Fuzzing at Scale by Abhishek Arya
Democratizing Fuzzing at Scale by Abhishek AryaDemocratizing Fuzzing at Scale by Abhishek Arya
Democratizing Fuzzing at Scale by Abhishek Arya
 
Digital Signal Processing Lecture notes n.pdf
Digital Signal Processing Lecture notes n.pdfDigital Signal Processing Lecture notes n.pdf
Digital Signal Processing Lecture notes n.pdf
 
School management system project report.pdf
School management system project report.pdfSchool management system project report.pdf
School management system project report.pdf
 
Hall booking system project report .pdf
Hall booking system project report  .pdfHall booking system project report  .pdf
Hall booking system project report .pdf
 
ENERGY STORAGE DEVICES INTRODUCTION UNIT-I
ENERGY STORAGE DEVICES  INTRODUCTION UNIT-IENERGY STORAGE DEVICES  INTRODUCTION UNIT-I
ENERGY STORAGE DEVICES INTRODUCTION UNIT-I
 
İTÜ CAD and Reverse Engineering Workshop
İTÜ CAD and Reverse Engineering WorkshopİTÜ CAD and Reverse Engineering Workshop
İTÜ CAD and Reverse Engineering Workshop
 
Construction method of steel structure space frame .pptx
Construction method of steel structure space frame .pptxConstruction method of steel structure space frame .pptx
Construction method of steel structure space frame .pptx
 
CFD Simulation of By-pass Flow in a HRSG module by R&R Consult.pptx
CFD Simulation of By-pass Flow in a HRSG module by R&R Consult.pptxCFD Simulation of By-pass Flow in a HRSG module by R&R Consult.pptx
CFD Simulation of By-pass Flow in a HRSG module by R&R Consult.pptx
 
retail automation billing system ppt.pptx
retail automation billing system ppt.pptxretail automation billing system ppt.pptx
retail automation billing system ppt.pptx
 
ONLINE CAR SERVICING SYSTEM PROJECT REPORT.pdf
ONLINE CAR SERVICING SYSTEM PROJECT REPORT.pdfONLINE CAR SERVICING SYSTEM PROJECT REPORT.pdf
ONLINE CAR SERVICING SYSTEM PROJECT REPORT.pdf
 
Quality defects in TMT Bars, Possible causes and Potential Solutions.
Quality defects in TMT Bars, Possible causes and Potential Solutions.Quality defects in TMT Bars, Possible causes and Potential Solutions.
Quality defects in TMT Bars, Possible causes and Potential Solutions.
 
The Benefits and Techniques of Trenchless Pipe Repair.pdf
The Benefits and Techniques of Trenchless Pipe Repair.pdfThe Benefits and Techniques of Trenchless Pipe Repair.pdf
The Benefits and Techniques of Trenchless Pipe Repair.pdf
 
Scaling in conventional MOSFET for constant electric field and constant voltage
Scaling in conventional MOSFET for constant electric field and constant voltageScaling in conventional MOSFET for constant electric field and constant voltage
Scaling in conventional MOSFET for constant electric field and constant voltage
 
Furniture showroom management system project.pdf
Furniture showroom management system project.pdfFurniture showroom management system project.pdf
Furniture showroom management system project.pdf
 
KIT-601 Lecture Notes-UNIT-4.pdf Frequent Itemsets and Clustering
KIT-601 Lecture Notes-UNIT-4.pdf Frequent Itemsets and ClusteringKIT-601 Lecture Notes-UNIT-4.pdf Frequent Itemsets and Clustering
KIT-601 Lecture Notes-UNIT-4.pdf Frequent Itemsets and Clustering
 
Halogenation process of chemical process industries
Halogenation process of chemical process industriesHalogenation process of chemical process industries
Halogenation process of chemical process industries
 
Arduino based vehicle speed tracker project
Arduino based vehicle speed tracker projectArduino based vehicle speed tracker project
Arduino based vehicle speed tracker project
 
2024 DevOps Pro Europe - Growing at the edge
2024 DevOps Pro Europe - Growing at the edge2024 DevOps Pro Europe - Growing at the edge
2024 DevOps Pro Europe - Growing at the edge
 
Introduction to Machine Learning Unit-5 Notes for II-II Mechanical Engineering
Introduction to Machine Learning Unit-5 Notes for II-II Mechanical EngineeringIntroduction to Machine Learning Unit-5 Notes for II-II Mechanical Engineering
Introduction to Machine Learning Unit-5 Notes for II-II Mechanical Engineering
 
Introduction to Machine Learning Unit-4 Notes for II-II Mechanical Engineering
Introduction to Machine Learning Unit-4 Notes for II-II Mechanical EngineeringIntroduction to Machine Learning Unit-4 Notes for II-II Mechanical Engineering
Introduction to Machine Learning Unit-4 Notes for II-II Mechanical Engineering
 

Introduction to TextRank - 22.pptx

  • 2. 2 Classification of the Automatic Text Summarization Systems (El-Kassas, Salama, Rafea, & Mohamed, 2021)
  • 3. 3 Text Summarization Approaches ● Generate a summary by understanding the main concepts in the input document ● Paraphrasing the text to express those concepts in fewer words ● Using a clear language ● Extraction of the most important sentences from the input document ● Higher accuracy: the summary with the exact terminologies that exist in the original text ● Faster and simpler Extractive (萃取式) Abstractive (重寫式) (El-Kassas, Salama, Rafea, & Mohamed, 2021)
  • 4. 4 Graph-Based Extractive Text Summarization TextRank ● TextRank algorithm is a graph-based approach inspired by the methodology of PageRank. ○ The PageRank algorithm of Google is a ranking algorithm for web pages available online based on the search results. ● TextRank is a widely used method as no prior requirements of linguistic or domain knowledge. ● TextRank is an unsupervised approach for text summarization to generate extraction based summaries.
  • 5. 5 The Graph-Based Ranking Model PageRank (1998) TextRank (2004)
  • 6. 6 TextRank algorithm 1. Segment document into sentences. 2. Create representation of each sentences. 3. Score sentences. a. Create a similarity matrix: measure similarity of sentences by Cosine Similarity. b. Run the graph-based algorithm to calculate the score of sentences. 4. Select the top ranked sentences as the summary.
  • 7. 7 Step 1. Segmentation “Hi world! Hello world! This is Tim.” [ “Hi world!”, “Hello world!”, “This is Tim.” ]
  • 8. 8 Step 2. Representation [ “Hi world!”, “Hello world!”, “This is Tim.” ] Sen Word Index Word 0 0 hi 0 1 world 1 2 hello 1 1 world 2 3 this 2 4 is 2 5 tim Representation
  • 9. 9 Step 3a. Creating a similarity matrix: Sen Word Index 0 0 0 1 1 2 1 1 2 3 2 4 2 5 0 1 2 0 1 0.366 0 1 0.366 1 0 2 0 0 1 Similarity Matrix Representation
  • 10. 10 Step 3b. Graph-based algorithm (1/2) (Nenkova & McKeown, 2012) ● Iteration 0: ● Iteration 1: Run on the graph for several iterations until it converges…
  • 11. 11 Step 3b. Graph-based algorithm (1/2) (Nenkova & McKeown, 2012) ● Iteration 0: ● Iteration 1: Run on the graph for several iterations until it converges…
  • 12. 12 Step 3b. Graph-based algorithm (2/2) (Mihalcea, & Tarau, 2004)
  • 13. 13 Step 4. Select sentences ● [9] Hurricane Gilbert swept toward the Dominican Republic Sunday, and the Civil … ● [16] The National Hurricane Center in Miami reported its position at 2 a.m. Sunday at latitude 16.1 north… ● [15] The National Weather Service in San Juan, Puerto Rico, said Gilbert was moving westward at 15 mph… (Mihalcea, & Tarau, 2004)
  • 15. 15 Reference ● Mihalcea, R., & Tarau, P. (2004). Textrank: Bringing order into text. Proceedings of the 2004 Conference on Empirical Methods in Natural Language Processing, 404–411. ● El-Kassas, W. S., Salama, C. R., Rafea, A. A., & Mohamed, H. K. (2021). Automatic text summarization: A comprehensive survey. Expert Systems with Applications, 165, 113679. https://doi.org/10.1016/j.eswa.2020.113679 ● PyTextRank. (2022). [Python]. derwen.ai. https://github.com/DerwenAI/pytextrank (Original work published 2016)

Editor's Notes

  1. Automatic Text Summarization
  2. https://www.slideshare.net/andrewkoo/textrank-algorithm?qid=df925632-c81e-44d0-993a-4e3e7221a3ca&v=&b=&from_search=3
  3. 相似度演算法,相似度矩陣
  4. 四個格子,四個步驟