ITC-CSCC 2010, Pattaya, Thailand
ระบบแจ้งเตือนการคัดลอกเนื้อหาบนเว็บ
CopyAlert
สันติพงษ์ ไทยประยูร และอลิสา คงทน
ห้องปฏิบั...
2
 ความเป็นมาและแรงจูงใจ
 แนะนาระบบ
 เปรียบเทียบซอฟต์แวร์ในต่างประเทศ
 ความพร้อมสู่ตลาดเชิงพาณิชย์และวางแผนการตลาด
 แ...
ผู้ขโมยผลงานเจ้าของผลงาน 3
ความเป็นมาและแรงจูงใจ
4
ความเป็นมาและแรงจูงใจ
5
ภาพรวมระบบ
BingAPI
Checking
Monitoring
Web
Send URLs
-Analyzed Results
-Alert Email
- ความถูกต้อง 85.6%
- เวลาที่ใช้ในกา...
6
 สนับสนุนการติดตามการคัดลอกหน้าเว็บบนอินเทอร์เน็ตแบบอัตโนมัติ ทั้ง
ภาษาไทยและอังกฤษ
 แจ้งเตือนอัตโนมัติด้วยอีเมลเมื่อเ...
7
 การติดแท็ก
คุณสมบัติของระบบ
8
 แถบสีข้อความที่คล้ายกัน
คุณสมบัติของระบบ
9
 ประวัติการตรวจสอบ
คุณสมบัติของระบบ
10
 สามารถเข้าถึงได้ทุกที่ ทุกเวลา
 ใช้งานง่าย ตรวจสอบได้รวดเร็ว
 ช่วยปกป้องเนื้อหาเว็บไม่ให้ถูกคัดลอก
 ช่วยนักเขียนแล...
11
เปรียบเทียบซอฟต์แวร์ในต่างประเทศ
Products/Features
Thai-English Language
Support
Automatically Monitor
Pages
Send Notif...
12
ความพร้อมสู่ตลาดเชิงพาณิชย์
 จุดแข็ง (Strength)
 สนับสนุนการติดตามการคัดลอกหน้าเว็บบนอินเทอร์เน็ตแบบ
อัตโนมัติ ทั้งภา...
13
กลุ่มผู้ใช้เป้าหมาย
14
วางแผนการตลาด
บริการ ประเภท แพ็คเกจ กลุ่มลูกค้า เป้าหมาย ส่งเสริม
การขาย
Online
Service
Monthly -Free
-Standard
-Profes...
15
 เพิ่มประสิทธิภาพระบบ
 เพิ่มเครื่องมือสืบค้น (Search Engine) เพื่อสามารถตรวจสอบได้ครอบคลุม
 วิเคราะห์ว่าลิงค์ไหนมีกา...
16
สาธิตระบบ
17
Questions / Comments ?
Thank you for your attention
18
ขั้นตอนการทางานของระบบ
19
ประสิทธิภาพ
Method #URLs #Chunks Accuracy (%)
Response
Time
(Sec/Url)
Baseline 100 36 85.6 89.91
Randomly
Selection
100...
Similarity Score Calculation
Source
A
200 คำ
Source
B
150 คำ
Source
C
300 คำ
20
คำ
30
คำ
40
คำ
20/200 =
10%
30/150 =
20%
4...
21
TT = “กำร|ใช้|สำร|อินทรีย์|ใน|วงจร|อิเล็กทรอนิกส์| |ซึ่ง|จะ|มี|ต้น|ทุน|ใน|กำร|ผลิต|ถูก|ยิ่ง|กว่ำ|กำร|ผลิต||วงจร|จำก|
ซิ...
Upcoming SlideShare
Loading in …5
×

20130720 copy alert-ticta2013

196 views
134 views

Published on

0 Comments
1 Like
Statistics
Notes
 • Be the first to comment

No Downloads
Views
Total views
196
On SlideShare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
0
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

20130720 copy alert-ticta2013

 1. 1. ITC-CSCC 2010, Pattaya, Thailand ระบบแจ้งเตือนการคัดลอกเนื้อหาบนเว็บ CopyAlert สันติพงษ์ ไทยประยูร และอลิสา คงทน ห้องปฏิบัติการวิจัยเทคโนโลยีเสียง (SPT) ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (NECTEC) TICTA2013, Bangkok, Thailand
 2. 2. 2  ความเป็นมาและแรงจูงใจ  แนะนาระบบ  เปรียบเทียบซอฟต์แวร์ในต่างประเทศ  ความพร้อมสู่ตลาดเชิงพาณิชย์และวางแผนการตลาด  แนวโน้มการพัฒนาในอนาคต  สาธิตการทางาน หัวข้อ
 3. 3. ผู้ขโมยผลงานเจ้าของผลงาน 3 ความเป็นมาและแรงจูงใจ
 4. 4. 4 ความเป็นมาและแรงจูงใจ
 5. 5. 5 ภาพรวมระบบ BingAPI Checking Monitoring Web Send URLs -Analyzed Results -Alert Email - ความถูกต้อง 85.6% - เวลาที่ใช้ในการตรวจ 44.83 sec/URL
 6. 6. 6  สนับสนุนการติดตามการคัดลอกหน้าเว็บบนอินเทอร์เน็ตแบบอัตโนมัติ ทั้ง ภาษาไทยและอังกฤษ  แจ้งเตือนอัตโนมัติด้วยอีเมลเมื่อเนื้อหาถูกคัดลอก  ผู้ใช้สามารถติดแท็ก (Tag) บนหน้าเว็บเพื่อเฝ้าระวังผลงานของตัวเองแบบ Real-Time  สามารถแสดงแถบสีข้อความที่คล้ายกันพร้อมทั้งเปอร์เซ็นต์ความคล้าย  ผู้ใช้สามารถปรับเปลี่ยนเปอร์เซ็นต์ความคล้ายได้ด้วยตนเอง  แสดงประวัติผลการตรวจสอบ คุณสมบัติของระบบ
 7. 7. 7  การติดแท็ก คุณสมบัติของระบบ
 8. 8. 8  แถบสีข้อความที่คล้ายกัน คุณสมบัติของระบบ
 9. 9. 9  ประวัติการตรวจสอบ คุณสมบัติของระบบ
 10. 10. 10  สามารถเข้าถึงได้ทุกที่ ทุกเวลา  ใช้งานง่าย ตรวจสอบได้รวดเร็ว  ช่วยปกป้องเนื้อหาเว็บไม่ให้ถูกคัดลอก  ช่วยนักเขียนและบรรณาธิการในการหาว่าใครขโมยต้นฉบับ  ช่วยบล็อกเกอร์และนักข่าวในการหาเว็บเพจที่ถูกเว็บไซต์อื่นนาไปดัดแปลง หรือทาซ้าโดยไม่มีการอ้างอิง ประโยชน์แก่ผู้ใช้
 11. 11. 11 เปรียบเทียบซอฟต์แวร์ในต่างประเทศ Products/Features Thai-English Language Support Automatically Monitor Pages Send Notifications by Email Embeddable Tag Document Highlight and Similarity Score
 12. 12. 12 ความพร้อมสู่ตลาดเชิงพาณิชย์  จุดแข็ง (Strength)  สนับสนุนการติดตามการคัดลอกหน้าเว็บบนอินเทอร์เน็ตแบบ อัตโนมัติ ทั้งภาษาไทยและอังกฤษ  ลดเวลาเจ้าของผลงานในการตรวจสอบการคัดลอก  ตรวจสอบการคัดลอกรวดเร็วและถูกต้อง  โอกาส (Opportunity)  การคัดลอกเนื้อหาเว็บจากที่หนึ่งไปยังอีกที่หนึ่งเพิ่มมากขึ้น  นักเขียนมีความต้องการคอยติดตามเนื้อหาเว็บตนเอง  ประกาศใช้พระราชบัญญัติลิขสิทธิ์ พ.ศ. ๒๕๓๗
 13. 13. 13 กลุ่มผู้ใช้เป้าหมาย
 14. 14. 14 วางแผนการตลาด บริการ ประเภท แพ็คเกจ กลุ่มลูกค้า เป้าหมาย ส่งเสริม การขาย Online Service Monthly -Free -Standard -Professional นักเขียน/ บุคคลทั่วไป 70% บูธ/ โฆษณา/ เว็บไซต์/ ทดลองใช้ งาน API Monthly Enterprise องค์กร/ บริษัท 30%
 15. 15. 15  เพิ่มประสิทธิภาพระบบ  เพิ่มเครื่องมือสืบค้น (Search Engine) เพื่อสามารถตรวจสอบได้ครอบคลุม  วิเคราะห์ว่าลิงค์ไหนมีการอ้างอิงแหล่งที่มา  ตรวจสอบรูปภาพที่ถูกคัดลอกมาจากเว็บ  ระบุเฉพาะเว็บไซต์ที่ต้องตรวจสอบ แนวโน้มการพัฒนาในอนาคต
 16. 16. 16 สาธิตระบบ
 17. 17. 17 Questions / Comments ? Thank you for your attention
 18. 18. 18 ขั้นตอนการทางานของระบบ
 19. 19. 19 ประสิทธิภาพ Method #URLs #Chunks Accuracy (%) Response Time (Sec/Url) Baseline 100 36 85.6 89.91 Randomly Selection 100 23 85.6 56.81 Intelligent Selection 100 18 85.6 44.82
 20. 20. Similarity Score Calculation Source A 200 คำ Source B 150 คำ Source C 300 คำ 20 คำ 30 คำ 40 คำ 20/200 = 10% 30/150 = 20% 40/300 = 13% 20 คำ 30 คำ 40 คำ Total similarity score is 90/500 = 18% My work 500 คำ - เปอร์เซ็นความคล้ายทั้งหมด (Total Similarity Score) คือ เปอร์เซ็นความคล้ายทั้งหมดที่เอกสาร ของเราเหมือนกับแหล่งอื่น - เปอร์เซ็นความคล้ายตามแหล่งที่มา (Similarity Score by Source) คือ เอกสารของเรามีความ คล้ายเป็นกี่เปอร์เซ็นของแต่ละแหล่ง
 21. 21. 21 TT = “กำร|ใช้|สำร|อินทรีย์|ใน|วงจร|อิเล็กทรอนิกส์| |ซึ่ง|จะ|มี|ต้น|ทุน|ใน|กำร|ผลิต|ถูก|ยิ่ง|กว่ำ|กำร|ผลิต||วงจร|จำก| ซิลิกอน|ที่|ใช้|ใน|ปัจจุบัน|และ|สำมำรถ|นำ|ไป|ใช้|ได้|กับ|พื้น|ผิว|ที่|โค้งงอ” T = “การใช้สารอินทรีย์ในวงจรอิเล็กทรอนิกส์ ซึ่งจะมีต้นทุนในการผลิตถูกยิ่งกว่าการผลิต วงจรจาก”ซิลิกอน”ที่ใช้ ในปัจจุบันและสามารถนาไปใช้ได้กับพื้นผิวที่โค้งงอ” Window Size = 10 Sliding Window = 6 1 10 6 C1 = “กำร|ใช้|สำร|อินทรีย์|ใน|วงจร|อิเล็กทรอนิกส์| |ซึ่ง|จะ|” C2 = “อิเล็กทรอนิกส์| |ซึ่ง|จะ|มี|ต้น|ทุน|ใน|กำร|ผลิต|” C3 = “ทุน|ใน|กำร|ผลิต|ถูก|ยิ่ง|กว่ำ|กำร|ผลิต| |” C4 = “กว่ำ|กำร|ผลิต| |วงจร|จำก|ซิลิกอน|ที่|ใช้|ใน|” C5 = “ซิลิกอน|ที่|ใช้|ใน|ปัจจุบัน|และ|สำมำรถ|นำ|ไป|ใช้|ได้|” C6 = “นำ|ไป|ใช้|ได้|กับ|พื้น|ผิว|ที่|โค้งงอ|” เทคนิคการเลื่อนกรอบ (Sliding Windows Technique)

×