More Related Content Similar to Voice technology เทคโนโลยีเสียง (20) More from maruay songtanin (20) Voice technology เทคโนโลยีเสียง3. ผู้ช่วยเสมือนที่ใช้เสียง (Voice based virtual assistants)
ผู้ช่วยเสมือนตามบ้านอย่าง Alexa และ Google Home ได้สร้าง
ความมั่นใจในการสนทนา ทาให้ผู้บริโภคคุ้นเคยกับการโต้ตอบ
กับเทคโนโลยีที่ราบรื่น
Amazon และ Google ครองตาแหน่งสาคัญระหว่างตราสินค้าและ
ลูกค้า โดยอาศัยประโยชน์จากความสะดวกของการสนทนานี้
4. เทคโนโลยีด้านเสียง
ทุกวันนี้ เกือบทุกคนที่มีแล็ปท็อปหรือสมาร์ทโฟน จะมี
ประสบการณ์บางอย่างกับเทคโนโลยีเสียง
บางทีคุณอาจใช้ Siri เพื่อตั้งเตือนการปลุก หรือขอเพลงบางเพลง
ระหว่างเดินทางไปทางาน หรือบางทีคุณอาจขอให้ Cortana เตือน
คุณเกี่ยวกับการประชุมที่กาลังจะมาถึง
เทคโนโลยีเสียงมีวิวัฒนาการที่ช้าแต่แน่นอน ได้เปลี่ยนวิธีที่เรา
โต้ตอบกับอุปกรณ์ของเรา ทาให้เราทางานหลายอย่างได้ เช่น
ตรวจสอบสภาพอากาศหรือสั่งพิซซ่า โดยใช้เพียงเสียงของเรา
5. ทาไมต้องตอนนี้ ?
เสียงคือ การเชื่อมต่อกับผู้ใช้ (user interface) ที่ดั้งเดิมที่สุด
พวกเราส่วนใหญ่ เติบโตขึ้นจากการเรียนรู้วิธีการสื่อสารด้วยวิธีนี้
ทาให้เป็นวิธีการสื่อสารที่ต้องการ เพราะเป็นสิ่งที่เราพอใจที่สุด
ตอนนี้ เรากาลังเวียนกลับไปที่เสียง หลังจากใช้เวลาหลายปีกับ
อีเมล์ การส่งข้อความ และการพิมพ์ค้นหา เป็นต้น
6. ทาไมต้องตอนนี้ ? (ต่อ)
Speech recognition รู้จาเสียงได้ถึง 99% (เทียบกับมนุษย์เข้าใจ
คาของกันและกัน เพียงแค่ประมาณ 92%)
คาดว่าอุตสาหกรรมเทคโนโลยีเสียง จะเพิ่มรายได้เป็นสี่เท่า
ภายในปี ค.ศ. 2022
และในที่สุด โลกก็กาลังใกล้เข้ามากับ "ระบบนิเวศของ
เทคโนโลยี (ecosystem of tech)" อย่างรวดเร็ว ซึ่งโทรศัพท์
แล็ปท็อป ทีวี รถยนต์ และอุปกรณ์ภายในบ้านของคุณ สามารถ
สื่อสารซึ่งกันและกันด้วย อินเทอร์เน็ตของสรรพสิ่ง (Internet of
Things)
8. การเชื่อมต่อด้วยเสียง (Computer Voice Interfaces)
การเชื่อมต่อด้วยเสียงของคอมพิวเตอร์ เป็นการผสมผสาน
ระหว่าง การจดจาเสียง (Voice Recognition) และ การ
ประมวลผลภาษาธรรมชาติ (Natural Language Processing: NLP)
สาหรับผู้ใช้ อาจเข้าใจว่า "การเชื่อมต่อด้วยเสียง (voice
interfaces)" กับคอมพิวเตอร์ เช่น Siri หรือ Alexa เป็น
เทคโนโลยีเดียว
อันที่จริงแล้ว มันเป็นสองเทคโนโลยีที่รวมกัน
9. การเชื่อมต่อด้วยเสียง (ต่อ)
ประการแรก คอมพิวเตอร์ต้องเข้าใจอย่างถ่องแท้ในสิ่งที่คุณพูด
นั่นหมายถึงการถอดรหัสเสียงพึมพา ลบเสียงรบกวนรอบข้าง
จัดการเสียงและสาเนียงต่างๆ ซึ่งในปัจจุบันนี้ ทาได้ดีขึ้น
ประการที่สอง คอมพิวเตอร์จาเป็นต้องเข้าใจสิ่งที่คุณตั้งใจให้ทา
สิ่งนี้ เป็นเรื่องยาก เพราะมันหมายถึงการแปลและทาแผนที่คาสั่ง
นั้น ไปยังคาสั่งที่มีอยู่ แล้วจึงดาเนินการ
ทั้งสองนี้ แตกต่างกันมาก อย่างแรกเรียกว่า การจดจาเสียง (Voice
Recognition) และอย่างที่สองเรียกว่า การประมวลผล
ภาษาธรรมชาติ (Natural Language Processing)
11. การประมวลด้วยเสียง (Voice computing)
การประมวลด้วยเสียง เป็นการพัฒนาฮาร์ดแวร์หรือซอฟต์แวร์
เพื่อประมวลผลของเสียงที่นาเข้า
มันครอบคลุมหลายสาขาเช่น การปฏิสัมพันธ์ระหว่างมนุษย์กับ
คอมพิวเตอร์ การสนทนาภาษาศาสตร์ด้วยคอมพิวเตอร์ การ
ประมวลผลภาษาธรรมชาติ การรู้จาเสียงอัตโนมัติ การ
สังเคราะห์เสียงพูด วิศวกรรมเสียง การประมวลผลสัญญาณ
ดิจิตอลคอมพิวเตอร์ ข้อมูลในคลาวด์ วิทยาศาสตร์ข้อมูล
จริยธรรม กฎหมาย และความปลอดภัยของข้อมูล
12. การประมวลด้วยเสียง (ต่อ)
ประมาณปี ค.ศ. 2011 Siri ได้ปรากฏตัวบน Apple iPhones ใน
ฐานะผู้ช่วยเสียงคนแรกที่เข้าถึงผู้บริโภค
Amazon เปิดตัว Amazon Echo ในปี ค.ศ. 2014 (30+ ล้าน
อุปกรณ์)
Microsoft เปิดตัว Cortana ค.ศ. 2015 (400 ล้านของผู้ใช้
Windows 10)
Google เปิดตัว Google Assistant ค.ศ. 2016 (2 พันล้านของ
ผู้ใช้งานรายเดือนบนโทรศัพท์ Android)
และ Apple เปิดตัว HomePod ค.ศ. 2018 (ยอดขาย 500,000
อุปกรณ์ และ 1 พันล้านอุปกรณ์ ที่ใช้งานกับ iOS/Siri)
13. การรู้จาเสียง (Speech recognition)
การรู้จาเสียง เป็นสาขาย่อยสหวิทยาการของภาษาศาสตร์ด้าน
คอมพิวเตอร์ ที่พัฒนาวิธีการและเทคโนโลยี ช่วยให้การรู้จาและ
การแปลภาษาพูดเป็นข้อความด้วยคอมพิวเตอร์
ซึ่งเป็นที่รู้จักกันคือ การรู้จาเสียงอัตโนมัติ (Automatic Speech
Recognition: ASR) และ การแปลงเสียงพูดเป็นข้อความ (Speech
To Text: STT)
เป็นการรวมความรู้และการวิจัย ด้านภาษาศาสตร์ วิทยาการ
คอมพิวเตอร์ และสาขาวิศวกรรมไฟฟ้ า
14. การรู้จาเสียง (ต่อ)
ระบบรู้จาเสียงบางระบบต้องการ "การฝึกอบรม" (หรือที่เรียกว่า
"การลงทะเบียน") ซึ่งผู้พูดแต่ละคนต้องอ่านข้อความหรือ
คาศัพท์ที่มีอยู่ในระบบ ระบบจะวิเคราะห์เสียงเฉพาะของบุคคล
และใช้ในการรู้จาเสียงพูดของบุคคลนั้นอย่างละเอียด ทาให้มี
ความแม่นยามากขึ้น
ระบบที่ไม่ใช้การฝึกอบรมจะเรียกว่าระบบ "ผู้พูดแบบอิสระ"
ระบบที่ใช้การฝึกอบรมจะเรียกว่า "ผู้พูดที่เจาะจง"
15. การประมวลผลภาษาธรรมชาติ (Natural language processing: NLP)
การประมวลผลภาษาธรรมชาติ เป็นสาขาย่อยของวิทยาการ
คอมพิวเตอร์ วิศวกรรมข้อมูล และปัญญาประดิษฐ์ ที่เกี่ยวข้องกับ
การปฏิสัมพันธ์ระหว่างคอมพิวเตอร์และภาษามนุษย์ โดยเฉพาะ
อย่างยิ่ง วิธีการที่โปรแกรมคอมพิวเตอร์ใช้ในการประมวลผล
และวิเคราะห์ข้อมูลภาษาธรรมชาติจานวนมาก
ความท้าทายในการประมวลผลภาษาธรรมชาติ มักเกี่ยวข้องกับ
การรู้จาเสียงพูด ความเข้าใจภาษาธรรมชาติ และการสร้างภาษา
ของธรรมชาติ
16. การเชื่อมต่อกับผู้ใช้เสียง (Voice-User Interface: VUI)
การเชื่อมต่อกับผู้ใช้เสียง ทาให้มนุษย์สามารถพูดโต้ตอบกับ
คอมพิวเตอร์ได้ โดยใช้การรู้จาเสียง เพื่อทาความเข้าใจกับคาสั่ง
และคาถามที่พูด
อุปกรณ์คาสั่งเสียง (Voice Command Device: VCD) เป็นอุปกรณ์
ที่ควบคุมด้วยส่วนต่อประสานกับผู้ใช้เสียง
VCD รุ่นใหม่นั้น เป็นแบบผู้พูดอิสระ ดังนั้นจึงสามารถตอบสนอง
ต่อเสียงที่หลากหลาย โดยไม่คานึงถึงอิทธิพลของสาเนียงภาษา
19. เทคโนโลยีเสียงเปลี่ยนแปลงวิธีการทางานของเราอย่างไร
ที่ผ่านมา มีกี่ครั้งที่คุณตั้งระบบเตือน ส่งข้อความ หรือค้นหา
คาตอบ เพียงแค่พูดลงในโทรศัพท์ของคุณ
เทคโนโลยีเสียง เมื่อรวมกับผู้ช่วย AI (ปัญญาประดิษฐ์) ในตัว
เช่น Siri และ Cortana ทาให้สถานการณ์เหล่านี้ เป็นเรื่องธรรมดา
และเปลี่ยนวิธีที่เราใช้ชีวิตประจาวัน
แต่เทคโนโลยีเสียงนั้น ไม่ได้มีเพียงประโยชน์ในขอบเขตของ
ผู้บริโภคเท่านั้น ในด้านธุรกิจก็ได้รับประโยชน์อย่างมาก จาก
ความสามารถในการออกคาสั่งค้นหาข้อมูล และสั่งการบันทึก
โดยใช้เพียงเสียงและอุปกรณ์อัจฉริยะ
20. 1. ปรับปรุงการแบ่งปันข้อมูลภายในองค์กร
IBM Watson เป็นแอปพลิเคชั่นเสียง ที่ปรับแต่งสาหรับองค์กร
ลองคิดดูว่า ในขณะที่ทางานอยู่ในโรงงาน บุคลากรสามารถ
เข้าถึงอินทราเน็ตของบริษัท เอกสารกระบวนการ และเอกสาร
ทรัพยากรบุคคลทั้งหมด โดยไม่ต้องยกนิ้ ว
การทาให้ทุกคนสามารถเข้าถึงข้อมูลได้ จะช่วยให้ทุกระดับของ
องค์กรมีประสิทธิภาพมากขึ้น
21. 2. เพิ่มผลผลิตผ่านการทางานได้หลายอย่าง
ความสามารถในการถามคาถามง่าย ๆ กาหนดการประชุม จับ
เวลา การเตือน และอีกมากมาย โดยไม่ต้องหยุดในสิ่งที่คุณทา
จะมีประโยชน์อย่างเหลือเชื่อ และก็เป็นเช่นนั้นแล้ว
Alexa เป็นเครื่องมือสาคัญสาหรับสานักงานในวันนี้ ที่สร้างความ
มั่นใจในการติดตามรายการดาเนินการ รายการที่ต้องทา และ
เตือนการประชุมที่จะเกิดขึ้น
23. 4. ควบคุมสภาพแวดล้อมการทางานได้ดีขึ้น
เป็นที่คาดการณ์ว่า ในปี ค.ศ. 2020 จะมีถึง 30% ของการค้นหา
ในเว็บด้วยเสียง และภายใน 4 ปี การซื้ อสินค้าออนไลน์ด้วยเสียง
คาดว่าจะสูงถึง 4 หมื่นล้านดอลลาร์
ในขณะที่เรากาลังเขียนอีเมล์ เราสามารถใช้ Alexa เพื่อสั่งของ
จาก Amazon รับคาแนะนาร้านอาหาร ค้นหาสถิติล่าสุด และ
ปรับเปลี่ยนอุณหภูมิในสานักงาน
เรายังสามารถขอให้ Alexa รับสายแทนได้
24. 5. ระบบอัตโนมัติของกระบวนการประจา
Alexa สาหรับธุรกิจ ใช้คาสั่งเสียงง่าย ๆ เพื่อควบคุมอุปกรณ์ใน
ห้อง ตั้งค่าการประชุมโดยไม่มีปัญหาขัดแย้ง และประหยัดเวลา
ในโลกธุรกิจ
นอกจากนี้ ยังสามารถรายงานไปยังแผนกไอที เกี่ยวกับ
เครื่องพิมพ์ที่เสียหาย ฯลฯ
ในระยะยาว หนึ่งในข้อเสนอที่มีค่ามากที่สุดของผู้ช่วยด้านเสียง
คือ ความสามารถในการทาให้กระบวนการประจากลายเป็น
อัตโนมัติ
25. 6. ความคล่องตัวของการทางานและลดแรงเสียดทานการสื่อสาร
Google ได้แนะนาความสามารถของเทคโนโลยีเสียง ในการ
กาหนดตารางนัดหมาย ที่ส่งผลกระทบต่อกระบวนการทางาน
รายวันของเรา
อีกไม่นาน เราจะสามารถพูดออกมาดัง ๆ ว่า "นัดประชุมกับ
ทอมเวลา 14.00 น." เท่านั้น เป็นอันเสร็จสิ้น!
การส่งอีเมล์ ข้อความโต้ตอบแบบทันที และเรื่องสานักงานที่ไม่มี
ที่สิ้นสุด ซึ่งต้องใช้เวลาในแต่ละวัน เทคโนโลยีเสียงจะกลายเป็น
เครื่องมืออันล้าค่า สาหรับการปรับปรุงขั้นตอนการทางานทั่วไป
และช่วยลดแรงเสียดทาน
27. 8. เอกสารและจดบันทึกที่ง่ายขึ้น
ทุกบริษัท ต้องการเอกสารเกี่ยวกับกระบวนการในระดับหนึ่ง
ขั้นตอนการปฏิบัติงานมาตรฐาน และรูปแบบการสื่อสารที่
ยาวนานและน่าเบื่อ
ถ้ายังไม่มีใครมีเวลาเขียนให้กับพวกเขา ทาไมไม่บอกพวกเขาใช้
เทคโนโลยีเสียง?
การแก้ไขบางอย่างของข้อความ ง่ายกว่าการเขียนตั้งแต่เริ่มต้น
28. 9. งานที่เป็นของมนุษย์โดยเฉพาะ
เสียงได้เริ่มเข้ามามีบทบาทในสถานที่ทางาน เพื่อปรับปรุง
ประสิทธิภาพของผู้ปฏิบัติงาน
การเขียนตามคาบอก ช่วยให้การจดบันทึกรายละเอียดระหว่าง
การประชุมเป็นปัจจุบัน เป็นไปได้อย่างไม่มีความแตกต่าง
Cortana ช่วยให้คุณค้นหา กาหนดเวลาการนัดหมาย และตั้งค่า
การเตือน
เมื่อใช้อย่างมีประสิทธิภาพ เทคโนโลยีจะช่วยให้ผู้ปฏิบัติงาน
มุ่งเน้นไปที่กลยุทธ์ และความคิดสร้างสรรค์ ซึ่งเป็นองค์ประกอบ
ที่ทาให้เราเป็นมนุษย์โดยเฉพาะ