Voice technology เทคโนโลยีเสียง

พลตรี มารวย ส่งทานินทร์ maruays@hotmail.com
19 มกราคม 2562

เกริ่นนา
 การยอมรับอย่างกว้างขวางของเทคโนโลยีเสียงโดยชาวอเมริกัน
นับล้าน จะเปลี่ยนวิธีที่ผู้คนค้นหา บริโภค และดาเนินการกับ
ข้อมูล ในอนาคตข้างหน้า
 ในขณะนี้ เทคโนโลยีเสียง (voice technology) ได้สร้างผลกระทบ
ต่อพฤติกรรมของผู้คน
 จากการวิจัยของ Google พบว่า 72% ของคนที่มี ลาโพงเปิดใช้
งานด้วยเสียง (voice-activated speaker) บอกว่า อุปกรณ์ของ
พวกเขา ถูกใช้เป็นส่วนหนึ่งของกิจวัตรประจาวัน

ผู้ช่วยเสมือนที่ใช้เสียง (Voice based virtual assistants)
 ผู้ช่วยเสมือนตามบ้านอย่าง Alexa และ Google Home ได้สร้าง
ความมั่นใจในการสนทนา ทาให้ผู้บริโภคคุ้นเคยกับการโต้ตอบ
กับเทคโนโลยีที่ราบรื่น
 Amazon และ Google ครองตาแหน่งสาคัญระหว่างตราสินค้าและ
ลูกค้า โดยอาศัยประโยชน์จากความสะดวกของการสนทนานี้

เทคโนโลยีด้านเสียง
 ทุกวันนี้ เกือบทุกคนที่มีแล็ปท็อปหรือสมาร์ทโฟน จะมี
ประสบการณ์บางอย่างกับเทคโนโลยีเสียง
 บางทีคุณอาจใช้ Siri เพื่อตั้งเตือนการปลุก หรือขอเพลงบางเพลง
ระหว่างเดินทางไปทางาน หรือบางทีคุณอาจขอให้ Cortana เตือน
คุณเกี่ยวกับการประชุมที่กาลังจะมาถึง
 เทคโนโลยีเสียงมีวิวัฒนาการที่ช้าแต่แน่นอน ได้เปลี่ยนวิธีที่เรา
โต้ตอบกับอุปกรณ์ของเรา ทาให้เราทางานหลายอย่างได้ เช่น
ตรวจสอบสภาพอากาศหรือสั่งพิซซ่า โดยใช้เพียงเสียงของเรา

ทาไมต้องตอนนี้ ?
 เสียงคือ การเชื่อมต่อกับผู้ใช้ (user interface) ที่ดั้งเดิมที่สุด
 พวกเราส่วนใหญ่ เติบโตขึ้นจากการเรียนรู้วิธีการสื่อสารด้วยวิธีนี้
ทาให้เป็นวิธีการสื่อสารที่ต้องการ เพราะเป็นสิ่งที่เราพอใจที่สุด
 ตอนนี้ เรากาลังเวียนกลับไปที่เสียง หลังจากใช้เวลาหลายปีกับ
อีเมล์ การส่งข้อความ และการพิมพ์ค้นหา เป็นต้น

ทาไมต้องตอนนี้ ? (ต่อ)
 Speech recognition รู้จาเสียงได้ถึง 99% (เทียบกับมนุษย์เข้าใจ
คาของกันและกัน เพียงแค่ประมาณ 92%)
 คาดว่าอุตสาหกรรมเทคโนโลยีเสียง จะเพิ่มรายได้เป็นสี่เท่า
ภายในปี ค.ศ. 2022
 และในที่สุด โลกก็กาลังใกล้เข้ามากับ "ระบบนิเวศของ
เทคโนโลยี (ecosystem of tech)" อย่างรวดเร็ว ซึ่งโทรศัพท์
แล็ปท็อป ทีวี รถยนต์ และอุปกรณ์ภายในบ้านของคุณ สามารถ
สื่อสารซึ่งกันและกันด้วย อินเทอร์เน็ตของสรรพสิ่ง (Internet of
Things)

https://danielmiessler.com/blog/computer-voice-interfaces-are-a-combination-of-voice-recognition-and-nlp/

การเชื่อมต่อด้วยเสียง (Computer Voice Interfaces)
 การเชื่อมต่อด้วยเสียงของคอมพิวเตอร์ เป็นการผสมผสาน
ระหว่าง การจดจาเสียง (Voice Recognition) และ การ
ประมวลผลภาษาธรรมชาติ (Natural Language Processing: NLP)
 สาหรับผู้ใช้ อาจเข้าใจว่า "การเชื่อมต่อด้วยเสียง (voice
interfaces)" กับคอมพิวเตอร์ เช่น Siri หรือ Alexa เป็น
เทคโนโลยีเดียว
 อันที่จริงแล้ว มันเป็นสองเทคโนโลยีที่รวมกัน

การเชื่อมต่อด้วยเสียง (ต่อ)
 ประการแรก คอมพิวเตอร์ต้องเข้าใจอย่างถ่องแท้ในสิ่งที่คุณพูด
นั่นหมายถึงการถอดรหัสเสียงพึมพา ลบเสียงรบกวนรอบข้าง
จัดการเสียงและสาเนียงต่างๆ ซึ่งในปัจจุบันนี้ ทาได้ดีขึ้น
 ประการที่สอง คอมพิวเตอร์จาเป็นต้องเข้าใจสิ่งที่คุณตั้งใจให้ทา
สิ่งนี้ เป็นเรื่องยาก เพราะมันหมายถึงการแปลและทาแผนที่คาสั่ง
นั้น ไปยังคาสั่งที่มีอยู่ แล้วจึงดาเนินการ
 ทั้งสองนี้ แตกต่างกันมาก อย่างแรกเรียกว่า การจดจาเสียง (Voice
Recognition) และอย่างที่สองเรียกว่า การประมวลผล
ภาษาธรรมชาติ (Natural Language Processing)

From Wikipedia
Voice computing, Speech recognition, Natural language processing (NLP),
Voice user interface

การประมวลด้วยเสียง (Voice computing)
 การประมวลด้วยเสียง เป็นการพัฒนาฮาร์ดแวร์หรือซอฟต์แวร์
เพื่อประมวลผลของเสียงที่นาเข้า
 มันครอบคลุมหลายสาขาเช่น การปฏิสัมพันธ์ระหว่างมนุษย์กับ
คอมพิวเตอร์ การสนทนาภาษาศาสตร์ด้วยคอมพิวเตอร์ การ
ประมวลผลภาษาธรรมชาติ การรู้จาเสียงอัตโนมัติ การ
สังเคราะห์เสียงพูด วิศวกรรมเสียง การประมวลผลสัญญาณ
ดิจิตอลคอมพิวเตอร์ ข้อมูลในคลาวด์ วิทยาศาสตร์ข้อมูล
จริยธรรม กฎหมาย และความปลอดภัยของข้อมูล

การประมวลด้วยเสียง (ต่อ)
 ประมาณปี ค.ศ. 2011 Siri ได้ปรากฏตัวบน Apple iPhones ใน
ฐานะผู้ช่วยเสียงคนแรกที่เข้าถึงผู้บริโภค
 Amazon เปิดตัว Amazon Echo ในปี ค.ศ. 2014 (30+ ล้าน
อุปกรณ์)
 Microsoft เปิดตัว Cortana ค.ศ. 2015 (400 ล้านของผู้ใช้
Windows 10)
 Google เปิดตัว Google Assistant ค.ศ. 2016 (2 พันล้านของ
ผู้ใช้งานรายเดือนบนโทรศัพท์ Android)
 และ Apple เปิดตัว HomePod ค.ศ. 2018 (ยอดขาย 500,000
อุปกรณ์ และ 1 พันล้านอุปกรณ์ ที่ใช้งานกับ iOS/Siri)

การรู้จาเสียง (Speech recognition)
 การรู้จาเสียง เป็นสาขาย่อยสหวิทยาการของภาษาศาสตร์ด้าน
คอมพิวเตอร์ ที่พัฒนาวิธีการและเทคโนโลยี ช่วยให้การรู้จาและ
การแปลภาษาพูดเป็นข้อความด้วยคอมพิวเตอร์
 ซึ่งเป็นที่รู้จักกันคือ การรู้จาเสียงอัตโนมัติ (Automatic Speech
Recognition: ASR) และ การแปลงเสียงพูดเป็นข้อความ (Speech
To Text: STT)
 เป็นการรวมความรู้และการวิจัย ด้านภาษาศาสตร์ วิทยาการ
คอมพิวเตอร์ และสาขาวิศวกรรมไฟฟ้ า

การรู้จาเสียง (ต่อ)
 ระบบรู้จาเสียงบางระบบต้องการ "การฝึกอบรม" (หรือที่เรียกว่า
"การลงทะเบียน") ซึ่งผู้พูดแต่ละคนต้องอ่านข้อความหรือ
คาศัพท์ที่มีอยู่ในระบบ ระบบจะวิเคราะห์เสียงเฉพาะของบุคคล
และใช้ในการรู้จาเสียงพูดของบุคคลนั้นอย่างละเอียด ทาให้มี
ความแม่นยามากขึ้น
 ระบบที่ไม่ใช้การฝึกอบรมจะเรียกว่าระบบ "ผู้พูดแบบอิสระ"
ระบบที่ใช้การฝึกอบรมจะเรียกว่า "ผู้พูดที่เจาะจง"

การประมวลผลภาษาธรรมชาติ (Natural language processing: NLP)
 การประมวลผลภาษาธรรมชาติ เป็นสาขาย่อยของวิทยาการ
คอมพิวเตอร์ วิศวกรรมข้อมูล และปัญญาประดิษฐ์ ที่เกี่ยวข้องกับ
การปฏิสัมพันธ์ระหว่างคอมพิวเตอร์และภาษามนุษย์ โดยเฉพาะ
อย่างยิ่ง วิธีการที่โปรแกรมคอมพิวเตอร์ใช้ในการประมวลผล
และวิเคราะห์ข้อมูลภาษาธรรมชาติจานวนมาก
 ความท้าทายในการประมวลผลภาษาธรรมชาติ มักเกี่ยวข้องกับ
การรู้จาเสียงพูด ความเข้าใจภาษาธรรมชาติ และการสร้างภาษา
ของธรรมชาติ

การเชื่อมต่อกับผู้ใช้เสียง (Voice-User Interface: VUI)
 การเชื่อมต่อกับผู้ใช้เสียง ทาให้มนุษย์สามารถพูดโต้ตอบกับ
คอมพิวเตอร์ได้ โดยใช้การรู้จาเสียง เพื่อทาความเข้าใจกับคาสั่ง
และคาถามที่พูด
 อุปกรณ์คาสั่งเสียง (Voice Command Device: VCD) เป็นอุปกรณ์
ที่ควบคุมด้วยส่วนต่อประสานกับผู้ใช้เสียง
 VCD รุ่นใหม่นั้น เป็นแบบผู้พูดอิสระ ดังนั้นจึงสามารถตอบสนอง
ต่อเสียงที่หลากหลาย โดยไม่คานึงถึงอิทธิพลของสาเนียงภาษา

การเชื่อมต่อกับผู้ใช้เสียง (ต่อ)
 มีการเชื่อมต่อประสานกับผู้ใช้เสียง ในรถยนต์ ระบบอัตโนมัติ
ภายในบ้าน ระบบปฏิบัติการคอมพิวเตอร์ เครื่องใช้ภายในบ้าน
เช่น เครื่องซักผ้า เตาไมโครเวฟ และรีโมทคอนโทรลของ
โทรทัศน์
 สิ่งเหล่านี้ ใช้เสียงเป็นวิธีหลักในการโต้ตอบกับผู้ช่วยเสมือน บน
สมาร์ทโฟนและลาโพงอัจฉริยะ

https://www.forbes.com/sites/forbesagencycouncil/2018/07/27/how-voice-technology-is-changing-the-way-we-
work/#7b988f114a4d

เทคโนโลยีเสียงเปลี่ยนแปลงวิธีการทางานของเราอย่างไร
 ที่ผ่านมา มีกี่ครั้งที่คุณตั้งระบบเตือน ส่งข้อความ หรือค้นหา
คาตอบ เพียงแค่พูดลงในโทรศัพท์ของคุณ
 เทคโนโลยีเสียง เมื่อรวมกับผู้ช่วย AI (ปัญญาประดิษฐ์) ในตัว
เช่น Siri และ Cortana ทาให้สถานการณ์เหล่านี้ เป็นเรื่องธรรมดา
และเปลี่ยนวิธีที่เราใช้ชีวิตประจาวัน
 แต่เทคโนโลยีเสียงนั้น ไม่ได้มีเพียงประโยชน์ในขอบเขตของ
ผู้บริโภคเท่านั้น ในด้านธุรกิจก็ได้รับประโยชน์อย่างมาก จาก
ความสามารถในการออกคาสั่งค้นหาข้อมูล และสั่งการบันทึก
โดยใช้เพียงเสียงและอุปกรณ์อัจฉริยะ

1. ปรับปรุงการแบ่งปันข้อมูลภายในองค์กร
 IBM Watson เป็นแอปพลิเคชั่นเสียง ที่ปรับแต่งสาหรับองค์กร
 ลองคิดดูว่า ในขณะที่ทางานอยู่ในโรงงาน บุคลากรสามารถ
เข้าถึงอินทราเน็ตของบริษัท เอกสารกระบวนการ และเอกสาร
ทรัพยากรบุคคลทั้งหมด โดยไม่ต้องยกนิ้ ว
 การทาให้ทุกคนสามารถเข้าถึงข้อมูลได้ จะช่วยให้ทุกระดับของ
องค์กรมีประสิทธิภาพมากขึ้น

2. เพิ่มผลผลิตผ่านการทางานได้หลายอย่าง
 ความสามารถในการถามคาถามง่าย ๆ กาหนดการประชุม จับ
เวลา การเตือน และอีกมากมาย โดยไม่ต้องหยุดในสิ่งที่คุณทา
จะมีประโยชน์อย่างเหลือเชื่อ และก็เป็นเช่นนั้นแล้ว
 Alexa เป็นเครื่องมือสาคัญสาหรับสานักงานในวันนี้ ที่สร้างความ
มั่นใจในการติดตามรายการดาเนินการ รายการที่ต้องทา และ
เตือนการประชุมที่จะเกิดขึ้น

3. มีเวลาว่างมากขึ้นสาหรับผู้บริหารระดับสูง
 ความช่วยเหลือด้วยเสียง มีความเป็นไปได้ที่จะเพิ่มเวลาที่มีค่า
ให้กับผู้บริหารระดับสูง ซึ่งช่วยให้พวกเขาเปลี่ยนจุดเน้นไปยัง
ลาดับความสาคัญที่สูงขึ้น ในรายการที่พวกเขามีอยู่
 การใส่การประชุมในปฏิทิน การส่งข้อความด่วน และงานอื่น ๆ
ที่คล้ายกัน จะถูกแทนที่ด้วยเทคโนโลยีเสียง

4. ควบคุมสภาพแวดล้อมการทางานได้ดีขึ้น
 เป็นที่คาดการณ์ว่า ในปี ค.ศ. 2020 จะมีถึง 30% ของการค้นหา
ในเว็บด้วยเสียง และภายใน 4 ปี การซื้ อสินค้าออนไลน์ด้วยเสียง
คาดว่าจะสูงถึง 4 หมื่นล้านดอลลาร์
 ในขณะที่เรากาลังเขียนอีเมล์ เราสามารถใช้ Alexa เพื่อสั่งของ
จาก Amazon รับคาแนะนาร้านอาหาร ค้นหาสถิติล่าสุด และ
ปรับเปลี่ยนอุณหภูมิในสานักงาน
 เรายังสามารถขอให้ Alexa รับสายแทนได้

5. ระบบอัตโนมัติของกระบวนการประจา
 Alexa สาหรับธุรกิจ ใช้คาสั่งเสียงง่าย ๆ เพื่อควบคุมอุปกรณ์ใน
ห้อง ตั้งค่าการประชุมโดยไม่มีปัญหาขัดแย้ง และประหยัดเวลา
ในโลกธุรกิจ
 นอกจากนี้ ยังสามารถรายงานไปยังแผนกไอที เกี่ยวกับ
เครื่องพิมพ์ที่เสียหาย ฯลฯ
 ในระยะยาว หนึ่งในข้อเสนอที่มีค่ามากที่สุดของผู้ช่วยด้านเสียง
คือ ความสามารถในการทาให้กระบวนการประจากลายเป็น
อัตโนมัติ

6. ความคล่องตัวของการทางานและลดแรงเสียดทานการสื่อสาร
 Google ได้แนะนาความสามารถของเทคโนโลยีเสียง ในการ
กาหนดตารางนัดหมาย ที่ส่งผลกระทบต่อกระบวนการทางาน
รายวันของเรา
 อีกไม่นาน เราจะสามารถพูดออกมาดัง ๆ ว่า "นัดประชุมกับ
ทอมเวลา 14.00 น." เท่านั้น เป็นอันเสร็จสิ้น!
 การส่งอีเมล์ ข้อความโต้ตอบแบบทันที และเรื่องสานักงานที่ไม่มี
ที่สิ้นสุด ซึ่งต้องใช้เวลาในแต่ละวัน เทคโนโลยีเสียงจะกลายเป็น
เครื่องมืออันล้าค่า สาหรับการปรับปรุงขั้นตอนการทางานทั่วไป
และช่วยลดแรงเสียดทาน

7. ข้อมูลเชิงลึกเกี่ยวกับแนวคิดผู้บริโภค
 นอกเหนือจากประโยชน์ของผู้ช่วยเสียงในที่ทางาน ซึ่งสามารถใช้
ในการจองการประชุม จัดการรายการที่ต้องทา และส่งข้อความ
ถึงเพื่อนร่วมงาน เทคโนโลยีเสียงสามารถช่วยนักการตลาดให้อยู่
ในใจของผู้บริโภค ด้วยการสารวจผลลัพธ์การค้นหาด้วยเสียง
 ตัวอย่างเช่น การเล่นเกมด้วยเสียง (Voice gaming) สามารถใช้
เป็นแบบจาลองสาหรับวิธีที่ผู้บริโภค สารวจเนื้ อหาของเว็บไซต์
ด้วยเสียง

8. เอกสารและจดบันทึกที่ง่ายขึ้น
 ทุกบริษัท ต้องการเอกสารเกี่ยวกับกระบวนการในระดับหนึ่ง
ขั้นตอนการปฏิบัติงานมาตรฐาน และรูปแบบการสื่อสารที่
ยาวนานและน่าเบื่อ
 ถ้ายังไม่มีใครมีเวลาเขียนให้กับพวกเขา ทาไมไม่บอกพวกเขาใช้
เทคโนโลยีเสียง?
 การแก้ไขบางอย่างของข้อความ ง่ายกว่าการเขียนตั้งแต่เริ่มต้น

9. งานที่เป็นของมนุษย์โดยเฉพาะ
 เสียงได้เริ่มเข้ามามีบทบาทในสถานที่ทางาน เพื่อปรับปรุง
ประสิทธิภาพของผู้ปฏิบัติงาน
 การเขียนตามคาบอก ช่วยให้การจดบันทึกรายละเอียดระหว่าง
การประชุมเป็นปัจจุบัน เป็นไปได้อย่างไม่มีความแตกต่าง
 Cortana ช่วยให้คุณค้นหา กาหนดเวลาการนัดหมาย และตั้งค่า
การเตือน
 เมื่อใช้อย่างมีประสิทธิภาพ เทคโนโลยีจะช่วยให้ผู้ปฏิบัติงาน
มุ่งเน้นไปที่กลยุทธ์ และความคิดสร้างสรรค์ ซึ่งเป็นองค์ประกอบ
ที่ทาให้เราเป็นมนุษย์โดยเฉพาะ

สรุป
 สาหรับนักธุรกิจและผู้มีอานาจตัดสินใจด้านสารสนเทศ ไม่ควร
ละเลยความพยายามที่จะเข้าใจการใช้ประโยชน์จากเสียงใน
แอพพลิเคชั่นที่หลากหลาย
 เทคโนโลยีเสียง เป็นส่วนหนึ่งของการเปลี่ยนแปลงโดยรวมและ
เป็นบวก ของวิธีการที่องค์กรดาเนินการ วิธีที่นักธุรกิจเชื่อมโยง
กับข้อมูลและบุคคลอื่น ๆ รวมถึงการให้บริการกับลูกค้า
 หากองค์กรต้องการส่งมอบประสบการณ์ของลูกค้าที่ดีขึ้นในวัน
พรุ่งนี้ ควรจะต้องเริ่มเตรียมตัวตั้งแต่วันนี้

Voice technology เทคโนโลยีเสียง

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Similar to Voice technology เทคโนโลยีเสียง

Similar to Voice technology เทคโนโลยีเสียง (20)

More from maruay songtanin

More from maruay songtanin (20)

Voice technology เทคโนโลยีเสียง