Your SlideShare is downloading. ×
Người Ảo
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×

Introducing the official SlideShare app

Stunning, full-screen experience for iPhone and Android

Text the download link to your phone

Standard text messaging rates apply

Người Ảo

281
views

Published on

Published in: Technology

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
281
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
2
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide
  • Total: 18 minutes including questions => 15 minutes for the presentation Thank you very much, chairperson, for your kind introduction. My name is Le Quoc Anh, I am a PhD student from Paris where I work on an expressive gesture model for humanoid robots under the direction of Professor Catherine Pelachaud. Schedule Mechanisme Such as Account Realize Obtain /ob chen/ Architecture /ar ki tec tro/ Exchange /ex s change z/ Twice / wi so/ Table /ta ble/ Creating /cre et ting/ Message /me se/ Virtual /vir tu al/
  • Người ảo có thể thay thế con người trong nhiều công việc để giảm chi phí, tăng hiệu quả. Một trong những ứng dụng tương đối gần gũi là giáo viên ảo. Hiện nay, trong các chương trình học tập trực tuyến, thường là học sinh đọc tài liệu, xem hoặc nghe bài giảng thu sẵn của giáo viên trên máy tính. Cách đó có lẽ sẽ kém thú vị so với giảng dạy và tương tác trực tiếp với học sinh bằng giáo viên ảo. Người ảo cũng có thể tham gia bán hàng, tư vấn cho khách hàng hoặc tham gia giao tiếp hành chính công. Một người ảo đại diện cho cơ quan công quyền luôn miệng cười khi giao tiếp với công dân sẽ tạo cảm giác dễ chịu hơn là màn hình chi chít chữ và số. Giải pháp giao tiếp với người ảo cũng giúp những người không biết chữ (đặc biệt là nhiều người nhập cư nghe nói được mà không viết được) dễ dàng hơn khi sử dụng những dịch vụ cung cấp qua mạng máy tính. Trong lĩnh vực giải trí, người ảo chắc chắn sẽ có vai trò rất lớn, đặc biệt là làm tăng tính hấp dẫn của game. Ở Anh, doanh số từ game hiện nay còn lớn hơn điện ảnh. Không kể những nhân vật mà người ta tưởng tượng ra trong phim ảnh, trong thực tế đã có những dạng người ảo với những đặc tính nhất định, ví dụ người ảo trong một số trò chơi điện tử (không phải những nhân vật có người nhập vai mà là những nhân vật ảo độc lập). Những nhân vật này có một vài đặc tính giống con người, như vẻ mặt biểu cảm, có khả năng giao tiếp. Ví dụ, khi nói thì nhấp môi, đưa tay, nhướng mày... phù hợp với ngữ điệu và nội dung đang nói.
  • Việc tạo người ảo không chỉ liên quan đến phần mềm, mà còn phụ thuộc vào rất nhiều ngành khoa học khác nhau. Chúng ta phải chờ kết quả nghiên cứu trong những lĩnh vực đó. Một trong những vấn đề quan trọng là làm sao cho máy tính hiểu được tiếng nói, xử lý được ngôn ngữ tự nhiên, đặc biệt trong những môi trường có nhiều tiếng ồn. Sau khi nhận dạng được tiếng nói, máy tính còn phải nói với chúng ta. Thách thức ở đây là người ảo phải biết nói ra một cách tự nhiên, có ngữ điệu, phù hợp từng ngữ cảnh nhất định, lúc buồn nói khác, khi vui nói khác... chứ không phải nói đều đều. Khi trả lời, máy phải biết dùng cấu trúc ngôn ngữ tự nhiên, có thưa có gửi, chứ không chỉ là lõi thông tin, đồng thời phải có nhịp hội thoại, chứ không phải theo kiểu nhát gừng hỏi – trả lời. Quá trình hội thoại cũng cần thoát khỏi các tình huống có sẵn, tiến tới làm cho máy có "suy nghĩ” để trả lời mọi trường hợp... Một thách thức lớn khác là tạo ra các chuyển động của hình ảnh đồ họa để người ảo cử động tự nhiên như người thật. Chẳng hạn, khi người ảo nói, chúng ta phải thấy sự chuyển động của các cơ và ánh sáng trên khuôn mặt, hoặc chuyển động của môi phù hợp với âm thanh phát ra. Tóm lại là phải liên kết những phần thể hiện bên ngoài với phần trí tuệ nhân tạo bên trong để những lời nói, cử chỉ, điệu bộ ăn khớp với nội dung đang nói. Tôi cho rằng khoảng 30 - 50 năm nữa khoa học sẽ giải quyết được những vấn đề đó...
  • Transcript

    • 1. Lê Quốc AnhNgười ẢoNgười ẢoTrình bày bởi Lê Quốc Anh
    • 2. Lê Quốc Anh và các đồng nghiệp1. Giới thiệu chung về người ảo2. Giới thiệu kiến trúc GRETA3. Nghiên cứu trường hợp cụ thể: Tạo cử chỉ4. Tìm kiếm cơ hội hợp tác tạo sản phẩm Việtpage 2 Người ảo thông minhNội dung trình bày
    • 3. Lê Quốc Anh và các đồng nghiệpGiới thiệu chungpage 3 Người ảo thông minh
    • 4. Lê Quốc Anh và các đồng nghiệppage 4 Người ảo thông minhHoàn cảnh ra đời Ban đầu chúng ta nghĩ máy tính là cái bảng tính chỉ với các con số. Saukhi nhập thêm các chữ cái, chúng ta nghĩ nó là máy gõ chữ. Rồi khi đồhọa máy tính phát triển, chúng ta xem nó như cái ti vi... [Douglas Adams,2001] Và bây giờ, với sự phát triển của các phần mềm thông minh, chúng tagiao tiếp với máy tính như thể chúng thực sự là con người [Nass et al.,1997] Thế là người ta tìm cách biến nó thành người bằng cách trang bị cho nógiao diện giao tiếp giống với con người thông qua giọng nói, khuôn mặt,cử chỉ,…[Cassell et al. 2000] thay vì sử dụng bàn phím, con chuột haydòng chữ vô cảm [PcWorld, 2008]
    • 5. Lê Quốc Anh và các đồng nghiệppage 5 Người ảo thông minhĐịnh nghĩa Các tên gọi khác nhau• IVA (Intelligent Virtual Agent), ACA (Agent Conversationnel Animé), ECA(Embodied Conversational Agent), ACE (Agent Conversationnel Incarné),Virtual Human, Digital Clone• Tiếng Việt: Tác nhân,Tác tử thông minh• Chúng tôi tạm gọi là Người Ảo theo cách dịch Virtual Human và đã đượcsử dụng trên PC World Việt Nam [Số ra 26/06/2008] Người Ảo là một nhân vật có hình dáng, hành động tương tự con người Hoạt động trong môi trường ảo (máy chiếu, máy tính) hoặc môi trườngthật (người máy) Khác với nhận vật đóng thế (avatar), Người Ảo có trí thông minh và tựchủ trong hành động Có thể giao tiếp với con người thông qua lời nói và cử chỉ (tay chân mặtmũi, …)EMBRGretaMAX
    • 6. Lê Quốc Anh và các đồng nghiệppage 6 Người ảo thông minhNgười Ảo: Đặc điểm chung Patrick Olivier (2008, Newcastle, UK),:• Có 2 loại người ảo:- một loại vật lý (như robot)- một loại thể hiện bằng hình ảnh 3 chiều trên máy tính.• 4 đặc điểm căn bản của con người:- khả năng giao tiếp;- cảm nhận, cảm thụ thế giới;- suy nghĩ, tư duy;- hành động. Russell và Norvig (1995, Berkeley, USA)• Cấu tạo một Người Ảo nói chung như hình bên sẽ gồm:- khả năng cảm thụ thông qua tai, mắt và các cơ quan cảm nhận khác- khả năng hành động bằng tay, chân, miệng và các phần khác của cơ thể• Người ảo vật lý (robot) có thể được trang bị camera hoặc tia hồng ngoại đểthu nhận thông tin và các cơ vận động khác nhau để hành độngRobot Kismet, MIT
    • 7. Lê Quốc Anh và các đồng nghiệppage 7 Người ảo thông minhVí dụ minh họa (Nguồn PC World VietNam)
    • 8. Lê Quốc Anh và các đồng nghiệppage 8 Người ảo thông minhTiềm năng ứng dụng Đào tạo, giáo dục với giáoviên ảo Hỗ trợ trực tuyến, giải đápthắc mắc Bạn đồng hành liên thôngtừ điện thoại, ti vi đến máytính Giải trí, trò chơi hóa thângiao tiếp với người ảo trongmôi trương ảo Thương mại điện tử trongvai người bán hàng ảo hoặctư vấn viên ảo
    • 9. Lê Quốc Anh và các đồng nghiệppage 9 Người ảo thông minhMột số dự án Người Ảo tiêu biểuNhân viên ảo tại Newark Liberty
    • 10. Lê Quốc Anh và các đồng nghiệppage 10 Người ảo thông minhMột số dự án Người Ảo tiêu biểuGratch et al. at USC, MỹWachsmuth et al. atBielefeld, ĐứcLIMSI, PhápTelecom, Pháp
    • 11. Lê Quốc Anh và các đồng nghiệpPhòng thí nghiệm tại LIMSI, Pháppage 11 Người ảo thông minh
    • 12. Lê Quốc Anh và các đồng nghiệppage 12 Người ảo thông minhMindEmotionLanguagePlanningBehaviorGenerationSmartBodyBodyIntentions& EmotionInteractionAnimationScheduleBehavior LibraryBehaviorMarkupMã hóa: Thực hiệnhành vi nào?Cử chỉ? Tư thế?Mặt mũi?Mã hóa: Thực hiệnhành vi nào?Cử chỉ? Tư thế?Mặt mũi?Thực hiện: Làm thếNào để biểu diễn?Lập lịch thế nào &phối hợp chúng?Thực hiện: Làm thếNào để biểu diễn?Lập lịch thế nào &phối hợp chúng?Phòng thí nghiệm tại USC, Mỹ
    • 13. Lê Quốc Anh và các đồng nghiệpPhòng thí nghiệm tại Bielefeld, Đứcpage 13 Người ảo thông minh
    • 14. Lê Quốc Anh và các đồng nghiệppage 14 Người ảo thông minhGiới thiệu GRETA Khả năng hành động biểu cảm theo• Tính cách riêng định nghĩa trước• Hoàn cảnh và đối tượng giao tiếp• Chức năng giao tiếp Đặc điểm hệ thống:• Xử lý thời gian thực• Mô đun hóa với các tầng xử lý khác nhau Giao tiếp đa phương tiện (mặt, cử chỉ,…) Có thể điều khiển cả người ảo máy tính và ngườiảo vật lý (robot)
    • 15. Lê Quốc Anh và các đồng nghiệppage 15 Người ảo thông minhKiến trúc chuẩn tạo hành vi của Người ẢoFML Thiết lậphành viThực hiệnhành viThiết lậpmục đíchBMLPhản hồi ngược Phản hồi ngược1. Tính cách cá nhân2. Thư mục hành vi1. Hệ chuẩn SAIBA được xây dựng bởi cộng đồng quốc tế [Kopp, 2006]2. Gồm 3 giai đoạn xử lý thông tin riêng biệt, không phụ thuộc vào mộtmô hình người ảo cụ thể nào (ví dụ phần mô hình đồ họa hay một môhình người máy vật lý). Điều khiển bởi 2 ngôn ngữ miêu tả kịch bản.
    • 16. Lê Quốc Anh và các đồng nghiệppage 16 Người ảo thông minhFML – Ngôn ngữ mô tả ý định, mục đích Mô tả nội dung những ý định, mục đích hay cảmxúc mà người ảo muốn truyền đạt khi đang giaotiếp Mức độ thể hiện nội dung sẽ được tham chiếu đến• Tính cách cá nhân• Các yếu tố xã hội, quan hệ• Cảm xúc, trạng thái tâm lý hiện tại Quy định cho bộ phận tổng hợp tiếng nói nhưmức độ biểu cảm, ràng buộc thời gian,…
    • 17. Lê Quốc Anh và các đồng nghiệppage 17 Người ảo thông minhBML – Ngôn ngữ mô tả hành vi Mô tả các hành vi cụ thể mà người ảo sẽ thực hiệnđể đạt được mục đích đã cho• Hành động nào sẽ xuất hiện (mặt mũi hay cử chỉ?)Đồng bộ hóa các hành động (từ lời nói đến khuônmặt và cử chỉ,…)• Hành động thế nào (mặt cười hay khóc, cử chỉ giơtay lên hay xuống,…) Các mô tả ở mức chung chung, không phụ thuộcvào mô hình người ảo nào sẽ thực hiện Có nhiều mức mô tả khác nhau để có thể mở rộngđể điều khiển nhiều mô hình người ảo khác nhau
    • 18. Lê Quốc Anh và các đồng nghiệpBehavior Realizer(Common Module)Intent Lexicon Behavior LexiconBehavior Planner(Common Module)FAP-BAPValuesJointValuesActiveMQMessaging Central SystemFML-APMLBML BML KeyframesAnimation Realizer(Specific Module)Animation Realizer(Specific Module)Keyframes KeyframesGretaAnimation LexiconNaoAnimation LexiconInput Data (text,audio, video, etc)Intent Planner(Common Module)FML-APMLBaselines for NaoBaselines for GretaRepositories for NaoRepositories for GretaFAP-BAPPlayerNao Built-inProprietaryProceduresKiến trúc hiện tại trong hệ thống GRETApage 18 Người ảo thông minh(Le Quoc Anh et al., ICMI 2012)
    • 19. Lê Quốc Anh và các đồng nghiệpVí dụ trong ứng dụng kể chuyệnpage 19 Người ảo thông minhVăn b n (n i dung chuy n)ả ộ ệPhân tích c u trúc, ngấ ữnghĩa , n i dungộMô t FMLảTính toán hành viMiêu t hành viảBMLMô t hành vi BMLảTi ng nóiếTh vi n hànhư ệvi m u cho Naoẫvà GretaPhân tích v n đi u ph cầ ệ ụv t o gi ng nóiụ ạ ọT ng h p ti ng nóiổ ợ ếTính toán c m xúc, ýảđ nh, m c đích giao ti pị ụ ếTrích D án GVLEX [Rodolphe, 2010]ự
    • 20. Lê Quốc Anh và các đồng nghiệpThách thức đa ngànhpage 20 Người ảo thông minhNhận dạngkhuôn mặtTâm lýhọcXã hộihọcNhận dạngtiếng nóiNhận dạngcử chỉTạo cảmxúcTạo tiếng nóibiểu cảmTạo cửchỉTạo khuônmặtTạo cá tínhriêngHệ thống ra quyết định vàthực hiện hành vi ngườiHệ thống tính toán cảmxúc (Affective Computing)
    • 21. Lê Quốc Anh và các đồng nghiệppage 21 Người ảo thông minhCác dự án đang tiến hành tại ParisTech Mô phỏng biểu cảm khuôn mặt (facial emotions) Mô phỏng tư thế con người (pose, torso) Mô phỏng cử chỉ biểu cảm con người (gestures) Mô phỏng chuyển động đầu (head) Mô phỏng chuyển động mắt (eyes, gaze) Mô phỏng chuyển động mí mắt (eyebrow) Mô phỏng tương tác nhiều người (multiagents) Mô phỏng miệng cười (smile, laugh) Mô phỏng phản hồi trong giao tiếp (backchanels)
    • 22. Lê Quốc Anh và các đồng nghiệpMô phỏng cử chỉ người Định nghĩa cử chỉ: Là tất cả các chuyển động củabàn tay, cánh tay thường đi cùng lời nói để hỗ trợ,bổ sung cho việc truyền đạt nội dung Phân loại cử chỉ (McNeill, Kendon, Krauss,…):• Nhóm chỉ định: để chỉ tay đến một đối tượng được nói đến• Nhóm hình tượng: miêu tả đối tượng cụ thể• Nhóm ẩn dụ: miêu tả đối tượng trìu tượng• Nhóm hòa nhịp: đưa tay lên xuống hòa nhịp lời nói• Nhóm tự thích nghi: Gãi tai, gãi đầu• Nhóm quy ước, biểu tượng: Chữ V chiến thắngpage 22 Người ảo thông minh
    • 23. Lê Quốc Anh và các đồng nghiệppage 23 Người ảo thông minhCác nhóm cử chỉ (minh họa từ LEA, LIMSI)
    • 24. Lê Quốc Anh và các đồng nghiệpTạo mẫu cử chỉ cho thư viện Một hành động cử chỉ chuyển động qua nhiều điểm mốc trongkhông gian. Mỗi cột mốc đuợc mô tả bằng 1 tập tham số (vị trí cổtay, hướng lòng bàn tay, hướng ngón tay, hình dạng bàn tay,…)[McNeill, 1992] Trong thư mục mẫu các cử chỉ, chỉ cột mốc quan trọng được mãhóa (stroke points), các cột mốc khác cùng con đường chuyểnđộng được tính tự động thời gian thực [Le Quoc Anh et al., 2011] Các mẫu được mô tả dạng trừu tượng, không liên quan đến cơ chếthực hiện cụ thể nàopage 24 Người ảo thông minh
    • 25. Lê Quốc Anh và các đồng nghiệppage 25 Người ảo thông minhĂn khớp cử chỉ và lời nóiẢnh lấy từ trang site của SAIBA1. Gồm 7 cột mốc chính (bắt đầu cử động, sẵn sàng, bắt đầu thểhiện, thể hiện rõ nhất, kết thúc thể hiện, tạm nghỉ và kết thúc)2. Chia thành nhiều giai đoạn, trong đó giai đoạn thể hiện là quantrọng nhất vì nó truyền đạt thông tin cho toàn bộ cử chỉ3. Theo McNeill (1992), Kendon (2005) cột mốc stroke phải đượcthực hiện cùng lúc với lời nói mà nó muốn nhấn mạnh
    • 26. Lê Quốc Anh và các đồng nghiệpTạo biểu cảm cho cử chỉ Từ cùng một cử chỉ mẫu trong thư viện,người ảo sẽ thực hiện nó theo nhiều cáchkhác nhau [Mancini, 2006] phụ thuộc vào:• Tính cách cá nhân: nhẹ nhàng, mạnh bạo,chậm,...• Cảm xúc hiện tại: đang tức giận,…• Hoàn cảnh xã hội: nói chuyện với người lạ,quen, đang có chuyện gấp.. Mô hình hóa qua 1 tập tham số biểu cảm[Wallbott, 1997]• Không gian (SPC)• Thời gian (TMP)• Tần suất (REP)• Năng lượng (PWR)• Độ mượt (FLD)page 26 Người ảo thông minh
    • 27. Lê Quốc Anh và các đồng nghiệpVí dụ minh họa (tạo cử chỉ cho người ảo)page 27 Người ảo thông minhFMLBMLKEYFRAMESThư viện mẫuChọn mẫu cửchỉ từ thư việnLập lịchchuyển độngĐồng bộ hóa vớitiếng nóiTính toán biểucảm cho cử chỉ
    • 28. Lê Quốc Anh và các đồng nghiệpThử nghiệm và đánh giá Rô bốt Nao (Aldebaran, Pháp) thực hiện các cử chỉtrong khi đang kể một truyện ngắn «3 chú nhạnđêm » với hệ thống tổng hợp tiếng nói Acapela 63 người Pháp tham gia đánh giá Kết quả [Le Quoc Anh et al., HRI 2013]:• 76% đánh giá cử chỉ ăn khớp lời nói• 70% đánh giá cử chỉ có biểu cảmpage 28 Người ảo thông minhĐánh giáH th ngệ ốGRETAĐiều khiển
    • 29. Lê Quốc Anh và các đồng nghiệpMột lần phát triển, nhiều ứng dụngpage 29 Người ảo thông minhDữ liệuhành vi,cảm xúccá nhânDữ liệuhành vi,cảm xúccá nhânBộ điềukhiểnchungduy nhấtInternetInternet
    • 30. Lê Quốc Anh và các đồng nghiệpHướng phát triển tương lai và tìm kiếm sự hợp tác Tích hợp hệ thống tổng hợp tiếng nói Việt ví dụ• Nhóm của TS Vũ Hải Quân tại AILAB, HCM??? Xây dựng mô hình đồ họa 3D nhân vật thuần Việt• Hình dáng, tính cách, hành vi Việt• TS Bùi Thế Duy, HMI, ĐHCN, Hanoi ?? Xử lý văn bản tiếng Việt• TS Lê Hồng Phương, TS Phan Xuân Hiếu (FPT)?? Nhận dạng hình ảnh và điều khiển bằng cử chỉ• TS Trần Nguyên Ngọc (FPT)?? Tích hợp vào rô bốt• Nao (TS Trần Thế Trung, FPT)• mRobot (Hồ Vĩnh Hoàng, TOSY)page 30 Người ảo thông minh
    • 31. Lê Quốc Anh và các đồng nghiệpLỜI CẢM ƠNpage 31 Người ảo thông minh