SlideShare a Scribd company logo
1 of 20
AI/NLP/Computer Vision/Speech
Trí tuệ nhân tạo đa thể thức
Công ty Cổ phần Aimesoft
Vietnam Frontier Summit 2019
 Phát triển ứng dụng thông minh gần giống con
người
Bài toán và Cơ hội
(C) Aimesoft : Multimodal AI
Giải pháp
(C) Aimesoft : Multimodal AI
Trí tuệ nhân tạo đa thể thức là gì?
MMAI
Là công nghệ AI mới, cho phép mô phỏng quá trình hợp nhất dữ liệu
(ảnh, tiếng nói, text) để xử lý thông minh giống con người
Xử lý ảnh
Tổng hợp
tiếng nóiNhận diện
tiếng nói
Xử lý
Ngôn ngữ tự nhiên
Multimodal Artificial Intelligence
(Trí tuệ nhân tạo đa thể thức)
4
Multimodal AI khác gì với với Single Modal
AI?
Single Modal AI Multimodal AI
Đây là cái gì?
Đây là điện thoại
đi động ạ
Multimodal AI kết hợp xử lý ảnh, nhận diện video với Xử lý ngôn ngữ tự nhiên
nên có thể “nhìn” và trả lời chính xác
Demo video :
https://drive.google.com/file/d/1kD_ONFqIn5Vn_N8oCqnza09FkZ_kdfVN/view?usp=sharing
5
Demo Multimodal AI: tự động mặc cả
Video link : https://www.youtube.com/watch?v=liEZZYlvbW8
6
Các công nghệ trong Aimesoft Multimodal AI
Multimodal
AI
Dữ liệu lớn
Xử lý ảnh
Khai phá
dữ liệu
Khai phá
văn bản
Xử lý
tiếng nói
Xử lý
Ngôn ngữ tự nhiên
MMAI
- Hợp nhất (Fusion) nhiều kiểu dữ liệu như ảnh, tiếng nói, text, … và các thuật
toán xử lý thông minh (Xử lý ảnh, Xử lý tiếng nói, Xử lý ngôn ngữ) vào một mô
hình AI duy nhất để đạt độ chính xác cao
Multimodal Artificial Intelligence
(Trí tuệ nhân tạo đa thể thức)
7
Đội ngũ nghiên cứu phát triển AI
(C) Aimesoft : Multimodal AI
Tổng giám đốc
Nguyễn Tuấn Đức
(TS ngành NLP, ĐH Tokyo)
Giám đốc Công nghệ
Nguyễn Đức Tâm
(TS ngành Toán, ĐH Tokyo)
Nghiên cứu viên có học vị tiến sỹ
Xử lý ngôn ngữ tự nhiên :
1 (ĐH Tokyo)
Nghiên cứu viên có học vị tiến sỹ
Xử lý ảnh :
3 (ĐH Tokyo, ĐH Ecole de Mine)
Nghiên cứu viên có học vị tiến sỹ
Xử lý tiếng nói:
2 (ĐH Paris, INRIA)
Kỹ sư Xử lý ngôn ngữ tự nhiên, Xử lý ảnh, Khoa học dữ liệu : ~ 25 người
Công nghệ Xử lý ảnh cho MMAI
Hoá đơn
_______
_______
_______
 Nhận diện ảnh
 Smart OCR (nhận diện chữ, số hoá)
 Nhận diện người, hành động, vật thể
 Phân mảnh theo ý nghĩa
 Phân tích dự đoán
 Dự đoán dựa trên ảnh
HL80615938D
9
Công nghệ Khai phá dữ liệu
Phân tích
dự đoán
Lắng nghe trên mạng xã hội Phân tích dòng thời gian
VWAP
t
Bán
Mua
(C) Aimesoft : Multimodal AI
Giải pháp bán hàng tự động AIShop
 Giải pháp bán hàng tự động dựa trên Multimodal AI
 Nhận diện ảnh, tiếng nói, ngôn ngữ để tự động đáp ứng
nhu cầu của khách hàng trong cửa hàng/siêu thị
AIShop
Hướng dẫn về cửa hàng
Hướng dẫn về mặt hàng
Gợi ý sản phẩm
Trả lời về giả cả
(C) Aimesoft : Multimodal AI
Database
Mặc cả tự động
Giọng nói
Hành động
Ngôn ngữ
Nhân viên lễ tân ảo AimeReception
 Giải pháp Lễ tân ảo dựa trên Multimodal AI
 Tự động chào khi phát hiện khách đến
 Trả lời câu hỏi của khách, hướng dẫn phòng họp
 Tự động đọc và lưu danh thiếp
(C) Aimesoft : Multimodal AI
Demo video : https://drive.google.com/file/d/1pfIoqmpv3xusFOUeBRl48F98HhGmbsZf/view?usp=sharing
Giải pháp MMAI cho kính thông minh
 Giải pháp Multimodal AI cho kính thông minh
 Tự động đọc chữ trước mặt
 Tự động nhận diện đồ vật trước mặt
 Hướng dẫn người khiếm thị qua đường (nhận diện đèn giao thông)
(C) Aimesoft : Multimodal AI
Demo video : https://drive.google.com/file/d/1oeGlEtKSuoZK_cq9qV7sayk2SGTy8GVU/view
Giải pháp Xử lý tiền tệ thông minh
 Dùng AI để xử lý tiền giấy, tiền xu
HL80615938D10EUR
1 rupee
Nhận dạng loại tiền, mệnh giá
Nhận diện số series
Nhận diện tiền giả
Nhận diện vết bẩn, chữ viết bẩn
Đếm tiền thông minh
Demo Giải pháp Số hoá thông minh (Smart OCR)
(C) Aimesoft : Multimodal AI
Demo URL :
https://cmt.gpu02.aimesoft.com:5050/
Công nghệ lý giải/phân tích video
 Nhận diện mặt hàng, vật thể trong video
 Nhận diện tuổi, giới tính, hành động của khách hàng
Nhận diện tuổi, giới tính từ video
Demo :
Pose estimation : https://drive.google.com/file/d/1eFI0cqjK3hOkO3NBHwYaFHcQCBna4pN4/view?usp=sharing
Age/gender detection : https://drive.google.com/file/d/1Yvl4-z5r6YZXBSF7UthkXElBLrdhhhPV/view
Giải pháp cho Y tế thông minh : Phân tích bệnh án
 Tự động nhận diện tên thuốc, tên bệnh, tác dụng phụ giữa thuốc – bệnh
 Tự động tóm tắt quá trình diễn biến của bệnh
(C) Aimesoft : Multimodal AI
Các giải pháp Multimodal AI cho Phân tích dự đoán
Dự đoán giá trị
tài sản cũ, BĐS
 Từ các dữ liệu trong quá khứ, dữ liệu trên mạng xã hội, phân
tích dự đoán chứng khoán, tín dụng, điện lực, …
Khai phá văn bản
Phân tích cảm xúc
Lắng nghe SNS
Các thuật toán
phân tích
dự đoán
Giải pháp cho
cty điện
Giải pháp chứng khoán
thông minh
VWAP
t
Bán
Mua
Giải pháp tín dụng thông minh
(C) Aimesoft : Multimodal AI
Cảm ơn!
Thông tin liên lạc
http://www.aimesoft.com/
http://www.facebook.com/aimesoft
Công ty Cổ phần Aimesoft
(C) Aimesoft : Multimodal AI

More Related Content

More from Nexus FrontierTech

[AI Series Talk #2] Moving AI from PoC Stage to Production
[AI Series Talk #2] Moving AI from PoC Stage to Production[AI Series Talk #2] Moving AI from PoC Stage to Production
[AI Series Talk #2] Moving AI from PoC Stage to ProductionNexus FrontierTech
 
[VFS 2019] Introduction to GANs - Pixta Vietnam
[VFS 2019] Introduction to GANs - Pixta Vietnam[VFS 2019] Introduction to GANs - Pixta Vietnam
[VFS 2019] Introduction to GANs - Pixta VietnamNexus FrontierTech
 
[VFS 2019] Enabling Young Generation for Future - AWS Vietnam User Group
[VFS 2019] Enabling Young Generation for Future - AWS Vietnam User Group[VFS 2019] Enabling Young Generation for Future - AWS Vietnam User Group
[VFS 2019] Enabling Young Generation for Future - AWS Vietnam User GroupNexus FrontierTech
 
[VFS 2019] Building chatbot with RASA
[VFS 2019] Building chatbot with RASA[VFS 2019] Building chatbot with RASA
[VFS 2019] Building chatbot with RASANexus FrontierTech
 
[VFS 2019] Vietnamese Speech-to-Text: Applications and Product
[VFS 2019] Vietnamese Speech-to-Text: Applications and Product[VFS 2019] Vietnamese Speech-to-Text: Applications and Product
[VFS 2019] Vietnamese Speech-to-Text: Applications and ProductNexus FrontierTech
 
[VFS 2019] How AI Will Innovate Recruitment
[VFS 2019] How AI Will Innovate Recruitment[VFS 2019] How AI Will Innovate Recruitment
[VFS 2019] How AI Will Innovate RecruitmentNexus FrontierTech
 
[VFS 2019] Preventive Approach to Designing and Selling Healthy AI System
[VFS 2019] Preventive Approach to Designing and Selling Healthy AI System [VFS 2019] Preventive Approach to Designing and Selling Healthy AI System
[VFS 2019] Preventive Approach to Designing and Selling Healthy AI System Nexus FrontierTech
 
[VFS 2019] Phương pháp phát hiện bất thường bằng học máy
[VFS 2019] Phương pháp phát hiện bất thường bằng học máy[VFS 2019] Phương pháp phát hiện bất thường bằng học máy
[VFS 2019] Phương pháp phát hiện bất thường bằng học máyNexus FrontierTech
 
[VFS 2019] OCR Techniques for Digital Transformation Evolution
[VFS 2019] OCR Techniques for Digital Transformation Evolution[VFS 2019] OCR Techniques for Digital Transformation Evolution
[VFS 2019] OCR Techniques for Digital Transformation EvolutionNexus FrontierTech
 
[VFS 2019] Human Activity Recognition Approaches
[VFS 2019] Human Activity Recognition Approaches [VFS 2019] Human Activity Recognition Approaches
[VFS 2019] Human Activity Recognition Approaches Nexus FrontierTech
 
[VFS 2019] Datamart Introduction (brief)
[VFS 2019] Datamart Introduction (brief)[VFS 2019] Datamart Introduction (brief)
[VFS 2019] Datamart Introduction (brief)Nexus FrontierTech
 
[VFS 2019] Data Strategy for Vietnamese Businesses to Levarage AI
[VFS 2019] Data Strategy for Vietnamese Businesses to Levarage AI[VFS 2019] Data Strategy for Vietnamese Businesses to Levarage AI
[VFS 2019] Data Strategy for Vietnamese Businesses to Levarage AINexus FrontierTech
 
[VFS 2019] Digital Solution for Enterprises: 24/7 A.I English Speaking Coach
[VFS 2019] Digital Solution for Enterprises: 24/7 A.I English Speaking Coach[VFS 2019] Digital Solution for Enterprises: 24/7 A.I English Speaking Coach
[VFS 2019] Digital Solution for Enterprises: 24/7 A.I English Speaking CoachNexus FrontierTech
 
[VFS 2019] Project Management for AI-based Product - A Better Approach
[VFS 2019] Project Management for AI-based Product - A Better Approach[VFS 2019] Project Management for AI-based Product - A Better Approach
[VFS 2019] Project Management for AI-based Product - A Better ApproachNexus FrontierTech
 
[VFS 2019] AI Ecosystem transition from zero to hero - case study by rubikAI
[VFS 2019] AI Ecosystem transition from zero to hero - case study by rubikAI[VFS 2019] AI Ecosystem transition from zero to hero - case study by rubikAI
[VFS 2019] AI Ecosystem transition from zero to hero - case study by rubikAINexus FrontierTech
 
[VFS 2019] Capitalize E-Commerce Opportunities
[VFS 2019] Capitalize E-Commerce Opportunities[VFS 2019] Capitalize E-Commerce Opportunities
[VFS 2019] Capitalize E-Commerce OpportunitiesNexus FrontierTech
 
[Case Simulation Workshop] Michael Evans - High performance system building
[Case Simulation Workshop] Michael Evans - High performance system building[Case Simulation Workshop] Michael Evans - High performance system building
[Case Simulation Workshop] Michael Evans - High performance system buildingNexus FrontierTech
 

More from Nexus FrontierTech (20)

[AI Series Talk #2] Moving AI from PoC Stage to Production
[AI Series Talk #2] Moving AI from PoC Stage to Production[AI Series Talk #2] Moving AI from PoC Stage to Production
[AI Series Talk #2] Moving AI from PoC Stage to Production
 
[VFS 2019] Introduction to GANs - Pixta Vietnam
[VFS 2019] Introduction to GANs - Pixta Vietnam[VFS 2019] Introduction to GANs - Pixta Vietnam
[VFS 2019] Introduction to GANs - Pixta Vietnam
 
[VFS 2019] Enabling Young Generation for Future - AWS Vietnam User Group
[VFS 2019] Enabling Young Generation for Future - AWS Vietnam User Group[VFS 2019] Enabling Young Generation for Future - AWS Vietnam User Group
[VFS 2019] Enabling Young Generation for Future - AWS Vietnam User Group
 
[VFS 2019] Building chatbot with RASA
[VFS 2019] Building chatbot with RASA[VFS 2019] Building chatbot with RASA
[VFS 2019] Building chatbot with RASA
 
[VFS 2019] Vietnamese Speech-to-Text: Applications and Product
[VFS 2019] Vietnamese Speech-to-Text: Applications and Product[VFS 2019] Vietnamese Speech-to-Text: Applications and Product
[VFS 2019] Vietnamese Speech-to-Text: Applications and Product
 
[VFS 2019] How AI Will Innovate Recruitment
[VFS 2019] How AI Will Innovate Recruitment[VFS 2019] How AI Will Innovate Recruitment
[VFS 2019] How AI Will Innovate Recruitment
 
[VFS 2019] AI in Finance
[VFS 2019] AI in Finance[VFS 2019] AI in Finance
[VFS 2019] AI in Finance
 
[VFS 2019] Preventive Approach to Designing and Selling Healthy AI System
[VFS 2019] Preventive Approach to Designing and Selling Healthy AI System [VFS 2019] Preventive Approach to Designing and Selling Healthy AI System
[VFS 2019] Preventive Approach to Designing and Selling Healthy AI System
 
[VFS 2019] Phương pháp phát hiện bất thường bằng học máy
[VFS 2019] Phương pháp phát hiện bất thường bằng học máy[VFS 2019] Phương pháp phát hiện bất thường bằng học máy
[VFS 2019] Phương pháp phát hiện bất thường bằng học máy
 
[VFS 2019] OCR Techniques for Digital Transformation Evolution
[VFS 2019] OCR Techniques for Digital Transformation Evolution[VFS 2019] OCR Techniques for Digital Transformation Evolution
[VFS 2019] OCR Techniques for Digital Transformation Evolution
 
[VFS 2019] Human Activity Recognition Approaches
[VFS 2019] Human Activity Recognition Approaches [VFS 2019] Human Activity Recognition Approaches
[VFS 2019] Human Activity Recognition Approaches
 
[VFS 2019] Datamart Introduction (brief)
[VFS 2019] Datamart Introduction (brief)[VFS 2019] Datamart Introduction (brief)
[VFS 2019] Datamart Introduction (brief)
 
[VFS 2019] Data Strategy for Vietnamese Businesses to Levarage AI
[VFS 2019] Data Strategy for Vietnamese Businesses to Levarage AI[VFS 2019] Data Strategy for Vietnamese Businesses to Levarage AI
[VFS 2019] Data Strategy for Vietnamese Businesses to Levarage AI
 
[VFS 2019] AI for Banks
[VFS 2019] AI for Banks[VFS 2019] AI for Banks
[VFS 2019] AI for Banks
 
[VFS 2019] Digital Solution for Enterprises: 24/7 A.I English Speaking Coach
[VFS 2019] Digital Solution for Enterprises: 24/7 A.I English Speaking Coach[VFS 2019] Digital Solution for Enterprises: 24/7 A.I English Speaking Coach
[VFS 2019] Digital Solution for Enterprises: 24/7 A.I English Speaking Coach
 
[VFS 2019] Project Management for AI-based Product - A Better Approach
[VFS 2019] Project Management for AI-based Product - A Better Approach[VFS 2019] Project Management for AI-based Product - A Better Approach
[VFS 2019] Project Management for AI-based Product - A Better Approach
 
[VFS 2019] AI Ecosystem transition from zero to hero - case study by rubikAI
[VFS 2019] AI Ecosystem transition from zero to hero - case study by rubikAI[VFS 2019] AI Ecosystem transition from zero to hero - case study by rubikAI
[VFS 2019] AI Ecosystem transition from zero to hero - case study by rubikAI
 
[VFS 2019] Capitalize E-Commerce Opportunities
[VFS 2019] Capitalize E-Commerce Opportunities[VFS 2019] Capitalize E-Commerce Opportunities
[VFS 2019] Capitalize E-Commerce Opportunities
 
[Case Simulation Workshop] Michael Evans - High performance system building
[Case Simulation Workshop] Michael Evans - High performance system building[Case Simulation Workshop] Michael Evans - High performance system building
[Case Simulation Workshop] Michael Evans - High performance system building
 
Meet&Greet #3 - IoT Vietnam
Meet&Greet #3 - IoT VietnamMeet&Greet #3 - IoT Vietnam
Meet&Greet #3 - IoT Vietnam
 

[VFS 2019] Aimesoft Solutions

  • 1. AI/NLP/Computer Vision/Speech Trí tuệ nhân tạo đa thể thức Công ty Cổ phần Aimesoft Vietnam Frontier Summit 2019
  • 2.  Phát triển ứng dụng thông minh gần giống con người Bài toán và Cơ hội (C) Aimesoft : Multimodal AI
  • 3. Giải pháp (C) Aimesoft : Multimodal AI
  • 4. Trí tuệ nhân tạo đa thể thức là gì? MMAI Là công nghệ AI mới, cho phép mô phỏng quá trình hợp nhất dữ liệu (ảnh, tiếng nói, text) để xử lý thông minh giống con người Xử lý ảnh Tổng hợp tiếng nóiNhận diện tiếng nói Xử lý Ngôn ngữ tự nhiên Multimodal Artificial Intelligence (Trí tuệ nhân tạo đa thể thức) 4
  • 5. Multimodal AI khác gì với với Single Modal AI? Single Modal AI Multimodal AI Đây là cái gì? Đây là điện thoại đi động ạ Multimodal AI kết hợp xử lý ảnh, nhận diện video với Xử lý ngôn ngữ tự nhiên nên có thể “nhìn” và trả lời chính xác Demo video : https://drive.google.com/file/d/1kD_ONFqIn5Vn_N8oCqnza09FkZ_kdfVN/view?usp=sharing 5
  • 6. Demo Multimodal AI: tự động mặc cả Video link : https://www.youtube.com/watch?v=liEZZYlvbW8 6
  • 7. Các công nghệ trong Aimesoft Multimodal AI Multimodal AI Dữ liệu lớn Xử lý ảnh Khai phá dữ liệu Khai phá văn bản Xử lý tiếng nói Xử lý Ngôn ngữ tự nhiên MMAI - Hợp nhất (Fusion) nhiều kiểu dữ liệu như ảnh, tiếng nói, text, … và các thuật toán xử lý thông minh (Xử lý ảnh, Xử lý tiếng nói, Xử lý ngôn ngữ) vào một mô hình AI duy nhất để đạt độ chính xác cao Multimodal Artificial Intelligence (Trí tuệ nhân tạo đa thể thức) 7
  • 8. Đội ngũ nghiên cứu phát triển AI (C) Aimesoft : Multimodal AI Tổng giám đốc Nguyễn Tuấn Đức (TS ngành NLP, ĐH Tokyo) Giám đốc Công nghệ Nguyễn Đức Tâm (TS ngành Toán, ĐH Tokyo) Nghiên cứu viên có học vị tiến sỹ Xử lý ngôn ngữ tự nhiên : 1 (ĐH Tokyo) Nghiên cứu viên có học vị tiến sỹ Xử lý ảnh : 3 (ĐH Tokyo, ĐH Ecole de Mine) Nghiên cứu viên có học vị tiến sỹ Xử lý tiếng nói: 2 (ĐH Paris, INRIA) Kỹ sư Xử lý ngôn ngữ tự nhiên, Xử lý ảnh, Khoa học dữ liệu : ~ 25 người
  • 9. Công nghệ Xử lý ảnh cho MMAI Hoá đơn _______ _______ _______  Nhận diện ảnh  Smart OCR (nhận diện chữ, số hoá)  Nhận diện người, hành động, vật thể  Phân mảnh theo ý nghĩa  Phân tích dự đoán  Dự đoán dựa trên ảnh HL80615938D 9
  • 10. Công nghệ Khai phá dữ liệu Phân tích dự đoán Lắng nghe trên mạng xã hội Phân tích dòng thời gian VWAP t Bán Mua (C) Aimesoft : Multimodal AI
  • 11. Giải pháp bán hàng tự động AIShop  Giải pháp bán hàng tự động dựa trên Multimodal AI  Nhận diện ảnh, tiếng nói, ngôn ngữ để tự động đáp ứng nhu cầu của khách hàng trong cửa hàng/siêu thị AIShop Hướng dẫn về cửa hàng Hướng dẫn về mặt hàng Gợi ý sản phẩm Trả lời về giả cả (C) Aimesoft : Multimodal AI Database Mặc cả tự động Giọng nói Hành động Ngôn ngữ
  • 12. Nhân viên lễ tân ảo AimeReception  Giải pháp Lễ tân ảo dựa trên Multimodal AI  Tự động chào khi phát hiện khách đến  Trả lời câu hỏi của khách, hướng dẫn phòng họp  Tự động đọc và lưu danh thiếp (C) Aimesoft : Multimodal AI Demo video : https://drive.google.com/file/d/1pfIoqmpv3xusFOUeBRl48F98HhGmbsZf/view?usp=sharing
  • 13. Giải pháp MMAI cho kính thông minh  Giải pháp Multimodal AI cho kính thông minh  Tự động đọc chữ trước mặt  Tự động nhận diện đồ vật trước mặt  Hướng dẫn người khiếm thị qua đường (nhận diện đèn giao thông) (C) Aimesoft : Multimodal AI Demo video : https://drive.google.com/file/d/1oeGlEtKSuoZK_cq9qV7sayk2SGTy8GVU/view
  • 14. Giải pháp Xử lý tiền tệ thông minh  Dùng AI để xử lý tiền giấy, tiền xu HL80615938D10EUR 1 rupee Nhận dạng loại tiền, mệnh giá Nhận diện số series Nhận diện tiền giả Nhận diện vết bẩn, chữ viết bẩn Đếm tiền thông minh
  • 15. Demo Giải pháp Số hoá thông minh (Smart OCR) (C) Aimesoft : Multimodal AI Demo URL : https://cmt.gpu02.aimesoft.com:5050/
  • 16. Công nghệ lý giải/phân tích video  Nhận diện mặt hàng, vật thể trong video  Nhận diện tuổi, giới tính, hành động của khách hàng
  • 17. Nhận diện tuổi, giới tính từ video Demo : Pose estimation : https://drive.google.com/file/d/1eFI0cqjK3hOkO3NBHwYaFHcQCBna4pN4/view?usp=sharing Age/gender detection : https://drive.google.com/file/d/1Yvl4-z5r6YZXBSF7UthkXElBLrdhhhPV/view
  • 18. Giải pháp cho Y tế thông minh : Phân tích bệnh án  Tự động nhận diện tên thuốc, tên bệnh, tác dụng phụ giữa thuốc – bệnh  Tự động tóm tắt quá trình diễn biến của bệnh (C) Aimesoft : Multimodal AI
  • 19. Các giải pháp Multimodal AI cho Phân tích dự đoán Dự đoán giá trị tài sản cũ, BĐS  Từ các dữ liệu trong quá khứ, dữ liệu trên mạng xã hội, phân tích dự đoán chứng khoán, tín dụng, điện lực, … Khai phá văn bản Phân tích cảm xúc Lắng nghe SNS Các thuật toán phân tích dự đoán Giải pháp cho cty điện Giải pháp chứng khoán thông minh VWAP t Bán Mua Giải pháp tín dụng thông minh (C) Aimesoft : Multimodal AI
  • 20. Cảm ơn! Thông tin liên lạc http://www.aimesoft.com/ http://www.facebook.com/aimesoft Công ty Cổ phần Aimesoft (C) Aimesoft : Multimodal AI