4. Trí tuệ nhân tạo đa thể thức là gì?
MMAI
Là công nghệ AI mới, cho phép mô phỏng quá trình hợp nhất dữ liệu
(ảnh, tiếng nói, text) để xử lý thông minh giống con người
Xử lý ảnh
Tổng hợp
tiếng nóiNhận diện
tiếng nói
Xử lý
Ngôn ngữ tự nhiên
Multimodal Artificial Intelligence
(Trí tuệ nhân tạo đa thể thức)
4
5. Multimodal AI khác gì với với Single Modal
AI?
Single Modal AI Multimodal AI
Đây là cái gì?
Đây là điện thoại
đi động ạ
Multimodal AI kết hợp xử lý ảnh, nhận diện video với Xử lý ngôn ngữ tự nhiên
nên có thể “nhìn” và trả lời chính xác
Demo video :
https://drive.google.com/file/d/1kD_ONFqIn5Vn_N8oCqnza09FkZ_kdfVN/view?usp=sharing
5
6. Demo Multimodal AI: tự động mặc cả
Video link : https://www.youtube.com/watch?v=liEZZYlvbW8
6
7. Các công nghệ trong Aimesoft Multimodal AI
Multimodal
AI
Dữ liệu lớn
Xử lý ảnh
Khai phá
dữ liệu
Khai phá
văn bản
Xử lý
tiếng nói
Xử lý
Ngôn ngữ tự nhiên
MMAI
- Hợp nhất (Fusion) nhiều kiểu dữ liệu như ảnh, tiếng nói, text, … và các thuật
toán xử lý thông minh (Xử lý ảnh, Xử lý tiếng nói, Xử lý ngôn ngữ) vào một mô
hình AI duy nhất để đạt độ chính xác cao
Multimodal Artificial Intelligence
(Trí tuệ nhân tạo đa thể thức)
7
8. Đội ngũ nghiên cứu phát triển AI
(C) Aimesoft : Multimodal AI
Tổng giám đốc
Nguyễn Tuấn Đức
(TS ngành NLP, ĐH Tokyo)
Giám đốc Công nghệ
Nguyễn Đức Tâm
(TS ngành Toán, ĐH Tokyo)
Nghiên cứu viên có học vị tiến sỹ
Xử lý ngôn ngữ tự nhiên :
1 (ĐH Tokyo)
Nghiên cứu viên có học vị tiến sỹ
Xử lý ảnh :
3 (ĐH Tokyo, ĐH Ecole de Mine)
Nghiên cứu viên có học vị tiến sỹ
Xử lý tiếng nói:
2 (ĐH Paris, INRIA)
Kỹ sư Xử lý ngôn ngữ tự nhiên, Xử lý ảnh, Khoa học dữ liệu : ~ 25 người
9. Công nghệ Xử lý ảnh cho MMAI
Hoá đơn
_______
_______
_______
Nhận diện ảnh
Smart OCR (nhận diện chữ, số hoá)
Nhận diện người, hành động, vật thể
Phân mảnh theo ý nghĩa
Phân tích dự đoán
Dự đoán dựa trên ảnh
HL80615938D
9
10. Công nghệ Khai phá dữ liệu
Phân tích
dự đoán
Lắng nghe trên mạng xã hội Phân tích dòng thời gian
VWAP
t
Bán
Mua
(C) Aimesoft : Multimodal AI
11. Giải pháp bán hàng tự động AIShop
Giải pháp bán hàng tự động dựa trên Multimodal AI
Nhận diện ảnh, tiếng nói, ngôn ngữ để tự động đáp ứng
nhu cầu của khách hàng trong cửa hàng/siêu thị
AIShop
Hướng dẫn về cửa hàng
Hướng dẫn về mặt hàng
Gợi ý sản phẩm
Trả lời về giả cả
(C) Aimesoft : Multimodal AI
Database
Mặc cả tự động
Giọng nói
Hành động
Ngôn ngữ
12. Nhân viên lễ tân ảo AimeReception
Giải pháp Lễ tân ảo dựa trên Multimodal AI
Tự động chào khi phát hiện khách đến
Trả lời câu hỏi của khách, hướng dẫn phòng họp
Tự động đọc và lưu danh thiếp
(C) Aimesoft : Multimodal AI
Demo video : https://drive.google.com/file/d/1pfIoqmpv3xusFOUeBRl48F98HhGmbsZf/view?usp=sharing
13. Giải pháp MMAI cho kính thông minh
Giải pháp Multimodal AI cho kính thông minh
Tự động đọc chữ trước mặt
Tự động nhận diện đồ vật trước mặt
Hướng dẫn người khiếm thị qua đường (nhận diện đèn giao thông)
(C) Aimesoft : Multimodal AI
Demo video : https://drive.google.com/file/d/1oeGlEtKSuoZK_cq9qV7sayk2SGTy8GVU/view
14. Giải pháp Xử lý tiền tệ thông minh
Dùng AI để xử lý tiền giấy, tiền xu
HL80615938D10EUR
1 rupee
Nhận dạng loại tiền, mệnh giá
Nhận diện số series
Nhận diện tiền giả
Nhận diện vết bẩn, chữ viết bẩn
Đếm tiền thông minh
15. Demo Giải pháp Số hoá thông minh (Smart OCR)
(C) Aimesoft : Multimodal AI
Demo URL :
https://cmt.gpu02.aimesoft.com:5050/
16. Công nghệ lý giải/phân tích video
Nhận diện mặt hàng, vật thể trong video
Nhận diện tuổi, giới tính, hành động của khách hàng
17. Nhận diện tuổi, giới tính từ video
Demo :
Pose estimation : https://drive.google.com/file/d/1eFI0cqjK3hOkO3NBHwYaFHcQCBna4pN4/view?usp=sharing
Age/gender detection : https://drive.google.com/file/d/1Yvl4-z5r6YZXBSF7UthkXElBLrdhhhPV/view
18. Giải pháp cho Y tế thông minh : Phân tích bệnh án
Tự động nhận diện tên thuốc, tên bệnh, tác dụng phụ giữa thuốc – bệnh
Tự động tóm tắt quá trình diễn biến của bệnh
(C) Aimesoft : Multimodal AI
19. Các giải pháp Multimodal AI cho Phân tích dự đoán
Dự đoán giá trị
tài sản cũ, BĐS
Từ các dữ liệu trong quá khứ, dữ liệu trên mạng xã hội, phân
tích dự đoán chứng khoán, tín dụng, điện lực, …
Khai phá văn bản
Phân tích cảm xúc
Lắng nghe SNS
Các thuật toán
phân tích
dự đoán
Giải pháp cho
cty điện
Giải pháp chứng khoán
thông minh
VWAP
t
Bán
Mua
Giải pháp tín dụng thông minh
(C) Aimesoft : Multimodal AI
20. Cảm ơn!
Thông tin liên lạc
http://www.aimesoft.com/
http://www.facebook.com/aimesoft
Công ty Cổ phần Aimesoft
(C) Aimesoft : Multimodal AI