Ra mắt nền tảng công nghệ xử lý giọng nói tiếng Việt ứng dụng trí tuệ nhân tạo VAIS và Vbee

Chiều ngày 19/6/2020, tại Hà Nội, Bộ TT&TT đã tổ chức Lễ ra mắt nền tảng công nghệ xử lý giọng nói tiếng Việt ứng dụng trí tuệ nhân tạo VAIS và Vbee. Thứ trưởng Nguyễn Thành Hưng đã tham dự và phát biểu.Tham dự còn có đại diện Phòng Thương mại và Công nghiệp Việt Nam, đại diện cơ quan chuyên trách CNTT của một số bộ, ngành và các cơ quan báo chí.

Đây là một trong chuỗi sự kiện giới thiệu các nền tảng số “Make in Vietnam” nhằm thực hiện “Chương trình chuyển đổi số quốc gia đến năm 2025, định hướng đến năm 2030” vừa được Thủ tướng Chính phủ phê duyệt.

Phát biểu tại buổi lễ, Thứ trưởng Nguyễn Thành Hưng nhận định, Bộ TT&TT lựa chọn giới thiệu và bảo trợ về truyền thông Nền tảng chuyển đổi giọng nói tiếng Việt thành văn bản VAIS và Nền tảng giọng nói nhân tạo tiếng Việt tự nhiên Vbee vì đây là hai nền tảng tiên phong tại Việt Nam về công nghệ lõi Speech–to–Text và Text–to–Speech sử dụng trí tuệ nhân tạo để chuyển đổi giữa giọng nói và văn bản tiếng Việt.
 
20200619-pg1-TT.jpg
 
Thứ trưởng Nguyễn Thành Hưng: "Nền tảng chuyển đổi giọng nói tiếng Việt thành văn bản VAIS và Nền tảng giọng nói nhân tạo tiếng Việt tự nhiên Vbee là hai nền tảng tiên phong tại Việt Nam về công nghệ lõi Speech–to–Text và Text–to–Speech sử dụng AI để chuyển đổi giữa giọng nói và văn bản tiếng Việt"
 
Nền tảng VAIS hiện đã được nhiều cơ quan nhà nước ở Trung ương và địa phương sử dụng như Văn phòng Trung ương Đảng, Văn phòng Chính phủ, Văn phòng Quốc hội, Bộ TT&TT, UBND Thành phố Hà Nội, hơn 50 đơn vị báo chí, truyền hình để phục vụ gỡ băng bài phát biểu tại các kỳ họp, sự kiện. Nền tảng Vbee đã cung cấp dịch vụ cho hơn 20 ngàn khách hàng cá nhân, hơn 500 doanh nghiệp, tổng công ty, sử dụng rộng rãi trong 3 lĩnh vực chính: tổng đài tự động, giải pháp tương tác thiết bị thông minh và nội dung số tự động.
 
Thứ trưởng tin tưởng rằng VAIS và Vbee đang đứng trước một thị trường rộng lớn với hơn 96 triệu dân, 700 nghìn doanh nghiệp, 126 triệu thuê bao điện thoại di động, tỷ lệ người sử dụng Internet đạt 68,7% (số liệu thống kê năm 2019). Ngoài ra, nền tảng chuyển đổi tiếng nói tiếng Việt thành văn bản VAIS cũng có tiềm năng lớn với khối cơ quan Nhà nước với 22 Bộ, cơ quan ngang bộ, 8 cơ quan thuộc Chính phủ, 63 tỉnh, thành phố trực thuộc Trung ương bao gồm toàn bộ các cơ quan hành chính, đơn vị sự nghiệp các cấp.
 
20200619-pg3-VAIS.jpg
 
Đại diện cho hai doanh nghiệp VAIS và Vbee phát biểu tại sự kiện
 
Đặc biệt, công nghệ giọng nói tiếng Việt có thể được ứng dụng vào các sản phẩm và dịch vụ, cung cấp cho cộng đồng người khiếm thị và người bị câm, giúp người khuyết tật dễ dàng tiếp cận thông tin và sản xuất thông tin, mang lại ý nghĩa xã hội to lớn.
 
Phát biểu với báo chí bên lề sự kiện, ông Nguyễn Huy Dũng, Cục trưởng Cục Tin học hóa – Bộ TT&TT cho biết, trong thời gian qua, Bộ TT&TT đã ra mắt 10 nền tảng khác nhau. Có những nền tảng được thị trường chấp nhận và hết sức phổ biến, có những nền tảng khác còn hết sức mới.
 
Theo phản hồi của thị trường, chất lượng của các nền tảng Việt không thua kém của nước ngoài, thậm chí tại một số lĩnh vực ngách, chất lượng của các nền tảng Việt còn tốt hơn của nước ngoài, chẳng hạn như nhận dạng, xử lý giọng nói tiếng Việt đạt độ chính xác tốt hơn, nền tảng học trực tuyến…, Cục trưởng nhận định.
 
 
* VAIS là nền tảng công nghệ lõi chuyển giọng nói tiếng Việt thành văn bản (Speech To Text) tiên phong tại Việt Nam, với những đặc trưng:
- Nhận dạng được đầy đủ  giọng nói cả 3 miền Bắc, Trung, Nam với độ chính xác lên đến 95%.
- Chuyển đổi giọng nói tiếng Việt thành văn bản với kết quả tức thì, với tốc độ vượt trội có thể nhanh gấp 500 lần thời lượng âm thanh.
- Nhận dạng tốt trong môi trường nhiễu và ở khoảng cách xa. Đặc biệt, nền tảng này có tính năng chuẩn hóa văn bản đầu ra: tên riêng, ngày, tháng, số…, hỗ trợ nhiều loại định dạng âm thanh đầu vào.
- Cung cấp giải pháp cho người dùng trực tiếp hoặc kết nối thông qua API tại: https://vais.vn/.
 
* Vbee là nền tảng công nghệ lõi về giọng nói nhân tạo Việt có cảm xúc (chuyển đổi văn bản thành giọng nói trí tuệ nhân tạo tiếng Việt có cảm xúc – Text To Speech) tiên phong tại Việt Nam với những đặc trưng sau:
- Công nghệ Vbee có thể học theo bất kỳ giọng của một người nào đó trong vòng 4 giờ đồng hồ với độ tương tự trên 95%.
- Giọng nói Vbee đa dạng vùng miền (Bắc, Trung, Nam...), giới tính và độ tuổi (Nam, Nữ)
- Giọng nói Vbee đa dạng độ tuổi, giới tính (Nam, Nữ)
- Công nghệ giọng nói nhân tạo Vbee có thể dự đoán cách đọc, các từ viết tắt, từ vay mượn, các từ ngữ đặc trưng của tiếng Việt mà các giải pháp nước ngoài không thể.
- Vbee xây dựng thành công nền tảng Vbee cloud (https://www.vbee.vn), cho phép người sử dụng, doanh nghiệp, lập trình viên có thể sử dụng trực tiếp hoặc qua tích hợp (API) một cách dễ dàng và thuận tiện.
- Vbee đã đóng gói thành công cho các giải pháp toàn diện trong các lĩnh vực sử dụng giọng nói nhân tạo của Vbee như: giải pháp về nội dung nhân tạo (sách nói, báo nói, lồng tiếng phim tự động, thu âm tự động…), giải pháp về tổng đài nhân tạo (vận tải, tài chính, thương mại điện tử…), giải pháp nhà thông minh (giao tiếp với thiết bị qua ngôn ngữ), giải pháp chatbot chăm sóc, tư vấn khách hàng.
 
 

mic.gov.vn