
12:10 - 30/01/2025
Startup Việt dạy AI nói tiếng Việt và hơn 50 ngôn ngữ khác
Nếu nhận cuộc gọi tự động từ tổng đài của doanh nghiệp, lắng nghe các bài báo bằng tiếng nói trên một trang báo điện tử, nghe clip đăng trên các mạng xã hội, khả năng rất chắc chắn là bạn nghe các “sản phẩm” của Vbee – một startup AI tại Hà Nội.
Ra đời từ 2018, Vbee là startup tại Hà Nội chuyên phát triển giải pháp xử lý ngôn ngữ tự nhiên (NLP) và AI hội thoại. Tuy vậy, chặng đường để hình thành Vbee lại bắt đầu từ hơn mười năm trước đó.
Từ bộ đọc cho người khiếm thị
Ngay từ hồi còn là sinh viên Đại học Bách khoa Hà Nội, anh sinh viên Hồ Minh Đức và các bạn đồng học đã cùng nhau ấp ủ ý tưởng xây dựng một giải pháp giúp người khiếm thị ở Việt Nam có một bộ đọc tốt hơn. Khi đó, lĩnh vực xử lý, chuyển đổi ngôn ngữ tiếng Việt từ văn bản thành giọng nói hay ngược lại vẫn còn là một khái niệm tương đối mơ hồ với hầu hết người dùng, thậm chí cả với những doanh nghiệp lớn của Việt Nam.
Những người am hiểu về ngôn ngữ học đều đồng tình rằng, điều quan trọng là phải có một công ty “made in Vietnam” để xây dựng giải pháp phù hợp cho người Việt. Lý do rất đơn giản: tiếng Việt là một ngôn ngữ phức tạp, khó học và khó phát âm nhất thế giới. Chính vì vậy, việc xây dựng các phần mềm và giải pháp chuyển đổi tiếng Việt vẫn là một thách thức không nhỏ, ngay cả đối với những tập đoàn công nghệ hàng đầu thế giới như Google, Microsoft hay Apple khi muốn thâm nhập thị trường Việt Nam. “Thời điểm đó, chúng tôi chỉ là một startup nhỏ, ít nhân viên, chưa có doanh thu hay sản phẩm cụ thể. Tất cả những gì chúng tôi có chỉ là một ý tưởng, với khả năng thành công cũng như rủi ro thất bại. Nhưng điều quan trọng là chúng tôi có chung một ý chí, quyết tâm theo đuổi ý tưởng đó đến cùng”, CEO Hồ Minh Đức nhớ lại.

Trong văn phòng của startup Vbee tại Hà Nội. Các trang điện tử và các nhà sang tạo nội dung Việt Nam sử dụng các giọng đọc AI của Vbee. Ảnh: Thu Trang.
Tiếng nói của muôn nhà
Ngày nay, Vbee là startup chuyên cung cấp các giải pháp và sản phẩm dựa trên công nghệ AI, chẳng hạn như chuyển văn bản thành giọng nói, nhận dạng giọng nói, trợ lý ảo, phân tích cảm xúc giọng nói… Các giải pháp của Vbee được sử dụng trong nhiều lĩnh vực như tổng đài tự động, giáo dục, truyền thông và giải trí…
Dựa trên nền tảng điện toán đám mây, Vbee hiện đang cung cấp các giải pháp hội thoại AI cho hơn 300 doanh nghiệp lớn nhỏ, phục vụ hơn hai triệu người dùng cuối. Các giọng đọc quen thuộc như Ngọc Huyền (giọng nữ Hà Nội thường được dùng để đọc tin tức), Thảo Trinh (giọng Sài Gòn cho các podcast), và Hoàng Dũng (giọng nam Hà Nội)… đều là những “sản phẩm” do Vbee tạo ra.
Các giọng đọc này thường xuyên xuất hiện trên các báo điện tử và trong các video clip trực tuyến. Bên cạnh đó, Vbee AIVoice còn có khả năng “nói” được hơn 50 ngôn ngữ khác nhau thông qua 200 giọng đọc ảo, với đầy đủ các cung bậc cảm xúc như giọng nói con người.
“Chúng tôi mang những đặc trưng riêng của tiếng Việt như ngữ âm, thanh điệu, ngữ điệu… vào những nghiên cứu của mình để tạo ra những giọng nói đầy cảm xúc, những cuộc hội thoại ảo nhưng rất con người”, vị CEO kiêm đồng sáng lập nói.
Tiến sĩ Nguyễn Thị Thu Trang – nhà đồng sáng lập kiêm Giám đốc Công nghệ (CTO) của Vbee – nói rằng lúc chưa phát triển thì chất lượng trợ lý ảo rất thấp và rất máy móc. Với AI tạo sinh (GenAI), Vbee tạo ra các hội thoại tự nhiên hơn. Ở các khu vực biên giới, các công cụ của Vbee càng chứng minh tính hữu dụng. Chẳng hạn Cửa khẩu Quốc tế Bờ Y thuộc xã Bờ Y ở huyện Ngọc Hồi thuộc tỉnh Kon Tum được mệnh danh là “ngã ba Đông Dương”. Ở trên đất bạn là tỉnh Attapeu của Lào và tỉnh Ratanakiri của Campuchia. Các đơn vị cửa khẩu Việt Nam có thể phát đi một văn bản bằng tiếng Việt, rồi ngay sau đó có thông báo bằng tiếng Lào và tiếng Khmer… “Đó là sự tiện lợi của các sản phẩm Vbee mà chưa có startup AI nào đạt được”, CTO Nguyễn Thị Thu Trang nói.
Tính đến tháng 5/2024, theo nền tảng dữ liệu Statista, OKXE, Infoplus, JobHopin, Teky và MFast là năm startup AI của Việt Nam gọi được nhiều vốn mạo hiểm nhất trong thời gian qua. Nhưng Kinh tế Sài Gòn nhấn mạnh rằng OKXE và Infoplus có quốc tịch Hàn Quốc nhưng hoạt động tại Việt Nam là chính, và AI chỉ là một trong những công cụ hỗ trợ mà cả năm startup trên sử dụng hiệu quả trong vận hành và kinh doanh.
Song Hảo (theo Giai phẩm xuân TGHN)
Ngày đăng: 30/1/2025
Ý kiến của bạn về bài viết
Không có chức năng bình luận cho bài viết này