09:56 - 28/09/2022
A.I. học viết và nói thay người
Hai startup Việt tiến vào thị trường sản phẩm công nghệ theo hai hướng khác nhau. Một chinh phục thị trường nước ngoài rồi mới quay lại với thị trường trong nước. Một lại thuyết phục cơ quan chính phủ bằng chất lượng sản phẩm rồi mới “tiến đánh” thị trường khách cá nhân và doanh nghiệp.
Công nghệ nổi bật đứng sau sự thành công của hai công cụ này là trí tuệ nhân tạo. AI cho phép robot học từ thực tiễn, giúp lời thoại chuyển ngữ thông minh hơn và tự nhiên hơn.
Hei.io chinh phục trời Tây
Lần đầu tiên đặt chân lên đất nước Phần Lan vắng vẻ và yên bình, Trần Ngọc Thái không khỏi cảm thấy áp lực. Bởi anh chưa thử sức lần nào ở thị trường Bắc Âu xa lạ.
Chỉ sau ba ngày, anh không còn nỗi lo nào khác. Không sốc văn hoá, không bỡ ngỡ với môi trường kinh doanh mới. Thái chia sẻ vậy vì anh nhận được nhiều sự hỗ trợ của chính phủ Phần Lan. Nơi đây, họ quan niệm “startup công nghệ là công dân có tiềm năng đóng thuế ở nước này”. Thái được giới thiệu với tỷ phú Peter Vesterbacka từ quỹ Finest Future – cũng là nhà đầu tư thiên thần cho startup HeiTech Ltd. do Thái sáng lập ở Phần Lan. Bên cạnh đó, anh còn được tổ chức Business Finland kết nối với hệ sinh thái tại đây.
Ứng dụng Hei.io của HeiTech là robot AI có khả năng lồng tiếng, chạy thuyết minh cho sự kiện và lồng tiếng video theo yêu cầu. Theo Crunchbase, Hei.io gần đây đạt trung bình hơn 760.000 lượt truy cập mỗi tháng, tăng hơn 800% kể từ ngày ra mắt vào tháng 4 năm nay. Sự thuận lợi của HeiTech cũng nhờ vào phần nắm rõ thị trường của Thái. Châu Âu đã ra đạo luật mới đòi hỏi các sản phẩm phát hình kỹ thuật số tiếng nước ngoài đều phải có phụ đề và lồng tiếng bản ngữ. Theo nghiên cứu của nền tảng tin tức và dịch thuật Slator, hơn 37% người được hãng khảo sát nói rằng thị trường này sẽ phát triển hơn nữa trong vòng ba năm tới.
HeiTech sẽ khó thành công nếu vẫn “ru rú” trong nước. Thị trường Việt Nam thích “xài chùa” nhiều thứ, nên các công ty làm chui làm lậu tha hồ tác quái.
“Tôi từng đồng sáng lập Voiz FM – ứng dụng sách nói và podcast. Voiz FM phải cạnh tranh rất nhiều với các kênh đọc truyện tự phát. Dĩ nhiên là họ chẳng phải tốn tiền bản quyền. Cứ có sách là họ đọc lên kênh của mình, phát trên YouTube rồi thu tiền quảng cáo. Còn Voiz FM phải thuyết phục từng tác giả chuyển nhượng bản quyền sách”, Thái chia sẻ.
Thói quen dùng miễn phí đồ của người khác đã đẩy đa số startup Việt phải chọn thị trường ngách nơi khác. Chính vì vậy, Thái cho rằng startup muốn thành công trong nước thì hãy nên khởi nghiệp ở nước ngoài, rồi hẵng quay lại thị trường trong nước. Ở nước ngoài, thói quen trả phí đã hình thành từ lâu nên chỉ vừa khởi sự đầu năm, HeiTech đã có doanh thu đủ chi trả cho một đội ngũ đầy đủ nhân viên hỗ trợ kỹ thuật và marketing. Tất cả đều là người bản địa, trừ người sáng lập.
HeiTech vừa được thành phố Espoo, gần thủ đô Helsinki, chọn sử dụng để lồng tiếng và dịch ba ngôn ngữ Ukraine, Nga và Việt Nam cho các dịch vụ, tài liệu với thời lượng tầm 700 phút. Thái mô tả cơ hội này như một bước đi nhanh chóng làm ấm lòng người nhập cư nơi xứ lạnh. Một cơ hội mà anh cho rằng ở Việt Nam có lẽ mất nhiều thời gian mới có được. Một nghiên cứu Slator cũng chỉ ra rằng có đến 66,3% doanh nghiệp toàn cầu cùng lĩnh vực như HeiTech nói rằng không có cơ hội tiếp cận và làm việc với các cơ quan chính quyền.
Trần Ngọc Thái cho rằng anh may mắn để đạt được cơ hội này. Nhưng đó là cuộc đấu tranh sống còn. Như chuyện anh đã cùng các nhà sáng lập của Voiz FM đương đầu với chiến đấu cùng vô vàn kênh sách nói vi phạm bản quyền trên YouTube, Facebook, Instagram… Ngoài ra, còn các diễn đàn chính thống như Hẻm Audio, Waka, Gác sách, Thư viện sách nói Hướng Dương, Sách mp3, Trạm Radio, Radio truyện… Có thể nói, thị trường Việt Nam còn khốc liệt hơn cả một nước yên bình như Phần Lan.
Khi bộ phim Squid Game gây bão trên Netflix, lời thoại trong phim đã được dịch và chạy phụ đề bằng nhiều ngôn ngữ ở các nước khác nhau. Đây là thành quả của robot thuộc startup công nghệ Deepdub. Sau thành công của bộ phim, thị trường chuyển ngữ thành văn bản và lời thoại bùng nổ. Theo Globalnewswire, thị trường dịch thuật theo thời gian thực đã trị giá 41 tỷ USD trong năm nay.
Memobot hút khách
Đối với Công ty Cổ phần Giải pháp trí tuệ thông minh nhân tạo Việt Nam (VAIS) thì câu chuyện trở thành nhà cung cấp giải pháp cho Quốc hội lại giúp startup này mở ra thị trường mới.
Năm 2019, phần mềm V-IONE của VAIS được Bộ Thông tin và Truyền thông bình chọn là Giải pháp tiêu biểu Chuyển đổi số Việt Nam. Phần mềm này có khả năng chuyển đổi giọng nói tiếng Việt thành văn bản. Khi thử nghiệm thành công trong chuyển đổi các phiên họp thành văn bản tại kỳ họp thứ 7 Quốc Hội khóa 14 năm 2019, VAIS nhận được thư khen của Tổng Thư ký Quốc hội đương nhiệm là Nguyễn Hạnh Phúc. VAIS sau đó chính thức trở thành nhà cung cấp giải pháp cho Quốc hội.
Các nhà sáng lập của VAIS đều có bề dày kinh nghiệm chinh chiến các dự án lớn tầm chính phủ. Ông Phạm Ngọc Phương có 12 năm kinh nghiệm trong lĩnh vực tư vấn dự án, thiết kế – và tích hợp hệ thống các dự án IT khối chính phủ. Hay PGS. TS. Lương Chi Mai, Phó viện trưởng Viện Công nghệ thông tin và truyền thông thuộc Đại học Việt – Pháp và TS. Đỗ Quốc Cường đã công bố 14 đề tài nghiên cứu về xử lý ngôn ngữ tự nhiên, xử lý tiếng nói.
V-IONE trở thành trợ thủ đắc lực cho thư ký và cánh nhà báo tường thuật các phiên họp Quốc hội. Đối với các nhà báo, nhận được thông tin trễ nghĩa là tin tức sẽ trễ theo. Một nhà báo kỳ cựu chia sẻ: “Thời của tôi, Văn phòng Quốc hội phải thuê 30 sinh viên rã băng lời thoại trong các phiên họp. Phiên sáng thì chiều mới có, còn các phiên chiều và tối thì sang ngày hôm sau. Các phóng viên phải tự rã băng. Giờ thì có phần mềm hỗ trợ”. V-IONE đã giải quyết được bài toán thời gian thực. Phần mềm này chỉ mất năm phút để chuyển một giờ nội dung băng ghi âm thành văn bản viết. V-IONE hiện có thể phân biệt rõ được giọng nói ba miền Bắc Trung Nam.
Tám năm nghiên cứu, đội ngũ sáng lập đã giải quyết được những lỗi tưởng chừng như nhỏ. Chẳng hạn, nếu văn bản không được viết hoa hay chấm câu đúng chỗ, tiếng “ơ ờ” khi ngập ngừng của người nói cũng được ghi lại… thì kết quả chỉ là bản nháp khó hiểu.
Sau khi thành công ở mảng B2G (dịch vụ cung cấp cho chính phủ), VAIS lấn sang mảng khách lẻ B2C và mảng khách doanh nghiệp B2B. Tháng 7/2022, VAIS đưa V-IONE lên các cửa hàng ứng dụng Play và App Store với tên gọi là memobot, “nhanh chân” hơn các ông lớn ngành công nghệ trong việc đưa ứng dụng đến tận tay người dùng qua smartphone. Hiện Viettel và FPT vẫn dùng phiên bản trên máy tính, còn Zalo vẫn dùng phần mềm này trong nội bộ chứ chưa triển khai ra ngoài. Ông Phạm Tấn Anh Vũ – đại diện kinh doanh khu vực phía Nam của VAIS – nói rằng thị trường chuyển giọng nói sang văn bản tại Việt Nam có giá trị ước tính 30 triệu USD.
Nhiều người cho rằng V-IONE chỉ là công cụ phục vụ cho hội họp, một thị trường ngách là chưa chính xác. “Chúng tôi thành lập nhiều tệp dữ liệu cho khách hàng từ những biên bản các cuộc họp. Bạn thử tưởng tượng, phần mềm của chúng tôi có thể phân chia dữ liệu theo năm tháng và chủ đề, ví dụ như về kinh tế, quản trị hay giáo dục. Đối với những nhà nghiên cứu, cơ sở dữ liệu này phải mất nhiều thời gian thu thập, nhưng vấn đề thời gian đã được giải quyết”, ông Vũ cho biết
Còn đối với các nhà báo, phần mềm này chính là công cụ lưu trữ để xuất bản đủ loại tin tức theo chủ đề hoặc có thể đưa lên chương trình podcast. Tính bí mật và riêng tư của văn bản sẽ được phân quyền theo quy định của từng tổ chức. “Cá nhân hay doanh nghiệp hay tổ chức đều có thể sử dụng. Vậy thì thị trường không hề nhỏ”, ông Vũ phân tích.
Mỹ Huyền (theo TGHN)
Có thể bạn quan tâm
Xe điện Ấn Độ được kích hoạt bởi ô nhiễm
Mặt trái của một ‘siêu CEO’
Google có thể hợp tác Hyundai Motor phát triển xe tự lái
VinSmart ra mắt điện thoại camera ẩn đầu tiên tại Việt Nam
Tesla mở nhà máy xe điện đầu tiên ở Ấn Độ
Tags:trí tuệ nhân tạo
Ý kiến của bạn về bài viết
Không có chức năng bình luận cho bài viết này