Nguyễn Thị Thu Trang, Sáng lập VBee: Text – To – Speech sẽ là xu hướng của cuộc sống

Nghiên cứu và ứng dụng công nghệ chuyển văn bản tiếng Việt thành giọng nói (Text – To -Speech) là mục tiêu của TS. Nguyễn Thị Thu Trang, Sáng lập Công ty cổ phần Dịch vụ và Giải pháp dữ liệu VBee cùng đội ngũ cộng sự.

VBee và Text – To – Speech

Nguyễn Thị Thu Trang đã có một sự nghiệp nghiên cứu, giảng dạy với Text – To – Speech – giải pháp chuyển văn bản tiếng Việt thành giọng nói, với mong muốn hỗ trợ người khiếm thị có thể tiếp cận thông tin tốt hơn. Nhưng, mọi việc đã không dừng lại.

“Tôi là giảng viên của Trường đại học Bách Khoa Hà Nội. Năm 2015, tôi bảo vệ luận án tiến sỹ với giải pháp chuyển văn bản tiếng Việt thành giọng nói. Dựa trên nền móng đó, tôi phát triển một số ứng dụng cộng đồng cho người khiếm thị. Nhưng, khi triển khai các ứng dụng, chúng tôi phát hiện rằng, công nghệ này còn có thể ứng dụng rộng rãi hơn, ở nhiều lĩnh vực trong mai sau. Tôi và các đồng nghiệp đã thử nghiệm cùng ứng dụng Vadi – “trợ lý ảo” lái xe với hai tính năng được tích hợp là bản đồ giao thông và báo nói. Ứng dụng này được cập nhật trên hệ điều hành Android hoặc iOS”, TS. Trang chia sẻ.

.
Nguyễn Thị Thu Trang, Sáng lập VBee

Text – To – Speech là công nghệ xử lý văn bản thành giọng nói đã được nghiên cứu dao động vài chục năm trước, đặc trưng phát triển mạnh trong 10-15 năm gần đây. Công nghệ này đã phát triển gần như hoàn thiện ở nước ngoài, đặc trưng tại các nước sử dụng tiếng Anh. Khi ứng dụng vào cuộc sống, công nghệ này mang lại lợi ích lớn cho cộng đồng người khuyết tật, như người khiếm thị, những người mất khả năng đọc, mất khả năng nói hoặc biểu đạt.

Ngoài ra, Text – To – Speech còn mang lại nhiều giá trị thực tiễn, ứng dụng trong hệ thống tổng đài chăm sóc khách hàng, tổng đài nhắc nợ, hay các hệ thống phát thanh trong các lĩnh vực công cộng như giao thông, y tế…

Nhưng tại Việt Nam, Text – To – Speech đang đi những bước đi đầu tiên. “VBee đã ra đời nhằm đưa công nghệ này vào cuộc sống của người Việt. Vadi một ứng dụng trong lĩnh vực giao thông cũng ra đời dựa trên nền móng này”, TS. Nguyễn Thị Thu Trang nói

Cùng với Trang, Hồ Minh Đức – người có hơn chục năm bí kíp kinh doanh trong lĩnh vực công nghệ và TS. Nguyễn Thanh Hùng, Trưởng Bộ môn Công nghệ phần mềm (Trường đại học Bách Khoa Hà Nội) cũng ghi tên trong danh sách sáng lập của VBee.

Ra đời từ đầu năm 2018, hiện tại đội ngũ của VBee có gần 20 người. Ngoài ra, Công ty có nhiều cộng tác viên, phần đông là sinh viên ưu tú của Trường đại học Bách khoa Hà Nội cùng nghiên cứu và làm việc.

Ứng dụng thực tiễn

Chia sẻ về Vadi, TS. Nguyễn Thị Thu Trang cho thấy, người dùng sẽ nhận được thông báo về tai nạn, tắc đường hoặc lũ lụt tại thời gian thực, từ đó đưa ra các gợi ý để lái xe chuyển cung đường khác.

Ngoài ra, Vadi còn phục vụ nhu cầu giải trí do được tích hợp công nghệ đọc báo. Đơn cử, người dùng có thể yêu cầu Vadi đọc một bài báo về trận bóng World Cup đêm qua, hoặc yêu cầu tìm đường tới một vị trí nào đó bằng giọng nói, không cần thao tác bằng tay.

“Chúng tôi là nhóm đầu tiên ở Việt Nam tích hợp tính năng bản đồ giao thông và báo đọc trong một ứng dụng”, TS. Trang nói.

Sự khác biệt là điều mà đội ngũ VBee để tâm. Ví dụ, về giọng đọc, nhóm mất khá nhiều thời gian để tạo ra giọng có ngữ điệu thu hút và gần gũi nhất với người dùng, khác với ngôn ngữ máy đọc thông thường là đều đều, không tự nhiên mà Google hay Microsoft đang hỗ trợ cho tiếng Việt.

Ứng dụng hiện có gần 5.000 người dùng. Nhóm nghiên cứu đã hoàn thiện tính năng điều khiển bằng giọng nói cho Vadi, giúp dễ dàng trong sử dụng, đặc trưng khi đang lái xe. Tương lai, ngoài cung cấp bản đồ và báo nói, nhóm sẽ cung cấp thêm các dịch vụ như sách nói, truyện nói hoặc các hình thức giải trí khác cho lái xe.

Người đồng sáng lập VBee, TS. Nguyễn Thanh Hùng cũng cho hay, dư địa phát triển ứng dụng của công nghệ Text-To-Speech còn rất lớn, Vadi là một phần trong đó.

Ngoài ra, công nghệ này còn có thể ứng dụng trên nhiều lĩnh vực như, bộ phận chăm sóc khách hàng, tổng đài, đọc chuyện cho trẻ bằng giọng của bố mẹ chỉ dẫn, BDS ứng dụng smart home (nhà thông minh)…

“Công ty đang hợp tác với một số đối tác để phát triển ứng dụng về tổng đài chăm sóc khách hàng và nhà thông minh. Khi bước vào nhà có thể bật tắt điện, nước bằng giọng nói, đưa ra thông báo, điều chỉnh thiết bị tivi… Tuy nhiên, chúng tôi xác định không phát triển theo số lượng mà sẽ hợp tác với những đối tượng ở các lĩnh vực khác nhau”, TS. Hùng chia sẻ.

Nói về dự dịnh phát triển trong thời gian tới, người đồng sáng lập VBee cho thấy, Công ty sẽ đáp ứng nhiều cho các bên có như cầu sử dụng dịch vụ ứng dụng công nghệ chuyển văn bản bằng giọng nói. Đồng thời, VBee nhưng vẫn tiếp tục và hoàn thiện ứng dụng Vadi.

Trò chuyện với TS. Nguyễn Thị Thu Trang:

Chị đến với Text – To – Speech như thế nào?

Năm 2010, tôi bắt đầu nghiên cứu về giải pháp này. Năm 2012, tôi sang trọng Pháp làm nghiên cứu sinh, đến năm 2015 bảo vệ xong luận án tiến sỹ về giải pháp Text – To – Speech cho tiếng Việt. Khi về nước, tôi bắt đầu nghiên cứu để ứng dụng công nghệ này trong cuộc sống.

Ba người cùng sáng lập và triển khai ứng dụng công nghệ, có khó khăn gì không?

Một mình tôi không thể làm được. Chúng tôi đều là những người đã có ít nhiều bí kíp thực tiễn, thống nhất quan điểm: mỗi người phụ trách một mảng để cùng phát triển thì sẽ đem lại kết quả tốt nhất.

Lâu nay, luôn có dao động cách giữa công nghệ và ứng dụng thực tiễn?

Tất nhiên sẽ có nhiều khó khăn, bởi nghiên cứu chỉ là trên môi trường giả định, còn môi trường thực tại đòi hỏi phải cân đối rất nhiều nhân tố. Nhưng chúng tôi bị hấp dẫn bởi bài toán cân đối được các đòi hỏi thực tiễn để đưa công nghệ vào thực tiễn.

Bạn đang xem chuyên mục Blog Bat Dong San ở Duanmizuki.org