Việt Nam phát triển thành công phần mềm dịch ngôn ngữ hiếm khu vực Đông Nam Á

Viện Công nghệ thông tin - Viện Hàn lâm Khoa học và Công nghệ Việt Nam cho biết, các nhà khoa học đã thành công trong việc ứng dụng các kỹ thuật xử lý ngôn ngữ tự nhiên tiên tiến để xây dựng các mô hình dịch máy tự động có chất lượng cao cho các cặp ngôn ngữ như Việt - Lào, Việt - Khmer, Việt - Thái, Việt - Malaysia và Việt - Indonesia.

Dịch máy (hay còn gọi là dịch tự động) là việc dịch một văn bản từ một ngôn ngữ này (ngôn ngữ nguồn) sang một hoặc nhiều ngôn ngữ khác (ngôn ngữ đích) một cách tự động, không có sự can thiệp của con người trong quá trình dịch. Hiện nay có nhiều sản phẩm dịch tự động được sử dụng phổ biến như Google Translate, Bing Translator… với chất lượng dịch rất tốt cho các câu đơn. Tuy nhiên, các hệ thống dịch máy chất lượng cao này cần các bộ dữ liệu song ngữ quy mô lớn, lên tới hàng triệu cặp câu để huấn luyện mô hình.

Theo PGS.TS Nguyễn Trường Thắng - Viện trưởng Viện Công nghệ thông tin, Viện Hàn lâm KH&CN Việt Nam, hiện rất nhiều ngôn ngữ trên thế giới không có đủ tài nguyên như vậy. Việc xây dựng mô hình dịch máy hiệu quả cho những ngôn ngữ nghèo tài nguyên, trong đó có các ngôn ngữ của khu vực Đông Nam Á là công việc hết sức cấp thiết và gặp nhiều thách thức.

Cũng theo PGS.TS Nguyễn Trường Thắng, để khắc phục các tồn tại này, nhóm các nhà nghiên cứu tại Viện Công nghệ thông tin (CNTT) đã phát triển một hệ thống dịch thuật lấy tiếng Việt làm trung tâm, có khả năng dịch thuật hai chiều giữa tiếng Việt và các ngôn ngữ nghèo tài nguyên của khu vực Đông Nam Á với chất lượng tương đương với các sản phẩm thương mại nổi tiếng trên thế giới.

"Chúng tôi định hướng những ngôn ngữ hiếm như tiếng Lào, tiếng Khmer… và sau này là những ngôn ngữ của các dân tộc thiểu số của Việt Nam là tiếng Mường, tiếng Thái… Vì đây là những ngôn ngữ mà nước ngoài không bao giờ làm, và nếu họ có làm thì họ cũng không hiểu đặc thù ngôn ngữ của Việt Nam, mà hiện nay cũng đã có một số đối tác quan tâm. Chúng ta lựa chọn hướng đi là nội địa hóa, nhưng phù hợp với năng lực và hướng đi của chúng ta", PGS.TS Nguyễn Trường Thắng cho biết.

Tính đến thời điểm hiện tại, hệ thống đã có khả năng dịch hai chiều giữa các cặp ngôn ngữ bao gồm Việt - Lào, Việt - Khmer, Việt - Thái, Việt - Malaysia và Việt - Indonesia. Nhóm nghiên cứu cũng cho biết, hệ thống được nghiên cứu phát triển dựa trên các tiến bộ mới nhất hiện nay trên thế giới trong lĩnh vực xử lý ngôn ngữ tự nhiên nói chung và dịch máy nói riêng. Các ngôn ngữ như tiếng Lào, tiếng Thái và tiếng Khmer mang lại những thách thức rất lớn khi xây dựng mô hình dịch máy, không chỉ vì sự khan hiếm của dữ liệu song ngữ mà còn vì những ngôn ngữ này rất phong phú về mặt hình thái, thiếu sự phân tách từ, phân tách câu và tính đa nghĩa. Tuy nhiên, mô hình dịch máy của Viện CNTT đã học được cách thích ứng với tất cả những đặc điểm đặc biệt này.

PGS.TS Chu Hoàng Hà - Phó Chủ tịch Viện Hàn lâm KH&CN Việt Nam nói: "Chúng ta có thể tạo ra những phần mềm dịch thuật rất chính xác với những ngôn ngữ của các dân tộc ASEAN và cũng có thể là ngôn ngữ của các dân tộc Việt Nam nữa, từ đó giúp cho việc giao tiếp thuận lợi hơn. Đặc biệt với sự áp dụng của mô hình ngôn ngữ lớn thì giúp cho việc dịch thuật chính xác hơn nhiều, giúp cho các hoạt động trao đổi, giao tiếp, ngoại giao".

Các nhà khoa học cũng cho biết, hệ thống dịch máy có thể dễ dàng mở rộng sang các ngôn ngữ đích mới bao gồm các ngôn ngữ dân tộc thiểu số tại Việt Nam (thường là rất nghèo tài nguyên dữ liệu) như tiếng Mường, tiếng Thái,… và cả các ngôn ngữ nước ngoài phổ biến như tiếng Trung, tiếng Pháp, tiếng Nga khi cần. Đặc biệt, hệ thống có khả năng tinh chỉnh để thích ứng với các miền ngôn ngữ chuyên sâu như y tế, luật… theo yêu cầu riêng của đối tác.

Có thể bạn quan tâm

Tin cùng chuyên mục

Hơn 1.000 suất quà Tết đến với người có công ở xã Mậu A

Hơn 1.000 suất quà Tết đến với người có công ở xã Mậu A

Nhân dịp Tết Nguyên đán Bính Ngọ 2026, xã Mậu A đã và đang triển khai nhiều hoạt động thăm hỏi, trao quà Tết cho người có công và gia đình chính sách trên địa bàn. Hoạt động thể hiện sâu sắc đạo lý “Uống nước nhớ nguồn”, sự tri ân và trách nhiệm của Đảng, Nhà nước và toàn xã hội đối với những người đã hy sinh, cống hiến cho sự nghiệp giải phóng dân tộc, bảo vệ Tổ quốc.

Chợ hoa Xuân đất mỏ

Chợ hoa Xuân đất mỏ

Dưới ánh nắng dịu nhẹ của những ngày giáp Tết, phường Cam Đường, tỉnh Lào Cai như khoác lên mình tấm áo mới rực rỡ sắc Xuân. Trên các tuyến đường quen thuộc của vùng đất Mỏ, không khí mua bán, tham quan hoa, cây cảnh trở nên sôi động. Chợ hoa Xuân Cam Đường 2026 góp phần làm nên nhịp sống vùng đất mỏ rộn ràng trước thềm Tết Nguyên đán Bính Ngọ 2026.

Xuân ấm Nậm Mạt

Xuân ấm Nậm Mạt

Trong tiết se lạnh của những ngày giáp Tết Nguyên đán Bính Ngọ 2026, chúng tôi trở lại thôn Nậm Mạt, xã Mường Bo - Nơi từng chìm trong u trầm, tan hoang sau cơn bão dữ Buloi, nay đã khoác lên mình diện mạo mới: những nếp nhà mới khang trang, tiếng cười nói rộn ràng vang khắp bản làng, lan tỏa hơi ấm của niềm tin và sức sống hồi sinh.

Tiến tới hoàn thiện khung pháp lý cho mô hình trường phổ thông nội trú xã biên giới

Tiến tới hoàn thiện khung pháp lý cho mô hình trường phổ thông nội trú xã biên giới

Theo Bộ Giáo dục và Đào tạo, song song việc triển khai xây dựng trường phổ thông nội trú liên cấp Bộ đang khẩn trương hoàn thiện khung pháp lý cho mô hình trường phổ thông nội trú xã biên giới, nhằm bảo đảm các trường được tổ chức và vận hành bài bản, thống nhất, ổn định và hiệu quả lâu dài.

BHXH Việt Nam yêu cầu 90% hồ sơ công việc được xử lý trên môi trường mạng năm 2026

BHXH Việt Nam yêu cầu 90% hồ sơ công việc được xử lý trên môi trường mạng năm 2026

BHXH Việt Nam vừa ban hành Quyết định số 96/QĐ-BHXH về cải cách hành chính (CCHC) năm 2026, nhằm tiếp tục xây dựng nền hành chính phục vụ, chuyên nghiệp, hiện đại, tinh gọn, công khai, minh bạch và hiệu quả; trong đó yêu cầu 90% hồ sơ công việc được xử lý trên môi trường mạng năm 2026.

Phó Chủ tịch - Tổng Thư ký Ủy ban Trung ương MTTQ Việt Nam Hà Thị Nga thăm, tặng quà Tết tại xã Bát Xát

Phó Chủ tịch - Tổng Thư ký Ủy ban Trung ương MTTQ Việt Nam Hà Thị Nga thăm, tặng quà Tết tại xã Bát Xát

Nhân dịp Tết Nguyên đán Bính Ngọ 2026, chiều 6/2, Đoàn công tác của Ủy ban Trung ương Mặt trận Tổ quốc Việt Nam do đồng chí Hà Thị Nga - Ủy viên BCH Trung ương Đảng, Phó Chủ tịch - Tổng Thư ký Ủy ban Trung ương Mặt trận Tổ quốc Việt Nam làm Trưởng đoàn đã đến thăm, tặng quà Tết cho các cựu chiến binh, cựu thanh niên xung phong và người khuyết tật trên địa bàn xã Bát Xát.

Hội Chữ thập đỏ các cấp - Nối dài nhịp cầu nhân ái

Hội Chữ thập đỏ các cấp - Nối dài nhịp cầu nhân ái

Những ngày giáp tết Nguyên đán, công việc của những người làm công tác nhân đạo lại bận rộn hơn bao giờ hết bởi nhiều mảnh đời kém may mắn vẫn ngày ngày cần được sẻ chia, hỗ trợ. Giữa những lo toan đời sống thường nhật, Hội Chữ thập đỏ các cấp tỉnh Lào Cai đã trở thành những nhịp cầu nhân ái, kết nối những tấm lòng hảo tâm với những mảnh đời kém may mắn, giúp họ vơi bớt khó khăn đón Tết ấm áp hơn khi Xuân về.

Liên Sơn nâng cao chỉ số hạnh phúc

Liên Sơn nâng cao chỉ số hạnh phúc

Ở xã Liên Sơn, câu chuyện về “chỉ số hạnh phúc” không còn là khái niệm chung chung mà được cụ thể hóa bằng những mô hình thiết thực: trường học hạnh phúc, gia đình hạnh phúc, thôn hạnh phúc - nơi mỗi người dân đều là một chủ thể tham gia xây dựng và thụ hưởng.

fb yt zl tw