Việt Nam phát triển thành công phần mềm dịch ngôn ngữ hiếm khu vực Đông Nam Á

Viện Công nghệ thông tin - Viện Hàn lâm Khoa học và Công nghệ Việt Nam cho biết, các nhà khoa học đã thành công trong việc ứng dụng các kỹ thuật xử lý ngôn ngữ tự nhiên tiên tiến để xây dựng các mô hình dịch máy tự động có chất lượng cao cho các cặp ngôn ngữ như Việt - Lào, Việt - Khmer, Việt - Thái, Việt - Malaysia và Việt - Indonesia.

Dịch máy (hay còn gọi là dịch tự động) là việc dịch một văn bản từ một ngôn ngữ này (ngôn ngữ nguồn) sang một hoặc nhiều ngôn ngữ khác (ngôn ngữ đích) một cách tự động, không có sự can thiệp của con người trong quá trình dịch. Hiện nay có nhiều sản phẩm dịch tự động được sử dụng phổ biến như Google Translate, Bing Translator… với chất lượng dịch rất tốt cho các câu đơn. Tuy nhiên, các hệ thống dịch máy chất lượng cao này cần các bộ dữ liệu song ngữ quy mô lớn, lên tới hàng triệu cặp câu để huấn luyện mô hình.

Theo PGS.TS Nguyễn Trường Thắng - Viện trưởng Viện Công nghệ thông tin, Viện Hàn lâm KH&CN Việt Nam, hiện rất nhiều ngôn ngữ trên thế giới không có đủ tài nguyên như vậy. Việc xây dựng mô hình dịch máy hiệu quả cho những ngôn ngữ nghèo tài nguyên, trong đó có các ngôn ngữ của khu vực Đông Nam Á là công việc hết sức cấp thiết và gặp nhiều thách thức.

Cũng theo PGS.TS Nguyễn Trường Thắng, để khắc phục các tồn tại này, nhóm các nhà nghiên cứu tại Viện Công nghệ thông tin (CNTT) đã phát triển một hệ thống dịch thuật lấy tiếng Việt làm trung tâm, có khả năng dịch thuật hai chiều giữa tiếng Việt và các ngôn ngữ nghèo tài nguyên của khu vực Đông Nam Á với chất lượng tương đương với các sản phẩm thương mại nổi tiếng trên thế giới.

"Chúng tôi định hướng những ngôn ngữ hiếm như tiếng Lào, tiếng Khmer… và sau này là những ngôn ngữ của các dân tộc thiểu số của Việt Nam là tiếng Mường, tiếng Thái… Vì đây là những ngôn ngữ mà nước ngoài không bao giờ làm, và nếu họ có làm thì họ cũng không hiểu đặc thù ngôn ngữ của Việt Nam, mà hiện nay cũng đã có một số đối tác quan tâm. Chúng ta lựa chọn hướng đi là nội địa hóa, nhưng phù hợp với năng lực và hướng đi của chúng ta", PGS.TS Nguyễn Trường Thắng cho biết.

Tính đến thời điểm hiện tại, hệ thống đã có khả năng dịch hai chiều giữa các cặp ngôn ngữ bao gồm Việt - Lào, Việt - Khmer, Việt - Thái, Việt - Malaysia và Việt - Indonesia. Nhóm nghiên cứu cũng cho biết, hệ thống được nghiên cứu phát triển dựa trên các tiến bộ mới nhất hiện nay trên thế giới trong lĩnh vực xử lý ngôn ngữ tự nhiên nói chung và dịch máy nói riêng. Các ngôn ngữ như tiếng Lào, tiếng Thái và tiếng Khmer mang lại những thách thức rất lớn khi xây dựng mô hình dịch máy, không chỉ vì sự khan hiếm của dữ liệu song ngữ mà còn vì những ngôn ngữ này rất phong phú về mặt hình thái, thiếu sự phân tách từ, phân tách câu và tính đa nghĩa. Tuy nhiên, mô hình dịch máy của Viện CNTT đã học được cách thích ứng với tất cả những đặc điểm đặc biệt này.

PGS.TS Chu Hoàng Hà - Phó Chủ tịch Viện Hàn lâm KH&CN Việt Nam nói: "Chúng ta có thể tạo ra những phần mềm dịch thuật rất chính xác với những ngôn ngữ của các dân tộc ASEAN và cũng có thể là ngôn ngữ của các dân tộc Việt Nam nữa, từ đó giúp cho việc giao tiếp thuận lợi hơn. Đặc biệt với sự áp dụng của mô hình ngôn ngữ lớn thì giúp cho việc dịch thuật chính xác hơn nhiều, giúp cho các hoạt động trao đổi, giao tiếp, ngoại giao".

Các nhà khoa học cũng cho biết, hệ thống dịch máy có thể dễ dàng mở rộng sang các ngôn ngữ đích mới bao gồm các ngôn ngữ dân tộc thiểu số tại Việt Nam (thường là rất nghèo tài nguyên dữ liệu) như tiếng Mường, tiếng Thái,… và cả các ngôn ngữ nước ngoài phổ biến như tiếng Trung, tiếng Pháp, tiếng Nga khi cần. Đặc biệt, hệ thống có khả năng tinh chỉnh để thích ứng với các miền ngôn ngữ chuyên sâu như y tế, luật… theo yêu cầu riêng của đối tác.

Có thể bạn quan tâm

Tin cùng chuyên mục

Vườn ươm của những mầm xanh

Vườn ươm của những mầm xanh

Những ngày cận Tết, không khí trong khuôn viên Trường Mầm non số 1 Văn Bàn (trước đây là Trường Mầm non Hoa Hồng) trở nên nhộn nhịp hơn thường ngày. Trên sân thượng khu nhà bếp và khu vườn phía sau trường, các thùng xốp trồng rau được sắp xếp gọn gàng. Dưới sự hướng dẫn của giáo viên, các em nhỏ tham gia chăm sóc, thu hoạch rau xanh - thành quả của cô và trò sau nhiều tuần gieo trồng, chăm sóc.

Chủ động phòng, chống bệnh do vi-rút Nipah tại Cửa khẩu Quốc tế Lào Cai

Chủ động phòng, chống bệnh do vi-rút Nipah tại Cửa khẩu Quốc tế Lào Cai

Trước diễn biến phức tạp của dịch bệnh truyền nhiễm, công tác phòng, chống dịch từ tuyến đầu biên giới được xác định là nhiệm vụ trọng tâm. Tại Cửa khẩu Quốc tế Lào Cai - một trong những cửa ngõ giao thương, xuất nhập cảnh lớn ở khu vực phía Bắc, các lực lượng chức năng đang triển khai đồng bộ, quyết liệt các biện pháp phòng, chống bệnh do vi-rút Nipah, nhằm bảo vệ sức khỏe cộng đồng và bảo đảm an toàn dịch tễ khu vực cửa khẩu.

Gian hàng 0 đồng - Lan tỏa yêu thương

Gian hàng 0 đồng - Lan tỏa yêu thương

Chiều 27/1, Chi hội Phụ nữ Công an phường Nam Cường tổ chức chương trình “Gian hàng 0 đồng - Lan tỏa yêu thương” nhằm hỗ trợ các gia đình có hoàn cảnh khó khăn trên địa bàn phường nhân dịp Tết Nguyên đán Bính Ngọ 2026.

Bảo tàng tỉnh Lào Cai sẵn sàng đón khách dịp Xuân Bính Ngọ 2026

Bảo tàng tỉnh Lào Cai sẵn sàng đón khách dịp Xuân Bính Ngọ 2026

Dịp Tết Nguyên đán Bính Ngọ 2026, Bảo tàng tỉnh Lào Cai được xác định là điểm nhấn trong chuỗi hoạt động chào đón năm mới của tỉnh. Những ngày này, tập thể cán bộ, viên chức Bảo tàng đang khẩn trương hoàn thiện cơ sở vật chất, nội dung trưng bày và phương án tổ chức, sẵn sàng phục vụ nhu cầu tham quan, trải nghiệm văn hóa của Nhân dân và du khách.

Tăng cường giám sát phòng, chống bệnh do vi-rút Nipah

Tăng cường giám sát phòng, chống bệnh do vi-rút Nipah

Để chủ động phòng, chống kiểm soát và ngăn ngừa nguy cơ bệnh do vi-rút Nipah gây ra trên địa bàn tỉnh Lào Cai, ngày 27/1/2026, Sở Y tế đã ban hành Văn bản số 423/SYT-NVY về việc tăng cường giám sát công tác phòng, chống bệnh do vi-rút Nipah.

Xây dựng tổ dân phố văn hóa ở Nam Cường: Cách làm thực chất ở cơ sở

Xây dựng tổ dân phố văn hóa ở Nam Cường: Cách làm thực chất ở cơ sở

Thay vì triển khai theo lối dàn trải, hình thức, phường Nam Cường đã lựa chọn cách tiếp cận thực chất trong xây dựng tổ dân phố văn hóa: lấy khu dân cư làm trung tâm, lấy sự đồng thuận của Nhân dân làm nền tảng và lấy hiệu quả thực tế làm thước đo. Từ chủ trương đúng đến cách làm phù hợp, phong trào đã từng bước đi vào chiều sâu, tạo chuyển biến rõ nét trong đời sống đô thị.

Gặp mặt, trao quà cho người có công nhân dịp Tết Nguyên đán

Gặp mặt, trao quà cho người có công nhân dịp Tết Nguyên đán

Ngày 27/1, Hội Hỗ trợ gia đình liệt sĩ tỉnh Lào Cai phối hợp với UBND phường Yên Bái và các đơn vị tài trợ tổ chức gặp mặt, trao quà Tết cho thương binh, bệnh binh, người phơi nhiễm chất độc da cam và người có công với cách mạng trên địa bàn tỉnh nhân dịp Tết Nguyên đán Bính Ngọ 2026.

Người tốt, việc thiện lan tỏa lòng nhân ái

Người tốt, việc thiện lan tỏa lòng nhân ái

Thời gian qua, Hội Chữ thập đỏ tỉnh đã triển khai thực hiện hiệu quả phong trào “Người tốt, việc thiện - Chung sức xây dựng cộng đồng nhân ái”, qua đó, giúp lan tỏa lòng nhân ái, cổ vũ hành động tử tế, góp phần xây dựng nếp sống văn hóa, đề cao giá trị nhân đạo trong cộng đồng.

Chương trình được triển khai tại 16 xã trên địa bàn tỉnh.

Hội Chữ thập đỏ tỉnh và Quỹ Thiện Tâm trao 8.600 suất quà Tết cho người nghèo tại Lào Cai

Thực hiện chương trình an sinh xã hội dịp Tết Nguyên đán Bính Ngọ năm 2026, Hội Chữ thập đỏ tỉnh Lào Cai phối hợp với Quỹ Thiện Tâm (Tập đoàn Vingroup) tổ chức các chương trình trao quà Tết cho hộ nghèo, hộ có hoàn cảnh đặc biệt khó khăn, với tổng số 8.600 suất quà Tết, trị giá hơn 5,16 tỷ đồng trên địa bàn tỉnh Lào Cai.

Dịch vụ làm đẹp "hút" khách dịp Tết

Dịch vụ làm đẹp "hút" khách dịp Tết

Tết Nguyên đán Bính Ngọ 2026 đang đến gần. Bên cạnh việc mua sắm, trang hoàng nhà cửa, nhiều chị em đã lựa chọn các dịch vụ làm đẹp với mong muốn có diện mạo rạng rỡ, tự tin vui Xuân, đón Tết. Những ngày này, tại các cửa tiệm làm đẹp, không khí luôn nhộn nhịp, khách hàng ra vào tấp nập từ sáng sớm cho đến tối muộn.

fb yt zl tw