Việt Nam phát triển thành công phần mềm dịch ngôn ngữ hiếm khu vực Đông Nam Á

Viện Công nghệ thông tin - Viện Hàn lâm Khoa học và Công nghệ Việt Nam cho biết, các nhà khoa học đã thành công trong việc ứng dụng các kỹ thuật xử lý ngôn ngữ tự nhiên tiên tiến để xây dựng các mô hình dịch máy tự động có chất lượng cao cho các cặp ngôn ngữ như Việt - Lào, Việt - Khmer, Việt - Thái, Việt - Malaysia và Việt - Indonesia.

Dịch máy (hay còn gọi là dịch tự động) là việc dịch một văn bản từ một ngôn ngữ này (ngôn ngữ nguồn) sang một hoặc nhiều ngôn ngữ khác (ngôn ngữ đích) một cách tự động, không có sự can thiệp của con người trong quá trình dịch. Hiện nay có nhiều sản phẩm dịch tự động được sử dụng phổ biến như Google Translate, Bing Translator… với chất lượng dịch rất tốt cho các câu đơn. Tuy nhiên, các hệ thống dịch máy chất lượng cao này cần các bộ dữ liệu song ngữ quy mô lớn, lên tới hàng triệu cặp câu để huấn luyện mô hình.

Theo PGS.TS Nguyễn Trường Thắng - Viện trưởng Viện Công nghệ thông tin, Viện Hàn lâm KH&CN Việt Nam, hiện rất nhiều ngôn ngữ trên thế giới không có đủ tài nguyên như vậy. Việc xây dựng mô hình dịch máy hiệu quả cho những ngôn ngữ nghèo tài nguyên, trong đó có các ngôn ngữ của khu vực Đông Nam Á là công việc hết sức cấp thiết và gặp nhiều thách thức.

Cũng theo PGS.TS Nguyễn Trường Thắng, để khắc phục các tồn tại này, nhóm các nhà nghiên cứu tại Viện Công nghệ thông tin (CNTT) đã phát triển một hệ thống dịch thuật lấy tiếng Việt làm trung tâm, có khả năng dịch thuật hai chiều giữa tiếng Việt và các ngôn ngữ nghèo tài nguyên của khu vực Đông Nam Á với chất lượng tương đương với các sản phẩm thương mại nổi tiếng trên thế giới.

"Chúng tôi định hướng những ngôn ngữ hiếm như tiếng Lào, tiếng Khmer… và sau này là những ngôn ngữ của các dân tộc thiểu số của Việt Nam là tiếng Mường, tiếng Thái… Vì đây là những ngôn ngữ mà nước ngoài không bao giờ làm, và nếu họ có làm thì họ cũng không hiểu đặc thù ngôn ngữ của Việt Nam, mà hiện nay cũng đã có một số đối tác quan tâm. Chúng ta lựa chọn hướng đi là nội địa hóa, nhưng phù hợp với năng lực và hướng đi của chúng ta", PGS.TS Nguyễn Trường Thắng cho biết.

Tính đến thời điểm hiện tại, hệ thống đã có khả năng dịch hai chiều giữa các cặp ngôn ngữ bao gồm Việt - Lào, Việt - Khmer, Việt - Thái, Việt - Malaysia và Việt - Indonesia. Nhóm nghiên cứu cũng cho biết, hệ thống được nghiên cứu phát triển dựa trên các tiến bộ mới nhất hiện nay trên thế giới trong lĩnh vực xử lý ngôn ngữ tự nhiên nói chung và dịch máy nói riêng. Các ngôn ngữ như tiếng Lào, tiếng Thái và tiếng Khmer mang lại những thách thức rất lớn khi xây dựng mô hình dịch máy, không chỉ vì sự khan hiếm của dữ liệu song ngữ mà còn vì những ngôn ngữ này rất phong phú về mặt hình thái, thiếu sự phân tách từ, phân tách câu và tính đa nghĩa. Tuy nhiên, mô hình dịch máy của Viện CNTT đã học được cách thích ứng với tất cả những đặc điểm đặc biệt này.

PGS.TS Chu Hoàng Hà - Phó Chủ tịch Viện Hàn lâm KH&CN Việt Nam nói: "Chúng ta có thể tạo ra những phần mềm dịch thuật rất chính xác với những ngôn ngữ của các dân tộc ASEAN và cũng có thể là ngôn ngữ của các dân tộc Việt Nam nữa, từ đó giúp cho việc giao tiếp thuận lợi hơn. Đặc biệt với sự áp dụng của mô hình ngôn ngữ lớn thì giúp cho việc dịch thuật chính xác hơn nhiều, giúp cho các hoạt động trao đổi, giao tiếp, ngoại giao".

Các nhà khoa học cũng cho biết, hệ thống dịch máy có thể dễ dàng mở rộng sang các ngôn ngữ đích mới bao gồm các ngôn ngữ dân tộc thiểu số tại Việt Nam (thường là rất nghèo tài nguyên dữ liệu) như tiếng Mường, tiếng Thái,… và cả các ngôn ngữ nước ngoài phổ biến như tiếng Trung, tiếng Pháp, tiếng Nga khi cần. Đặc biệt, hệ thống có khả năng tinh chỉnh để thích ứng với các miền ngôn ngữ chuyên sâu như y tế, luật… theo yêu cầu riêng của đối tác.

Có thể bạn quan tâm

Tin cùng chuyên mục

Quan tâm phát triển tổ chức công đoàn trong doanh nghiệp

Quan tâm phát triển tổ chức công đoàn trong doanh nghiệp

Việc tập trung nguồn lực rà soát, xây dựng phương án phát triển đoàn viên, thành lập công đoàn cơ sở tại các doanh nghiệp không chỉ là nhiệm vụ quan trọng của Liên đoàn Lao động tỉnh trong năm 2026, mà còn là bước đi chiến lược nhằm hiện thực hóa mục tiêu dài hạn của Công đoàn Việt Nam đến năm 2030 và 2045.

“Mái nhà Quang Trung” - mang bình yên trở lại

“Mái nhà Quang Trung” - mang bình yên trở lại

Chỉ vài tháng trước, xã Dương Quỳ còn ngổn ngang đất đá sau mưa lũ, nhiều ngôi nhà bị cuốn trôi, những sườn đồi sạt lở khiến cuộc sống người dân đảo lộn. Thế nhưng hôm nay, trên mảnh đất từng oằn mình trong thiên tai ấy, hơn 30 “mái nhà Quang Trung” đã được dựng lên. Trong những ngôi nhà mới, niềm vui và hy vọng đang dần trở lại với người dân vùng lũ.

Giải bài toán thiếu hụt lao động tại các khu công nghiệp

Giải bài toán thiếu hụt lao động tại các khu công nghiệp

Tỉnh Lào Cai đang bước vào giai đoạn tăng tốc công nghiệp hóa với quy hoạch mở rộng hàng chục khu, cụm công nghiệp. Trong khi hạ tầng sẵn sàng đón nhà đầu tư, các doanh nghiệp lại loay hoay trong bài toán thiếu hụt nhân lực. Để đạt mục tiêu tăng trưởng hai con số, việc khơi thông "nút thắt" lao động không chỉ là trách nhiệm của doanh nghiệp mà cần sự vào cuộc đồng bộ của cả hệ thống chính trị.

Tân Hợp: Đồng thuận cao từ phát huy dân chủ ở cơ sở

Tân Hợp: Đồng thuận cao từ phát huy dân chủ ở cơ sở

Xác định thực hiện dân chủ ở cơ sở là giải pháp căn cơ nhằm nâng cao hiệu lực, hiệu quả quản lý nhà nước, củng cố niềm tin của Nhân dân và tạo động lực phát triển bền vững, ngay sau khi thành lập, Đảng ủy, chính quyền xã Tân Hợp đã triển khai đồng bộ nhiều giải pháp.

Hướng tới nền hành chính hiện đại

Hướng tới nền hành chính hiện đại

Sau hơn 3 tháng triển khai thực hiện 100% thủ tục hành chính không phụ thuộc vào địa giới hành chính, Lào Cai đang ghi nhận những chuyển biến rõ nét trong cải cách hành chính. Việc kết nối, liên thông dữ liệu và đồng bộ hệ thống giải quyết thủ tục hành chính không chỉ giúp người dân, doanh nghiệp tiết kiệm thời gian, chi phí, mà còn mở ra cách tiếp cận mới: lấy người dân làm trung tâm phục vụ, hướng tới nền hành chính hiện đại, minh bạch.

Anh Phạm Duy Quyết cùng con trai tham gia hiến máu

Nghĩa cử cao đẹp của Phạm Duy Quyết

Anh Phạm Duy Quyết ở khu Cổ Phúc 3, xã Trấn Yên, tỉnh Lào Cai đã hơn chục lần tham gia hiến máu tình nguyện. Hiện tại, anh vẫn luôn duy trì cuộc sống lành mạnh, luyện tập thể dục mong có nhiều sức khỏe để hiến máu thêm nhiều lần nữa.

Ước vọng từ ngôi trường vùng biên Si Ma Cai

Ước vọng từ ngôi trường vùng biên Si Ma Cai

Việc xây dựng trường nội trú liên cấp tiểu học và trung học cơ sở tại các xã biên giới, đã thực sự mang đến “luồng gió mới”, khơi dậy niềm tin và kỳ vọng về tương lai giáo dục khởi sắc hơn trên vùng đất khó Si Ma Cai.

fb yt zl tw