Việt Nam phát triển thành công phần mềm dịch ngôn ngữ hiếm khu vực Đông Nam Á

Viện Công nghệ thông tin - Viện Hàn lâm Khoa học và Công nghệ Việt Nam cho biết, các nhà khoa học đã thành công trong việc ứng dụng các kỹ thuật xử lý ngôn ngữ tự nhiên tiên tiến để xây dựng các mô hình dịch máy tự động có chất lượng cao cho các cặp ngôn ngữ như Việt - Lào, Việt - Khmer, Việt - Thái, Việt - Malaysia và Việt - Indonesia.

Dịch máy (hay còn gọi là dịch tự động) là việc dịch một văn bản từ một ngôn ngữ này (ngôn ngữ nguồn) sang một hoặc nhiều ngôn ngữ khác (ngôn ngữ đích) một cách tự động, không có sự can thiệp của con người trong quá trình dịch. Hiện nay có nhiều sản phẩm dịch tự động được sử dụng phổ biến như Google Translate, Bing Translator… với chất lượng dịch rất tốt cho các câu đơn. Tuy nhiên, các hệ thống dịch máy chất lượng cao này cần các bộ dữ liệu song ngữ quy mô lớn, lên tới hàng triệu cặp câu để huấn luyện mô hình.

Theo PGS.TS Nguyễn Trường Thắng - Viện trưởng Viện Công nghệ thông tin, Viện Hàn lâm KH&CN Việt Nam, hiện rất nhiều ngôn ngữ trên thế giới không có đủ tài nguyên như vậy. Việc xây dựng mô hình dịch máy hiệu quả cho những ngôn ngữ nghèo tài nguyên, trong đó có các ngôn ngữ của khu vực Đông Nam Á là công việc hết sức cấp thiết và gặp nhiều thách thức.

Cũng theo PGS.TS Nguyễn Trường Thắng, để khắc phục các tồn tại này, nhóm các nhà nghiên cứu tại Viện Công nghệ thông tin (CNTT) đã phát triển một hệ thống dịch thuật lấy tiếng Việt làm trung tâm, có khả năng dịch thuật hai chiều giữa tiếng Việt và các ngôn ngữ nghèo tài nguyên của khu vực Đông Nam Á với chất lượng tương đương với các sản phẩm thương mại nổi tiếng trên thế giới.

"Chúng tôi định hướng những ngôn ngữ hiếm như tiếng Lào, tiếng Khmer… và sau này là những ngôn ngữ của các dân tộc thiểu số của Việt Nam là tiếng Mường, tiếng Thái… Vì đây là những ngôn ngữ mà nước ngoài không bao giờ làm, và nếu họ có làm thì họ cũng không hiểu đặc thù ngôn ngữ của Việt Nam, mà hiện nay cũng đã có một số đối tác quan tâm. Chúng ta lựa chọn hướng đi là nội địa hóa, nhưng phù hợp với năng lực và hướng đi của chúng ta", PGS.TS Nguyễn Trường Thắng cho biết.

Tính đến thời điểm hiện tại, hệ thống đã có khả năng dịch hai chiều giữa các cặp ngôn ngữ bao gồm Việt - Lào, Việt - Khmer, Việt - Thái, Việt - Malaysia và Việt - Indonesia. Nhóm nghiên cứu cũng cho biết, hệ thống được nghiên cứu phát triển dựa trên các tiến bộ mới nhất hiện nay trên thế giới trong lĩnh vực xử lý ngôn ngữ tự nhiên nói chung và dịch máy nói riêng. Các ngôn ngữ như tiếng Lào, tiếng Thái và tiếng Khmer mang lại những thách thức rất lớn khi xây dựng mô hình dịch máy, không chỉ vì sự khan hiếm của dữ liệu song ngữ mà còn vì những ngôn ngữ này rất phong phú về mặt hình thái, thiếu sự phân tách từ, phân tách câu và tính đa nghĩa. Tuy nhiên, mô hình dịch máy của Viện CNTT đã học được cách thích ứng với tất cả những đặc điểm đặc biệt này.

PGS.TS Chu Hoàng Hà - Phó Chủ tịch Viện Hàn lâm KH&CN Việt Nam nói: "Chúng ta có thể tạo ra những phần mềm dịch thuật rất chính xác với những ngôn ngữ của các dân tộc ASEAN và cũng có thể là ngôn ngữ của các dân tộc Việt Nam nữa, từ đó giúp cho việc giao tiếp thuận lợi hơn. Đặc biệt với sự áp dụng của mô hình ngôn ngữ lớn thì giúp cho việc dịch thuật chính xác hơn nhiều, giúp cho các hoạt động trao đổi, giao tiếp, ngoại giao".

Các nhà khoa học cũng cho biết, hệ thống dịch máy có thể dễ dàng mở rộng sang các ngôn ngữ đích mới bao gồm các ngôn ngữ dân tộc thiểu số tại Việt Nam (thường là rất nghèo tài nguyên dữ liệu) như tiếng Mường, tiếng Thái,… và cả các ngôn ngữ nước ngoài phổ biến như tiếng Trung, tiếng Pháp, tiếng Nga khi cần. Đặc biệt, hệ thống có khả năng tinh chỉnh để thích ứng với các miền ngôn ngữ chuyên sâu như y tế, luật… theo yêu cầu riêng của đối tác.

Có thể bạn quan tâm

Tin cùng chuyên mục

Người cao tuổi Púng Luông phát huy vai trò gương mẫu

Người cao tuổi Púng Luông phát huy vai trò gương mẫu

Những năm qua, người cao tuổi xã Púng Luông đã phát huy vai trò “tuổi cao - gương sáng”, không chỉ là chỗ dựa tinh thần trong mỗi gia đình, mà còn tích cực tham gia phát triển kinh tế, xây dựng nông thôn mới, giữ gìn bản sắc văn hóa và đảm bảo an ninh, trật tự ở cơ sở.

Đồng Ruộng đón Tết

Đồng Ruộng đón Tết

Những ngày cuối năm, đồng bào người Mông thôn Đồng Ruộng, xã Quy Mông tranh thủ dọn nhà, chuẩn bị lương thực, thực phẩm, quần áo mới… để đón Tết cổ truyền 2026.

Bộ Y tế cảnh báo khẩn về sữa công thức Aptamil đang bị thu hồi vì nhiễm độc tố

Bộ Y tế cảnh báo khẩn về sữa công thức Aptamil đang bị thu hồi vì nhiễm độc tố

Tối 25/1, Cục An toàn thực phẩm (Bộ Y tế) có văn bản gửi Sở Y tế các tỉnh, thành phố về việc cảnh báo sản phẩm sữa công thức Aptamil Infant Formula 800g do có nguy cơ nhiễm cereulide, một loại độc tố do vi khuẩn Bacillus cereus sinh ra, có thể gây ảnh hưởng nghiêm trọng đến sức khỏe trẻ nhỏ.

Trò chuyện cùng "hai giải Nhất" quốc gia THPT của Lào Cai

Trò chuyện cùng "hai giải Nhất" quốc gia THPT của Lào Cai

Kỳ thi học sinh giỏi quốc gia THPT năm học 2025 - 2026 khép lại với những con số ấn tượng: tỉnh Lào Cai xếp thứ 8 toàn quốc, giành tổng cộng 134 giải ở tất cả các môn thi. Trong bảng thành tích ấy, hai giải Nhất quốc gia ở môn Ngữ văn và Địa lý nổi bật như những điểm sáng đặc biệt. Cả hai giải Nhất đều thuộc về học sinh của Trường THPT Chuyên Nguyễn Tất Thành - ngôi trường nhiều năm liền là một trong những “cái nôi” đào tạo học sinh mũi nhọn của tỉnh. 

Cảnh báo rủi ro từ các dịch vụ làm đẹp cấp tốc dịp Tết

Cảnh báo rủi ro từ các dịch vụ làm đẹp cấp tốc dịp Tết

Thời điểm cận Tết Nguyên đán, nhu cầu làm đẹp gia tăng kéo theo số ca tai biến thẩm mỹ cũng tăng. Tâm lý nôn nóng muốn “đẹp nhanh” khiến không ít người lựa chọn các cơ sở thẩm mỹ không được cấp phép, sử dụng sản phẩm kém chất lượng, dẫn đến nhiều trường hợp biến chứng nặng, phải nhập viện điều trị.

Tuyển sinh đại học 2026: Chọn lọc kỳ thi riêng

Tuyển sinh đại học 2026: Chọn lọc kỳ thi riêng

Trong bối cảnh tuyển sinh đại học năm 2026 ở Việt Nam có nhiều thay đổi lớn, một trong những điểm đáng chú ý là sự mở rộng mạnh mẽ của các kỳ thi riêng do nhiều trường đại học tổ chức và ngày càng nhiều trường sử dụng kết quả của các kỳ thi này để xét tuyển đầu vào. Điều này không chỉ tạo thêm lựa chọn cho thí sinh mà còn thay đổi cách thức tuyển chọn, đánh giá năng lực thực tế của người học.

Gieo mầm văn hóa cho trẻ thơ

Gieo mầm văn hóa cho trẻ thơ

Bằng việc đưa nghề truyền thống của các dân tộc tại địa phương vào tiết học trải nghiệm, Trường Mầm non Hợp Thành (xã Hợp Thành) đã góp phần đổi mới phương pháp giáo dục mầm non, khơi dậy hứng thú học tập cho trẻ, đồng thời gieo mầm tình yêu văn hóa, ý thức trân trọng lao động và gìn giữ bản sắc địa phương ngay từ những năm đầu đời.

Giáo dục Lào Cai viết tiếp trang mới trong kỷ nguyên vươn mình

Giáo dục Lào Cai viết tiếp trang mới trong kỷ nguyên vươn mình

Đại hội đại biểu toàn quốc lần thứ XIV của Đảng thành công rất tốt đẹp. Những định hướng lớn được Đại hội xác định đang mở ra kỳ vọng về sự chuyển biến mạnh mẽ trong thực tiễn. Với ngành Giáo dục và Đào tạo tỉnh Lào Cai, nhiệm vụ được đặt ra tại Đại hội: "Xây dựng nền giáo dục quốc dân hiện đại, ngang tầm khu vực và thế giới" là định hướng để ngành tự tin viết tiếp những trang mới trong kỷ nguyên vươn mình.

Sôi nổi phong trào trồng cây, trồng hoa ở Đông Cuông

Sôi nổi phong trào trồng cây, trồng hoa ở Đông Cuông

Trong không khí rộn ràng chuẩn bị đón Tết Nguyên đán Bính Ngọ 2026, phong trào “Đất trống bừng sắc hoa – Đông Cuông khoe sắc thắm” đã và đang tạo nên điểm nhấn rõ nét trong chỉnh trang cảnh quan nông thôn ở xã Đông Cuông, tỉnh Lào Cai. 

Sôi nổi hội trại “Đông san sẻ – Tết sum vầy 2026”

Sôi nổi hội trại “Đông san sẻ – Tết sum vầy 2026”

Trong 2 ngày (24 - 25/1), Trường THPT Chuyên Nguyễn Tất Thành, phường Yên Bái, tỉnh Lào Cai đã tổ chức hội trại STEM với chủ đề “Đông san sẻ – Tết sum vầy 2026”, mang đến không gian trải nghiệm sáng tạo giàu bản sắc, lan tỏa tinh thần sẻ chia vì cộng đồng.

Xã Dương Quỳ mở rộng đường giao thông nông thôn

Xã Dương Quỳ mở rộng đường giao thông nông thôn

Chào mừng thành công Đại hội đại biểu toàn quốc lần thứ XIV của Đảng, Đảng ủy, HĐND, UBND, Ủy ban Mặt trận Tổ quốc Việt Nam xã Dương Quỳ đã tổ chức lễ phát động ra quân phong trào “Toàn dân tham gia xây dựng đường giao thông nông thôn” năm 2026 tại thôn Bản Bô.

fb yt zl tw