Việt Nam phát triển thành công phần mềm dịch ngôn ngữ hiếm khu vực Đông Nam Á

Viện Công nghệ thông tin - Viện Hàn lâm Khoa học và Công nghệ Việt Nam cho biết, các nhà khoa học đã thành công trong việc ứng dụng các kỹ thuật xử lý ngôn ngữ tự nhiên tiên tiến để xây dựng các mô hình dịch máy tự động có chất lượng cao cho các cặp ngôn ngữ như Việt - Lào, Việt - Khmer, Việt - Thái, Việt - Malaysia và Việt - Indonesia.

Dịch máy (hay còn gọi là dịch tự động) là việc dịch một văn bản từ một ngôn ngữ này (ngôn ngữ nguồn) sang một hoặc nhiều ngôn ngữ khác (ngôn ngữ đích) một cách tự động, không có sự can thiệp của con người trong quá trình dịch. Hiện nay có nhiều sản phẩm dịch tự động được sử dụng phổ biến như Google Translate, Bing Translator… với chất lượng dịch rất tốt cho các câu đơn. Tuy nhiên, các hệ thống dịch máy chất lượng cao này cần các bộ dữ liệu song ngữ quy mô lớn, lên tới hàng triệu cặp câu để huấn luyện mô hình.

Theo PGS.TS Nguyễn Trường Thắng - Viện trưởng Viện Công nghệ thông tin, Viện Hàn lâm KH&CN Việt Nam, hiện rất nhiều ngôn ngữ trên thế giới không có đủ tài nguyên như vậy. Việc xây dựng mô hình dịch máy hiệu quả cho những ngôn ngữ nghèo tài nguyên, trong đó có các ngôn ngữ của khu vực Đông Nam Á là công việc hết sức cấp thiết và gặp nhiều thách thức.

Cũng theo PGS.TS Nguyễn Trường Thắng, để khắc phục các tồn tại này, nhóm các nhà nghiên cứu tại Viện Công nghệ thông tin (CNTT) đã phát triển một hệ thống dịch thuật lấy tiếng Việt làm trung tâm, có khả năng dịch thuật hai chiều giữa tiếng Việt và các ngôn ngữ nghèo tài nguyên của khu vực Đông Nam Á với chất lượng tương đương với các sản phẩm thương mại nổi tiếng trên thế giới.

"Chúng tôi định hướng những ngôn ngữ hiếm như tiếng Lào, tiếng Khmer… và sau này là những ngôn ngữ của các dân tộc thiểu số của Việt Nam là tiếng Mường, tiếng Thái… Vì đây là những ngôn ngữ mà nước ngoài không bao giờ làm, và nếu họ có làm thì họ cũng không hiểu đặc thù ngôn ngữ của Việt Nam, mà hiện nay cũng đã có một số đối tác quan tâm. Chúng ta lựa chọn hướng đi là nội địa hóa, nhưng phù hợp với năng lực và hướng đi của chúng ta", PGS.TS Nguyễn Trường Thắng cho biết.

Tính đến thời điểm hiện tại, hệ thống đã có khả năng dịch hai chiều giữa các cặp ngôn ngữ bao gồm Việt - Lào, Việt - Khmer, Việt - Thái, Việt - Malaysia và Việt - Indonesia. Nhóm nghiên cứu cũng cho biết, hệ thống được nghiên cứu phát triển dựa trên các tiến bộ mới nhất hiện nay trên thế giới trong lĩnh vực xử lý ngôn ngữ tự nhiên nói chung và dịch máy nói riêng. Các ngôn ngữ như tiếng Lào, tiếng Thái và tiếng Khmer mang lại những thách thức rất lớn khi xây dựng mô hình dịch máy, không chỉ vì sự khan hiếm của dữ liệu song ngữ mà còn vì những ngôn ngữ này rất phong phú về mặt hình thái, thiếu sự phân tách từ, phân tách câu và tính đa nghĩa. Tuy nhiên, mô hình dịch máy của Viện CNTT đã học được cách thích ứng với tất cả những đặc điểm đặc biệt này.

PGS.TS Chu Hoàng Hà - Phó Chủ tịch Viện Hàn lâm KH&CN Việt Nam nói: "Chúng ta có thể tạo ra những phần mềm dịch thuật rất chính xác với những ngôn ngữ của các dân tộc ASEAN và cũng có thể là ngôn ngữ của các dân tộc Việt Nam nữa, từ đó giúp cho việc giao tiếp thuận lợi hơn. Đặc biệt với sự áp dụng của mô hình ngôn ngữ lớn thì giúp cho việc dịch thuật chính xác hơn nhiều, giúp cho các hoạt động trao đổi, giao tiếp, ngoại giao".

Các nhà khoa học cũng cho biết, hệ thống dịch máy có thể dễ dàng mở rộng sang các ngôn ngữ đích mới bao gồm các ngôn ngữ dân tộc thiểu số tại Việt Nam (thường là rất nghèo tài nguyên dữ liệu) như tiếng Mường, tiếng Thái,… và cả các ngôn ngữ nước ngoài phổ biến như tiếng Trung, tiếng Pháp, tiếng Nga khi cần. Đặc biệt, hệ thống có khả năng tinh chỉnh để thích ứng với các miền ngôn ngữ chuyên sâu như y tế, luật… theo yêu cầu riêng của đối tác.

Có thể bạn quan tâm

Tin cùng chuyên mục

Ưu tiên nguồn lực đầu tư cho y tế

Ưu tiên nguồn lực đầu tư cho y tế

Việc triển khai hiệu quả các chủ trương, chính sách của Đảng và Nhà nước đóng vai trò then chốt trong nâng cao chất lượng y tế cơ sở. Tại Lào Cai, Nghị quyết 72-NQ/TW ngày 9/9/2025 của Bộ Chính trị “Về một số giải pháp đột phá, tăng cường bảo vệ, chăm sóc và nâng cao sức khỏe Nhân dân” đã trở thành định hướng quan trọng nhằm củng cố mạng lưới y tế tuyến cơ sở, hướng tới mục tiêu phục vụ người dân toàn diện, kịp thời và bền vững.

Tỉnh Lào Cai tặng quà gia đình chính sách, hộ khó khăn tại xã Tú Lệ

Tỉnh Lào Cai tặng quà gia đình chính sách, hộ khó khăn tại xã Tú Lệ

Nhân kỷ niệm 51 năm Ngày Giải phóng miền Nam, thống nhất đất nước (30/4/1975 - 30/4/2026) và Ngày Quốc tế Lao động (01/5/1886 - 01/5/2026), sáng 29/4, đoàn công tác của tỉnh Lào Cai gồm Công an tỉnh, Sở Xây dựng, Sở Dân tộc và Tôn giáo, Bộ Chỉ huy Quân sự tỉnh đã thăm hỏi, tặng quà các gia đình người có công, hộ nghèo, công nhân, người lao động có hoàn cảnh đặc biệt khó khăn trên địa bàn xã Tú Lệ.

Hơn 20 năm cùng lan tỏa yêu thương

Hơn 20 năm cùng lan tỏa yêu thương

Hơn 20 năm qua, bà Nguyễn Thị Huệ - Chi hội trưởng Chi hội Chữ thập đỏ thôn Văn Yên, xã Mậu A, tỉnh Lào Cai luôn gắn bó với các hoạt động thiện nguyện, xem đó là niềm vui và lẽ sống của mình. Từ những việc làm đầy ý nghĩa, bà Huệ đã góp phần lan tỏa tinh thần nhân ái, sẻ chia đến nhiều hoàn cảnh khó khăn, giúp họ thêm nghị lực vươn lên trong cuộc sống.

Lào Cai ban hành Kế hoạch phát triển hệ sinh thái khởi nghiệp, đổi mới sáng tạo giai đoạn 2026 - 2030

Lào Cai ban hành Kế hoạch phát triển hệ sinh thái khởi nghiệp, đổi mới sáng tạo giai đoạn 2026 - 2030

Ngày 28/4, UBND tỉnh Lào Cai ban hành Kế hoạch phát triển hệ sinh thái khởi nghiệp, đổi mới sáng tạo giai đoạn 2026 - 2030, nhằm cụ thể hóa các chủ trương, chính sách lớn của Trung ương và của tỉnh về phát triển khoa học, công nghệ, đổi mới sáng tạo và kinh tế tư nhân.

Tăng tính thực tiễn trong giáo dục quốc phòng - an ninh

Tăng tính thực tiễn trong giáo dục quốc phòng - an ninh

Trong bối cảnh đổi mới giáo dục, việc chuyển từ truyền thụ kiến thức sang phát triển năng lực đã trở thành yêu cầu tất yếu. Với môn Giáo dục quốc phòng - an ninh, khi tăng cường thực hành, môn học không chỉ bớt khô khan mà còn trở nên sinh động, nâng cao hiệu quả học tập của học sinh.

Phòng, chống đuối nước cho trẻ em

Phòng, chống đuối nước cho trẻ em

Mặc dù chưa bước vào kỳ nghỉ hè, nhưng trên địa bàn tỉnh đã xảy ra một số vụ đuối nước mà nạn nhân chủ yếu là trẻ em. Để đảm bảo an toàn cho trẻ, bên cạnh các giải pháp, hành động từ chính quyền địa phương và cơ quan chức năng, vai trò quản lý của gia đình là yếu tố quan trọng.

Lào Cai: Nhiều hoạt động kỷ niệm 51 năm Ngày Giải phóng miền Nam, thống nhất đất nước (30/4/1975 - 30/4/2026)

Lào Cai: Nhiều hoạt động kỷ niệm 51 năm Ngày Giải phóng miền Nam, thống nhất đất nước (30/4/1975 - 30/4/2026)

Kỷ niệm 51 năm Ngày Giải phóng miền Nam, thống nhất đất nước (30/4/1975 - 30/4/2026), các địa phương trong tỉnh đã tổ chức nhiều hoạt động ý nghĩa, góp phần giáo dục truyền thống cách mạng, bồi đắp tinh thần yêu nước, lòng tự hào dân tộc cho cán bộ, hội viên, Nhân dân.

Bác sĩ thực hiện chụp nút mạch ung thư gan.

Bước tiến trong chẩn đoán hình ảnh và can thiệp điện quang

Trí tuệ nhân tạo (AI) đang từng bước trở thành một trong những thành tựu công nghệ có tác động sâu rộng trong lĩnh vực y học hiện đại, đặc biệt là trong chẩn đoán hình ảnh và can thiệp điện quang. Không chỉ dừng lại ở vai trò hỗ trợ, AI đang dần trở thành một “trợ thủ đắc lực” giúp nâng cao độ chính xác, rút ngắn thời gian chẩn đoán, tối ưu quy trình điều trị.

fb yt zl tw