Việt Nam phát triển thành công phần mềm dịch ngôn ngữ hiếm khu vực Đông Nam Á

Viện Công nghệ thông tin - Viện Hàn lâm Khoa học và Công nghệ Việt Nam cho biết, các nhà khoa học đã thành công trong việc ứng dụng các kỹ thuật xử lý ngôn ngữ tự nhiên tiên tiến để xây dựng các mô hình dịch máy tự động có chất lượng cao cho các cặp ngôn ngữ như Việt - Lào, Việt - Khmer, Việt - Thái, Việt - Malaysia và Việt - Indonesia.

Dịch máy (hay còn gọi là dịch tự động) là việc dịch một văn bản từ một ngôn ngữ này (ngôn ngữ nguồn) sang một hoặc nhiều ngôn ngữ khác (ngôn ngữ đích) một cách tự động, không có sự can thiệp của con người trong quá trình dịch. Hiện nay có nhiều sản phẩm dịch tự động được sử dụng phổ biến như Google Translate, Bing Translator… với chất lượng dịch rất tốt cho các câu đơn. Tuy nhiên, các hệ thống dịch máy chất lượng cao này cần các bộ dữ liệu song ngữ quy mô lớn, lên tới hàng triệu cặp câu để huấn luyện mô hình.

Theo PGS.TS Nguyễn Trường Thắng - Viện trưởng Viện Công nghệ thông tin, Viện Hàn lâm KH&CN Việt Nam, hiện rất nhiều ngôn ngữ trên thế giới không có đủ tài nguyên như vậy. Việc xây dựng mô hình dịch máy hiệu quả cho những ngôn ngữ nghèo tài nguyên, trong đó có các ngôn ngữ của khu vực Đông Nam Á là công việc hết sức cấp thiết và gặp nhiều thách thức.

Cũng theo PGS.TS Nguyễn Trường Thắng, để khắc phục các tồn tại này, nhóm các nhà nghiên cứu tại Viện Công nghệ thông tin (CNTT) đã phát triển một hệ thống dịch thuật lấy tiếng Việt làm trung tâm, có khả năng dịch thuật hai chiều giữa tiếng Việt và các ngôn ngữ nghèo tài nguyên của khu vực Đông Nam Á với chất lượng tương đương với các sản phẩm thương mại nổi tiếng trên thế giới.

"Chúng tôi định hướng những ngôn ngữ hiếm như tiếng Lào, tiếng Khmer… và sau này là những ngôn ngữ của các dân tộc thiểu số của Việt Nam là tiếng Mường, tiếng Thái… Vì đây là những ngôn ngữ mà nước ngoài không bao giờ làm, và nếu họ có làm thì họ cũng không hiểu đặc thù ngôn ngữ của Việt Nam, mà hiện nay cũng đã có một số đối tác quan tâm. Chúng ta lựa chọn hướng đi là nội địa hóa, nhưng phù hợp với năng lực và hướng đi của chúng ta", PGS.TS Nguyễn Trường Thắng cho biết.

Tính đến thời điểm hiện tại, hệ thống đã có khả năng dịch hai chiều giữa các cặp ngôn ngữ bao gồm Việt - Lào, Việt - Khmer, Việt - Thái, Việt - Malaysia và Việt - Indonesia. Nhóm nghiên cứu cũng cho biết, hệ thống được nghiên cứu phát triển dựa trên các tiến bộ mới nhất hiện nay trên thế giới trong lĩnh vực xử lý ngôn ngữ tự nhiên nói chung và dịch máy nói riêng. Các ngôn ngữ như tiếng Lào, tiếng Thái và tiếng Khmer mang lại những thách thức rất lớn khi xây dựng mô hình dịch máy, không chỉ vì sự khan hiếm của dữ liệu song ngữ mà còn vì những ngôn ngữ này rất phong phú về mặt hình thái, thiếu sự phân tách từ, phân tách câu và tính đa nghĩa. Tuy nhiên, mô hình dịch máy của Viện CNTT đã học được cách thích ứng với tất cả những đặc điểm đặc biệt này.

PGS.TS Chu Hoàng Hà - Phó Chủ tịch Viện Hàn lâm KH&CN Việt Nam nói: "Chúng ta có thể tạo ra những phần mềm dịch thuật rất chính xác với những ngôn ngữ của các dân tộc ASEAN và cũng có thể là ngôn ngữ của các dân tộc Việt Nam nữa, từ đó giúp cho việc giao tiếp thuận lợi hơn. Đặc biệt với sự áp dụng của mô hình ngôn ngữ lớn thì giúp cho việc dịch thuật chính xác hơn nhiều, giúp cho các hoạt động trao đổi, giao tiếp, ngoại giao".

Các nhà khoa học cũng cho biết, hệ thống dịch máy có thể dễ dàng mở rộng sang các ngôn ngữ đích mới bao gồm các ngôn ngữ dân tộc thiểu số tại Việt Nam (thường là rất nghèo tài nguyên dữ liệu) như tiếng Mường, tiếng Thái,… và cả các ngôn ngữ nước ngoài phổ biến như tiếng Trung, tiếng Pháp, tiếng Nga khi cần. Đặc biệt, hệ thống có khả năng tinh chỉnh để thích ứng với các miền ngôn ngữ chuyên sâu như y tế, luật… theo yêu cầu riêng của đối tác.

Có thể bạn quan tâm

Tin cùng chuyên mục

Lào Cai sắp xếp, sáp nhập các cơ sở y tế khu vực

Lào Cai sắp xếp, sáp nhập các cơ sở y tế khu vực

Thực hiện chủ trương kiện toàn tổ chức bộ máy, nâng cao hiệu quả hoạt động của hệ thống y tế, tỉnh Lào Cai triển khai việc sáp nhập một số bệnh viện đa khoa khu vực với trung tâm y tế cùng địa bàn, hình thành các Trung tâm Y tế khu vực trực thuộc Sở Y tế tỉnh kể từ ngày 1/1/2026

Khoảnh khắc chào đón "công dân 2026" đầu tiên của Việt Nam

Khoảnh khắc chào đón "công dân 2026" đầu tiên của Việt Nam

Đúng 0h05p ngày 1/1/2026 tại Bệnh viện Phụ sản Hà Nội, tiếng khóc chào đời của bé trai nặng 2,5kg vang lên trong niềm xúc động đặc biệt của gia đình và đội ngũ y bác sĩ. Bé được đặt tên là Cao Xuân Phúc, như một dấu mốc thiêng liêng, gửi gắm hy vọng, khởi đầu mới trong khoảnh khắc đất trời chuyển giao.

Vì sức khỏe cộng đồng

Vì sức khỏe cộng đồng

Trạm Y tế Cốc San đang triển khai hiệu quả các hoạt động chăm sóc, bảo vệ và nâng cao sức khỏe Nhân dân. Với tinh thần trách nhiệm và sự tận tâm trong công việc, đội ngũ y, bác sĩ và nhân viên y tế của trạm góp phần bảo đảm công tác y tế cơ sở, vì sức khỏe cộng đồng.

Phường Văn Phú: Trên 1.150 người được nhận quà nhân dịp chào mừng Đại hội Đảng và Tết Nguyên đán

Phường Văn Phú: Trên 1.150 người được nhận quà nhân dịp chào mừng Đại hội Đảng và Tết Nguyên đán

Ngày 31/12, phường Văn Phú đã huy động các lực lượng đồng loạt tổ chức trao quà của Đảng, Nhà nước nhân dịp chào mừng Đại hội đại biểu toàn quốc lần thứ XIV của Đảng và Tết Nguyên đán Bính Ngọ năm 2026 cho những người có công với cách mạng và đối tượng bảo trợ xã hội, người cao tuổi trên địa bàn.

Đưa thông tin đến gần dân, tạo nền tảng giảm nghèo bền vững

Đưa thông tin đến gần dân, tạo nền tảng giảm nghèo bền vững

Thực hiện mục tiêu “giảm nghèo về thông tin” trong Chương trình mục tiêu quốc gia giảm nghèo bền vững giai đoạn 2021 - 2025, tỉnh Lào Cai đã triển khai đồng bộ nhiều giải pháp đưa thông tin đến tận thôn, bản, vùng khó khăn. Thông qua tuyên truyền chính sách, phổ biến pháp luật và tập huấn kỹ năng sử dụng Internet, điện thoại thông minh, người nghèo, hộ cận nghèo và đồng bào dân tộc thiểu số từng bước được tiếp cận tri thức, nâng cao năng lực, chủ động vươn lên thoát nghèo bền vững.

nghi lễ Tằng cẩu

Tục “Tằng cẩu” của người Thái đen Mường Lò

Giữa vùng lòng chảo Mường Lò nơi được mệnh danh là “đất tổ” của người Thái đen, những nét văn hóa cổ xưa vẫn được lưu giữ vẹn nguyên, trong đó có tục “Tằng cẩu” - biểu tượng thiêng liêng và kiêu hãnh của người phụ nữ. Đó không đơn thuần chỉ là một kiểu tóc, mà là lời khẳng định về tiết hạnh, dấu mốc quan trọng nhất trong cuộc đời người con gái khi bước sang trang mới của cuộc sống gia đình.

Nơi gieo mầm hạnh phúc

Nơi gieo mầm hạnh phúc

Mang sứ mệnh cao cả, đồng hành với các cặp đôi trên hành trình thực hiện thiên chức làm cha, làm mẹ, Khoa Hỗ trợ sinh sản - Trung tâm Sản nhi, Bệnh viện Đa khoa số 1 tỉnh Lào Cai đang giúp các gia đình hiếm muộn hiện thực hóa giấc mơ về một tổ ấm vẹn tròn, đầy ắp tiếng cười trẻ thơ.

fb yt zl tw