Việt Nam phát triển thành công phần mềm dịch ngôn ngữ hiếm khu vực Đông Nam Á

Viện Công nghệ thông tin - Viện Hàn lâm Khoa học và Công nghệ Việt Nam cho biết, các nhà khoa học đã thành công trong việc ứng dụng các kỹ thuật xử lý ngôn ngữ tự nhiên tiên tiến để xây dựng các mô hình dịch máy tự động có chất lượng cao cho các cặp ngôn ngữ như Việt - Lào, Việt - Khmer, Việt - Thái, Việt - Malaysia và Việt - Indonesia.

Dịch máy (hay còn gọi là dịch tự động) là việc dịch một văn bản từ một ngôn ngữ này (ngôn ngữ nguồn) sang một hoặc nhiều ngôn ngữ khác (ngôn ngữ đích) một cách tự động, không có sự can thiệp của con người trong quá trình dịch. Hiện nay có nhiều sản phẩm dịch tự động được sử dụng phổ biến như Google Translate, Bing Translator… với chất lượng dịch rất tốt cho các câu đơn. Tuy nhiên, các hệ thống dịch máy chất lượng cao này cần các bộ dữ liệu song ngữ quy mô lớn, lên tới hàng triệu cặp câu để huấn luyện mô hình.

Theo PGS.TS Nguyễn Trường Thắng - Viện trưởng Viện Công nghệ thông tin, Viện Hàn lâm KH&CN Việt Nam, hiện rất nhiều ngôn ngữ trên thế giới không có đủ tài nguyên như vậy. Việc xây dựng mô hình dịch máy hiệu quả cho những ngôn ngữ nghèo tài nguyên, trong đó có các ngôn ngữ của khu vực Đông Nam Á là công việc hết sức cấp thiết và gặp nhiều thách thức.

Cũng theo PGS.TS Nguyễn Trường Thắng, để khắc phục các tồn tại này, nhóm các nhà nghiên cứu tại Viện Công nghệ thông tin (CNTT) đã phát triển một hệ thống dịch thuật lấy tiếng Việt làm trung tâm, có khả năng dịch thuật hai chiều giữa tiếng Việt và các ngôn ngữ nghèo tài nguyên của khu vực Đông Nam Á với chất lượng tương đương với các sản phẩm thương mại nổi tiếng trên thế giới.

"Chúng tôi định hướng những ngôn ngữ hiếm như tiếng Lào, tiếng Khmer… và sau này là những ngôn ngữ của các dân tộc thiểu số của Việt Nam là tiếng Mường, tiếng Thái… Vì đây là những ngôn ngữ mà nước ngoài không bao giờ làm, và nếu họ có làm thì họ cũng không hiểu đặc thù ngôn ngữ của Việt Nam, mà hiện nay cũng đã có một số đối tác quan tâm. Chúng ta lựa chọn hướng đi là nội địa hóa, nhưng phù hợp với năng lực và hướng đi của chúng ta", PGS.TS Nguyễn Trường Thắng cho biết.

Tính đến thời điểm hiện tại, hệ thống đã có khả năng dịch hai chiều giữa các cặp ngôn ngữ bao gồm Việt - Lào, Việt - Khmer, Việt - Thái, Việt - Malaysia và Việt - Indonesia. Nhóm nghiên cứu cũng cho biết, hệ thống được nghiên cứu phát triển dựa trên các tiến bộ mới nhất hiện nay trên thế giới trong lĩnh vực xử lý ngôn ngữ tự nhiên nói chung và dịch máy nói riêng. Các ngôn ngữ như tiếng Lào, tiếng Thái và tiếng Khmer mang lại những thách thức rất lớn khi xây dựng mô hình dịch máy, không chỉ vì sự khan hiếm của dữ liệu song ngữ mà còn vì những ngôn ngữ này rất phong phú về mặt hình thái, thiếu sự phân tách từ, phân tách câu và tính đa nghĩa. Tuy nhiên, mô hình dịch máy của Viện CNTT đã học được cách thích ứng với tất cả những đặc điểm đặc biệt này.

PGS.TS Chu Hoàng Hà - Phó Chủ tịch Viện Hàn lâm KH&CN Việt Nam nói: "Chúng ta có thể tạo ra những phần mềm dịch thuật rất chính xác với những ngôn ngữ của các dân tộc ASEAN và cũng có thể là ngôn ngữ của các dân tộc Việt Nam nữa, từ đó giúp cho việc giao tiếp thuận lợi hơn. Đặc biệt với sự áp dụng của mô hình ngôn ngữ lớn thì giúp cho việc dịch thuật chính xác hơn nhiều, giúp cho các hoạt động trao đổi, giao tiếp, ngoại giao".

Các nhà khoa học cũng cho biết, hệ thống dịch máy có thể dễ dàng mở rộng sang các ngôn ngữ đích mới bao gồm các ngôn ngữ dân tộc thiểu số tại Việt Nam (thường là rất nghèo tài nguyên dữ liệu) như tiếng Mường, tiếng Thái,… và cả các ngôn ngữ nước ngoài phổ biến như tiếng Trung, tiếng Pháp, tiếng Nga khi cần. Đặc biệt, hệ thống có khả năng tinh chỉnh để thích ứng với các miền ngôn ngữ chuyên sâu như y tế, luật… theo yêu cầu riêng của đối tác.

Có thể bạn quan tâm

Tin cùng chuyên mục

Duyệt 423.000 tỷ đồng cho Chương trình mục tiêu quốc gia

Duyệt 423.000 tỷ đồng cho Chương trình mục tiêu quốc gia

Việc phê duyệt 423.000 tỷ đồng cho Chương trình mục tiêu quốc gia giai đoạn 2026 - 2030 nhằm tiếp tục thực hiện các mục tiêu phát triển nông thôn mới, giảm nghèo bền vững và thúc đẩy phát triển kinh tế - xã hội vùng đồng bào dân tộc thiểu số và miền núi.

 Khoác "áo xuân" cho phố phường

Khoác "áo xuân" cho phố phường


Cận Tết, những tuyến đường, góc phố của trung tâm tỉnh dần “khoác” lên mình diện mạo rực rỡ, tràn đầy sinh khí với trăm hoa đua nở và linh vật năm Bính Ngọ 2026. Những phần việc trang trí cuối cùng đang được các đơn vị thi công tiến hành khẩn trương với mong muốn đem đến không khí tươi vui, phấn khởi để Nhân dân đón năm mới.

Miền Bắc có mưa dịp Tết, mùng 5 đón không khí lạnh

Miền Bắc có mưa dịp Tết, mùng 5 đón không khí lạnh

Dự báo từ đêm giao thừa đến mùng 4 Tết, miền Bắc sẽ có sương mù và mưa nhỏ vào buổi sáng, trưa chiều tạnh ráo, trời rét nhưng nhiệt độ thấp nhất chỉ từ 17-19 độ, cao nhất 20-23 độ. Từ mùng 5 Tết, miền Bắc đón không khí lạnh, nền nhiệt giảm.

LĐLĐ tỉnh tặng nhiều phần quà Tết cho đoàn viên, hộ nghèo và gia đình chính sách

LĐLĐ tỉnh tặng nhiều phần quà Tết cho đoàn viên, hộ nghèo và gia đình chính sách

Ngày 10/2 (tức 23 tháng Chạp), Đoàn công tác của Liên đoàn Lao động (LĐLĐ) tỉnh Lào Cai do đồng chí Nguyễn Thị Bích Nhiệm - Phó Chủ tịch Ủy ban MTTQ Việt Nam tỉnh, Chủ tịch LĐLĐ tỉnh làm Trưởng đoàn đã đến thăm, tặng quà và động viên các gia đình chính sách, gia đình có hoàn cảnh khó khăn tại xã Đông Cuông.

Góp yêu thương, mang Tết đến với học trò nghèo

Góp yêu thương, mang Tết đến với học trò nghèo

Trong dịp Tết Nguyên đán Bính Ngọ 2026, bằng việc vận động ủng hộ và trao những phần quà Tết thiết thực cho học sinh khó khăn, nhiều trường học trên địa bàn tỉnh đã thể hiện sự quan tâm, sẻ chia, động viên học trò trong dịp tết đến, xuân về.

Lan tỏa giá trị y học cổ truyền

Hội Đông y Lào Cai: Lan tỏa giá trị y học cổ truyền

Trong bối cảnh y tế hiện đại ngày càng phát triển, y học cổ truyền vẫn giữ vai trò bền bỉ chăm sóc sức khỏe cộng đồng. Tại Lào Cai, những năm qua, Hội Đông y tỉnh đã từng bước khẳng định vị thế là lực lượng nòng cốt trong gìn giữ, kế thừa và lan tỏa giá trị y học cổ truyền, đưa Đông y đến gần hơn với đời sống người dân, nhất là ở khu vực nông thôn, vùng đồng bào dân tộc thiểu số.

Cận cảnh hơn 20 linh vật ngựa khắp cả nước

Cận cảnh hơn 20 linh vật ngựa khắp cả nước

Nhiều linh vật ở khắp mọi miền đất nước gây chú ý với tạo hình độc đáo, mang thông điệp đặc biệt. Hàng chục linh vật ở Bắc Ninh, Hải Phòng, Đà Nẵng, TPHCM đã lộ diện, trở thành điểm chụp ảnh thú vị của người dân. 

Chủ động các phương án chăm sóc sức khỏe Nhân dân dịp Tết Nguyên đán

Chủ động các phương án chăm sóc sức khỏe Nhân dân dịp Tết Nguyên đán

Là đơn vị y tế tuyến cơ sở trên địa bàn miền núi, Trung tâm Y tế khu vực Trạm Tấu đã chủ động triển khai đồng bộ nhiều giải pháp chăm sóc sức khỏe Nhân dân dịp Tết Nguyên đán Bính Ngọ 2026. Các phương án từ bố trí nhân lực trực cấp cứu 24/24 giờ, dự trữ đầy đủ thuốc, vật tư y tế đến tăng cường công tác phòng, chống dịch bệnh được thực hiện nghiêm túc, góp phần nâng cao chất lượng khám, chữa bệnh, giúp người dân yên tâm đón Tết an toàn, khỏe mạnh.

fb yt zl tw