Việt Nam phát triển thành công phần mềm dịch ngôn ngữ hiếm khu vực Đông Nam Á

Viện Công nghệ thông tin - Viện Hàn lâm Khoa học và Công nghệ Việt Nam cho biết, các nhà khoa học đã thành công trong việc ứng dụng các kỹ thuật xử lý ngôn ngữ tự nhiên tiên tiến để xây dựng các mô hình dịch máy tự động có chất lượng cao cho các cặp ngôn ngữ như Việt - Lào, Việt - Khmer, Việt - Thái, Việt - Malaysia và Việt - Indonesia.

Dịch máy (hay còn gọi là dịch tự động) là việc dịch một văn bản từ một ngôn ngữ này (ngôn ngữ nguồn) sang một hoặc nhiều ngôn ngữ khác (ngôn ngữ đích) một cách tự động, không có sự can thiệp của con người trong quá trình dịch. Hiện nay có nhiều sản phẩm dịch tự động được sử dụng phổ biến như Google Translate, Bing Translator… với chất lượng dịch rất tốt cho các câu đơn. Tuy nhiên, các hệ thống dịch máy chất lượng cao này cần các bộ dữ liệu song ngữ quy mô lớn, lên tới hàng triệu cặp câu để huấn luyện mô hình.

Theo PGS.TS Nguyễn Trường Thắng - Viện trưởng Viện Công nghệ thông tin, Viện Hàn lâm KH&CN Việt Nam, hiện rất nhiều ngôn ngữ trên thế giới không có đủ tài nguyên như vậy. Việc xây dựng mô hình dịch máy hiệu quả cho những ngôn ngữ nghèo tài nguyên, trong đó có các ngôn ngữ của khu vực Đông Nam Á là công việc hết sức cấp thiết và gặp nhiều thách thức.

Cũng theo PGS.TS Nguyễn Trường Thắng, để khắc phục các tồn tại này, nhóm các nhà nghiên cứu tại Viện Công nghệ thông tin (CNTT) đã phát triển một hệ thống dịch thuật lấy tiếng Việt làm trung tâm, có khả năng dịch thuật hai chiều giữa tiếng Việt và các ngôn ngữ nghèo tài nguyên của khu vực Đông Nam Á với chất lượng tương đương với các sản phẩm thương mại nổi tiếng trên thế giới.

"Chúng tôi định hướng những ngôn ngữ hiếm như tiếng Lào, tiếng Khmer… và sau này là những ngôn ngữ của các dân tộc thiểu số của Việt Nam là tiếng Mường, tiếng Thái… Vì đây là những ngôn ngữ mà nước ngoài không bao giờ làm, và nếu họ có làm thì họ cũng không hiểu đặc thù ngôn ngữ của Việt Nam, mà hiện nay cũng đã có một số đối tác quan tâm. Chúng ta lựa chọn hướng đi là nội địa hóa, nhưng phù hợp với năng lực và hướng đi của chúng ta", PGS.TS Nguyễn Trường Thắng cho biết.

Tính đến thời điểm hiện tại, hệ thống đã có khả năng dịch hai chiều giữa các cặp ngôn ngữ bao gồm Việt - Lào, Việt - Khmer, Việt - Thái, Việt - Malaysia và Việt - Indonesia. Nhóm nghiên cứu cũng cho biết, hệ thống được nghiên cứu phát triển dựa trên các tiến bộ mới nhất hiện nay trên thế giới trong lĩnh vực xử lý ngôn ngữ tự nhiên nói chung và dịch máy nói riêng. Các ngôn ngữ như tiếng Lào, tiếng Thái và tiếng Khmer mang lại những thách thức rất lớn khi xây dựng mô hình dịch máy, không chỉ vì sự khan hiếm của dữ liệu song ngữ mà còn vì những ngôn ngữ này rất phong phú về mặt hình thái, thiếu sự phân tách từ, phân tách câu và tính đa nghĩa. Tuy nhiên, mô hình dịch máy của Viện CNTT đã học được cách thích ứng với tất cả những đặc điểm đặc biệt này.

PGS.TS Chu Hoàng Hà - Phó Chủ tịch Viện Hàn lâm KH&CN Việt Nam nói: "Chúng ta có thể tạo ra những phần mềm dịch thuật rất chính xác với những ngôn ngữ của các dân tộc ASEAN và cũng có thể là ngôn ngữ của các dân tộc Việt Nam nữa, từ đó giúp cho việc giao tiếp thuận lợi hơn. Đặc biệt với sự áp dụng của mô hình ngôn ngữ lớn thì giúp cho việc dịch thuật chính xác hơn nhiều, giúp cho các hoạt động trao đổi, giao tiếp, ngoại giao".

Các nhà khoa học cũng cho biết, hệ thống dịch máy có thể dễ dàng mở rộng sang các ngôn ngữ đích mới bao gồm các ngôn ngữ dân tộc thiểu số tại Việt Nam (thường là rất nghèo tài nguyên dữ liệu) như tiếng Mường, tiếng Thái,… và cả các ngôn ngữ nước ngoài phổ biến như tiếng Trung, tiếng Pháp, tiếng Nga khi cần. Đặc biệt, hệ thống có khả năng tinh chỉnh để thích ứng với các miền ngôn ngữ chuyên sâu như y tế, luật… theo yêu cầu riêng của đối tác.

Có thể bạn quan tâm

Tin cùng chuyên mục

Rộn niềm vui mới

Rộn niềm vui mới

Những ngày Tết Nguyên đán Bính Ngọ, tôi có dịp đến với những miền quê, lắng nghe trong hơi thở cuộc sống đang ngân vang niềm vui rộn rã, dù lặng lẽ, bình dị và nhỏ thôi, nhưng đánh dấu bước chuyển mới về nhận thức, tinh thần cố kết cộng đồng.

Ươm mùa xuân dưới núi Nhìu Cồ San

Ươm mùa xuân dưới núi Nhìu Cồ San

Trong các thôn, bản của khu vực vùng cao Bát Xát nói chung và xã Y Tý, Trịnh Tường nói riêng, ít nơi nào nằm ở độ cao gần 2.000 m so với mực nước biển mà có địa hình khá bằng phẳng, thoáng đãng như thôn Phìn Hồ. Điều đặc biệt ở Phìn Hồ là “vựa hoa đào” của huyện Bát Xát cũ với giống đào bản địa đẹp, ít nơi có được. Từ trồng đào bán dịp Tết, có những hộ dân thu hàng chục triệu đồng mỗi năm.

Nét đẹp văn hóa Tết trồng cây

Nét đẹp văn hóa Tết trồng cây

Đã thành nét đẹp văn hóa, mỗi năm vào dịp đầu xuân, cả nước lại sôi nổi, đồng loạt hưởng ứng “Tết trồng cây đời đời nhớ ơn Bác Hồ”, đẩy mạnh việc trồng cây, gây rừng, qua đó góp phần phát triển kinh tế - xã hội, giảm nhẹ thiên tai, giảm phát thải khí nhà kính, cải thiện môi trường, thích ứng biến đổi khí hậu.

Đừng để thực phẩm ngày Tết thành "gánh nặng" cho gan, ruột

Đừng để thực phẩm ngày Tết thành "gánh nặng" cho gan, ruột

Tết đến, mâm cỗ đầy ắp bánh chưng, thịt mỡ, giò chả, thêm vài ly rượu bia… khiến nhiều người dễ ăn quá đà. Hệ tiêu hóa vì thế “quá tải”, bụng đầy, khó tiêu, đêm trằn trọc khó ngủ. Theo các chuyên gia y tế, chỉ cần điều chỉnh một vài thói quen nhỏ trong ăn uống, sinh hoạt, mỗi người hoàn toàn có thể tận hưởng ngày xuân đủ đầy mà cơ thể vẫn nhẹ nhàng, khỏe khoắn.

Từ mù sương đến điểm sáng biên ải

Từ mù sương đến điểm sáng biên ải

Si Ma Cai - cái tên vang vọng bí ẩn, sự kiên cường, pha chút bỡ ngỡ của miền đất nơi phên giậu Tổ quốc. Nhắc đến Si Ma Cai là nhắc đến sương mù bảng lảng trên triền núi đá, đường biên giới uốn lượn giữa mây ngàn, vùng đất có chiều sâu lịch sử, văn hóa và khát vọng vươn lên mạnh mẽ.

Vui Tết ở Trường Sa

Vui Tết ở Trường Sa

Ngày mồng 1 Tết đầu năm mới Bính Ngọ 2026 trên đặc khu Trường Sa, tỉnh Khánh Hòa, thật đặc biệt. Quân và dân trên các đảo tham gia lễ chào cờ đầu năm và cùng tham gia các hoạt động văn hóa, văn nghệ.

Trải nghiệm hái táo đầu xuân ở Bát Xát

Trải nghiệm hái táo đầu xuân ở Bát Xát

Những ngày đầu xuân Bính Ngọ, nhiều vườn táo xanh tại xã Bát Xát rộn ràng đón người dân và du khách tới tham quan, trải nghiệm hái quả. Không chỉ mang lại nguồn thu nhập khá cho nông hộ, việc mở cửa của các nhà vườn đã góp phần làm phong phú thêm hoạt động du xuân trên địa bàn.

Khát vọng giữ gìn bản sắc

Khát vọng giữ gìn bản sắc

Trên địa bàn xã Hợp Thành có nhiều dân tộc cùng sinh sống, trong đó đồng bào Tày cư trú lâu đời tại các thôn Tượng 1, Tượng 3, Cáng 1, Cáng 2… Thời gian qua, UBND xã đã tuyên truyền, vận động các nghệ nhân và những người tâm huyết với văn hóa, văn nghệ thành lập Câu lạc bộ Bản sắc văn hóa dân tộc Tày xã Hợp Thành, nhằm bảo tồn và phát huy giá trị truyền thống của dân tộc.

fb yt zl tw