Việt Nam phát triển thành công phần mềm dịch ngôn ngữ hiếm khu vực Đông Nam Á

Viện Công nghệ thông tin - Viện Hàn lâm Khoa học và Công nghệ Việt Nam cho biết, các nhà khoa học đã thành công trong việc ứng dụng các kỹ thuật xử lý ngôn ngữ tự nhiên tiên tiến để xây dựng các mô hình dịch máy tự động có chất lượng cao cho các cặp ngôn ngữ như Việt - Lào, Việt - Khmer, Việt - Thái, Việt - Malaysia và Việt - Indonesia.

Dịch máy (hay còn gọi là dịch tự động) là việc dịch một văn bản từ một ngôn ngữ này (ngôn ngữ nguồn) sang một hoặc nhiều ngôn ngữ khác (ngôn ngữ đích) một cách tự động, không có sự can thiệp của con người trong quá trình dịch. Hiện nay có nhiều sản phẩm dịch tự động được sử dụng phổ biến như Google Translate, Bing Translator… với chất lượng dịch rất tốt cho các câu đơn. Tuy nhiên, các hệ thống dịch máy chất lượng cao này cần các bộ dữ liệu song ngữ quy mô lớn, lên tới hàng triệu cặp câu để huấn luyện mô hình.

Theo PGS.TS Nguyễn Trường Thắng - Viện trưởng Viện Công nghệ thông tin, Viện Hàn lâm KH&CN Việt Nam, hiện rất nhiều ngôn ngữ trên thế giới không có đủ tài nguyên như vậy. Việc xây dựng mô hình dịch máy hiệu quả cho những ngôn ngữ nghèo tài nguyên, trong đó có các ngôn ngữ của khu vực Đông Nam Á là công việc hết sức cấp thiết và gặp nhiều thách thức.

Cũng theo PGS.TS Nguyễn Trường Thắng, để khắc phục các tồn tại này, nhóm các nhà nghiên cứu tại Viện Công nghệ thông tin (CNTT) đã phát triển một hệ thống dịch thuật lấy tiếng Việt làm trung tâm, có khả năng dịch thuật hai chiều giữa tiếng Việt và các ngôn ngữ nghèo tài nguyên của khu vực Đông Nam Á với chất lượng tương đương với các sản phẩm thương mại nổi tiếng trên thế giới.

"Chúng tôi định hướng những ngôn ngữ hiếm như tiếng Lào, tiếng Khmer… và sau này là những ngôn ngữ của các dân tộc thiểu số của Việt Nam là tiếng Mường, tiếng Thái… Vì đây là những ngôn ngữ mà nước ngoài không bao giờ làm, và nếu họ có làm thì họ cũng không hiểu đặc thù ngôn ngữ của Việt Nam, mà hiện nay cũng đã có một số đối tác quan tâm. Chúng ta lựa chọn hướng đi là nội địa hóa, nhưng phù hợp với năng lực và hướng đi của chúng ta", PGS.TS Nguyễn Trường Thắng cho biết.

Tính đến thời điểm hiện tại, hệ thống đã có khả năng dịch hai chiều giữa các cặp ngôn ngữ bao gồm Việt - Lào, Việt - Khmer, Việt - Thái, Việt - Malaysia và Việt - Indonesia. Nhóm nghiên cứu cũng cho biết, hệ thống được nghiên cứu phát triển dựa trên các tiến bộ mới nhất hiện nay trên thế giới trong lĩnh vực xử lý ngôn ngữ tự nhiên nói chung và dịch máy nói riêng. Các ngôn ngữ như tiếng Lào, tiếng Thái và tiếng Khmer mang lại những thách thức rất lớn khi xây dựng mô hình dịch máy, không chỉ vì sự khan hiếm của dữ liệu song ngữ mà còn vì những ngôn ngữ này rất phong phú về mặt hình thái, thiếu sự phân tách từ, phân tách câu và tính đa nghĩa. Tuy nhiên, mô hình dịch máy của Viện CNTT đã học được cách thích ứng với tất cả những đặc điểm đặc biệt này.

PGS.TS Chu Hoàng Hà - Phó Chủ tịch Viện Hàn lâm KH&CN Việt Nam nói: "Chúng ta có thể tạo ra những phần mềm dịch thuật rất chính xác với những ngôn ngữ của các dân tộc ASEAN và cũng có thể là ngôn ngữ của các dân tộc Việt Nam nữa, từ đó giúp cho việc giao tiếp thuận lợi hơn. Đặc biệt với sự áp dụng của mô hình ngôn ngữ lớn thì giúp cho việc dịch thuật chính xác hơn nhiều, giúp cho các hoạt động trao đổi, giao tiếp, ngoại giao".

Các nhà khoa học cũng cho biết, hệ thống dịch máy có thể dễ dàng mở rộng sang các ngôn ngữ đích mới bao gồm các ngôn ngữ dân tộc thiểu số tại Việt Nam (thường là rất nghèo tài nguyên dữ liệu) như tiếng Mường, tiếng Thái,… và cả các ngôn ngữ nước ngoài phổ biến như tiếng Trung, tiếng Pháp, tiếng Nga khi cần. Đặc biệt, hệ thống có khả năng tinh chỉnh để thích ứng với các miền ngôn ngữ chuyên sâu như y tế, luật… theo yêu cầu riêng của đối tác.

Có thể bạn quan tâm

Tin cùng chuyên mục

Xã Sơn Lương: Hơn 400 triệu đồng được trao tại chương trình “Tình nguyện mùa đông”

Xã Sơn Lương: Hơn 400 triệu đồng được trao tại chương trình “Tình nguyện mùa đông”

Đoàn Thanh niên Công an tỉnh Lào Cai vừa phối hợp với Câu lạc bộ Ước mơ xanh tỉnh Ninh Bình tổ chức chương trình “Tình nguyện mùa đông” tại xã Sơn Lương, trao tặng nhiều phần quà thiết thực với tổng trị giá hơn 400 triệu đồng cho học sinh và các gia đình có hoàn cảnh khó khăn trên địa bàn.

Các đơn vị tài trợ tặng quà cho một số trường học và hộ nghèo tại xã Pha Long

Các đơn vị tài trợ tặng quà cho một số trường học và hộ nghèo tại xã Pha Long

Chiều 24/1, các đơn vị tài trợ gồm: Ngân hàng Thương mại Cổ phần đầu tư và phát triển Việt Nam chi nhánh Phúc Yên BIDV; Công ty Cổ phần Môi trường và Công trình đô thị Phúc Yên; Công ty TNHH kinh doanh thương mại Phương Trang phối hợp với Đảng ủy, UBND xã Pha Long tổ chức chương trình Quà Tết Bính Ngọ 2026 “Chia sẻ yêu thương - Sưởi ấm vùng cao”.

Phát lộ bức họa cổ dạng bản đồ chứa đa ngữ trong Kinh thành Huế

Phát lộ bức họa cổ dạng bản đồ chứa đa ngữ trong Kinh thành Huế

Trong quá trình triển khai trùng tu di tích Khâm Thiên Giám, nhóm thợ thi công bất ngờ phát hiện một bức họa cổ ẩn bên trong lớp sơn cũ trên tường, với hình thức như bản đồ chứa chữ Hán, chữ Việt và chữ Pháp, gợi mở về những bí ẩn cùng các giá trị lịch sử của công trình cổ xưa chuyên "bắt bệnh gió mưa" thuộc triều Nguyễn này.

Mùa may áo mới

Mùa may áo mới

Những ngày cuối năm, bên hiên nhà của đồng bào Mông, Dao… ở các thôn, bản vùng cao, sắc màu thổ cẩm lại hiện lên rực rỡ. Hình ảnh các cô, các chị tỉ mỉ từng đường kim, mũi chỉ đã trở nên quen thuộc. Cũng từ những đôi bàn tay khéo léo ấy, mùa may áo mới lặng lẽ bắt đầu, mang theo niềm vui và hy vọng của năm mới đang đến gần.

Đồng hành cùng cộng đồng vùng cao

Trung tâm Phát triển Khoa học Công nghệ và Chăm sóc sức khỏe cộng đồng Yên Bái: Đồng hành cùng cộng đồng vùng cao

Là đơn vị trực thuộc Liên hiệp các Hội Khoa học và Kỹ thuật tỉnh, hoạt động trong lĩnh vực khoa học - công nghệ gắn với chăm sóc sức khỏe cộng đồng, Trung tâm Phát triển Khoa học Công nghệ và Chăm sóc sức khỏe cộng đồng Yên Bái đã nhiều năm kiên trì triển khai các chương trình, dự án hướng về cộng đồng vùng cao, vùng đồng bào dân tộc thiểu số.

Bước đột phá để nâng cao chất lượng nguồn nhân lực

Bước đột phá để nâng cao chất lượng nguồn nhân lực

Cùng với cả nước, tỉnh Lào Cai đang hiện thực hóa Nghị quyết 71-NQ/TW ngày 22/8/2025 của Bộ Chính trị về đột phá phát triển giáo dục và đào tạo với quyết tâm và kỳ vọng tạo ra chuyển biến mạnh mẽ cho giáo dục địa phương, đặt nền móng phát triển bền vững nhằm nâng cao chất lượng nguồn nhân lực.

Đường lớn đã mở

Thông tuyến kỹ thuật đường Kim Thành - Ngòi Phát: Đường lớn đã mở

Những ngày giáp Tết Nguyên đán Bính Ngọ 2026, trên công trường tuyến đường Kim Thành - Ngòi Phát (nối Cửa khẩu Quốc tế đường bộ số II Kim Thành với Cửa khẩu Bản Vược) diễn ra khẩn trương, sôi động. Việc thông tuyến kỹ thuật không chỉ mang lại niềm phấn khởi cho người dân các xã Bát Xát, Trịnh Tường, A Mú Sung mà còn mở ra trục vận chuyển hàng hóa quan trọng cho hành lang kinh tế biên giới Lào Cai.

fb yt zl tw