Việt Nam phát triển thành công phần mềm dịch ngôn ngữ hiếm khu vực Đông Nam Á

Viện Công nghệ thông tin - Viện Hàn lâm Khoa học và Công nghệ Việt Nam cho biết, các nhà khoa học đã thành công trong việc ứng dụng các kỹ thuật xử lý ngôn ngữ tự nhiên tiên tiến để xây dựng các mô hình dịch máy tự động có chất lượng cao cho các cặp ngôn ngữ như Việt - Lào, Việt - Khmer, Việt - Thái, Việt - Malaysia và Việt - Indonesia.

Dịch máy (hay còn gọi là dịch tự động) là việc dịch một văn bản từ một ngôn ngữ này (ngôn ngữ nguồn) sang một hoặc nhiều ngôn ngữ khác (ngôn ngữ đích) một cách tự động, không có sự can thiệp của con người trong quá trình dịch. Hiện nay có nhiều sản phẩm dịch tự động được sử dụng phổ biến như Google Translate, Bing Translator… với chất lượng dịch rất tốt cho các câu đơn. Tuy nhiên, các hệ thống dịch máy chất lượng cao này cần các bộ dữ liệu song ngữ quy mô lớn, lên tới hàng triệu cặp câu để huấn luyện mô hình.

Theo PGS.TS Nguyễn Trường Thắng - Viện trưởng Viện Công nghệ thông tin, Viện Hàn lâm KH&CN Việt Nam, hiện rất nhiều ngôn ngữ trên thế giới không có đủ tài nguyên như vậy. Việc xây dựng mô hình dịch máy hiệu quả cho những ngôn ngữ nghèo tài nguyên, trong đó có các ngôn ngữ của khu vực Đông Nam Á là công việc hết sức cấp thiết và gặp nhiều thách thức.

Cũng theo PGS.TS Nguyễn Trường Thắng, để khắc phục các tồn tại này, nhóm các nhà nghiên cứu tại Viện Công nghệ thông tin (CNTT) đã phát triển một hệ thống dịch thuật lấy tiếng Việt làm trung tâm, có khả năng dịch thuật hai chiều giữa tiếng Việt và các ngôn ngữ nghèo tài nguyên của khu vực Đông Nam Á với chất lượng tương đương với các sản phẩm thương mại nổi tiếng trên thế giới.

"Chúng tôi định hướng những ngôn ngữ hiếm như tiếng Lào, tiếng Khmer… và sau này là những ngôn ngữ của các dân tộc thiểu số của Việt Nam là tiếng Mường, tiếng Thái… Vì đây là những ngôn ngữ mà nước ngoài không bao giờ làm, và nếu họ có làm thì họ cũng không hiểu đặc thù ngôn ngữ của Việt Nam, mà hiện nay cũng đã có một số đối tác quan tâm. Chúng ta lựa chọn hướng đi là nội địa hóa, nhưng phù hợp với năng lực và hướng đi của chúng ta", PGS.TS Nguyễn Trường Thắng cho biết.

Tính đến thời điểm hiện tại, hệ thống đã có khả năng dịch hai chiều giữa các cặp ngôn ngữ bao gồm Việt - Lào, Việt - Khmer, Việt - Thái, Việt - Malaysia và Việt - Indonesia. Nhóm nghiên cứu cũng cho biết, hệ thống được nghiên cứu phát triển dựa trên các tiến bộ mới nhất hiện nay trên thế giới trong lĩnh vực xử lý ngôn ngữ tự nhiên nói chung và dịch máy nói riêng. Các ngôn ngữ như tiếng Lào, tiếng Thái và tiếng Khmer mang lại những thách thức rất lớn khi xây dựng mô hình dịch máy, không chỉ vì sự khan hiếm của dữ liệu song ngữ mà còn vì những ngôn ngữ này rất phong phú về mặt hình thái, thiếu sự phân tách từ, phân tách câu và tính đa nghĩa. Tuy nhiên, mô hình dịch máy của Viện CNTT đã học được cách thích ứng với tất cả những đặc điểm đặc biệt này.

PGS.TS Chu Hoàng Hà - Phó Chủ tịch Viện Hàn lâm KH&CN Việt Nam nói: "Chúng ta có thể tạo ra những phần mềm dịch thuật rất chính xác với những ngôn ngữ của các dân tộc ASEAN và cũng có thể là ngôn ngữ của các dân tộc Việt Nam nữa, từ đó giúp cho việc giao tiếp thuận lợi hơn. Đặc biệt với sự áp dụng của mô hình ngôn ngữ lớn thì giúp cho việc dịch thuật chính xác hơn nhiều, giúp cho các hoạt động trao đổi, giao tiếp, ngoại giao".

Các nhà khoa học cũng cho biết, hệ thống dịch máy có thể dễ dàng mở rộng sang các ngôn ngữ đích mới bao gồm các ngôn ngữ dân tộc thiểu số tại Việt Nam (thường là rất nghèo tài nguyên dữ liệu) như tiếng Mường, tiếng Thái,… và cả các ngôn ngữ nước ngoài phổ biến như tiếng Trung, tiếng Pháp, tiếng Nga khi cần. Đặc biệt, hệ thống có khả năng tinh chỉnh để thích ứng với các miền ngôn ngữ chuyên sâu như y tế, luật… theo yêu cầu riêng của đối tác.

Có thể bạn quan tâm

Tin cùng chuyên mục

Niềm tin vững bền nơi phên giậu Tổ quốc

Niềm tin vững bền nơi phên giậu Tổ quốc

Khi sương sớm vẫn còn bảng lảng trên những triền núi, thôn Phù Lao Chải, xã A Mú Sung đã thức giấc. Tiếng ngựa hí vang vọng giữa không gian mênh mang, những vạt xoài, dứa, mít xanh mướt phủ kín những khoảng đất từng khô cằn, hoang hóa… nhịp sống mới đang hiện hữu rõ ràng nơi phên giậu Tổ quốc.

Cô gái Nùng và hành trình viết tiếp ước mơ

Cô gái Nùng và hành trình viết tiếp ước mơ

Sau 15 năm gác lại việc học vì hoàn cảnh khó khăn, em Cáo Thị Hiền - học sinh hệ Trung cấp, ngành tiếng Trung Quốc, khoa Công nghệ Thông tin và Ngoại ngữ, Trường Cao đẳng Lào Cai đã mạnh mẽ trở lại giảng đường để viết tiếp ước mơ còn dang dở. Quyết định trở lại trường của Hiền không chỉ là câu chuyện về nghị lực và khát vọng học tập, mà còn là minh chứng cho niềm tin rằng: Chỉ cần không từ bỏ, con đường đến tri thức luôn rộng mở.

Ngày hội hiến máu tình nguyện Chủ nhật đỏ năm 2026

Ngày hội hiến máu tình nguyện Chủ nhật đỏ năm 2026

Sáng 14/3, tại Trường Cao đẳng nghề Yên Bái, Ban Chỉ đạo vận động hiến máu tình nguyện tỉnh tổ chức Ngày hội Hiến máu tình nguyện Chủ nhật đỏ năm 2026 với chủ đề "Hiến máu yêu thương - kết nối sự sống”. Chương trình do Tỉnh đoàn Lào Cai chủ trì, phối hợp với Hội Chữ thập đỏ tỉnh, Sở Y tế tỉnh thực hiện.

Thông tin cần biết về Ngày Bầu cử

Thông tin cần biết về Ngày Bầu cử

Ngày Bầu cử đại biểu Quốc hội khóa XVI và đại biểu Hội đồng nhân dân các cấp nhiệm kỳ 2026 - 2031 là Chủ nhật, ngày 15/3/2026. Việc bỏ phiếu sẽ được bắt đầu từ 7 giờ sáng và thực hiện liên tục cho đến 7 giờ tối cùng ngày.

Hiệu quả mô hình “Ngôi nhà xanh” của phụ nữ xã Bảo Yên

Hiệu quả mô hình “Ngôi nhà xanh” của phụ nữ xã Bảo Yên

Sau hơn một tháng triển khai, mô hình “Ngôi nhà xanh” của Hội Phụ nữ xã Bảo Yên đã đem lại kết quả rõ rệt; góp phần giữ gìn môi trường “xanh - sạch - đẹp”, tạo nguồn quỹ thiết thực, hỗ trợ phụ nữ và trẻ em hoàn cảnh khó khăn; lan tỏa mạnh mẽ tinh thần trách nhiệm, sẻ chia trong cộng đồng.

Phụ nữ dân tộc thiểu số “mở cửa” tri thức ngoại ngữ

Phụ nữ dân tộc thiểu số “mở cửa” tri thức ngoại ngữ

Ngoại ngữ là cánh cửa mở ra chân trời mới. Với sự năng động, sáng tạo, nhiều phụ nữ dân tộc thiểu số Lào Cai vốn chỉ quen với ruộng đồng đã chủ động tiếp cận ngoại ngữ, có được công việc như ý, phát triển kinh tế gia đình, đóng góp xây dựng quê hương. Đó là những câu chuyện truyền cảm hứng về phụ nữ vùng cao, vùng dân tộc thiểu số mạnh mẽ vượt định kiến, khẳng định bản thân.

Trường THPT Chu Văn An nâng cao chất lượng giáo dục mũi nhọn

Trường THPT Chu Văn An nâng cao chất lượng giáo dục mũi nhọn

Cùng với việc phát triển giáo dục đại trà, nhiều năm qua, Trường THPT Chu Văn An (xã Mậu A, tỉnh Lào Cai) luôn chú trọng nâng cao chất lượng giáo dục mũi nhọn. Nhờ những giải pháp đồng bộ trong bồi dưỡng học sinh giỏi, nhà trường đã từng bước khẳng định vị thế, trở thành đơn vị có thành tích nổi bật của tỉnh.

Thời tiết 14/3: Nhiều khu vực có mưa, Bắc Bộ sáng sớm sương mù

Thời tiết 14/3: Nhiều khu vực có mưa, Bắc Bộ sáng sớm sương mù

Theo Trung tâm Dự báo Khí tượng Thủy văn Quốc gia, ngày 14/3, thời tiết nhiều khu vực trên cả nước tiếp tục có sự phân hóa, trong đó, Bắc Bộ và Bắc Trung Bộ xuất hiện sương mù vào sáng sớm, một số nơi có mưa rải rác; trong khi trên biển gió Đông Bắc hoạt động mạnh, gây biển động.

fb yt zl tw