Việt Nam phát triển thành công phần mềm dịch ngôn ngữ hiếm khu vực Đông Nam Á

Viện Công nghệ thông tin - Viện Hàn lâm Khoa học và Công nghệ Việt Nam cho biết, các nhà khoa học đã thành công trong việc ứng dụng các kỹ thuật xử lý ngôn ngữ tự nhiên tiên tiến để xây dựng các mô hình dịch máy tự động có chất lượng cao cho các cặp ngôn ngữ như Việt - Lào, Việt - Khmer, Việt - Thái, Việt - Malaysia và Việt - Indonesia.

Dịch máy (hay còn gọi là dịch tự động) là việc dịch một văn bản từ một ngôn ngữ này (ngôn ngữ nguồn) sang một hoặc nhiều ngôn ngữ khác (ngôn ngữ đích) một cách tự động, không có sự can thiệp của con người trong quá trình dịch. Hiện nay có nhiều sản phẩm dịch tự động được sử dụng phổ biến như Google Translate, Bing Translator… với chất lượng dịch rất tốt cho các câu đơn. Tuy nhiên, các hệ thống dịch máy chất lượng cao này cần các bộ dữ liệu song ngữ quy mô lớn, lên tới hàng triệu cặp câu để huấn luyện mô hình.

Theo PGS.TS Nguyễn Trường Thắng - Viện trưởng Viện Công nghệ thông tin, Viện Hàn lâm KH&CN Việt Nam, hiện rất nhiều ngôn ngữ trên thế giới không có đủ tài nguyên như vậy. Việc xây dựng mô hình dịch máy hiệu quả cho những ngôn ngữ nghèo tài nguyên, trong đó có các ngôn ngữ của khu vực Đông Nam Á là công việc hết sức cấp thiết và gặp nhiều thách thức.

Cũng theo PGS.TS Nguyễn Trường Thắng, để khắc phục các tồn tại này, nhóm các nhà nghiên cứu tại Viện Công nghệ thông tin (CNTT) đã phát triển một hệ thống dịch thuật lấy tiếng Việt làm trung tâm, có khả năng dịch thuật hai chiều giữa tiếng Việt và các ngôn ngữ nghèo tài nguyên của khu vực Đông Nam Á với chất lượng tương đương với các sản phẩm thương mại nổi tiếng trên thế giới.

"Chúng tôi định hướng những ngôn ngữ hiếm như tiếng Lào, tiếng Khmer… và sau này là những ngôn ngữ của các dân tộc thiểu số của Việt Nam là tiếng Mường, tiếng Thái… Vì đây là những ngôn ngữ mà nước ngoài không bao giờ làm, và nếu họ có làm thì họ cũng không hiểu đặc thù ngôn ngữ của Việt Nam, mà hiện nay cũng đã có một số đối tác quan tâm. Chúng ta lựa chọn hướng đi là nội địa hóa, nhưng phù hợp với năng lực và hướng đi của chúng ta", PGS.TS Nguyễn Trường Thắng cho biết.

Tính đến thời điểm hiện tại, hệ thống đã có khả năng dịch hai chiều giữa các cặp ngôn ngữ bao gồm Việt - Lào, Việt - Khmer, Việt - Thái, Việt - Malaysia và Việt - Indonesia. Nhóm nghiên cứu cũng cho biết, hệ thống được nghiên cứu phát triển dựa trên các tiến bộ mới nhất hiện nay trên thế giới trong lĩnh vực xử lý ngôn ngữ tự nhiên nói chung và dịch máy nói riêng. Các ngôn ngữ như tiếng Lào, tiếng Thái và tiếng Khmer mang lại những thách thức rất lớn khi xây dựng mô hình dịch máy, không chỉ vì sự khan hiếm của dữ liệu song ngữ mà còn vì những ngôn ngữ này rất phong phú về mặt hình thái, thiếu sự phân tách từ, phân tách câu và tính đa nghĩa. Tuy nhiên, mô hình dịch máy của Viện CNTT đã học được cách thích ứng với tất cả những đặc điểm đặc biệt này.

PGS.TS Chu Hoàng Hà - Phó Chủ tịch Viện Hàn lâm KH&CN Việt Nam nói: "Chúng ta có thể tạo ra những phần mềm dịch thuật rất chính xác với những ngôn ngữ của các dân tộc ASEAN và cũng có thể là ngôn ngữ của các dân tộc Việt Nam nữa, từ đó giúp cho việc giao tiếp thuận lợi hơn. Đặc biệt với sự áp dụng của mô hình ngôn ngữ lớn thì giúp cho việc dịch thuật chính xác hơn nhiều, giúp cho các hoạt động trao đổi, giao tiếp, ngoại giao".

Các nhà khoa học cũng cho biết, hệ thống dịch máy có thể dễ dàng mở rộng sang các ngôn ngữ đích mới bao gồm các ngôn ngữ dân tộc thiểu số tại Việt Nam (thường là rất nghèo tài nguyên dữ liệu) như tiếng Mường, tiếng Thái,… và cả các ngôn ngữ nước ngoài phổ biến như tiếng Trung, tiếng Pháp, tiếng Nga khi cần. Đặc biệt, hệ thống có khả năng tinh chỉnh để thích ứng với các miền ngôn ngữ chuyên sâu như y tế, luật… theo yêu cầu riêng của đối tác.

Có thể bạn quan tâm

Tin cùng chuyên mục

Công đoàn phường Âu Lâu tổ chức chương trình “Tết Sum vầy - Xuân ơn Đảng” năm 2026

Công đoàn phường Âu Lâu tổ chức chương trình “Tết Sum vầy - Xuân ơn Đảng” năm 2026

Chiều 30/01, Công đoàn phường Âu Lâu tổ chức Chương trình “Tết Sum vầy - Xuân ơn Đảng” năm 2026. Tham dự chương trình có đại diện Thường trực Liên đoàn Lao động tỉnh; Thường trực Đảng ủy, UBND, Ủy ban MTTQ Việt Nam phường Âu Lâu; lãnh đạo các phòng, ban, đoàn thể phường; đại diện các công đoàn cơ sở, doanh nghiệp trên địa bàn cùng đông đảo đoàn viên, người lao động thuộc diện được hỗ trợ.

Trường Tiểu học Bình Minh tổ chức Ngày hội "Vui hội xuân Bính Ngọ 2026"

Trường Tiểu học Bình Minh tổ chức Ngày hội "Vui hội xuân Bính Ngọ 2026"

Sáng 30/01/2026, Trường Tiểu học Bình Minh (phường Cam Đường) tổ chức Ngày hội “Vui hội xuân Bính Ngọ 2026” trong không khí vui tươi, phấn khởi, đậm đà bản sắc văn hóa dân tộc, thu hút sự tham gia của Ban đại diện cha mẹ học sinh, phụ huynh, cán bộ, giáo viên, nhân viên, sinh viên thực tập và toàn thể học sinh nhà trường.

Đoàn kết - thi đua - chung tay vì người nghèo

Cụm thi đua các cơ quan thuộc Ủy ban Mặt trận Tổ quốc Việt Nam tỉnh: Đoàn kết - thi đua - chung tay vì người nghèo

Thời gian qua, Cụm thi đua các cơ quan thuộc Ủy ban Mặt trận Tổ quốc Việt Nam tỉnh đã phát huy tinh thần đoàn kết, đổi mới cách làm theo hướng thiết thực, hiệu quả; tổ chức phong trào thi đua toàn diện, đồng hành cùng các ban, ngành, địa phương lan tỏa những giá trị nhân văn, góp phần hỗ trợ người nghèo vươn lên ổn định cuộc sống.

Tiểu thương phường Lào Cai tất bật đưa hoa ra chợ Tết

Tiểu thương phường Lào Cai tất bật đưa hoa ra chợ Tết

Dù đến ngày 1/2 chợ hoa Xuân phường Lào Cai mới chính thức khai hội, nhưng không khí Tết đã rộn ràng trên tuyến đường An Dương Vương. Từ sáng sớm đến tối muộn, các chuyến xe chở đầy hoa liên tục tập kết về khu vực chợ; tiểu thương khẩn trương bốc xếp, sắp đặt và chăm sóc từng chậu hoa với mong muốn mang sắc xuân đẹp nhất đến người dân phố núi.

Tiếng sáo Mường Lai: Từ Đại hội Đảng năm 1976 đến hành trình giữ lửa

Tiếng sáo Mường Lai: Từ Đại hội Đảng năm 1976 đến hành trình giữ lửa

Từ những thiếu nữ mười tám, đôi mươi mang theo tiếng sáo nứa mộc mạc phục vụ Đại hội Đảng toàn quốc lần thứ IV năm 1976, hơn nửa thế kỷ trôi qua, tiếng sáo của các “cô gái” Mường Lai năm ấy vẫn ngân vang giữa đại ngàn. Không chỉ là ký ức đáng tự hào của thời thanh xuân rực rỡ, tiếng sáo ấy còn được các nghệ nhân bền bỉ truyền lại cho thế hệ sau với mong muốn gìn giữ một giá trị văn hóa trường tồn với thời gian.

Tết đến sớm nơi biên cương Tổ quốc

Tết đến sớm nơi biên cương Tổ quốc

Hòa chung không khí hân hoan đón xuân mới đang lan tỏa khắp mọi miền, những ngày này, đồng bào các dân tộc khu vực biên giới tỉnh Lào Cai đang rộn ràng đón Tết sớm trong không khí ấm áp, nghĩa tình, thắm đượm tình quân - dân từ sự sẻ chia, chung tay của những người lính biên phòng.

Trường THPT Nguyễn Huệ tổ chức Ngày hội Giáo dục STEM - Tư vấn hướng nghiệp tuyển sinh năm 2026

Trường THPT Nguyễn Huệ tổ chức Ngày hội Giáo dục STEM - Tư vấn hướng nghiệp tuyển sinh năm 2026

Sáng nay - 30/1, Trường THPT Nguyễn Huệ tổ chức Ngày hội Giáo dục STEM - Tư vấn hướng nghiệp tuyển sinh năm 2026 với chủ đề “STEM Xuân Lào Cai - nơi hội tụ sắc màu Tây Bắc”. Chương trình có sự tham dự của lãnh đạo Sở Giáo dục và Đào tạo tỉnh, Tập đoàn Công nghiệp - Năng lượng Quốc gia Việt Nam, các chuyên gia giáo dục STEM cùng đại diện nhiều trường đại học, học viện và trên 1.600 học sinh nhà trường và một số trường THPT trên địa bàn toàn tỉnh.

Tú Lệ bứt phá cải cách hành chính công từ chuyển đổi số

Tú Lệ bứt phá cải cách hành chính công từ chuyển đổi số

Tú Lệ được biết đến là một xã vùng cao còn không ít khó khăn, địa bàn rộng, dân cư phân tán, trình độ tiếp cận công nghệ không đồng đều. Tuy nhiên, bước sang năm 2026, cùng với việc triển khai quyết liệt Nghị quyết số 57-NQ/TW của Bộ Chính trị, chuyển đổi số tại địa phương đã không còn dừng ở khẩu hiệu, mà từng bước đi vào thực chất, trở thành phương thức điều hành mới, nâng cao hiệu quả phục vụ người dân và tạo động lực thúc đẩy phát triển kinh tế - xã hội.

fb yt zl tw