Việt Nam phát triển thành công phần mềm dịch ngôn ngữ hiếm khu vực Đông Nam Á

Viện Công nghệ thông tin - Viện Hàn lâm Khoa học và Công nghệ Việt Nam cho biết, các nhà khoa học đã thành công trong việc ứng dụng các kỹ thuật xử lý ngôn ngữ tự nhiên tiên tiến để xây dựng các mô hình dịch máy tự động có chất lượng cao cho các cặp ngôn ngữ như Việt - Lào, Việt - Khmer, Việt - Thái, Việt - Malaysia và Việt - Indonesia.

Dịch máy (hay còn gọi là dịch tự động) là việc dịch một văn bản từ một ngôn ngữ này (ngôn ngữ nguồn) sang một hoặc nhiều ngôn ngữ khác (ngôn ngữ đích) một cách tự động, không có sự can thiệp của con người trong quá trình dịch. Hiện nay có nhiều sản phẩm dịch tự động được sử dụng phổ biến như Google Translate, Bing Translator… với chất lượng dịch rất tốt cho các câu đơn. Tuy nhiên, các hệ thống dịch máy chất lượng cao này cần các bộ dữ liệu song ngữ quy mô lớn, lên tới hàng triệu cặp câu để huấn luyện mô hình.

Theo PGS.TS Nguyễn Trường Thắng - Viện trưởng Viện Công nghệ thông tin, Viện Hàn lâm KH&CN Việt Nam, hiện rất nhiều ngôn ngữ trên thế giới không có đủ tài nguyên như vậy. Việc xây dựng mô hình dịch máy hiệu quả cho những ngôn ngữ nghèo tài nguyên, trong đó có các ngôn ngữ của khu vực Đông Nam Á là công việc hết sức cấp thiết và gặp nhiều thách thức.

Cũng theo PGS.TS Nguyễn Trường Thắng, để khắc phục các tồn tại này, nhóm các nhà nghiên cứu tại Viện Công nghệ thông tin (CNTT) đã phát triển một hệ thống dịch thuật lấy tiếng Việt làm trung tâm, có khả năng dịch thuật hai chiều giữa tiếng Việt và các ngôn ngữ nghèo tài nguyên của khu vực Đông Nam Á với chất lượng tương đương với các sản phẩm thương mại nổi tiếng trên thế giới.

"Chúng tôi định hướng những ngôn ngữ hiếm như tiếng Lào, tiếng Khmer… và sau này là những ngôn ngữ của các dân tộc thiểu số của Việt Nam là tiếng Mường, tiếng Thái… Vì đây là những ngôn ngữ mà nước ngoài không bao giờ làm, và nếu họ có làm thì họ cũng không hiểu đặc thù ngôn ngữ của Việt Nam, mà hiện nay cũng đã có một số đối tác quan tâm. Chúng ta lựa chọn hướng đi là nội địa hóa, nhưng phù hợp với năng lực và hướng đi của chúng ta", PGS.TS Nguyễn Trường Thắng cho biết.

Tính đến thời điểm hiện tại, hệ thống đã có khả năng dịch hai chiều giữa các cặp ngôn ngữ bao gồm Việt - Lào, Việt - Khmer, Việt - Thái, Việt - Malaysia và Việt - Indonesia. Nhóm nghiên cứu cũng cho biết, hệ thống được nghiên cứu phát triển dựa trên các tiến bộ mới nhất hiện nay trên thế giới trong lĩnh vực xử lý ngôn ngữ tự nhiên nói chung và dịch máy nói riêng. Các ngôn ngữ như tiếng Lào, tiếng Thái và tiếng Khmer mang lại những thách thức rất lớn khi xây dựng mô hình dịch máy, không chỉ vì sự khan hiếm của dữ liệu song ngữ mà còn vì những ngôn ngữ này rất phong phú về mặt hình thái, thiếu sự phân tách từ, phân tách câu và tính đa nghĩa. Tuy nhiên, mô hình dịch máy của Viện CNTT đã học được cách thích ứng với tất cả những đặc điểm đặc biệt này.

PGS.TS Chu Hoàng Hà - Phó Chủ tịch Viện Hàn lâm KH&CN Việt Nam nói: "Chúng ta có thể tạo ra những phần mềm dịch thuật rất chính xác với những ngôn ngữ của các dân tộc ASEAN và cũng có thể là ngôn ngữ của các dân tộc Việt Nam nữa, từ đó giúp cho việc giao tiếp thuận lợi hơn. Đặc biệt với sự áp dụng của mô hình ngôn ngữ lớn thì giúp cho việc dịch thuật chính xác hơn nhiều, giúp cho các hoạt động trao đổi, giao tiếp, ngoại giao".

Các nhà khoa học cũng cho biết, hệ thống dịch máy có thể dễ dàng mở rộng sang các ngôn ngữ đích mới bao gồm các ngôn ngữ dân tộc thiểu số tại Việt Nam (thường là rất nghèo tài nguyên dữ liệu) như tiếng Mường, tiếng Thái,… và cả các ngôn ngữ nước ngoài phổ biến như tiếng Trung, tiếng Pháp, tiếng Nga khi cần. Đặc biệt, hệ thống có khả năng tinh chỉnh để thích ứng với các miền ngôn ngữ chuyên sâu như y tế, luật… theo yêu cầu riêng của đối tác.

Có thể bạn quan tâm

Tin cùng chuyên mục

Không khí lạnh tăng cường từ 12/3, nhiều khu vực có mưa dông

Không khí lạnh tăng cường từ 12/3, nhiều khu vực có mưa dông

Theo Cục Khí tượng Thủy văn, từ tối và đêm 12 - 13/3, một đợt không khí lạnh tăng cường sẽ ảnh hưởng đến thời tiết nhiều khu vực trên cả nước. Một số tỉnh Trung Bộ có mưa, có nơi mưa vừa đến mưa to, trong khi nhiều vùng biển xuất hiện gió Đông Bắc mạnh, biển động.

Trao Huân chương Dũng cảm cho ông Hà Ngọc Sơn

Trao Huân chương Dũng cảm cho ông Hà Ngọc Sơn

Ngày 10/3, tại xã Bảo Ái, UBND tỉnh trang trọng tổ chức Lễ trao tặng Huân chương Dũng cảm của Chủ tịch nước cho ông Hà Ngọc Sơn, ở thôn Trung Sơn, xã Bảo Ái - người đã dũng cảm cứu sống 6 người trong vụ tai nạn giao thông đường thủy trên hồ Thác Bà xảy ra ngày 21/2/2026.

Cấp cứu ngoại viện – nơi giành lại sự sống từ tay tử thần

Cấp cứu ngoại viện – nơi giành lại sự sống từ tay tử thần

Cấp cứu ngoại viện là hoạt động đưa các kỹ thuật, dịch vụ chăm sóc và can thiệp y tế khẩn cấp đến với người bệnh ngoài phạm vi bệnh viện, đặc biệt là những trường hợp cần xử trí cấp cứu tại chỗ, hạn chế khả năng đi lại hoặc khó tiếp cận cơ sở y tế. Đây là hình thức tiếp cận chủ động của hệ thống y tế nhằm bảo đảm người bệnh được sơ cấp cứu và can thiệp ban đầu kịp thời, đúng chuyên môn ngay từ cộng đồng; qua đó giảm thiểu nguy cơ diễn biến nặng, biến chứng hoặc tử vong trước khi đến bệnh viện.

Dạy chữ, truyền nghề chắp cánh ước mơ!

Dạy chữ, truyền nghề chắp cánh ước mơ!

Hơn 20 năm qua, Trường Trung cấp Dân tộc Nội trú Nghĩa Lộ đã trở thành địa chỉ đào tạo văn hóa và dạy nghề cho con em đồng bào Mông, Thái, Tày, Dao, Mường… ở vùng có điều kiện kinh tế - xã hội khó khăn. Nhà trường đã đào tạo gần 20.000 kỹ thuật viên và công nhân kỹ thuật trình độ sơ cấp, trung cấp cho các địa phương trong khu vực và các tỉnh lân cận.

Nâng cao ý thức chấp hành pháp luật cho học sinh

Nâng cao ý thức chấp hành pháp luật cho học sinh

Thời gian qua, lực lượng công an các xã, phường trên địa bàn tỉnh tích cực phối hợp với các cơ sở giáo dục tổ chức tuyên truyền, giáo dục pháp luật cho học sinh, qua đó giúp trang bị kỹ năng tự bảo vệ bản thân, khơi dậy ý thức trách nhiệm của thế hệ trẻ đối với cộng đồng, góp phần xây dựng môi trường học đường an toàn, lành mạnh.

Đưa chính sách BHYT đến gần người dân

Mô hình “Thứ Hai vì sức khỏe cộng đồng”: Đưa chính sách BHYT đến gần người dân

Sáng thứ Hai hằng tuần, tại khu vực sảnh chờ khám của Bệnh viện Đa khoa số 1 tỉnh Lào Cai, nhiều người dừng lại bên bàn tư vấn của cán bộ Bảo hiểm xã hội (BHXH). Tại đây, những thắc mắc về thẻ bảo hiểm y tế (BHYT), quyền lợi khám chữa bệnh hay thủ tục tham gia bảo hiểm được giải đáp kịp thời. Mô hình “Thứ Hai vì sức khỏe cộng đồng” đang trở thành cầu nối đưa chính sách BHYT đến gần hơn với người dân.

Nữ “bác sĩ” của “cỗ máy thời gian”

Nữ “bác sĩ” của “cỗ máy thời gian”

Trước đây, nhiều người vẫn quan niệm phụ nữ là phái yếu, chỉ có thể làm công việc nội trợ, chăm sóc gia đình, không thể làm những việc khó. Đặc biệt, với những công việc liên quan đến các loại máy móc tinh vi ít khi dành cho phụ nữ. Vậy nhưng, ở phường Lào Cai có một phụ nữ đã 30 năm gắn bó với nghề sửa chữa đồng hồ do gia đình truyền lại. Bà là Vũ Thanh Mai, năm nay 54 tuổi, người được mệnh danh là nữ “bác sĩ” của “cỗ máy thời gian”.

Quyền bầu cử của các cử tri có giống nhau hay không?

Quyền bầu cử của các cử tri có giống nhau hay không?

Tùy thuộc thời gian cư trú hoặc quan hệ gắn bó với địa phương nơi đăng ký tham gia bầu cử mà Luật Bầu cử đại biểu Quốc hội và đại biểu Hội đồng nhân dân đã quy định từng nhóm đối tượng cử tri có phạm vi tham gia bầu cử không hoàn toàn giống nhau.

Khảo sát chất lượng lớp 12: “Phép thử” để các trường điều chỉnh chiến lược ôn thi

Khảo sát chất lượng lớp 12: “Phép thử” để các trường điều chỉnh chiến lược ôn thi

Tháng 3/2026, khoảng 100.000 học sinh lớp 12 tại Hà Nội sẽ tham gia kỳ khảo sát chất lượng do Sở GD&ĐT tổ chức. Đây là dịp để học sinh làm quen áp lực phòng thi, đồng thời giúp các trường đánh giá quá trình dạy học, điều chỉnh kế hoạch ôn tập. Hiện nhiều trường đã bắt đầu bước vào giai đoạn ôn thi “nước rút".

fb yt zl tw