Việt Nam phát triển thành công phần mềm dịch ngôn ngữ hiếm khu vực Đông Nam Á

Viện Công nghệ thông tin - Viện Hàn lâm Khoa học và Công nghệ Việt Nam cho biết, các nhà khoa học đã thành công trong việc ứng dụng các kỹ thuật xử lý ngôn ngữ tự nhiên tiên tiến để xây dựng các mô hình dịch máy tự động có chất lượng cao cho các cặp ngôn ngữ như Việt - Lào, Việt - Khmer, Việt - Thái, Việt - Malaysia và Việt - Indonesia.

Dịch máy (hay còn gọi là dịch tự động) là việc dịch một văn bản từ một ngôn ngữ này (ngôn ngữ nguồn) sang một hoặc nhiều ngôn ngữ khác (ngôn ngữ đích) một cách tự động, không có sự can thiệp của con người trong quá trình dịch. Hiện nay có nhiều sản phẩm dịch tự động được sử dụng phổ biến như Google Translate, Bing Translator… với chất lượng dịch rất tốt cho các câu đơn. Tuy nhiên, các hệ thống dịch máy chất lượng cao này cần các bộ dữ liệu song ngữ quy mô lớn, lên tới hàng triệu cặp câu để huấn luyện mô hình.

Theo PGS.TS Nguyễn Trường Thắng - Viện trưởng Viện Công nghệ thông tin, Viện Hàn lâm KH&CN Việt Nam, hiện rất nhiều ngôn ngữ trên thế giới không có đủ tài nguyên như vậy. Việc xây dựng mô hình dịch máy hiệu quả cho những ngôn ngữ nghèo tài nguyên, trong đó có các ngôn ngữ của khu vực Đông Nam Á là công việc hết sức cấp thiết và gặp nhiều thách thức.

Cũng theo PGS.TS Nguyễn Trường Thắng, để khắc phục các tồn tại này, nhóm các nhà nghiên cứu tại Viện Công nghệ thông tin (CNTT) đã phát triển một hệ thống dịch thuật lấy tiếng Việt làm trung tâm, có khả năng dịch thuật hai chiều giữa tiếng Việt và các ngôn ngữ nghèo tài nguyên của khu vực Đông Nam Á với chất lượng tương đương với các sản phẩm thương mại nổi tiếng trên thế giới.

"Chúng tôi định hướng những ngôn ngữ hiếm như tiếng Lào, tiếng Khmer… và sau này là những ngôn ngữ của các dân tộc thiểu số của Việt Nam là tiếng Mường, tiếng Thái… Vì đây là những ngôn ngữ mà nước ngoài không bao giờ làm, và nếu họ có làm thì họ cũng không hiểu đặc thù ngôn ngữ của Việt Nam, mà hiện nay cũng đã có một số đối tác quan tâm. Chúng ta lựa chọn hướng đi là nội địa hóa, nhưng phù hợp với năng lực và hướng đi của chúng ta", PGS.TS Nguyễn Trường Thắng cho biết.

Tính đến thời điểm hiện tại, hệ thống đã có khả năng dịch hai chiều giữa các cặp ngôn ngữ bao gồm Việt - Lào, Việt - Khmer, Việt - Thái, Việt - Malaysia và Việt - Indonesia. Nhóm nghiên cứu cũng cho biết, hệ thống được nghiên cứu phát triển dựa trên các tiến bộ mới nhất hiện nay trên thế giới trong lĩnh vực xử lý ngôn ngữ tự nhiên nói chung và dịch máy nói riêng. Các ngôn ngữ như tiếng Lào, tiếng Thái và tiếng Khmer mang lại những thách thức rất lớn khi xây dựng mô hình dịch máy, không chỉ vì sự khan hiếm của dữ liệu song ngữ mà còn vì những ngôn ngữ này rất phong phú về mặt hình thái, thiếu sự phân tách từ, phân tách câu và tính đa nghĩa. Tuy nhiên, mô hình dịch máy của Viện CNTT đã học được cách thích ứng với tất cả những đặc điểm đặc biệt này.

PGS.TS Chu Hoàng Hà - Phó Chủ tịch Viện Hàn lâm KH&CN Việt Nam nói: "Chúng ta có thể tạo ra những phần mềm dịch thuật rất chính xác với những ngôn ngữ của các dân tộc ASEAN và cũng có thể là ngôn ngữ của các dân tộc Việt Nam nữa, từ đó giúp cho việc giao tiếp thuận lợi hơn. Đặc biệt với sự áp dụng của mô hình ngôn ngữ lớn thì giúp cho việc dịch thuật chính xác hơn nhiều, giúp cho các hoạt động trao đổi, giao tiếp, ngoại giao".

Các nhà khoa học cũng cho biết, hệ thống dịch máy có thể dễ dàng mở rộng sang các ngôn ngữ đích mới bao gồm các ngôn ngữ dân tộc thiểu số tại Việt Nam (thường là rất nghèo tài nguyên dữ liệu) như tiếng Mường, tiếng Thái,… và cả các ngôn ngữ nước ngoài phổ biến như tiếng Trung, tiếng Pháp, tiếng Nga khi cần. Đặc biệt, hệ thống có khả năng tinh chỉnh để thích ứng với các miền ngôn ngữ chuyên sâu như y tế, luật… theo yêu cầu riêng của đối tác.

Có thể bạn quan tâm

Tin cùng chuyên mục

“Dân thụ hưởng” từ khẩu hiệu đến hành động

“Dân thụ hưởng” từ khẩu hiệu đến hành động

Thực hiện Đề án 05-ĐA/TU, ngày 29/12/2025 của Tỉnh ủy Lào Cai về củng cố khối đại đoàn kết toàn dân tộc, nâng cao chất lượng giám sát, phản biện xã hội và xây dựng Đảng, chính quyền vững mạnh, giai đoạn 2025 - 2030, thời gian qua, Mặt trận Tổ quốc (MTTQ) các cấp trên địa bàn tỉnh đã thực hiện hiệu quả công tác vận động, tập hợp Nhân dân, tham gia thực hiện và giám sát việc thực hiện Quy chế dân chủ ở cơ sở, góp phần phát huy vai trò làm chủ của Nhân dân.

Vì sức khỏe người dân Pha Long

Vì sức khỏe người dân Pha Long

Phòng khám Đa khoa khu vực Pha Long đang ngày càng khẳng định vai trò là điểm tựa y tế tin cậy của người dân vùng cao. Nơi đây, đội ngũ y, bác sĩ lặng thầm bám địa bàn, vượt qua nhiều thiếu thốn, cách trở, mang theo chuyên môn và tinh thần tận tụy để chăm sóc sức khỏe cho đồng bào.

Huấn luyện, diễn tập phòng cháy chữa cháy tại Trường tiểu học và trung học cơ sở Âu Lâu

Huấn luyện, diễn tập phòng cháy chữa cháy tại Trường tiểu học và trung học cơ sở Âu Lâu

Sáng 04/5, Trường Tiểu học và THCS Âu Lâu (phường Âu Lâu) phối hợp với Phòng Cảnh sát phòng cháy chữa cháy và cứu nạn cứu hộ, Công an tỉnh Lào Cai tổ chức tuyên truyền kiến thức, thực hành, trải nghiệm về phòng cháy, chữa cháy và cứu nạn, cứu hộ cho cán bộ, giáo viên, học sinh và lực lượng cơ sở.

Gần 317.000 lượt người được khám, chữa bệnh trong dịp nghỉ lễ 30/4-1/5

Gần 317.000 lượt người được khám, chữa bệnh trong dịp nghỉ lễ 30/4-1/5

Chiều 3/5, thông tin từ Cục Quản lý Khám chữa bệnh - Bộ Y tế cho biết, trong 24 giờ qua (tính từ 7 giờ ngày 2/5 - 7 giờ ngày 3/5), mặc dù trong dịp nghỉ lễ nhưng đội ngũ cán bộ, nhân viên y tế tại tất cả các cơ sở khám, chữa bệnh trực thuộc Bộ Y tế, các trường đại học, Y tế ngành và 34 tỉnh, thành phố trực thuộc Trung ương đều thường trực 4 cấp đầy đủ, thực hiện khám, cấp cứu cho 141.187 lượt người bệnh.

Chủ tịch UBND tỉnh chỉ đạo khẩn trương khắc phục hậu quả thiệt hại do mưa lớn kèm theo dông lốc, mưa đá gây ra trong ngày 02/5/2026

Chủ tịch UBND tỉnh chỉ đạo khẩn trương khắc phục hậu quả thiệt hại do mưa lớn kèm theo dông lốc, mưa đá gây ra trong ngày 02/5/2026

Huy động tối đa lực lượng tại chỗ để hỗ trợ, giúp đỡ các hộ dân có nhà bị ảnh hưởng, tốc mái; khôi phục sản xuất nông nghiệp; triển khai thực hiện ngay các chính sách hiện hành của Nhà nước để hỗ trợ người dân, đảm bảo kịp thời, đúng quy định, giúp người dân sớm ổn định cuộc sống... Đó là chỉ đạo của Chủ tịch UBND tỉnh về khẩn trương khắc phục hậu quả thiệt hại do mưa lớn kèm theo dông lốc, mưa đá gây ra trong ngày 02/5/2026.

Hiện thực hóa nghị quyết vì sức khỏe Nhân dân

Hiện thực hóa nghị quyết vì sức khỏe Nhân dân

Trước yêu cầu đổi mới mạnh mẽ công tác bảo vệ, chăm sóc và nâng cao sức khỏe Nhân dân, ngành Y tế Lào Cai đã và đang chủ động, tích cực triển khai Nghị quyết số 72-NQ/TW của Bộ Chính trị bằng nhiều giải pháp đồng bộ, toàn diện. Với quyết tâm chính trị cao, các nhiệm vụ trọng tâm từng bước được cụ thể hóa và tổ chức thực hiện hiệu quả, góp phần xây dựng nền tảng vững chắc cho sự phát triển bền vững của tỉnh trong giai đoạn mới.

Võ Thanh Tùng - Niềm tự hào của học sinh chuyên Tin

Võ Thanh Tùng - Niềm tự hào của học sinh chuyên Tin

Xuất sắc giành giải Nhất vòng loại cuộc thi Vô địch Tin học văn phòng thế giới (MOSWC) 2026 với số điểm tuyệt đối 1000/1000, em Võ Thanh Tùng (lớp 11 chuyên Tin, Trường THPT Chuyên Nguyễn Tất Thành) đã chính thức ghi tên mình vào vòng Chung kết Quốc gia.

fb yt zl tw