Việt Nam phát triển thành công phần mềm dịch ngôn ngữ hiếm khu vực Đông Nam Á

Viện Công nghệ thông tin - Viện Hàn lâm Khoa học và Công nghệ Việt Nam cho biết, các nhà khoa học đã thành công trong việc ứng dụng các kỹ thuật xử lý ngôn ngữ tự nhiên tiên tiến để xây dựng các mô hình dịch máy tự động có chất lượng cao cho các cặp ngôn ngữ như Việt - Lào, Việt - Khmer, Việt - Thái, Việt - Malaysia và Việt - Indonesia.

Dịch máy (hay còn gọi là dịch tự động) là việc dịch một văn bản từ một ngôn ngữ này (ngôn ngữ nguồn) sang một hoặc nhiều ngôn ngữ khác (ngôn ngữ đích) một cách tự động, không có sự can thiệp của con người trong quá trình dịch. Hiện nay có nhiều sản phẩm dịch tự động được sử dụng phổ biến như Google Translate, Bing Translator… với chất lượng dịch rất tốt cho các câu đơn. Tuy nhiên, các hệ thống dịch máy chất lượng cao này cần các bộ dữ liệu song ngữ quy mô lớn, lên tới hàng triệu cặp câu để huấn luyện mô hình.

Theo PGS.TS Nguyễn Trường Thắng - Viện trưởng Viện Công nghệ thông tin, Viện Hàn lâm KH&CN Việt Nam, hiện rất nhiều ngôn ngữ trên thế giới không có đủ tài nguyên như vậy. Việc xây dựng mô hình dịch máy hiệu quả cho những ngôn ngữ nghèo tài nguyên, trong đó có các ngôn ngữ của khu vực Đông Nam Á là công việc hết sức cấp thiết và gặp nhiều thách thức.

Cũng theo PGS.TS Nguyễn Trường Thắng, để khắc phục các tồn tại này, nhóm các nhà nghiên cứu tại Viện Công nghệ thông tin (CNTT) đã phát triển một hệ thống dịch thuật lấy tiếng Việt làm trung tâm, có khả năng dịch thuật hai chiều giữa tiếng Việt và các ngôn ngữ nghèo tài nguyên của khu vực Đông Nam Á với chất lượng tương đương với các sản phẩm thương mại nổi tiếng trên thế giới.

"Chúng tôi định hướng những ngôn ngữ hiếm như tiếng Lào, tiếng Khmer… và sau này là những ngôn ngữ của các dân tộc thiểu số của Việt Nam là tiếng Mường, tiếng Thái… Vì đây là những ngôn ngữ mà nước ngoài không bao giờ làm, và nếu họ có làm thì họ cũng không hiểu đặc thù ngôn ngữ của Việt Nam, mà hiện nay cũng đã có một số đối tác quan tâm. Chúng ta lựa chọn hướng đi là nội địa hóa, nhưng phù hợp với năng lực và hướng đi của chúng ta", PGS.TS Nguyễn Trường Thắng cho biết.

Tính đến thời điểm hiện tại, hệ thống đã có khả năng dịch hai chiều giữa các cặp ngôn ngữ bao gồm Việt - Lào, Việt - Khmer, Việt - Thái, Việt - Malaysia và Việt - Indonesia. Nhóm nghiên cứu cũng cho biết, hệ thống được nghiên cứu phát triển dựa trên các tiến bộ mới nhất hiện nay trên thế giới trong lĩnh vực xử lý ngôn ngữ tự nhiên nói chung và dịch máy nói riêng. Các ngôn ngữ như tiếng Lào, tiếng Thái và tiếng Khmer mang lại những thách thức rất lớn khi xây dựng mô hình dịch máy, không chỉ vì sự khan hiếm của dữ liệu song ngữ mà còn vì những ngôn ngữ này rất phong phú về mặt hình thái, thiếu sự phân tách từ, phân tách câu và tính đa nghĩa. Tuy nhiên, mô hình dịch máy của Viện CNTT đã học được cách thích ứng với tất cả những đặc điểm đặc biệt này.

PGS.TS Chu Hoàng Hà - Phó Chủ tịch Viện Hàn lâm KH&CN Việt Nam nói: "Chúng ta có thể tạo ra những phần mềm dịch thuật rất chính xác với những ngôn ngữ của các dân tộc ASEAN và cũng có thể là ngôn ngữ của các dân tộc Việt Nam nữa, từ đó giúp cho việc giao tiếp thuận lợi hơn. Đặc biệt với sự áp dụng của mô hình ngôn ngữ lớn thì giúp cho việc dịch thuật chính xác hơn nhiều, giúp cho các hoạt động trao đổi, giao tiếp, ngoại giao".

Các nhà khoa học cũng cho biết, hệ thống dịch máy có thể dễ dàng mở rộng sang các ngôn ngữ đích mới bao gồm các ngôn ngữ dân tộc thiểu số tại Việt Nam (thường là rất nghèo tài nguyên dữ liệu) như tiếng Mường, tiếng Thái,… và cả các ngôn ngữ nước ngoài phổ biến như tiếng Trung, tiếng Pháp, tiếng Nga khi cần. Đặc biệt, hệ thống có khả năng tinh chỉnh để thích ứng với các miền ngôn ngữ chuyên sâu như y tế, luật… theo yêu cầu riêng của đối tác.

Có thể bạn quan tâm

Tin cùng chuyên mục

Thủ tướng yêu cầu bảo đảm an toàn tuyệt đối cho nhân dân trước bão số 15

Thủ tướng yêu cầu bảo đảm an toàn tuyệt đối cho nhân dân trước bão số 15

Trước diễn biến phức tạp của bão số 15 đang mạnh thêm và di chuyển nhanh, Thủ tướng Chính phủ ban hành Công điện yêu cầu các bộ, ngành và địa phương chủ động ứng phó ở mức cao nhất, đặt an toàn tính mạng Nhân dân lên trên hết, chuẩn bị sẵn sàng phương án phòng tránh và xử lý các tình huống khẩn cấp.

Thời tiết ngày 27/11: Bão số 15 mạnh cấp 12 giật cấp 15, di chuyển phức tạp trên Biển Đông

Thời tiết ngày 27/11: Bão số 15 mạnh cấp 12 giật cấp 15, di chuyển phức tạp trên Biển Đông

Theo Trung tâm Dự báo Khí tượng Thuỷ văn Quốc gia, hồi 4 giờ ngày 27/11, bão số 15 hoạt động trên khu vực giữa Biển Đông tiếp tục gia tăng cường độ và có diễn biến khó lường. Vị trí tâm bão ở khoảng 13,0 độ Vĩ Bắc, 114,5 độ Kinh Đông, cách đảo Song Tử Tây khoảng 190 km về phía Bắc.

Lằn ranh đỏ trong thế giới ảo

Lằn ranh đỏ trong thế giới ảo

Thế giới đang bước vào một giai đoạn lịch sử chưa từng có tiền lệ, nơi không gian mạng và các hệ thống trí tuệ nhân tạo (AI) không còn đơn thuần là công cụ kỹ thuật hỗ trợ đời sống con người, mà đã chuyển hóa thành một môi trường sinh tồn mới, thế giới coi đó là một "lãnh thổ" thứ năm bên cạnh vùng đất, vùng trời, vùng biển và không gian.

Lối sống tối giản trở thành xu thế toàn cầu

Lối sống tối giản trở thành xu thế toàn cầu

Trong bối cảnh kinh tế tăng trưởng chậm lại, môi trường xuống cấp và áp lực tinh thần ngày càng lớn, nhiều người, đặc biệt là giới trẻ trên thế giới, đang chọn lối sống giảm bớt thay vì tích thêm. Họ hạn chế mua sắm, bỏ bớt đồ đạc và thu gọn không gian sống. Từ sống đơn giản đến sống tinh gọn, lối sống tối giản đang trở thành một trong những xu hướng xã hội nổi bật của thập kỷ này.

Diễn đàn tiếng nói Thanh thiếu niên Lào Cai 2025: Trao quyền để các em tự lên tiếng

Diễn đàn tiếng nói Thanh thiếu niên Lào Cai 2025: Trao quyền để các em tự lên tiếng

Sáng 26/11, Sở Giáo dục và Đào tạo tỉnh Lào Cai phối hợp với Tổ chức Cứu trợ trẻ em quốc tế (Save the Children International) tổ chức Diễn đàn tiếng nói thanh thiếu niên năm 2025, thuộc chương trình "Hỗ trợ Thanh thiếu niên thực hiện sáng kiến" (SHIFT). Hoạt động nằm trong kế hoạch của dự án "Chương trình Phát triển cộng đồng lấy trẻ em làm trọng tâm" triển khai trong tháng 11 - 12/2025 trên địa bàn tỉnh.

Đêm về sáng trời rét hại, ngày trời nắng

Dự báo thời tiết đêm nay và ngày mai (27/11): Đêm về sáng trời rét hại, ngày trời nắng

Theo Đài Khí tượng - Thủy văn tỉnh Lào Cai, do chịu ảnh hưởng của lưỡi áp cao lạnh lục địa tăng cường trở lại, sau có cường độ ổn định, nên thời tiết các địa phương trong tỉnh đêm nay và ngày mai (27/11) ít mây đến quang mây, không mưa, ngày trời nắng, gió Đông Bắc cấp 2, trời rét, đêm về sáng rét hại.

Trường Cao đẳng Lào Cai tổ chức hội thảo "Chuyển đổi số và trí tuệ nhân tạo"

Trường Cao đẳng Lào Cai tổ chức hội thảo "Chuyển đổi số và trí tuệ nhân tạo"

Sáng 26/11, Trường Cao đẳng Lào Cai tổ chức Hội thảo chuyên đề “Chuyển đổi số và trí tuệ nhân tạo”. Tham gia hội thảo có hơn 200 đại biểu là chuyên gia, lãnh đạo các sở, ngành có liên quan; Hiệp hội Giáo dục nghề nghiệp và Nghề công tác xã hội; lãnh đạo, nhà giáo và sinh viên ngành công nghệ thông tin của Trường Cao đẳng Lào Cai, Trường Cao đẳng Nghề Yên Bái, Trường Cao đẳng Lai Châu...

Băng giá xuất hiện tại vùng cao Y Tý

Băng giá xuất hiện tại vùng cao Y Tý

Do nhiệt độ giảm sâu, sáng nay (26/11) đợt băng giá đầu tiên đã xuất hiện tại nhiều khu vực của xã Y Tý, tỉnh Lào Cai. Vào khoảng 7 giờ sáng nay, nhiệt độ ghi nhận được tại đây là 3 độ C, đến khoảng 10 giờ, nhiệt độ ở mức 5 độ C.

Thời tiết ngày 26/11: Bão tăng cấp trên Biển Đông, sóng biển dâng cao

Thời tiết ngày 26/11: Bão tăng cấp trên Biển Đông, sóng biển dâng cao

Theo Trung tâm Dự báo Khí tượng Thủy văn Quốc gia, hồi 4 giờ sáng 26/11, bão đang ở cách đảo Song Tử Tây khoảng 540 km về phía Đông, với tâm bão tại 12,2 độ Vĩ Bắc; 119,1 độ Kinh Đông. Sức gió mạnh nhất vùng gần tâm bão đạt cấp 8 (62-74 km/giờ), giật cấp 10. Khối mây đối lưu quanh tâm bão tiếp tục phát triển, trong khi hoàn lưu bão mở rộng nhanh khi di chuyển theo hướng Tây Bắc với tốc độ 20-25 km/giờ.

Chi trả gộp 3 tháng lương hưu và trợ cấp bảo hiểm xã hội cho người dân 4 tỉnh vùng lũ

Chi trả gộp 3 tháng lương hưu và trợ cấp bảo hiểm xã hội cho người dân 4 tỉnh vùng lũ

Bảo hiểm xã hội Việt Nam thực hiện chi trả gộp 3 tháng lương hưu và trợ cấp bảo hiểm xã hội vào kỳ chi trả tháng 12 năm 2025 cho người thụ hưởng chính sách ở 4 tỉnh Đắk Lắk, Gia Lai, Khánh Hòa, Lâm Đồng. Chính sách nhằm tạo điều kiện cho người dân tại vùng bị ảnh hưởng bởi bão, lũ, lụt khắc phục hậu quả, đón Tết Nguyên đán 2026.

fb yt zl tw