Việt Nam phát triển thành công phần mềm dịch ngôn ngữ hiếm khu vực Đông Nam Á

Viện Công nghệ thông tin - Viện Hàn lâm Khoa học và Công nghệ Việt Nam cho biết, các nhà khoa học đã thành công trong việc ứng dụng các kỹ thuật xử lý ngôn ngữ tự nhiên tiên tiến để xây dựng các mô hình dịch máy tự động có chất lượng cao cho các cặp ngôn ngữ như Việt - Lào, Việt - Khmer, Việt - Thái, Việt - Malaysia và Việt - Indonesia.

Dịch máy (hay còn gọi là dịch tự động) là việc dịch một văn bản từ một ngôn ngữ này (ngôn ngữ nguồn) sang một hoặc nhiều ngôn ngữ khác (ngôn ngữ đích) một cách tự động, không có sự can thiệp của con người trong quá trình dịch. Hiện nay có nhiều sản phẩm dịch tự động được sử dụng phổ biến như Google Translate, Bing Translator… với chất lượng dịch rất tốt cho các câu đơn. Tuy nhiên, các hệ thống dịch máy chất lượng cao này cần các bộ dữ liệu song ngữ quy mô lớn, lên tới hàng triệu cặp câu để huấn luyện mô hình.

Theo PGS.TS Nguyễn Trường Thắng - Viện trưởng Viện Công nghệ thông tin, Viện Hàn lâm KH&CN Việt Nam, hiện rất nhiều ngôn ngữ trên thế giới không có đủ tài nguyên như vậy. Việc xây dựng mô hình dịch máy hiệu quả cho những ngôn ngữ nghèo tài nguyên, trong đó có các ngôn ngữ của khu vực Đông Nam Á là công việc hết sức cấp thiết và gặp nhiều thách thức.

Cũng theo PGS.TS Nguyễn Trường Thắng, để khắc phục các tồn tại này, nhóm các nhà nghiên cứu tại Viện Công nghệ thông tin (CNTT) đã phát triển một hệ thống dịch thuật lấy tiếng Việt làm trung tâm, có khả năng dịch thuật hai chiều giữa tiếng Việt và các ngôn ngữ nghèo tài nguyên của khu vực Đông Nam Á với chất lượng tương đương với các sản phẩm thương mại nổi tiếng trên thế giới.

"Chúng tôi định hướng những ngôn ngữ hiếm như tiếng Lào, tiếng Khmer… và sau này là những ngôn ngữ của các dân tộc thiểu số của Việt Nam là tiếng Mường, tiếng Thái… Vì đây là những ngôn ngữ mà nước ngoài không bao giờ làm, và nếu họ có làm thì họ cũng không hiểu đặc thù ngôn ngữ của Việt Nam, mà hiện nay cũng đã có một số đối tác quan tâm. Chúng ta lựa chọn hướng đi là nội địa hóa, nhưng phù hợp với năng lực và hướng đi của chúng ta", PGS.TS Nguyễn Trường Thắng cho biết.

Tính đến thời điểm hiện tại, hệ thống đã có khả năng dịch hai chiều giữa các cặp ngôn ngữ bao gồm Việt - Lào, Việt - Khmer, Việt - Thái, Việt - Malaysia và Việt - Indonesia. Nhóm nghiên cứu cũng cho biết, hệ thống được nghiên cứu phát triển dựa trên các tiến bộ mới nhất hiện nay trên thế giới trong lĩnh vực xử lý ngôn ngữ tự nhiên nói chung và dịch máy nói riêng. Các ngôn ngữ như tiếng Lào, tiếng Thái và tiếng Khmer mang lại những thách thức rất lớn khi xây dựng mô hình dịch máy, không chỉ vì sự khan hiếm của dữ liệu song ngữ mà còn vì những ngôn ngữ này rất phong phú về mặt hình thái, thiếu sự phân tách từ, phân tách câu và tính đa nghĩa. Tuy nhiên, mô hình dịch máy của Viện CNTT đã học được cách thích ứng với tất cả những đặc điểm đặc biệt này.

PGS.TS Chu Hoàng Hà - Phó Chủ tịch Viện Hàn lâm KH&CN Việt Nam nói: "Chúng ta có thể tạo ra những phần mềm dịch thuật rất chính xác với những ngôn ngữ của các dân tộc ASEAN và cũng có thể là ngôn ngữ của các dân tộc Việt Nam nữa, từ đó giúp cho việc giao tiếp thuận lợi hơn. Đặc biệt với sự áp dụng của mô hình ngôn ngữ lớn thì giúp cho việc dịch thuật chính xác hơn nhiều, giúp cho các hoạt động trao đổi, giao tiếp, ngoại giao".

Các nhà khoa học cũng cho biết, hệ thống dịch máy có thể dễ dàng mở rộng sang các ngôn ngữ đích mới bao gồm các ngôn ngữ dân tộc thiểu số tại Việt Nam (thường là rất nghèo tài nguyên dữ liệu) như tiếng Mường, tiếng Thái,… và cả các ngôn ngữ nước ngoài phổ biến như tiếng Trung, tiếng Pháp, tiếng Nga khi cần. Đặc biệt, hệ thống có khả năng tinh chỉnh để thích ứng với các miền ngôn ngữ chuyên sâu như y tế, luật… theo yêu cầu riêng của đối tác.

Có thể bạn quan tâm

Tin cùng chuyên mục

Nhiều hoạt động ý nghĩa tại chương trình “Xuân về trên bản – Phiên chợ 0 đồng”

Nhiều hoạt động ý nghĩa tại chương trình “Xuân về trên bản – Phiên chợ 0 đồng”

Ngày 17/1, tại Trường TH&THCS Nghĩa Sơn, chương trình thiện nguyện “Xuân về trên bản – Phiên chợ 0 đồng” đã được tổ chức trong không khí đầm ấm, vui tươi, mang theo hơi ấm mùa xuân và sự sẻ chia đến với người dân, trẻ em có hoàn cảnh khó khăn trên địa bàn phường Nghĩa Lộ.

Gần 300 chủ cơ sở, hộ kinh doanh được huấn luyện PCCC, CNCH

Gần 300 chủ cơ sở, hộ kinh doanh được huấn luyện PCCC, CNCH

Trong 2 ngày 17 và 18/1, Đội Cảnh sát chữa cháy và cứu nạn, cứu hộ khu vực số 8 (Phòng Cảnh sát PCCC và CNCH, Công an tỉnh Lào Cai), đã tổ chức huấn luyện nghiệp vụ PCCC và CNCH cho người đứng đầu cơ sở, người được phân công thực hiện nhiệm vụ PCCC và CNCH tại cơ sở trên địa bàn phường Lào Cai, xã Bát Xát và xã Cốc San.

Tuổi nghỉ hưu năm 2026 là bao nhiêu?

Tuổi nghỉ hưu năm 2026 là bao nhiêu?

Năm 2026, độ tuổi nghỉ hưu của lao động nam là 61 tuổi 6 tháng, lao động nữ là 57 tuổi; năm 2027, độ tuổi nghỉ hưu của lao động nam là 61 tuổi 9 tháng, lao động nữ là 57 tuổi 4 tháng.

Hội Phụ nữ xã Bảo Hà ra quân thực hiện công trình “Đường cờ, hoa sáng - xanh - sạch - đẹp"

Hội Phụ nữ xã Bảo Hà ra quân thực hiện công trình “Đường cờ, hoa sáng - xanh - sạch - đẹp"

Ngày 17/1, Hội Phụ nữ xã Bảo Hà tổ chức chương trình ra quân thực hiện công trình “Đường cờ, hoa sáng - xanh - sạch - đẹp”, thiết thực chào mừng Đại hội đại biểu toàn quốc lần thứ XIV của Đảng và bầu cử đại biểu Quốc hội khóa XVI, đại biểu HĐND các cấp nhiệm kỳ 2026 - 2031.

Lan tỏa yêu thương qua chương trình “Đông ấm - Xuân yêu thương”

Xã Hợp Thành: Lan tỏa yêu thương qua chương trình “Đông ấm - Xuân yêu thương”

Ngày 17/1, tại Trường Tiểu học và THCS số 2 Tả Phời, Đoàn Thanh niên xã Hợp Thành phối hợp cùng Đoàn thanh niên Công ty TNHH MTV Apatit Việt Nam tổ chức chương trình "Đông ấm - Xuân yêu thương". Đây là hoạt động thường niên giàu ý nghĩa nhằm sẻ chia khó khăn, tiếp thêm động lực cho học sinh nghèo và hỗ trợ các gia đình yếu thế đón Tết Nguyên đán ấm áp, nghĩa tình.

Lưu giữ “hơi thở” của mùa màng vùng cao

Lưu giữ “hơi thở” của mùa màng vùng cao

Hơn một năm trở lại đây, ai đến xã Mường Khương đều ấn tượng về một nhà hàng nhỏ bên đường Tùng Lâu, bởi không gian quán có rất nhiều chiếc cối xay đá cổ, khắc hoa văn đẹp, gợi nhớ kỷ niệm tuổi thơ của nhiều người. Chủ nhân của bộ sưu tập cối đá đặc biệt này là anh Nguyễn Văn Mạnh, chủ nhà hàng Mộc quán.

Học sinh đang lập nhóm chuẩn bị kiến thức cho tiết học lịch sử tại trường.

Khi học sinh làm chủ nhịp học

Tại các trường học trên địa bàn tỉnh Lào Cai, học sinh được trao quyền làm chủ nhịp học từ khâu chuẩn bị bài, tiếp cận kiến thức đến trao đổi, lớp học bắt đầu dịch chuyển từ mô hình truyền thụ sang tự học có định hướng, mở ra những thay đổi mang tính căn bản.

Đảm bảo an toàn tuyệt đối cho các chuyến bay

Đảm bảo an toàn tuyệt đối cho các chuyến bay

Ngày 16/1, Cục trưởng Cục Hàng không Việt Nam Uông Việt Dũng đã trực tiếp dẫn đầu đoàn công tác đảm bảo an ninh, an toàn, công tác phục vụ người dân trước thềm khai mạc Đại hội XIV của Đảng tại Cảng Hàng không quốc tế Nội Bài.

fb yt zl tw