Việt Nam phát triển thành công phần mềm dịch ngôn ngữ hiếm khu vực Đông Nam Á

Viện Công nghệ thông tin - Viện Hàn lâm Khoa học và Công nghệ Việt Nam cho biết, các nhà khoa học đã thành công trong việc ứng dụng các kỹ thuật xử lý ngôn ngữ tự nhiên tiên tiến để xây dựng các mô hình dịch máy tự động có chất lượng cao cho các cặp ngôn ngữ như Việt - Lào, Việt - Khmer, Việt - Thái, Việt - Malaysia và Việt - Indonesia.

Dịch máy (hay còn gọi là dịch tự động) là việc dịch một văn bản từ một ngôn ngữ này (ngôn ngữ nguồn) sang một hoặc nhiều ngôn ngữ khác (ngôn ngữ đích) một cách tự động, không có sự can thiệp của con người trong quá trình dịch. Hiện nay có nhiều sản phẩm dịch tự động được sử dụng phổ biến như Google Translate, Bing Translator… với chất lượng dịch rất tốt cho các câu đơn. Tuy nhiên, các hệ thống dịch máy chất lượng cao này cần các bộ dữ liệu song ngữ quy mô lớn, lên tới hàng triệu cặp câu để huấn luyện mô hình.

Theo PGS.TS Nguyễn Trường Thắng - Viện trưởng Viện Công nghệ thông tin, Viện Hàn lâm KH&CN Việt Nam, hiện rất nhiều ngôn ngữ trên thế giới không có đủ tài nguyên như vậy. Việc xây dựng mô hình dịch máy hiệu quả cho những ngôn ngữ nghèo tài nguyên, trong đó có các ngôn ngữ của khu vực Đông Nam Á là công việc hết sức cấp thiết và gặp nhiều thách thức.

Cũng theo PGS.TS Nguyễn Trường Thắng, để khắc phục các tồn tại này, nhóm các nhà nghiên cứu tại Viện Công nghệ thông tin (CNTT) đã phát triển một hệ thống dịch thuật lấy tiếng Việt làm trung tâm, có khả năng dịch thuật hai chiều giữa tiếng Việt và các ngôn ngữ nghèo tài nguyên của khu vực Đông Nam Á với chất lượng tương đương với các sản phẩm thương mại nổi tiếng trên thế giới.

"Chúng tôi định hướng những ngôn ngữ hiếm như tiếng Lào, tiếng Khmer… và sau này là những ngôn ngữ của các dân tộc thiểu số của Việt Nam là tiếng Mường, tiếng Thái… Vì đây là những ngôn ngữ mà nước ngoài không bao giờ làm, và nếu họ có làm thì họ cũng không hiểu đặc thù ngôn ngữ của Việt Nam, mà hiện nay cũng đã có một số đối tác quan tâm. Chúng ta lựa chọn hướng đi là nội địa hóa, nhưng phù hợp với năng lực và hướng đi của chúng ta", PGS.TS Nguyễn Trường Thắng cho biết.

Tính đến thời điểm hiện tại, hệ thống đã có khả năng dịch hai chiều giữa các cặp ngôn ngữ bao gồm Việt - Lào, Việt - Khmer, Việt - Thái, Việt - Malaysia và Việt - Indonesia. Nhóm nghiên cứu cũng cho biết, hệ thống được nghiên cứu phát triển dựa trên các tiến bộ mới nhất hiện nay trên thế giới trong lĩnh vực xử lý ngôn ngữ tự nhiên nói chung và dịch máy nói riêng. Các ngôn ngữ như tiếng Lào, tiếng Thái và tiếng Khmer mang lại những thách thức rất lớn khi xây dựng mô hình dịch máy, không chỉ vì sự khan hiếm của dữ liệu song ngữ mà còn vì những ngôn ngữ này rất phong phú về mặt hình thái, thiếu sự phân tách từ, phân tách câu và tính đa nghĩa. Tuy nhiên, mô hình dịch máy của Viện CNTT đã học được cách thích ứng với tất cả những đặc điểm đặc biệt này.

PGS.TS Chu Hoàng Hà - Phó Chủ tịch Viện Hàn lâm KH&CN Việt Nam nói: "Chúng ta có thể tạo ra những phần mềm dịch thuật rất chính xác với những ngôn ngữ của các dân tộc ASEAN và cũng có thể là ngôn ngữ của các dân tộc Việt Nam nữa, từ đó giúp cho việc giao tiếp thuận lợi hơn. Đặc biệt với sự áp dụng của mô hình ngôn ngữ lớn thì giúp cho việc dịch thuật chính xác hơn nhiều, giúp cho các hoạt động trao đổi, giao tiếp, ngoại giao".

Các nhà khoa học cũng cho biết, hệ thống dịch máy có thể dễ dàng mở rộng sang các ngôn ngữ đích mới bao gồm các ngôn ngữ dân tộc thiểu số tại Việt Nam (thường là rất nghèo tài nguyên dữ liệu) như tiếng Mường, tiếng Thái,… và cả các ngôn ngữ nước ngoài phổ biến như tiếng Trung, tiếng Pháp, tiếng Nga khi cần. Đặc biệt, hệ thống có khả năng tinh chỉnh để thích ứng với các miền ngôn ngữ chuyên sâu như y tế, luật… theo yêu cầu riêng của đối tác.

Có thể bạn quan tâm

Tin cùng chuyên mục

Bảo vệ người cao tuổi khi thời tiết lạnh sâu

Bảo vệ người cao tuổi khi thời tiết lạnh sâu

Bác sĩ chuyên khoa II Nguyễn Thị Thu Hiền, Khoa Nội Chung, Bệnh viện Lão Khoa Trung ương cho biết, thời tiết là yếu tố tác động trực tiếp, thường xuyên và nhanh chóng tới cơ thể thông qua nhiều cơ quan, bộ phận của cơ thể.

Chủ động phòng, chống rét cho người bệnh

Chủ động phòng, chống rét cho người bệnh

Những ngày qua, rét đậm, rét hại kéo dài gây ảnh hưởng lớn tới sức khỏe người dân, đặc biệt là người cao tuổi, trẻ em và người mắc bệnh mãn tính. Các bệnh viện, trung tâm y tế trên địa bàn tỉnh đã chủ động thực hiện nhiều biện pháp phòng, chống rét để bảo đảm sức khỏe cho bệnh nhân đến khám và điều trị.

Thời tiết ngày 15/1: Bắc Bộ và Bắc Trung Bộ trời rét, nhiều nơi có sương mù

Thời tiết ngày 15/1: Bắc Bộ và Bắc Trung Bộ trời rét, nhiều nơi có sương mù

Theo Trung tâm Dự báo khí tượng thủy văn quốc gia, ngày 15/1, thời tiết trên cả nước tiếp tục chịu ảnh hưởng của khối không khí lạnh suy yếu chậm, khiến nhiều khu vực Bắc Bộ và Bắc Trung Bộ duy trì trạng thái trời rét vào sáng sớm và ban đêm, kèm theo sương mù rải rác, trong khi ban ngày có xu hướng giảm mây và hửng nắng.

Nâng cao chất lượng dịch vụ y tế

Nâng cao chất lượng dịch vụ y tế

Trung tâm Y tế khu vực Bảo Thắng đã và đang triển khai đồng bộ nhiều giải pháp nhằm nâng cao chất lượng dịch vụ y tế, trong đó tập trung đầu tư cơ sở vật chất, tăng cường trang thiết bị, củng cố nguồn nhân lực và cải cách quy trình khám, chữa bệnh. Trọng tâm của các giải pháp là rút ngắn thời gian chờ đợi, tăng cường hỗ trợ người bệnh, đồng thời chuẩn hóa giao tiếp, ứng xử tại các khoa, phòng.

Mùa cam trĩu quả

Mùa cam trĩu quả

Những ngày này, các vùng trồng cây ăn quả của tỉnh bước vào mùa thu hoạch rộn ràng nhất trong năm. Sau một năm cần mẫn vun trồng, chăm sóc, người nông dân đón mùa quả ngọt với hy vọng mang lại nguồn thu nhập ổn định, góp phần “vẽ” nên bức tranh nông thôn yên bình, trù phú.

Nâng cao chất lượng dân số vùng đồng bào dân tộc thiểu số

Nâng cao chất lượng dân số vùng đồng bào dân tộc thiểu số

Những năm qua, các dự án, chính sách của Chương trình Mục tiêu quốc gia phát triển kinh tế - xã hội vùng đồng bào dân tộc thiểu số và miền núi được triển khai đồng bộ trên nhiều lĩnh vực. Riêng lĩnh vực dân số, tỉnh Lào Cai đạt nhiều kết quả tích cực trong nâng cao chất lượng dân số, chăm sóc sức khỏe Nhân dân, góp phần ổn định và phát triển dân số tại vùng khó khăn.

Học đi đôi với hành ở trường Cao đẳng Nghề Yên Bái

Học đi đôi với hành ở trường Cao đẳng Nghề Yên Bái

Trong những phòng tập của Khoa Nghệ thuật - Trường Cao đẳng Nghề Yên Bái, tỉnh Lào Cai, tiếng nhạc cụ dân tộc hòa cùng nhịp đếm của thầy và trò vang lên rộn rã mỗi ngày. Với học sinh nơi đây, mỗi điệu múa, lời ca không chỉ là bài học trên giảng đường mà đang dần trở thành hành trang vững chắc cho tương lai.

Mở cánh cửa tri thức, thắp sáng niềm tin

Mở cánh cửa tri thức, thắp sáng niềm tin

Thời gian qua, tại xã Cốc San, các lớp xóa mù chữ được triển khai hiệu quả, không chỉ giúp người dân biết đọc, biết viết mà còn từng bước nâng cao nhận thức, khơi dậy tinh thần học tập suốt đời và khả năng hòa nhập xã hội.

Hành trình trưởng thành của học sinh nội trú: Khi kỹ năng sống được gieo từ trái tim

Hành trình trưởng thành của học sinh nội trú: Khi kỹ năng sống được gieo từ trái tim

Thay vì những giờ chào cờ truyền thống, Trường Phổ thông Dân tộc Nội trú THPT Yên Bái, tỉnh Lào Cai đã đổi mới không gian sinh hoạt đầu tuần thành những “sân khấu” kỹ năng sống sôi động. Tất cả các chương trình đều do chính thành viên Câu lạc bộ Tổ chức sự kiện và Truyền thông của trường đảm nhiệm. Đây không chỉ là những bài học kỹ năng sống đơn thuần, mà còn là hành trình để mỗi học sinh nội trú học cách yêu thương, sẻ chia và khẳng định giá trị bản thân trong môi trường giàu tính nhân văn.

fb yt zl tw