Xã hội

Việt Nam phát triển thành công phần mềm dịch ngôn ngữ hiếm khu vực Đông Nam Á

31/12/2023 06:16

Viện Công nghệ thông tin - Viện Hàn lâm Khoa học và Công nghệ Việt Nam cho biết, các nhà khoa học đã thành công trong việc ứng dụng các kỹ thuật xử lý ngôn ngữ tự nhiên tiên tiến để xây dựng các mô hình dịch máy tự động có chất lượng cao cho các cặp ngôn ngữ như Việt - Lào, Việt - Khmer, Việt - Thái, Việt - Malaysia và Việt - Indonesia.

Dịch máy (hay còn gọi là dịch tự động) là việc dịch một văn bản từ một ngôn ngữ này (ngôn ngữ nguồn) sang một hoặc nhiều ngôn ngữ khác (ngôn ngữ đích) một cách tự động, không có sự can thiệp của con người trong quá trình dịch. Hiện nay có nhiều sản phẩm dịch tự động được sử dụng phổ biến như Google Translate, Bing Translator… với chất lượng dịch rất tốt cho các câu đơn. Tuy nhiên, các hệ thống dịch máy chất lượng cao này cần các bộ dữ liệu song ngữ quy mô lớn, lên tới hàng triệu cặp câu để huấn luyện mô hình.

Theo PGS.TS Nguyễn Trường Thắng - Viện trưởng Viện Công nghệ thông tin, Viện Hàn lâm KH&CN Việt Nam, hiện rất nhiều ngôn ngữ trên thế giới không có đủ tài nguyên như vậy. Việc xây dựng mô hình dịch máy hiệu quả cho những ngôn ngữ nghèo tài nguyên, trong đó có các ngôn ngữ của khu vực Đông Nam Á là công việc hết sức cấp thiết và gặp nhiều thách thức.

Cũng theo PGS.TS Nguyễn Trường Thắng, để khắc phục các tồn tại này, nhóm các nhà nghiên cứu tại Viện Công nghệ thông tin (CNTT) đã phát triển một hệ thống dịch thuật lấy tiếng Việt làm trung tâm, có khả năng dịch thuật hai chiều giữa tiếng Việt và các ngôn ngữ nghèo tài nguyên của khu vực Đông Nam Á với chất lượng tương đương với các sản phẩm thương mại nổi tiếng trên thế giới.

"Chúng tôi định hướng những ngôn ngữ hiếm như tiếng Lào, tiếng Khmer… và sau này là những ngôn ngữ của các dân tộc thiểu số của Việt Nam là tiếng Mường, tiếng Thái… Vì đây là những ngôn ngữ mà nước ngoài không bao giờ làm, và nếu họ có làm thì họ cũng không hiểu đặc thù ngôn ngữ của Việt Nam, mà hiện nay cũng đã có một số đối tác quan tâm. Chúng ta lựa chọn hướng đi là nội địa hóa, nhưng phù hợp với năng lực và hướng đi của chúng ta", PGS.TS Nguyễn Trường Thắng cho biết.

Tính đến thời điểm hiện tại, hệ thống đã có khả năng dịch hai chiều giữa các cặp ngôn ngữ bao gồm Việt - Lào, Việt - Khmer, Việt - Thái, Việt - Malaysia và Việt - Indonesia. Nhóm nghiên cứu cũng cho biết, hệ thống được nghiên cứu phát triển dựa trên các tiến bộ mới nhất hiện nay trên thế giới trong lĩnh vực xử lý ngôn ngữ tự nhiên nói chung và dịch máy nói riêng. Các ngôn ngữ như tiếng Lào, tiếng Thái và tiếng Khmer mang lại những thách thức rất lớn khi xây dựng mô hình dịch máy, không chỉ vì sự khan hiếm của dữ liệu song ngữ mà còn vì những ngôn ngữ này rất phong phú về mặt hình thái, thiếu sự phân tách từ, phân tách câu và tính đa nghĩa. Tuy nhiên, mô hình dịch máy của Viện CNTT đã học được cách thích ứng với tất cả những đặc điểm đặc biệt này.

PGS.TS Chu Hoàng Hà - Phó Chủ tịch Viện Hàn lâm KH&CN Việt Nam nói: "Chúng ta có thể tạo ra những phần mềm dịch thuật rất chính xác với những ngôn ngữ của các dân tộc ASEAN và cũng có thể là ngôn ngữ của các dân tộc Việt Nam nữa, từ đó giúp cho việc giao tiếp thuận lợi hơn. Đặc biệt với sự áp dụng của mô hình ngôn ngữ lớn thì giúp cho việc dịch thuật chính xác hơn nhiều, giúp cho các hoạt động trao đổi, giao tiếp, ngoại giao".

Các nhà khoa học cũng cho biết, hệ thống dịch máy có thể dễ dàng mở rộng sang các ngôn ngữ đích mới bao gồm các ngôn ngữ dân tộc thiểu số tại Việt Nam (thường là rất nghèo tài nguyên dữ liệu) như tiếng Mường, tiếng Thái,… và cả các ngôn ngữ nước ngoài phổ biến như tiếng Trung, tiếng Pháp, tiếng Nga khi cần. Đặc biệt, hệ thống có khả năng tinh chỉnh để thích ứng với các miền ngôn ngữ chuyên sâu như y tế, luật… theo yêu cầu riêng của đối tác.

Từ khóa:

#dịch thuật #ngôn ngữ

Theo dõi Báo Lào Cai trên

Có thể bạn quan tâm

Phát huy vai trò của tổ chức Công đoàn trong giai đoạn mới

Kỷ luật nghiêm nữ sinh viên "dọa" sẽ lấy trật ven bệnh nhân

Hưởng ứng Ngày Thế giới Phòng chống viêm gan virus (28/7): Tăng tốc hành động ngăn ngừa xơ gan và ung thư gan

Thời tiết ngày 28/7: Lào Cai và Bắc Bộ mưa to diện rộng, đề phòng lũ quét, sạt lở đất

Tìm kiếm, cứu hộ tàu Khôi Nguyên 18: Đã có 48 người được cứu sống

Chi nhánh Ngân hàng Chính sách xã hội tỉnh Lào Cai trao tặng 150 triệu đồng tri ân người có công

Lào Cai cảnh báo nguy cơ lũ quét, sạt lở tại 66 xã, phường

Ban Công đoàn các Khu công nghiệp cơ sở 2 tổ chức Hội nghị sơ kết công tác công đoàn 6 tháng đầu năm

Tin cùng chuyên mục

Lào Cai cảnh báo nguy cơ lũ quét, sạt lở đất do mưa lớn

Xã hội 27/07/2026 17:56

Chiều 27/7, Đài Khí tượng Thủy văn tỉnh Lào Cai phát tin cảnh báo nguy cơ xảy ra lũ quét trên các sông, suối nhỏ, sạt lở đất trên sườn đồi dốc, taluy giao thông, sụt lún đất và ngập úng cục bộ tại một số khu vực trên địa bàn tỉnh do mưa lớn tiếp diễn.

Cựu chiến binh Lương Đức Thuận phát triển kinh tế hiệu quả với mô hình nuôi dúi

Xã hội 27/07/2026 17:06

Phát huy phẩm chất "Bộ đội Cụ Hồ" trong thời bình, cựu chiến binh Lương Đức Thuận, hội viên Hội Cựu chiến binh xã Gia Phú, hiện trú tại thôn Đồng Lục, xã Gia Phú, đã mạnh dạn phát triển mô hình nuôi dúi thương phẩm và dúi sinh sản. Mô hình không chỉ phù hợp với điều kiện thực tế của gia đình mà còn mang lại hiệu quả kinh tế ổn định, với thu nhập trên 100 triệu đồng mỗi năm.

Hành trình cống hiến không ngừng của những người lính

Xã hội 27/07/2026 16:28

Chiến tranh đã lùi xa, nhưng với những người lính, hành trình cống hiến cho Tổ quốc và Nhân dân vẫn tiếp tục được viết nên bằng những việc làm thiết thực trong cuộc sống đời thường. Trở về giữa thời bình, họ vẫn giữ vững phẩm chất Bộ đội Cụ Hồ, phát huy bản lĩnh, ý chí kiên cường và tinh thần trách nhiệm, trở thành những tấm gương sáng về nghị lực vươn lên, tận tụy cống hiến, góp phần xây dựng quê hương, đất nước ngày càng phát triển.

Bao giờ hết cảnh lưới điện dân sinh “vắt” qua đường sắt

Xã hội 27/07/2026 16:08

Dù đường gom dân sinh ven tuyến đường sắt Yên Viên - Lào Cai, đoạn qua xã Bảo Hà dài 12,7 km đã hoàn thành gần 2 năm qua, nhưng đến nay, hệ thống điện dân dụng vẫn chưa được đầu tư đồng bộ. Vì vậy, hàng trăm hộ dân vẫn phải tự kéo điện qua đường sắt về để sử dụng, tiềm ẩn nguy cơ mất an toàn, nhất là trong mùa mưa bão.

“Tiếp lửa” truyền thống cách mạng cho thế hệ trẻ

Xã hội 27/07/2026 16:03

Tháng Bảy - tháng của lòng biết ơn, tuổi trẻ Lào Cai sôi nổi triển khai nhiều hoạt động đền ơn đáp nghĩa, hướng về các Anh hùng, liệt sĩ và người có công với cách mạng. Mỗi công trình, phần việc thể hiện sự tri ân đối với những người đã hy sinh, cống hiến vì Tổ quốc, đồng thời, góp phần giáo dục truyền thống cách mạng, bồi đắp đạo lý “Uống nước nhớ nguồn”, khơi dậy trách nhiệm và khát vọng cống hiến trong thế hệ trẻ.

Xem xét kỷ luật hai sinh viên y khoa livestream phản cảm tại bệnh viện

Xã hội 27/07/2026 14:50

Sau vụ việc hai sinh viên thực tập tại Bệnh viện Đa khoa Đức Giang có phát ngôn thiếu chuẩn mực, gây bức xúc trên mạng xã hội, Trường Đại học Kinh doanh và Công nghệ Hà Nội sẽ họp hội đồng kỷ luật và xử lý nghiêm theo quy định.

Từ ngày 13/12, tổ chức kỳ thi năng lực tiếng Trung (HSK 3.0) phiên bản mới, người ôn phiên bản cũ cần làm gì?

Xã hội 27/07/2026 14:23

Kỳ thi năng lực tiếng Trung phiên bản 3.0 (HSK 3.0), với hệ thống đánh giá gồm 3 bậc, 9 cấp độ, sẽ chính thức thay thế hoàn toàn phiên bản 2.0 từ ngày 13/12.

Phường Âu Lâu tập huấn nâng cao năng lực phòng, chống thiên tai cho 327 lực lượng xung kích

Xã hội 27/07/2026 13:45

Ngày 27/7, phường Âu Lâu tổ chức khai mạc Chương trình tập huấn nâng cao năng lực ứng phó thiên tai và công tác cứu hộ, cứu nạn cho lực lượng xung kích phòng, chống thiên tai trên địa bàn.

Nghiệp đoàn cơ sở chợ Sơn Thịnh chung tay hỗ trợ các hộ dân bị thiệt hại do mưa bão tại xã Lao Chải

Xã hội 27/07/2026 13:44

Ngày 26/7, Nghiệp đoàn cơ sở chợ Sơn Thịnh phối hợp với các nhà hảo tâm, mạnh thường quân tổ chức chương trình thăm hỏi, động viên và trao kinh phí hỗ trợ các hộ gia đình bị thiệt hại do trận mưa bão xảy ra ngày 19/7 tại xã Lao Chải, tỉnh Lào Cai.

Cao điểm 500 ngày đêm “Đền ơn đáp nghĩa”

Xã hội 27/07/2026 13:00

Trong các cuộc kháng chiến giành độc lập và bảo vệ biên cương Tổ quốc, 9.098 người con của Lào Cai đã anh dũng hy sinh, hiến dâng tuổi xuân cho đất nước; toàn tỉnh có 4.492 thương binh và bệnh binh, 1.693 người bị nhiễm chất độc hóa học, cùng 377 Mẹ Việt Nam Anh hùng.

Lào Cai: Nhiều địa phương Lào Cai tổ chức hoạt động tri ân ý nghĩa nhân dịp 27/7

Xã hội 27/07/2026 12:02

Kỷ niệm 79 năm Ngày Thương binh - Liệt sĩ (27/7/1947 - 27/7/2026), nhiều địa phương trên địa bàn tỉnh Lào Cai đã đồng loạt tổ chức các hoạt động dâng hương, dâng hoa, thắp nến tri ân, thăm hỏi và tặng quà gia đình chính sách, người có công với cách mạng.

Bộ Giáo dục và Đào tạo tính phương án tổ chức thi tốt nghiệp trung học phổ thông nhiều đợt trong năm

Xã hội 27/07/2026 10:30

Bộ Giáo dục và Đào tạo đang rà soát toàn diện công tác tổ chức kỳ thi tốt nghiệp trung học phổ thông, đồng thời tính toán phương án tổ chức kỳ thi thành nhiều đợt trong năm và tăng cường ứng dụng công nghệ nhằm bảo đảm an toàn, minh bạch.

Những “bác sĩ” toa xe đường sắt

Xã hội 27/07/2026 09:34

Tiếng còi tàu xé tan không gian tĩnh lặng của ga Yên Bái trong buổi sáng tháng Bảy. Đoàn tàu chở quặng Apatít từ ga Xuân Giao A chậm rãi lăn bánh vào ga, những bánh thép nghiến trên đường ray phát ra thứ âm thanh khô khốc quen thuộc. Khi đoàn tàu vừa dừng lại, 4 công nhân trong sắc xanh của bộ đồ bảo hộ nhanh chóng tỏa về hai phía. Không có tiếng hô khẩu lệnh, không có những động tác thừa, ai cũng hiểu chính xác phần việc của mình.

Lương hưu tháng 7/2026 tăng 8%: Cách tự tính số tiền thực nhận

Cải cách hành chính 27/07/2026 09:25

Từ ngày 1/7/2026, lương hưu của người đang hưởng trước thời điểm này tăng 8% trên mức tháng 6/2026. Người dân có thể tự tính và đối chiếu số tiền thực nhận.

Ba thế hệ chung khúc quân hành

Chính trị - thời sự 27/07/2026 09:03

Trong ngôi nhà yên tĩnh ở tổ dân phố Yên Ninh 3, phường Yên Bái, tỉnh Lào Cai, ông Phạm Tiến như sống lại kí ức một thời hào hùng. Câu chuyện vượt thời gian của ông có nụ cười, nước mắt và cả niềm tự hào về người bố là thương binh chống Pháp, về chặng đường quân ngũ của chính mình và người con trai đang tiếp bước ông cha.

Ký ức của mẹ

Xã hội 27/07/2026 08:27

Chiến tranh đã lùi xa hơn nửa thế kỷ. Những cánh rừng năm nào đã xanh trở lại, những vùng quê từng in dấu bom đạn đã đổi thay từng ngày. Nhưng với những người mẹ có chồng, có con nằm lại nơi chiến trường, nỗi đau dường như chưa bao giờ khép lại. Sau mỗi tấm ảnh cũ, mỗi tấm Bằng Tổ quốc ghi công là một cuộc đời lặng lẽ gìn giữ ký ức về những người đã hiến dâng tuổi xuân cho Tổ quốc.

Lan tỏa đạo lý “Uống nước nhớ nguồn”

Xã hội 27/07/2026 00:24

Những ngày tháng Bảy, khắp các địa phương trong tỉnh sôi nổi tổ chức nhiều hoạt động tri ân anh hùng liệt sĩ, thương binh, bệnh binh và người có công với cách mạng. Từ dâng hương tưởng niệm, chỉnh trang công trình ghi công liệt sĩ đến thăm hỏi gia đình chính sách, những việc làm ý nghĩa góp phần lan tỏa đạo lý “Uống nước nhớ nguồn”, giáo dục truyền thống cách mạng và bồi đắp trách nhiệm cho thế hệ trẻ.

Tuổi trẻ Lào Cai thắp nến tri ân các anh hùng liệt sĩ

Xã hội 26/07/2026 22:25

Nhân kỷ niệm 79 năm Ngày Thương binh - Liệt sĩ (27/7/1947 - 27/7/2026), tối 26/7, Tỉnh đoàn Lào Cai đồng loạt tổ chức Lễ dâng hương và chương trình "Thắp nến tri ân các Anh hùng liệt sĩ" tại các nghĩa trang, đài tưởng niệm liệt sĩ trên địa bàn tỉnh, nhằm bày tỏ lòng thành kính, biết ơn sâu sắc đối với các Anh hùng liệt sĩ đã anh dũng hy sinh vì sự nghiệp đấu tranh giải phóng dân tộc, bảo vệ độc lập, tự do của Tổ quốc

Mưa lớn diện rộng từ 27-28/7: Lào Cai và 6 tỉnh miền núi phía Bắc khẩn trương triển khai phương án ứng phó

Xã hội 26/07/2026 21:03

Trước dự báo xuất hiện đợt mưa lớn diện rộng từ chiều tối ngày 27/7 đến đêm 28/7, Ban Chỉ đạo Phòng thủ dân sự quốc gia đã đề nghị Ủy ban nhân dân 7 tỉnh miền núi phía Bắc, gồm Lào Cai, Thái Nguyên, Tuyên Quang, Phú Thọ, Lai Châu, Điện Biên và Sơn La, khẩn trương triển khai các biện pháp phòng, chống thiên tai nhằm bảo đảm an toàn tính mạng người dân, hạn chế thiệt hại do ngập lụt, lũ quét, sạt lở đất và dông, lốc.

Bảo Ái tri ân người có công bằng những việc làm thiết thực

Xã hội 26/07/2026 20:12

Phát huy truyền thống “Uống nước nhớ nguồn”, xã Bảo Ái luôn quan tâm thực hiện đầy đủ, kịp thời các chế độ, chính sách đối với người có công và thân nhân người có công. Không chỉ là những phần quà trong dịp lễ, Tết, sự tri ân còn được thể hiện bằng việc chủ động rà soát đối tượng, chăm lo đời sống, hỗ trợ những gia đình còn khó khăn và lan tỏa trách nhiệm của cộng đồng đối với những người đã cống hiến cho Tổ quốc.

Việt Nam phát triển thành công phần mềm dịch ngôn ngữ hiếm khu vực Đông Nam Á

Từ khóa:

Đọc nhiều

LIÊN KẾT WEBSITE