Khi AI biết kiểm chứng sự thật: Bước tiến mới từ Viettel AI tại NAACL 2025

Tại NAACL 2025, một trong những Hội nghị trí tuệ nhân tạo (AI) hàng đầu thế giới tổ chức tại Hoa Kỳ, Viettel AI đã giới thiệu VeGraph - Phương pháp kiểm chứng thông tin giúp tăng độ chính xác lên tới 5% so với các phương pháp hiện có.

VeGraph cải thiện độ chính xác từ 2 - 5% so với các phương pháp hiện có.
VeGraph cải thiện độ chính xác từ 2 - 5% so với các phương pháp hiện có.

NAACL 2025 (Annual Conference of the Nations of the Americas Chapter of the Association for Computational Linguistics) là Diễn đàn khoa học uy tín hàng đầu thế giới trong lĩnh vực xử lý ngôn ngữ tự nhiên và ngôn ngữ học tính toán.

Theo thông tin chiều 16/5 của Viettel, sự bùng nổ của Internet và mạng xã hội khiến các nội dung do người dùng tự tạo ngày càng phổ biến; đồng thời kéo theo làn sóng tin giả, tin không chính thống lan rộng. Những thông tin sai lệch này không chỉ gây hoang mang cho người dân trong các lĩnh vực nhạy cảm như sức khỏe, thiên tai, chính sách công… mà còn dẫn đến hậu quả nghiêm trọng như: Thiệt hại kinh tế, suy giảm uy tín tổ chức và đe dọa an ninh Quốc gia.

“Nếu trước kia, những thông tin này chỉ gây tác động đến một thời điểm và phạm vi nhất định, bây giờ, chúng đang trở nên ngày càng nguy hiểm khi trở thành một phần dữ liệu đầu vào cho các hệ thống trí tuệ nhân tạo (AI). Trong quá trình tìm kiếm, thu thập thông tin để phản hồi người dùng, các hệ thống như chatbot, trợ lý ảo hoàn toàn có khả năng sử dụng, tạo ra hoặc lan truyền thông tin sai lệch nếu không có khả năng tự kiểm chứng”, đại diện Viettel cho biết.

Kiểm chứng thông tin là quá trình xác minh tính đúng - sai của một thông tin. Ví dụ, mục tiêu của việc kiểm chứng câu nói “NASA đã tìm thấy sự sống trên sao Hỏa” là kiểm tra xem thông tin này có dựa trên sự thật được công bố hay không? thông qua các nguồn đáng tin cậy như báo chí, dữ liệu khoa học hay cơ sở tri thức. Để tự kiểm chứng được thông tin, các hệ thống AI phải có khả năng hiểu câu, tìm kiếm thông tin liên quan và kết luận một cách logic dựa trên dữ liệu khách quan.

VeGraph (Verify-in-the-Graph) là phương pháp kiểm chứng thông tin do đội ngũ kỹ sư tại Trung tâm Dịch vụ dữ liệu và Trí tuệ nhân tạo Viettel (Viettel AI) nghiên cứu, phát triển và trình bày tại NAACL 2025 - một trong 3 Hội nghị quốc tế danh giá nhất về xử lý ngôn ngữ tự nhiên. Kết quả thử nghiệm trên hai bộ dữ liệu kiểm chứng phổ biến là HoVer và FEVEROUS cho thấy, VeGraph cải thiện độ chính xác từ 2 - 5% so với các phương pháp hiện có.

Theo chuyên gia của Viettel AI, hầu hết các phương pháp kiểm chứng thông tin hiện vẫn gặp khó khi xử lý các phát ngôn mơ hồ, ẩn dụ hoặc nhiều tầng nghĩa, vốn thường được dùng để “ngụy trang” thông tin giả; đồng thời chưa thể lý giải rõ vì sao một nội dung bị đánh giá là sai, khiến người dùng khó tin tưởng kết quả. Nhiều phương pháp cũng dựa chủ yếu vào mô hình ngôn ngữ lớn (LLM) mà thiếu khả năng kiểm tra chéo với các nguồn tri thức chính thống, dẫn tới nguy cơ tạo ra kết luận sai lệch hay còn gọi là hiện tượng “ảo giác” (hallucination).

Khác với các công cụ chỉ suy luận nội bộ trong mô hình, VeGraph chủ động phân tách yêu cầu kiểm chứng thông tin thành từng mệnh đề nhỏ rồi đối chiếu với các nguồn tham khảo đáng tin cậy như văn bản pháp luật, cơ sở dữ liệu chính phủ, tài liệu chuyên ngành… Toàn bộ quá trình kiểm chứng được hệ thống hóa thành từng bước rõ ràng, giúp người dùng dễ dàng theo dõi và kiểm tra, tăng độ chính xác và minh bạch - yếu tố ngày càng quan trọng trong các ứng dụng AI. Tính năng này còn tạo điều kiện để các tổ chức nhanh chóng điều chỉnh, cải tiến hệ thống khi cần.

Hướng tới một môi trường số minh bạch và an toàn, VeGraph được đánh giá cao về tính ứng dụng thực tiễn. Ngoài khả năng tích hợp vào các hệ thống AI để tăng độ chính xác và tin cậy, công nghệ này có thể được phát triển thành hệ thống kiểm chứng thông tin trong nhiều lĩnh vực như y tế, báo chí, pháp luật hay quản lý nhà nước… Nhờ đó, người dân có thể tự kiểm chứng những thông tin quan trọng, yêu cầu tính chính thống cao như tin tức thời sự, thông tin về thuốc, vaccine, dược phẩm, hay các quy định pháp luật...

Tương lai, VeGraph sẽ được mở rộng theo hướng xử lý đa dạng các định dạng dữ liệu như hình ảnh, video, âm thanh…, nhận diện các dạng ngôn ngữ phức tạp như ẩn dụ, hàm ý và kết hợp thêm các đồ thị tri thức nhằm nâng cao khả năng suy luận.

Năm nay, NAACL 2025 thu hút một số lượng bài nghiên cứu kỷ lục, lên đến hơn 3.000 bài, tỷ lệ chấp nhận cho các bài báo chính rất cạnh tranh (khoảng 22%), quy tụ những nghiên cứu đột phá nhất. NAACL 2025 đặc biệt tập trung vào các tiến bộ vượt bậc trong phát triển mô hình ngôn ngữ lớn, xử lý ngôn ngữ tự nhiên đa dạng văn hóa và đa ngôn ngữ, các khả năng suy luận mới nổi và AI có trách nhiệm.

Theo baotintuc.vn

Có thể bạn quan tâm

Tin cùng chuyên mục

Biến công nghệ trở thành 'trợ lý' sáng tạo đắc lực

Biến công nghệ trở thành 'trợ lý' sáng tạo đắc lực

Việt Nam rất có tiềm năng và đã sẵn sàng cho những bước nhảy vọt trong kỉ nguyên số. Tuy nhiên để biến những thách thức thành cơ hội Việt Nam cần có nhiều giải pháp đồng bộ từ cơ chế đến nguồn lực để đầu tư cơ sở vật chất cũng như đào tạo nguồn nhân lực chất lượng trong thời đại kỉ nguyên số.

Tìm lại giọng nói đã mất sau 25 năm nhờ AI

Tìm lại giọng nói đã mất sau 25 năm nhờ AI

Một phụ nữ Anh mắc bệnh thần kinh vận động (MND), khiến bà mất khả năng nói, đã có thể giao tiếp trở lại bằng chính giọng nói của mình nhờ công nghệ trí tuệ nhân tạo (AI) và một đoạn ghi âm dài 8 giây trích từ video cũ của gia đình.

Trí tuệ nhân tạo làm thay đổi thói quen mua sắm

Trí tuệ nhân tạo làm thay đổi thói quen mua sắm

Một nghiên cứu mới đây cho thấy mặc dù gần một nửa số người dân Australia sử dụng trí tuệ nhân tạo (AI) để tìm kiếm các sản phẩm trực tuyến, song có tới 9/10 người lo ngại những rủi ro, nhất là vấn đề quyền riêng tư và bảo mật thông tin cá nhân.

Bài cuối: Cần những giải pháp đồng bộ để tháo gỡ

Không để khoảng trống trong thực hiện thủ tục hành chính Bài cuối: Cần những giải pháp đồng bộ để tháo gỡ

Dù còn những vướng mắc, khó khăn nhất định trong giai đoạn đầu chuyển tiếp, nhưng với tinh thần chủ động và những giải pháp cụ thể, UBND tỉnh đã chỉ đạo các sở, ban, ngành, đơn vị liên quan và UBND các xã, phường khẩn trương có giải pháp khắc phục.

Lào Cai ra mắt trang zalo OA “Mặt trận Lào Cai thông tin tuyên truyền và lắng nghe dân nói”

Lào Cai ra mắt trang zalo OA “Mặt trận Lào Cai thông tin tuyên truyền và lắng nghe dân nói”

Thực hiện Nghị quyết số 57 của Bộ Chính trị về đột phá phát triển khoa học - công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia; Kế hoạch hành động số 01 của Tỉnh ủy Lào Cai, mới đây Ban Thường trực Ủy ban MTTQ Việt Nam tỉnh Lào Cai đã chính thức ra mắt trang zalo OA với tên gọi “Mặt trận Lào Cai thông tin tuyên truyền và lắng nghe dân nói”.

Bài 1: Hoạt động ổn định nhưng vướng mắc vẫn còn

Không để khoảng trống trong thực hiện thủ tục hành chính: Bài 1: Hoạt động ổn định nhưng vướng mắc vẫn còn

Hiện nay, hàng trăm thủ tục hành chính đã được chuyển về trung tâm phục vụ hành chính công các xã để thực hiện. Tuy nhiên, vì nhiều nguyên nhân, một số thủ tục hành chính vẫn đang gặp khó khăn trong triển khai. Để phục vụ người dân tốt hơn, chính quyền các địa phương và ngành chức năng cũng như doanh nghiệp viễn thông cần có giải pháp để khắc phục tồn tại, bất cập.

Tái hiện lịch sử bằng công nghệ

Tái hiện lịch sử bằng công nghệ

Không chỉ gợi nhắc ký ức hào hùng, những mô hình ứng dụng công nghệ số còn mở ra cách tiếp cận mới, giúp lịch sử “sống lại” trong đời sống hôm nay, nuôi dưỡng niềm tự hào và khát vọng cống hiến của thế hệ trẻ.

Khi hợp tác xã chuyển đổi số

Khi hợp tác xã chuyển đổi số

Trong bối cảnh cả nền kinh tế đã và đang chuyển mình theo cuộc cách mạng công nghiệp 4.0, các hợp tác xã (HTX) cũng đang thích ứng và tiếp cận gần hơn với sự chuyển mình đó. Theo các chuyên gia, việc phát triển HTX điện tử sẽ tạo động lực để các HTX, hộ kinh doanh cá thể phát triển bứt phá.

fb yt zl tw