Khi AI biết kiểm chứng sự thật: Bước tiến mới từ Viettel AI tại NAACL 2025

Tại NAACL 2025, một trong những Hội nghị trí tuệ nhân tạo (AI) hàng đầu thế giới tổ chức tại Hoa Kỳ, Viettel AI đã giới thiệu VeGraph - Phương pháp kiểm chứng thông tin giúp tăng độ chính xác lên tới 5% so với các phương pháp hiện có.

VeGraph cải thiện độ chính xác từ 2 - 5% so với các phương pháp hiện có.
VeGraph cải thiện độ chính xác từ 2 - 5% so với các phương pháp hiện có.

NAACL 2025 (Annual Conference of the Nations of the Americas Chapter of the Association for Computational Linguistics) là Diễn đàn khoa học uy tín hàng đầu thế giới trong lĩnh vực xử lý ngôn ngữ tự nhiên và ngôn ngữ học tính toán.

Theo thông tin chiều 16/5 của Viettel, sự bùng nổ của Internet và mạng xã hội khiến các nội dung do người dùng tự tạo ngày càng phổ biến; đồng thời kéo theo làn sóng tin giả, tin không chính thống lan rộng. Những thông tin sai lệch này không chỉ gây hoang mang cho người dân trong các lĩnh vực nhạy cảm như sức khỏe, thiên tai, chính sách công… mà còn dẫn đến hậu quả nghiêm trọng như: Thiệt hại kinh tế, suy giảm uy tín tổ chức và đe dọa an ninh Quốc gia.

“Nếu trước kia, những thông tin này chỉ gây tác động đến một thời điểm và phạm vi nhất định, bây giờ, chúng đang trở nên ngày càng nguy hiểm khi trở thành một phần dữ liệu đầu vào cho các hệ thống trí tuệ nhân tạo (AI). Trong quá trình tìm kiếm, thu thập thông tin để phản hồi người dùng, các hệ thống như chatbot, trợ lý ảo hoàn toàn có khả năng sử dụng, tạo ra hoặc lan truyền thông tin sai lệch nếu không có khả năng tự kiểm chứng”, đại diện Viettel cho biết.

Kiểm chứng thông tin là quá trình xác minh tính đúng - sai của một thông tin. Ví dụ, mục tiêu của việc kiểm chứng câu nói “NASA đã tìm thấy sự sống trên sao Hỏa” là kiểm tra xem thông tin này có dựa trên sự thật được công bố hay không? thông qua các nguồn đáng tin cậy như báo chí, dữ liệu khoa học hay cơ sở tri thức. Để tự kiểm chứng được thông tin, các hệ thống AI phải có khả năng hiểu câu, tìm kiếm thông tin liên quan và kết luận một cách logic dựa trên dữ liệu khách quan.

VeGraph (Verify-in-the-Graph) là phương pháp kiểm chứng thông tin do đội ngũ kỹ sư tại Trung tâm Dịch vụ dữ liệu và Trí tuệ nhân tạo Viettel (Viettel AI) nghiên cứu, phát triển và trình bày tại NAACL 2025 - một trong 3 Hội nghị quốc tế danh giá nhất về xử lý ngôn ngữ tự nhiên. Kết quả thử nghiệm trên hai bộ dữ liệu kiểm chứng phổ biến là HoVer và FEVEROUS cho thấy, VeGraph cải thiện độ chính xác từ 2 - 5% so với các phương pháp hiện có.

Theo chuyên gia của Viettel AI, hầu hết các phương pháp kiểm chứng thông tin hiện vẫn gặp khó khi xử lý các phát ngôn mơ hồ, ẩn dụ hoặc nhiều tầng nghĩa, vốn thường được dùng để “ngụy trang” thông tin giả; đồng thời chưa thể lý giải rõ vì sao một nội dung bị đánh giá là sai, khiến người dùng khó tin tưởng kết quả. Nhiều phương pháp cũng dựa chủ yếu vào mô hình ngôn ngữ lớn (LLM) mà thiếu khả năng kiểm tra chéo với các nguồn tri thức chính thống, dẫn tới nguy cơ tạo ra kết luận sai lệch hay còn gọi là hiện tượng “ảo giác” (hallucination).

Khác với các công cụ chỉ suy luận nội bộ trong mô hình, VeGraph chủ động phân tách yêu cầu kiểm chứng thông tin thành từng mệnh đề nhỏ rồi đối chiếu với các nguồn tham khảo đáng tin cậy như văn bản pháp luật, cơ sở dữ liệu chính phủ, tài liệu chuyên ngành… Toàn bộ quá trình kiểm chứng được hệ thống hóa thành từng bước rõ ràng, giúp người dùng dễ dàng theo dõi và kiểm tra, tăng độ chính xác và minh bạch - yếu tố ngày càng quan trọng trong các ứng dụng AI. Tính năng này còn tạo điều kiện để các tổ chức nhanh chóng điều chỉnh, cải tiến hệ thống khi cần.

Hướng tới một môi trường số minh bạch và an toàn, VeGraph được đánh giá cao về tính ứng dụng thực tiễn. Ngoài khả năng tích hợp vào các hệ thống AI để tăng độ chính xác và tin cậy, công nghệ này có thể được phát triển thành hệ thống kiểm chứng thông tin trong nhiều lĩnh vực như y tế, báo chí, pháp luật hay quản lý nhà nước… Nhờ đó, người dân có thể tự kiểm chứng những thông tin quan trọng, yêu cầu tính chính thống cao như tin tức thời sự, thông tin về thuốc, vaccine, dược phẩm, hay các quy định pháp luật...

Tương lai, VeGraph sẽ được mở rộng theo hướng xử lý đa dạng các định dạng dữ liệu như hình ảnh, video, âm thanh…, nhận diện các dạng ngôn ngữ phức tạp như ẩn dụ, hàm ý và kết hợp thêm các đồ thị tri thức nhằm nâng cao khả năng suy luận.

Năm nay, NAACL 2025 thu hút một số lượng bài nghiên cứu kỷ lục, lên đến hơn 3.000 bài, tỷ lệ chấp nhận cho các bài báo chính rất cạnh tranh (khoảng 22%), quy tụ những nghiên cứu đột phá nhất. NAACL 2025 đặc biệt tập trung vào các tiến bộ vượt bậc trong phát triển mô hình ngôn ngữ lớn, xử lý ngôn ngữ tự nhiên đa dạng văn hóa và đa ngôn ngữ, các khả năng suy luận mới nổi và AI có trách nhiệm.

Theo baotintuc.vn

Có thể bạn quan tâm

Tin cùng chuyên mục

Bảng xếp hạng của RRC trong hạng mục DocVQA 6/2025.

CMC đạt tốp 12 thế giới về nhận dạng văn bản

Mô hình CATI-VLM (Visual Document Understanding) do Viện Ứng dụng công nghệ CMC(CMC ATI) phát triển đã vượt qua nhiều đối thủ quốc tế đạt tốp 12 thế giới và tốp 1 Việt Nam trong bảng xếp hạng vừa được Robust Reading Competition (RRC) công bố tháng 6/2025 tại hạng mục Document Visual Question Answering (DocVQA)

Tổng Bí thư Tô Lâm và các đồng chí trong Ban Chỉ đạo ấn nút khai trương ra mắt hệ thống 3 nền tảng số phục vụ giám sát triển khai Nghị quyết 57-NQ/TW.

Tập trung cao độ, hành động quyết liệt 8 vấn đề về phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia

Sáng 2-7, tại Hà Nội, Ban Chỉ đạo Trung ương về phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số (Ban Chỉ đạo) tổ chức hội nghị sơ kết 6 tháng đầu năm và triển khai nhiệm vụ trọng tâm 6 tháng cuối năm 2025 theo hình thức trực tiếp kết hợp với trực tuyến với các địa phương. Tổng Bí thư Tô Lâm, Trưởng ban Chỉ đạo Trung ương chủ trì hội nghị.

96,5% dân số Lào Cai được quản lý sức khỏe điện tử

96,5% dân số Lào Cai được quản lý sức khỏe điện tử

Theo thông tin từ Sở Y tế tỉnh, đến thời điểm hiện tại, 96,5% dân số trên địa bàn tỉnh đã được quản lý sức khỏe điện tử, vượt xa mục tiêu đề ra trong Kế hoạch 220/KH-UBND ngày 26/4/2023 về chuyển đổi số ngành y tế giai đoạn 2023 - 2025, định hướng đến năm 2030.

Yên Bái chuyển đổi số để vững bước vào kỷ nguyên mới

Yên Bái chuyển đổi số để vững bước vào kỷ nguyên mới

Xác định chuyển đổi số (CĐS) là xu thế, thời cơ, động lực tạo đột phá trong phát triển, tỉnh Yên Bái đã nỗ lực thúc đẩy CĐS trên nhiều lĩnh vực. Từ đó, làm thay đổi căn bản, toàn diện hoạt động chỉ đạo, điều hành, quản lý của cấp ủy, chính quyền các cấp, hoạt động sản xuất, kinh doanh của doanh nghiệp, phương thức sống, làm việc của người dân theo hướng tích cực, đem lại cuộc sống hiện đại, thông minh, tiện ích.

Nhà báo "tỉnh táo" trước AI

Nhà báo "tỉnh táo" trước AI

Trí tuệ nhân tạo (AI) đang tạo ra những thay đổi mãnh liệt trong lĩnh vực báo chí. Tỉnh táo trước làn sóng thông tin ảo, fake-news do AI tạo ra khi tác nghiệp trở thành đòi hỏi cấp thiết với đội ngũ phóng viên, biên tập viên. Các nhà báo, chuyên gia công nghệ đã chia sẻ vấn đề này với phóng viên báo Tin tức và Dân tộc.

Công nghệ - cầu nối để tiếp cận, giám sát chính sách

Công nghệ - cầu nối để tiếp cận, giám sát chính sách

Nghị quyết số 57-NQ/TW về đột phá phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia và Nghị quyết số 66-NQ/TW về đổi mới công tác xây dựng và thi hành pháp luật đáp ứng yêu cầu phát triển đất nước trong kỷ nguyên mới đang được ngành tư pháp cụ thể hóa bằng những hành động cụ thể.

fb yt zl tw