Khi AI biết kiểm chứng sự thật: Bước tiến mới từ Viettel AI tại NAACL 2025

Tại NAACL 2025, một trong những Hội nghị trí tuệ nhân tạo (AI) hàng đầu thế giới tổ chức tại Hoa Kỳ, Viettel AI đã giới thiệu VeGraph - Phương pháp kiểm chứng thông tin giúp tăng độ chính xác lên tới 5% so với các phương pháp hiện có.

VeGraph cải thiện độ chính xác từ 2 - 5% so với các phương pháp hiện có.
VeGraph cải thiện độ chính xác từ 2 - 5% so với các phương pháp hiện có.

NAACL 2025 (Annual Conference of the Nations of the Americas Chapter of the Association for Computational Linguistics) là Diễn đàn khoa học uy tín hàng đầu thế giới trong lĩnh vực xử lý ngôn ngữ tự nhiên và ngôn ngữ học tính toán.

Theo thông tin chiều 16/5 của Viettel, sự bùng nổ của Internet và mạng xã hội khiến các nội dung do người dùng tự tạo ngày càng phổ biến; đồng thời kéo theo làn sóng tin giả, tin không chính thống lan rộng. Những thông tin sai lệch này không chỉ gây hoang mang cho người dân trong các lĩnh vực nhạy cảm như sức khỏe, thiên tai, chính sách công… mà còn dẫn đến hậu quả nghiêm trọng như: Thiệt hại kinh tế, suy giảm uy tín tổ chức và đe dọa an ninh Quốc gia.

“Nếu trước kia, những thông tin này chỉ gây tác động đến một thời điểm và phạm vi nhất định, bây giờ, chúng đang trở nên ngày càng nguy hiểm khi trở thành một phần dữ liệu đầu vào cho các hệ thống trí tuệ nhân tạo (AI). Trong quá trình tìm kiếm, thu thập thông tin để phản hồi người dùng, các hệ thống như chatbot, trợ lý ảo hoàn toàn có khả năng sử dụng, tạo ra hoặc lan truyền thông tin sai lệch nếu không có khả năng tự kiểm chứng”, đại diện Viettel cho biết.

Kiểm chứng thông tin là quá trình xác minh tính đúng - sai của một thông tin. Ví dụ, mục tiêu của việc kiểm chứng câu nói “NASA đã tìm thấy sự sống trên sao Hỏa” là kiểm tra xem thông tin này có dựa trên sự thật được công bố hay không? thông qua các nguồn đáng tin cậy như báo chí, dữ liệu khoa học hay cơ sở tri thức. Để tự kiểm chứng được thông tin, các hệ thống AI phải có khả năng hiểu câu, tìm kiếm thông tin liên quan và kết luận một cách logic dựa trên dữ liệu khách quan.

VeGraph (Verify-in-the-Graph) là phương pháp kiểm chứng thông tin do đội ngũ kỹ sư tại Trung tâm Dịch vụ dữ liệu và Trí tuệ nhân tạo Viettel (Viettel AI) nghiên cứu, phát triển và trình bày tại NAACL 2025 - một trong 3 Hội nghị quốc tế danh giá nhất về xử lý ngôn ngữ tự nhiên. Kết quả thử nghiệm trên hai bộ dữ liệu kiểm chứng phổ biến là HoVer và FEVEROUS cho thấy, VeGraph cải thiện độ chính xác từ 2 - 5% so với các phương pháp hiện có.

Theo chuyên gia của Viettel AI, hầu hết các phương pháp kiểm chứng thông tin hiện vẫn gặp khó khi xử lý các phát ngôn mơ hồ, ẩn dụ hoặc nhiều tầng nghĩa, vốn thường được dùng để “ngụy trang” thông tin giả; đồng thời chưa thể lý giải rõ vì sao một nội dung bị đánh giá là sai, khiến người dùng khó tin tưởng kết quả. Nhiều phương pháp cũng dựa chủ yếu vào mô hình ngôn ngữ lớn (LLM) mà thiếu khả năng kiểm tra chéo với các nguồn tri thức chính thống, dẫn tới nguy cơ tạo ra kết luận sai lệch hay còn gọi là hiện tượng “ảo giác” (hallucination).

Khác với các công cụ chỉ suy luận nội bộ trong mô hình, VeGraph chủ động phân tách yêu cầu kiểm chứng thông tin thành từng mệnh đề nhỏ rồi đối chiếu với các nguồn tham khảo đáng tin cậy như văn bản pháp luật, cơ sở dữ liệu chính phủ, tài liệu chuyên ngành… Toàn bộ quá trình kiểm chứng được hệ thống hóa thành từng bước rõ ràng, giúp người dùng dễ dàng theo dõi và kiểm tra, tăng độ chính xác và minh bạch - yếu tố ngày càng quan trọng trong các ứng dụng AI. Tính năng này còn tạo điều kiện để các tổ chức nhanh chóng điều chỉnh, cải tiến hệ thống khi cần.

Hướng tới một môi trường số minh bạch và an toàn, VeGraph được đánh giá cao về tính ứng dụng thực tiễn. Ngoài khả năng tích hợp vào các hệ thống AI để tăng độ chính xác và tin cậy, công nghệ này có thể được phát triển thành hệ thống kiểm chứng thông tin trong nhiều lĩnh vực như y tế, báo chí, pháp luật hay quản lý nhà nước… Nhờ đó, người dân có thể tự kiểm chứng những thông tin quan trọng, yêu cầu tính chính thống cao như tin tức thời sự, thông tin về thuốc, vaccine, dược phẩm, hay các quy định pháp luật...

Tương lai, VeGraph sẽ được mở rộng theo hướng xử lý đa dạng các định dạng dữ liệu như hình ảnh, video, âm thanh…, nhận diện các dạng ngôn ngữ phức tạp như ẩn dụ, hàm ý và kết hợp thêm các đồ thị tri thức nhằm nâng cao khả năng suy luận.

Năm nay, NAACL 2025 thu hút một số lượng bài nghiên cứu kỷ lục, lên đến hơn 3.000 bài, tỷ lệ chấp nhận cho các bài báo chính rất cạnh tranh (khoảng 22%), quy tụ những nghiên cứu đột phá nhất. NAACL 2025 đặc biệt tập trung vào các tiến bộ vượt bậc trong phát triển mô hình ngôn ngữ lớn, xử lý ngôn ngữ tự nhiên đa dạng văn hóa và đa ngôn ngữ, các khả năng suy luận mới nổi và AI có trách nhiệm.

Theo baotintuc.vn

Có thể bạn quan tâm

Tin cùng chuyên mục

Hóa đơn điện tử từ máy tính tiền: Tiểu thương không có hóa đơn đầu vào, phải làm thế nào?

Hóa đơn điện tử từ máy tính tiền: Tiểu thương không có hóa đơn đầu vào, phải làm thế nào?

Chính sách áp dụng hóa đơn điện tử (HĐĐT) đối với hộ kinh doanh có doanh thu từ 1 tỷ đồng/năm trở lên đã được triển khai từ ngày 1/6/2025, nhưng đến nay, nhiều tiểu thương vẫn còn bỡ ngỡ, lo lắng vì chưa hiểu hết về lợi ích của chính sách thuế, cũng như quy trình sử dụng HĐĐT khởi tạo từ máy tính tiền.

Cơ hội để báo chí tìm lối đi trong thời đại số

Cơ hội để báo chí tìm lối đi trong thời đại số

Báo chí Việt Nam và thế giới đang trải qua một cuộc chuyển mình mạnh mẽ chưa từng có về phương thức, cách thức làm nghề. Công nghệ phát triển như vũ bão, đặc biệt là mạng xã hội và trí tuệ nhân tạo (AI) đã và đang tác động rất lớn đến mọi mặt của đời sống xã hội.

Hội nghị chuyển giao nhiệm vụ quản lý nhà nước về an toàn thông tin mạng từ Sở Khoa học và Công nghệ sang Công an tỉnh Lào Cai.

Chuyển giao nhiệm vụ quản lý nhà nước về an toàn thông tin mạng từ Sở Khoa học và Công nghệ sang Công an tỉnh Lào Cai

Sáng 9/6, tại trụ sở Sở Khoa học và Công nghệ đã diễn ra Hội nghị chuyển giao nhiệm vụ quản lý nhà nước về an toàn thông tin mạng từ Sở Khoa học và Công nghệ sang Công an tỉnh Lào Cai. Đồng chí Nguyễn Thành Sinh, Phó Chủ tịch UBND tỉnh chủ trì hội nghị.

Giải quyết bài toán dữ liệu và nhân lực cho phát triển AI “Make in Vietnam”

Giải quyết bài toán dữ liệu và nhân lực cho phát triển AI “Make in Vietnam”

Trí tuệ nhân tạo (AI) Việt Nam đang phát triển nhanh chóng và có tiềm năng lớn nhờ sự quan tâm của chính phủ, doanh nghiệp và cộng đồng công nghệ. Tuy nhiên, dữ liệu và nhân lực là hai trong số những điểm nghẽn cần tháo gỡ để phát triển AI nội địa bền vững, phù hợp với điều kiện đặc thù của Việt Nam.

Cục Thuế đề nghị các tổ chức cung cấp giải pháp hóa đơn điện tử đồng hành hỗ trợ hộ kinh doanh

Cục Thuế đề nghị các tổ chức cung cấp giải pháp hóa đơn điện tử đồng hành hỗ trợ hộ kinh doanh

Cục Thuế vừa có văn bản gửi các tổ chức cung cấp giải pháp hóa đơn điện tử (gồm tổ chức cung cấp giải pháp hóa đơn điện tử và tổ chức cung cấp dịch vụ nhận, truyền, lưu trữ dữ liệu hóa đơn điện tử) về việc phối hợp cùng cơ quan thuế triển khai hóa đơn điện tử khởi tạo từ máy tính tiền đối với hộ kinh doanh.

Khát vọng thương hiệu AI Việt

Khát vọng thương hiệu AI Việt

Tại Diễn đàn cấp cao Chuyển đổi số Việt Nam - châu Á 2025 được tổ chức mới đây, ông Nguyễn Tử Quảng, Phó Chủ tịch Hiệp hội Phần mềm và Dịch vụ công nghệ thông tin Việt Nam (VINASA) chia sẻ: “Việt Nam hoàn toàn có thể tạo ra DeepSeek hay một mô hình nền tảng giống GPT của riêng mình”.

fb yt zl tw