Khi AI biết kiểm chứng sự thật: Bước tiến mới từ Viettel AI tại NAACL 2025

Tại NAACL 2025, một trong những Hội nghị trí tuệ nhân tạo (AI) hàng đầu thế giới tổ chức tại Hoa Kỳ, Viettel AI đã giới thiệu VeGraph - Phương pháp kiểm chứng thông tin giúp tăng độ chính xác lên tới 5% so với các phương pháp hiện có.

VeGraph cải thiện độ chính xác từ 2 - 5% so với các phương pháp hiện có.
VeGraph cải thiện độ chính xác từ 2 - 5% so với các phương pháp hiện có.

NAACL 2025 (Annual Conference of the Nations of the Americas Chapter of the Association for Computational Linguistics) là Diễn đàn khoa học uy tín hàng đầu thế giới trong lĩnh vực xử lý ngôn ngữ tự nhiên và ngôn ngữ học tính toán.

Theo thông tin chiều 16/5 của Viettel, sự bùng nổ của Internet và mạng xã hội khiến các nội dung do người dùng tự tạo ngày càng phổ biến; đồng thời kéo theo làn sóng tin giả, tin không chính thống lan rộng. Những thông tin sai lệch này không chỉ gây hoang mang cho người dân trong các lĩnh vực nhạy cảm như sức khỏe, thiên tai, chính sách công… mà còn dẫn đến hậu quả nghiêm trọng như: Thiệt hại kinh tế, suy giảm uy tín tổ chức và đe dọa an ninh Quốc gia.

“Nếu trước kia, những thông tin này chỉ gây tác động đến một thời điểm và phạm vi nhất định, bây giờ, chúng đang trở nên ngày càng nguy hiểm khi trở thành một phần dữ liệu đầu vào cho các hệ thống trí tuệ nhân tạo (AI). Trong quá trình tìm kiếm, thu thập thông tin để phản hồi người dùng, các hệ thống như chatbot, trợ lý ảo hoàn toàn có khả năng sử dụng, tạo ra hoặc lan truyền thông tin sai lệch nếu không có khả năng tự kiểm chứng”, đại diện Viettel cho biết.

Kiểm chứng thông tin là quá trình xác minh tính đúng - sai của một thông tin. Ví dụ, mục tiêu của việc kiểm chứng câu nói “NASA đã tìm thấy sự sống trên sao Hỏa” là kiểm tra xem thông tin này có dựa trên sự thật được công bố hay không? thông qua các nguồn đáng tin cậy như báo chí, dữ liệu khoa học hay cơ sở tri thức. Để tự kiểm chứng được thông tin, các hệ thống AI phải có khả năng hiểu câu, tìm kiếm thông tin liên quan và kết luận một cách logic dựa trên dữ liệu khách quan.

VeGraph (Verify-in-the-Graph) là phương pháp kiểm chứng thông tin do đội ngũ kỹ sư tại Trung tâm Dịch vụ dữ liệu và Trí tuệ nhân tạo Viettel (Viettel AI) nghiên cứu, phát triển và trình bày tại NAACL 2025 - một trong 3 Hội nghị quốc tế danh giá nhất về xử lý ngôn ngữ tự nhiên. Kết quả thử nghiệm trên hai bộ dữ liệu kiểm chứng phổ biến là HoVer và FEVEROUS cho thấy, VeGraph cải thiện độ chính xác từ 2 - 5% so với các phương pháp hiện có.

Theo chuyên gia của Viettel AI, hầu hết các phương pháp kiểm chứng thông tin hiện vẫn gặp khó khi xử lý các phát ngôn mơ hồ, ẩn dụ hoặc nhiều tầng nghĩa, vốn thường được dùng để “ngụy trang” thông tin giả; đồng thời chưa thể lý giải rõ vì sao một nội dung bị đánh giá là sai, khiến người dùng khó tin tưởng kết quả. Nhiều phương pháp cũng dựa chủ yếu vào mô hình ngôn ngữ lớn (LLM) mà thiếu khả năng kiểm tra chéo với các nguồn tri thức chính thống, dẫn tới nguy cơ tạo ra kết luận sai lệch hay còn gọi là hiện tượng “ảo giác” (hallucination).

Khác với các công cụ chỉ suy luận nội bộ trong mô hình, VeGraph chủ động phân tách yêu cầu kiểm chứng thông tin thành từng mệnh đề nhỏ rồi đối chiếu với các nguồn tham khảo đáng tin cậy như văn bản pháp luật, cơ sở dữ liệu chính phủ, tài liệu chuyên ngành… Toàn bộ quá trình kiểm chứng được hệ thống hóa thành từng bước rõ ràng, giúp người dùng dễ dàng theo dõi và kiểm tra, tăng độ chính xác và minh bạch - yếu tố ngày càng quan trọng trong các ứng dụng AI. Tính năng này còn tạo điều kiện để các tổ chức nhanh chóng điều chỉnh, cải tiến hệ thống khi cần.

Hướng tới một môi trường số minh bạch và an toàn, VeGraph được đánh giá cao về tính ứng dụng thực tiễn. Ngoài khả năng tích hợp vào các hệ thống AI để tăng độ chính xác và tin cậy, công nghệ này có thể được phát triển thành hệ thống kiểm chứng thông tin trong nhiều lĩnh vực như y tế, báo chí, pháp luật hay quản lý nhà nước… Nhờ đó, người dân có thể tự kiểm chứng những thông tin quan trọng, yêu cầu tính chính thống cao như tin tức thời sự, thông tin về thuốc, vaccine, dược phẩm, hay các quy định pháp luật...

Tương lai, VeGraph sẽ được mở rộng theo hướng xử lý đa dạng các định dạng dữ liệu như hình ảnh, video, âm thanh…, nhận diện các dạng ngôn ngữ phức tạp như ẩn dụ, hàm ý và kết hợp thêm các đồ thị tri thức nhằm nâng cao khả năng suy luận.

Năm nay, NAACL 2025 thu hút một số lượng bài nghiên cứu kỷ lục, lên đến hơn 3.000 bài, tỷ lệ chấp nhận cho các bài báo chính rất cạnh tranh (khoảng 22%), quy tụ những nghiên cứu đột phá nhất. NAACL 2025 đặc biệt tập trung vào các tiến bộ vượt bậc trong phát triển mô hình ngôn ngữ lớn, xử lý ngôn ngữ tự nhiên đa dạng văn hóa và đa ngôn ngữ, các khả năng suy luận mới nổi và AI có trách nhiệm.

Theo baotintuc.vn

Có thể bạn quan tâm

Tin cùng chuyên mục

"Đòn bẩy" chiến lược đưa Lào Cai thành cực tăng trưởng

"Đòn bẩy" chiến lược đưa Lào Cai thành cực tăng trưởng

Với tư duy lãnh đạo đổi mới, tỉnh Lào Cai đã và đang triển khai hàng loạt quyết sách, lấy Nghị quyết 57-NQ/TW của Bộ Chính trị làm kim chỉ nam. Từ thể chế, hạ tầng đến con người, mọi yếu tố đang được Lào Cai chủ động thực hiện, tạo nền tảng vững chắc để bứt phá phát triển năng động, thành cực tăng trưởng mới nơi biên cương Tổ quốc.

Phát huy hiệu quả hoạt động Tổ công nghệ số cộng đồng ở Đông Cuông

Phát huy hiệu quả hoạt động Tổ công nghệ số cộng đồng ở Đông Cuông

Trong bối cảnh chuyển đổi số đang được triển khai sâu rộng đến từng địa phương, việc phát huy vai trò của Tổ công nghệ số cộng đồng đã trở thành yếu tố quan trọng giúp người dân nông thôn tiếp cận công nghệ. Tại xã Đông Cuông, mô hình này đang được triển khai hiệu quả, góp phần thúc đẩy quá trình chuyển đổi số cơ sở gắn với xây dựng nông thôn mới.

Chuyển đổi số – động lực mới trong xây dựng nông thôn mới

Chuyển đổi số – động lực mới trong xây dựng nông thôn mới

Chuyển đổi số đang trở thành một trong những yếu tố then chốt trong quá trình xây dựng nông thôn mới tại Lào Cai. Trên cả ba trụ cột: chính quyền số, kinh tế số và xã hội số, nhiều giải pháp đã và đang được triển khai đồng bộ, góp phần nâng cao hiệu quả quản lý, thay đổi phương thức sản xuất và cải thiện đời sống của người dân nông thôn, miền núi.

Số hóa để phát triển bền vững

Số hóa để phát triển bền vững

Tại Lào Cai, cộng đồng doanh nghiệp chủ yếu là doanh nghiệp vừa và nhỏ (DNVVN), việc chủ động tiếp cận và ứng dụng công nghệ số không chỉ giúp doanh nghiệp tối ưu hóa hoạt động sản xuất, kinh doanh, cải thiện hiệu suất lao động mà còn là chìa khóa mở rộng thị trường trong kỷ nguyên số.

Lào Cai hưởng ứng Ngày Chuyển đổi số Quốc gia

Lào Cai hưởng ứng Ngày Chuyển đổi số Quốc gia

Hưởng ứng Ngày hội đổi mới sáng tạo Quốc gia (1/10) và Ngày Chuyển đổi số quốc gia (10/10), tỉnh Lào Cai sẽ tổ chức nhiều hoạt động hưởng ứng nhằm khẳng định cam kết mạnh mẽ của tỉnh Lào Cai trong thúc đẩy đổi mới sáng tạo và chuyển đổi số, coi đây là động lực chiến lược để tăng trưởng kinh tế nhanh, bền vững, nâng cao năng suất và năng lực cạnh tranh quốc gia.

Chuẩn hóa liên thông dữ liệu khu vực công tư

Chuẩn hóa liên thông dữ liệu khu vực công tư

Trong bối cảnh chuyển đổi số diễn ra mạnh mẽ, dữ liệu được xem là “tài nguyên” cốt lõi của quốc gia và doanh nghiệp. Tuy nhiên, việc khai thác dữ liệu để thúc đẩy các loại hình doanh nghiệp, vẫn đối mặt nhiều thách thức về an toàn và liên thông khu vực công tư.

"Bình dân học vụ số" làn sóng mạnh mẽ trong cộng đồng dân cư

"Bình dân học vụ số" làn sóng mạnh mẽ trong cộng đồng dân cư

Thực hiện phong trào “Bình dân học vụ số” do Tổng Bí thư Tô Lâm, Trưởng Ban Chỉ đạo Trung ương về phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số phát động, Tỉnh ủy, UBND tỉnh Lào Cai đã tiếp thu, triển khai hiệu quả, sáng tạo phù hợp với thực tiễn địa phương. Từ đó tạo sức lan toả mạnh mẽ trong trong cộng đồng, góp phần phát triển bền vững.  

fb yt zl tw