CMC đạt tốp 12 thế giới về nhận dạng văn bản

Mô hình CATI-VLM (Visual Document Understanding) do Viện Ứng dụng công nghệ CMC(CMC ATI) phát triển đã vượt qua nhiều đối thủ quốc tế đạt tốp 12 thế giới và tốp 1 Việt Nam trong bảng xếp hạng vừa được Robust Reading Competition (RRC) công bố tháng 6/2025 tại hạng mục Document Visual Question Answering (DocVQA)

Trong bối cảnh và chuyển đổi ứng dụng trí tuệ nhân tạo tại Việt Nam đang diễn ra mạnh mẽ, công nghệ OCR (Nhận dạng ký tự quang học) ngày càng giữ vai trò quan trọng trong việc số hóa tài liệu, tự động hóa quy trình nghiệp vụ, tiết kiệm chi phí và nâng cao hiệu quả quản trị. Tuy nhiên, với đặc thù tiếng Việt có dấu và chữ viết tay, bài toán nhận dạng không chỉ dừng lại ở việc 'đọc chữ', mà đòi hỏi mô hình phải có khả năng hiểu ngữ cảnh toàn diện.

Mới đây, Viện Ứng dụng công nghệ CMC (CMC ATI) đã công bố mô hình CATI-VLM (Visual Document Understanding) - do đội ngũ nghiên cứu phát triển từ kho dữ liệu lớn 5TB, vượt qua nhiều đối thủ quốc tế đạt tốp 12 thế giới và tốp 1 Việt Nam trong bảng xếp hạng vừa được Robust Reading Competition (RRC) công bố tháng 6/2025 tại hạng mục Document Visual Question Answering (DocVQA).

Robust Reading Competition (RRC) là một sân chơi khoa học uy tín, (https://rrc.cvc.uab.es/) được tổ chức bởi Trung tâm Thị giác máy tính (CVC) thuộc Đại học Autònoma de Barcelona (UAB) Tây Ban Nha, một cơ sở nghiên cứu có uy tín của thế giới trong lĩnh vực thị giác máy tính.

Cuộc thi khởi xướng từ năm 2011, được tổ chức thường niên trong khuôn khổ Hội nghị Quốc tế về phân tích và nhận dạng văn bản ICDAR – một trong những diễn đàn hàng đầu thế giới trong lĩnh vực thị giác máy tính. Cuộc thi thu hút đông đảo các nhà nghiên cứu, kỹ sư từ các trường đại học, viện nghiên cứu và các tập đoàn công nghệ lớn như Đại học Thanh Hoa, Hyundai Motor Group, Tencent… Các bài toán của RRC được thiết kế để thúc đẩy tiến bộ công nghệ, gắn chặt với bài toán thực tiễn từ dịch thuật, quản trị dữ liệu doanh nghiệp đến phân tích đô thị và xử lý tài liệu lịch sử.

Tiến sĩ Đặng Minh Tuấn, Viện trưởng CMC ATI chia sẻ: "Chúng tôi rất vui mừng khi năng lực nghiên cứu của đội ngũ CMC được khẳng định qua một sân chơi uy tín toàn cầu như RRC. Chỉ trong thời gian ngắn, đội ngũ nghiên cứu đã đạt thứ hạng cao, cho thấy năng lực cạnh tranh quốc tế với các tên tuổi lớn từ các quốc gia phát triển. Quan trọng hơn, đây là minh chứng rõ ràng cho khả năng làm chủ công nghệ để giải quyết các bài toán đặc thù của tiếng Việt và các lĩnh vực chuyên ngành tại Việt Nam."

Tiến sĩ Đặng Minh Tuấn, Viện trưởng CMC ATI.
Tiến sĩ Đặng Minh Tuấn, Viện trưởng CMC ATI.

CATI-VLM khác biệt so với OCR truyền thống ở chỗ không chỉ trích xuất ký tự, mà còn hiểu nhiều lớp thông tin: nội dung văn bản, yếu tố phi văn bản (ô tick, checkbox, biểu đồ, chữ ký, công thức), bố cục (cấu trúc trang, bảng biểu, form mẫu) và phong cách (font chữ, phần highlight…). Mô hình có thể trả lời câu hỏi trực quan đặt ra trên hình ảnh tài liệu, tương tự ChatGPT, mà không cần học trước từng form cụ thể.

Đáng chú ý, trên bảng xếp hạng RRC, CATI-VLM chỉ với 3 tỷ tham số nhưng đạt độ chính xác cao nhất ở 4/7 bộ dữ liệu, vượt trội nhiều mô hình Big Tech như Deepseek (27 tỷ tham số), GPT-4 Vision Turbo + Amazon Textract OCR (tốp 34) hay Baidu (tốp 22).

Thành tích cũng cho thấy cách tiếp cận thực chất, tập trung làm chủ lõi công nghệ, tối ưu hóa mô hình phù hợp với điều kiện hạ tầng của Việt Nam thay vì chạy theo quy mô tham số.

Ví dụ mẫu đơn tuyển sinh Đại học
Ví dụ mẫu đơn tuyển sinh Đại học
Văn bản đã được nhận dạng từ chữ viết tay ở hình trên.
Văn bản đã được nhận dạng từ chữ viết tay ở hình trên.

Ông Nguyễn Trung Chính, Chủ tịch Hội đồng quản trị, Chủ tịch Điều hành Tập đoàn Công nghệ CMC, nhấn mạnh: "Đây là thành quả của hơn một thập niên kiên trì đầu tư nghiên cứu-phát triển (R&D) công nghệ. Việc CMC đạt thành tích cao tại sân chơi công nghệ quốc tế khẳng định chiến lược làm chủ công nghệ Việt, đi đôi với định hướng Chuyển đổi AI và tiến ra thị trường toàn cầu. Chúng tôi tin trí tuệ Việt Nam hoàn toàn đủ năng lực sánh vai Big Tech toàn cầu, tạo vị thế xứng đáng trên bản đồ công nghệ thế giới."

CATI-VLM sẽ được ứng dụng trong chuỗi sản phẩm thuộc hệ sinh thái C.OpenAI, gồm: Trợ lý ảo CLS rà soát văn bản pháp luật, CMC SmartDoc – nền tảng chuyển đổi số tài liệu, Hệ quản trị tri thức CMC KMS, hệ thống báo cáo tự động cho văn phòng thông minh và các ứng dụng Agentic Documents thế hệ mới.

nhandan.vn

Có thể bạn quan tâm

Tin cùng chuyên mục

Thay đổi một số chỉ tiêu trong chương trình hành động phát triển khoa học, công nghệ, chuyển đổi số

Thay đổi một số chỉ tiêu trong chương trình hành động phát triển khoa học, công nghệ, chuyển đổi số

Chính phủ ban hành Nghị quyết số 11/NQ-CP sửa đổi, bổ sung, cập nhật Nghị quyết số 71/NQ-CP ngày 1/4/2025 của Chính phủ sửa đổi, bổ sung cập nhật Chương trình hành động của Chính phủ thực hiện Nghị quyết số 57-NQ/TW ngày 22/12/2024 của Bộ Chính trị về đột phá phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia.

Đẩy mạnh tăng trưởng kinh tế số

Đẩy mạnh tăng trưởng kinh tế số

Nhằm mang lại các sản phẩm, dịch vụ tiện ích cho người dân, doanh nghiệp, thúc đẩy tăng trưởng kinh tế số, ngành ngân hàng tỉnh Lào Cai đã sớm vào cuộc triển khai Nghị quyết 57-NQ/TW ngày 22/12/2024 của Bộ Chính trị với tinh thần quyết liệt, đồng bộ, lấy người dân, doanh nghiệp làm trung tâm.

Ươm mầm năng lực số cho học sinh

Ươm mầm năng lực số cho học sinh

Từ thực tiễn đào tạo và những kết quả nổi bật đạt được tại các sân chơi khoa học - công nghệ trong nước và quốc tế, Trường Tiểu học Kim Đồng (phường Lào Cai) đang từng bước khẳng định vai trò là đơn vị tiên phong trong công tác ươm mầm năng lực số cho học sinh.

Hành trình chinh phục đỉnh cao "AI Thực chiến 2025" của chàng trai 10x Lào Cai

Hành trình chinh phục đỉnh cao "AI Thực chiến 2025" của chàng trai 10x Lào Cai

Giải Nhất cuộc thi “AI Thực chiến 2025” đã gọi tên Đoàn Viết Thắng - chàng trai quê Lào Cai, đội trưởng team Converged cùng các đồng đội, sau hành trình cạnh tranh khốc liệt giữa những nhóm nghiên cứu AI hàng đầu cả nước. Thành tích này không chỉ là dấu mốc cá nhân, mà còn cho thấy sự trưởng thành của thế hệ kỹ sư trẻ Việt Nam trong việc làm chủ và ứng dụng trí tuệ nhân tạo vào các bài toán thực tiễn.

“Bình dân học vụ số” thúc đẩy phát triển bền vững

“Bình dân học vụ số” thúc đẩy phát triển bền vững

Khi Phong trào “Bình dân học vụ số” thấm sâu vào đời sống, mỗi người dân trở thành một chủ thể của chuyển đổi số thì chuyển đổi số không còn là khẩu hiệu mà thực sự trở thành động lực nội sinh thúc đẩy phát triển bền vững, tạo nền tảng để Lào Cai tự tin hội nhập và vươn lên trong kỷ nguyên số.

Vận hành chính quyền với hệ thống quản trị số “Make in Mường Lai”

Vận hành chính quyền với hệ thống quản trị số “Make in Mường Lai”

Từ tháng 7/2025, tỉnh Lào Cai chính thức vận hành mô hình chính quyền địa phương hai cấp, trong đó xã Mường Lai nổi lên như một điểm sáng về đổi mới phương thức lãnh đạo, điều hành. Vượt qua những lúng túng ban đầu trước khối lượng công việc lớn khi sáp nhập và tiếp nhận nhiệm vụ từ cấp huyện, địa phương đã chủ động xây dựng hệ thống quản trị số “Make in Mường Lai”, ứng dụng trí tuệ nhân tạo (AI) trong giám sát cán bộ và phục vụ người dân.

Người dân "biết số, hiểu số và dùng số"

Người dân "biết số, hiểu số và dùng số"

Thực hiện Nghị quyết số 57-NQ/TW của Bộ Chính trị về đột phá phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia, tỉnh Lào Cai xác định người dân vừa là chủ thể, vừa là trung tâm của tiến trình chuyển đổi số. Từ nhận thức đó, thời gian qua, các cấp, ngành trong tỉnh đã tập trung triển khai nhiều giải pháp đồng bộ nhằm nâng cao kỹ năng số cho người dân, đặc biệt ở khu vực nông thôn, vùng sâu, vùng đồng bào dân tộc thiểu số. 

Lào Cai triển khai Bộ tiêu chí đánh giá hiệu quả khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số

Lào Cai triển khai Bộ tiêu chí đánh giá hiệu quả khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số

UBND tỉnh Lào Cai vừa ban hành Kế hoạch thực hiện Quyết định số 2244/QĐ-TTg ngày 13/10/2025 của Thủ tướng Chính phủ về việc ban hành Bộ tiêu chí đánh giá hiệu quả của khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số đối với phát triển kinh tế - xã hội trên địa bàn tỉnh.

Động lực cho đổi mới sáng tạo

Động lực cho đổi mới sáng tạo

Mô hình liên kết “3 nhà” (Nhà nước, nhà trường, nhà doanh nghiệp) trong phát triển khoa học công nghệ, đổi mới sáng tạo và chuyển đổi số là một trong những giải pháp được tỉnh triển khai nhằm thực hiện hiệu quả Nghị quyết số 57-NQ/TW ngày 22/12/2024 của Bộ Chính trị về đột phá phát triển khoa học công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia.

Chuyển đổi số mở lối cho y tế Việt Nam bứt phá

Chuyển đổi số mở lối cho y tế Việt Nam bứt phá

Những thành tựu y học mới cùng sự hỗ trợ của công nghệ hiện đại đang tạo động lực mạnh mẽ cho ngành y tế đổi mới toàn diện. Kết hợp chuyển đổi số với nâng cao chất lượng bệnh viện được kỳ vọng sẽ giúp hệ thống y tế phục vụ người dân hiệu quả và bền vững hơn.

Nghị quyết số 57-NQ/TW: Đồng tốc, đồng lòng, bước ra 'vùng chính sách' để đi vào đời sống

Nghị quyết số 57-NQ/TW: Đồng tốc, đồng lòng, bước ra 'vùng chính sách' để đi vào đời sống

Sau một năm triển khai Nghị quyết số 57-NQ/TW của Bộ Chính trị, những chuyển động bước đầu cho thấy tinh thần đồng tốc trong chỉ đạo, đồng lòng trong tổ chức thực hiện. Nghị quyết 57 đang được cụ thể hóa bằng thể chế, nguồn lực và các kết quả có thể đo đếm.

fb yt zl tw