CMC đạt tốp 12 thế giới về nhận dạng văn bản

Mô hình CATI-VLM (Visual Document Understanding) do Viện Ứng dụng công nghệ CMC(CMC ATI) phát triển đã vượt qua nhiều đối thủ quốc tế đạt tốp 12 thế giới và tốp 1 Việt Nam trong bảng xếp hạng vừa được Robust Reading Competition (RRC) công bố tháng 6/2025 tại hạng mục Document Visual Question Answering (DocVQA)

Trong bối cảnh và chuyển đổi ứng dụng trí tuệ nhân tạo tại Việt Nam đang diễn ra mạnh mẽ, công nghệ OCR (Nhận dạng ký tự quang học) ngày càng giữ vai trò quan trọng trong việc số hóa tài liệu, tự động hóa quy trình nghiệp vụ, tiết kiệm chi phí và nâng cao hiệu quả quản trị. Tuy nhiên, với đặc thù tiếng Việt có dấu và chữ viết tay, bài toán nhận dạng không chỉ dừng lại ở việc 'đọc chữ', mà đòi hỏi mô hình phải có khả năng hiểu ngữ cảnh toàn diện.

Mới đây, Viện Ứng dụng công nghệ CMC (CMC ATI) đã công bố mô hình CATI-VLM (Visual Document Understanding) - do đội ngũ nghiên cứu phát triển từ kho dữ liệu lớn 5TB, vượt qua nhiều đối thủ quốc tế đạt tốp 12 thế giới và tốp 1 Việt Nam trong bảng xếp hạng vừa được Robust Reading Competition (RRC) công bố tháng 6/2025 tại hạng mục Document Visual Question Answering (DocVQA).

Robust Reading Competition (RRC) là một sân chơi khoa học uy tín, (https://rrc.cvc.uab.es/) được tổ chức bởi Trung tâm Thị giác máy tính (CVC) thuộc Đại học Autònoma de Barcelona (UAB) Tây Ban Nha, một cơ sở nghiên cứu có uy tín của thế giới trong lĩnh vực thị giác máy tính.

Cuộc thi khởi xướng từ năm 2011, được tổ chức thường niên trong khuôn khổ Hội nghị Quốc tế về phân tích và nhận dạng văn bản ICDAR – một trong những diễn đàn hàng đầu thế giới trong lĩnh vực thị giác máy tính. Cuộc thi thu hút đông đảo các nhà nghiên cứu, kỹ sư từ các trường đại học, viện nghiên cứu và các tập đoàn công nghệ lớn như Đại học Thanh Hoa, Hyundai Motor Group, Tencent… Các bài toán của RRC được thiết kế để thúc đẩy tiến bộ công nghệ, gắn chặt với bài toán thực tiễn từ dịch thuật, quản trị dữ liệu doanh nghiệp đến phân tích đô thị và xử lý tài liệu lịch sử.

Tiến sĩ Đặng Minh Tuấn, Viện trưởng CMC ATI chia sẻ: "Chúng tôi rất vui mừng khi năng lực nghiên cứu của đội ngũ CMC được khẳng định qua một sân chơi uy tín toàn cầu như RRC. Chỉ trong thời gian ngắn, đội ngũ nghiên cứu đã đạt thứ hạng cao, cho thấy năng lực cạnh tranh quốc tế với các tên tuổi lớn từ các quốc gia phát triển. Quan trọng hơn, đây là minh chứng rõ ràng cho khả năng làm chủ công nghệ để giải quyết các bài toán đặc thù của tiếng Việt và các lĩnh vực chuyên ngành tại Việt Nam."

Tiến sĩ Đặng Minh Tuấn, Viện trưởng CMC ATI.
Tiến sĩ Đặng Minh Tuấn, Viện trưởng CMC ATI.

CATI-VLM khác biệt so với OCR truyền thống ở chỗ không chỉ trích xuất ký tự, mà còn hiểu nhiều lớp thông tin: nội dung văn bản, yếu tố phi văn bản (ô tick, checkbox, biểu đồ, chữ ký, công thức), bố cục (cấu trúc trang, bảng biểu, form mẫu) và phong cách (font chữ, phần highlight…). Mô hình có thể trả lời câu hỏi trực quan đặt ra trên hình ảnh tài liệu, tương tự ChatGPT, mà không cần học trước từng form cụ thể.

Đáng chú ý, trên bảng xếp hạng RRC, CATI-VLM chỉ với 3 tỷ tham số nhưng đạt độ chính xác cao nhất ở 4/7 bộ dữ liệu, vượt trội nhiều mô hình Big Tech như Deepseek (27 tỷ tham số), GPT-4 Vision Turbo + Amazon Textract OCR (tốp 34) hay Baidu (tốp 22).

Thành tích cũng cho thấy cách tiếp cận thực chất, tập trung làm chủ lõi công nghệ, tối ưu hóa mô hình phù hợp với điều kiện hạ tầng của Việt Nam thay vì chạy theo quy mô tham số.

Ví dụ mẫu đơn tuyển sinh Đại học
Ví dụ mẫu đơn tuyển sinh Đại học
Văn bản đã được nhận dạng từ chữ viết tay ở hình trên.
Văn bản đã được nhận dạng từ chữ viết tay ở hình trên.

Ông Nguyễn Trung Chính, Chủ tịch Hội đồng quản trị, Chủ tịch Điều hành Tập đoàn Công nghệ CMC, nhấn mạnh: "Đây là thành quả của hơn một thập niên kiên trì đầu tư nghiên cứu-phát triển (R&D) công nghệ. Việc CMC đạt thành tích cao tại sân chơi công nghệ quốc tế khẳng định chiến lược làm chủ công nghệ Việt, đi đôi với định hướng Chuyển đổi AI và tiến ra thị trường toàn cầu. Chúng tôi tin trí tuệ Việt Nam hoàn toàn đủ năng lực sánh vai Big Tech toàn cầu, tạo vị thế xứng đáng trên bản đồ công nghệ thế giới."

CATI-VLM sẽ được ứng dụng trong chuỗi sản phẩm thuộc hệ sinh thái C.OpenAI, gồm: Trợ lý ảo CLS rà soát văn bản pháp luật, CMC SmartDoc – nền tảng chuyển đổi số tài liệu, Hệ quản trị tri thức CMC KMS, hệ thống báo cáo tự động cho văn phòng thông minh và các ứng dụng Agentic Documents thế hệ mới.

nhandan.vn

Có thể bạn quan tâm

Tin cùng chuyên mục

Chuyển đổi số trong hoạt động của cơ quan tư pháp

Chuyển đổi số trong hoạt động của cơ quan tư pháp

Trong bối cảnh đẩy mạnh cải cách hành chính và xây dựng chính quyền số, các cơ quan tư pháp tỉnh Lào Cai đang từng bước ứng dụng công nghệ thông tin vào mọi hoạt động nghiệp vụ, từ tiếp nhận hồ sơ, giải quyết thủ tục đến quản lý dữ liệu và công khai thông tin pháp lý.

Hành động thực chất thực hiện mục tiêu chuyển đổi số

Hành động thực chất thực hiện mục tiêu chuyển đổi số

Năm 2026, tỉnh Lào Cai xác định chuyển đổi mạnh mẽ từ “nhận thức” sang “hành động thực chất” trong phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số. Những kết quả đạt được trong năm 2025 sẽ là nền tảng quan trọng để tỉnh phát triển đột phá trong giai đoạn 2026 - 2030. Với quyết tâm cao, hành động quyết liệt của tỉnh sẽ góp phần thúc đẩy phát triển kinh tế - xã hội, nâng cao chỉ số hài lòng cho người dân.

AI - Chìa khóa giúp doanh nghiệp tăng trưởng

AI - Chìa khóa giúp doanh nghiệp tăng trưởng

Trong bối cảnh chuyển đổi số đang diễn ra rộng khắp, trí tuệ nhân tạo (AI) đã và đang được ứng dụng mạnh mẽ trong hầu hết các khâu quan trọng của doanh nghiệp. AI được kỳ vọng là chìa khóa giúp doanh nghiệp tăng trưởng trong kỷ nguyên mới.

Cảnh báo lỗ hổng bảo mật trong Chromium của Google - nguy cơ mất an ninh mạng trên các trình duyệt web

Cảnh báo lỗ hổng bảo mật trong Chromium của Google - nguy cơ mất an ninh mạng trên các trình duyệt web

Khi người dùng vô tình truy cập vào trang web này, trình duyệt có thể bị lợi dụng để chạy các đoạn mã do tin tặc cài sẵn. Từ đó, tin tặc có thể âm thầm đánh cắp thông tin đăng nhập, theo dõi hoạt động duyệt web hoặc chiếm quyền các tài khoản đang đăng nhập của người dùng.

“Bình dân học vụ số”: Từ tri thức đến động lực chuyển đổi số ở Lào Cai

“Bình dân học vụ số”: Từ tri thức đến động lực chuyển đổi số ở Lào Cai

Chuyển đổi số đang khẳng định vai trò chiến lược của khoa học, công nghệ và đổi mới sáng tạo trong phát triển nhanh, bền vững. Sau một năm thực hiện Nghị quyết 57-NQ/TW, tinh thần “hành động đột phá, lan tỏa kết quả” dần đi vào thực tiễn. Tại Lào Cai, phong trào “Bình dân học vụ số” với cách tiếp cận từ cơ sở, thôn bản và từng người dân đã tạo chuyển động tích cực. Khi tri thức số được lan tỏa, khoa học - công nghệ và chuyển đổi số sẽ trở thành động lực thúc đẩy phát triển kinh tế - xã hội.

Cuộc “cách mạng số” ở Khánh Hòa

Cuộc “cách mạng số” ở Khánh Hòa

Sau hợp nhất, cấp ủy, chính quyền xã Khánh Hòa xác định lấy “số hóa” làm trung tâm xây dựng và vận hành đơn vị hành chính cấp xã. “Số hóa” đã và đang vào từng nếp nhà, từng thôn, bản, biến Khánh Hòa trở thành địa phương đi đầu trong thực hiện nhiệm vụ chuyển đổi số của toàn tỉnh.

Bài 2: Nền tảng dữ liệu số - Chiến lược tạo đột phá phát triển

“Bình dân học vụ số”: Từ tri thức đến động lực chuyển đổi số ở Lào Cai Bài 2: Nền tảng dữ liệu số - Chiến lược tạo đột phá phát triển

Nếu phong trào “Bình dân học vụ số” giúp người dân từng bước làm quen với môi trường số, thì hạ tầng viễn thông và hệ thống dữ liệu chính là nền tảng để những kỹ năng ấy được ứng dụng hiệu quả vào thực tiễn. Vì vậy, Lào Cai đang tập trung nguồn lực đầu tư hạ tầng số hiện đại, mở rộng mạng băng rộng và phát triển các nền tảng dữ liệu dùng chung, từng bước hình thành chính quyền số, kinh tế số và xã hội số bền vững.

Bài 1: Khi tri thức số bắt đầu từ cộng đồng

“Bình dân học vụ số”: Từ tri thức đến động lực chuyển đổi số ở Lào Cai Bài 1: Khi tri thức số bắt đầu từ cộng đồng

Sau hơn một năm triển khai Nghị quyết 57-NQ/TW của Bộ Chính trị, yêu cầu “hành động đột phá, lan tỏa kết quả” đang từng bước hiện hữu trong đời sống. Tại Lào Cai, trong tiến trình chuyển đổi số, con người được xác định là yếu tố nền tảng. Từ nhận thức đó, địa phương đã lựa chọn hướng đi mang tính căn cơ: phổ cập kỹ năng số cho người dân thông qua phong trào “Bình dân học vụ số”, đưa tri thức số lan tỏa tới cộng đồng.

Tăng “sức đề kháng số” cho thanh niên

Tăng “sức đề kháng số” cho thanh niên

Thông qua Dự án “Thanh niên trong công tác phòng ngừa rủi ro trên không gian mạng”, hàng nghìn đoàn viên, thanh niên đã được trang bị kiến thức và kỹ năng cần thiết để sử dụng internet an toàn, từng bước hình thành “sức đề kháng số”.

Tổng Bí thư chủ trì phiên họp về phát triển KHCN, đổi mới sáng tạo và chuyển đổi số

Tổng Bí thư chủ trì phiên họp về phát triển KHCN, đổi mới sáng tạo và chuyển đổi số

Chiều 12/3/2026, tại Trụ sở Trung ương Đảng, Tổng Bí thư Tô Lâm, Trưởng Ban Chỉ đạo Trung ương về phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số chủ trì phiên họp thứ nhất Thường trực Ban chỉ đạo về phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số năm 2026.

Chuyển đổi số góp phần nâng cao chất lượng bầu cử

Chuyển đổi số góp phần nâng cao chất lượng bầu cử

Lần đầu tiên, công nghệ được áp dụng vào nhiều khâu chuẩn bị từ xây dựng cơ sở dữ liệu cử tri, cung cấp thông tin qua robot hỗ trợ tra cứu, ứng dụng trí tuệ nhân tạo (AI) trong tuyên truyền đến các nền tảng số phục vụ quản lý. Chuyển đổi số đang tạo nên những chuyển biến rõ nét trong công tác tổ chức bầu cử, góp phần nâng cao tính minh bạch, chính xác và thuận tiện cho người dân.

fb yt zl tw