CMC đạt tốp 12 thế giới về nhận dạng văn bản

Mô hình CATI-VLM (Visual Document Understanding) do Viện Ứng dụng công nghệ CMC(CMC ATI) phát triển đã vượt qua nhiều đối thủ quốc tế đạt tốp 12 thế giới và tốp 1 Việt Nam trong bảng xếp hạng vừa được Robust Reading Competition (RRC) công bố tháng 6/2025 tại hạng mục Document Visual Question Answering (DocVQA)

Trong bối cảnh và chuyển đổi ứng dụng trí tuệ nhân tạo tại Việt Nam đang diễn ra mạnh mẽ, công nghệ OCR (Nhận dạng ký tự quang học) ngày càng giữ vai trò quan trọng trong việc số hóa tài liệu, tự động hóa quy trình nghiệp vụ, tiết kiệm chi phí và nâng cao hiệu quả quản trị. Tuy nhiên, với đặc thù tiếng Việt có dấu và chữ viết tay, bài toán nhận dạng không chỉ dừng lại ở việc 'đọc chữ', mà đòi hỏi mô hình phải có khả năng hiểu ngữ cảnh toàn diện.

Mới đây, Viện Ứng dụng công nghệ CMC (CMC ATI) đã công bố mô hình CATI-VLM (Visual Document Understanding) - do đội ngũ nghiên cứu phát triển từ kho dữ liệu lớn 5TB, vượt qua nhiều đối thủ quốc tế đạt tốp 12 thế giới và tốp 1 Việt Nam trong bảng xếp hạng vừa được Robust Reading Competition (RRC) công bố tháng 6/2025 tại hạng mục Document Visual Question Answering (DocVQA).

Robust Reading Competition (RRC) là một sân chơi khoa học uy tín, (https://rrc.cvc.uab.es/) được tổ chức bởi Trung tâm Thị giác máy tính (CVC) thuộc Đại học Autònoma de Barcelona (UAB) Tây Ban Nha, một cơ sở nghiên cứu có uy tín của thế giới trong lĩnh vực thị giác máy tính.

Cuộc thi khởi xướng từ năm 2011, được tổ chức thường niên trong khuôn khổ Hội nghị Quốc tế về phân tích và nhận dạng văn bản ICDAR – một trong những diễn đàn hàng đầu thế giới trong lĩnh vực thị giác máy tính. Cuộc thi thu hút đông đảo các nhà nghiên cứu, kỹ sư từ các trường đại học, viện nghiên cứu và các tập đoàn công nghệ lớn như Đại học Thanh Hoa, Hyundai Motor Group, Tencent… Các bài toán của RRC được thiết kế để thúc đẩy tiến bộ công nghệ, gắn chặt với bài toán thực tiễn từ dịch thuật, quản trị dữ liệu doanh nghiệp đến phân tích đô thị và xử lý tài liệu lịch sử.

Tiến sĩ Đặng Minh Tuấn, Viện trưởng CMC ATI chia sẻ: "Chúng tôi rất vui mừng khi năng lực nghiên cứu của đội ngũ CMC được khẳng định qua một sân chơi uy tín toàn cầu như RRC. Chỉ trong thời gian ngắn, đội ngũ nghiên cứu đã đạt thứ hạng cao, cho thấy năng lực cạnh tranh quốc tế với các tên tuổi lớn từ các quốc gia phát triển. Quan trọng hơn, đây là minh chứng rõ ràng cho khả năng làm chủ công nghệ để giải quyết các bài toán đặc thù của tiếng Việt và các lĩnh vực chuyên ngành tại Việt Nam."

Tiến sĩ Đặng Minh Tuấn, Viện trưởng CMC ATI.
Tiến sĩ Đặng Minh Tuấn, Viện trưởng CMC ATI.

CATI-VLM khác biệt so với OCR truyền thống ở chỗ không chỉ trích xuất ký tự, mà còn hiểu nhiều lớp thông tin: nội dung văn bản, yếu tố phi văn bản (ô tick, checkbox, biểu đồ, chữ ký, công thức), bố cục (cấu trúc trang, bảng biểu, form mẫu) và phong cách (font chữ, phần highlight…). Mô hình có thể trả lời câu hỏi trực quan đặt ra trên hình ảnh tài liệu, tương tự ChatGPT, mà không cần học trước từng form cụ thể.

Đáng chú ý, trên bảng xếp hạng RRC, CATI-VLM chỉ với 3 tỷ tham số nhưng đạt độ chính xác cao nhất ở 4/7 bộ dữ liệu, vượt trội nhiều mô hình Big Tech như Deepseek (27 tỷ tham số), GPT-4 Vision Turbo + Amazon Textract OCR (tốp 34) hay Baidu (tốp 22).

Thành tích cũng cho thấy cách tiếp cận thực chất, tập trung làm chủ lõi công nghệ, tối ưu hóa mô hình phù hợp với điều kiện hạ tầng của Việt Nam thay vì chạy theo quy mô tham số.

Ví dụ mẫu đơn tuyển sinh Đại học
Ví dụ mẫu đơn tuyển sinh Đại học
Văn bản đã được nhận dạng từ chữ viết tay ở hình trên.
Văn bản đã được nhận dạng từ chữ viết tay ở hình trên.

Ông Nguyễn Trung Chính, Chủ tịch Hội đồng quản trị, Chủ tịch Điều hành Tập đoàn Công nghệ CMC, nhấn mạnh: "Đây là thành quả của hơn một thập niên kiên trì đầu tư nghiên cứu-phát triển (R&D) công nghệ. Việc CMC đạt thành tích cao tại sân chơi công nghệ quốc tế khẳng định chiến lược làm chủ công nghệ Việt, đi đôi với định hướng Chuyển đổi AI và tiến ra thị trường toàn cầu. Chúng tôi tin trí tuệ Việt Nam hoàn toàn đủ năng lực sánh vai Big Tech toàn cầu, tạo vị thế xứng đáng trên bản đồ công nghệ thế giới."

CATI-VLM sẽ được ứng dụng trong chuỗi sản phẩm thuộc hệ sinh thái C.OpenAI, gồm: Trợ lý ảo CLS rà soát văn bản pháp luật, CMC SmartDoc – nền tảng chuyển đổi số tài liệu, Hệ quản trị tri thức CMC KMS, hệ thống báo cáo tự động cho văn phòng thông minh và các ứng dụng Agentic Documents thế hệ mới.

nhandan.vn

Có thể bạn quan tâm

Tin cùng chuyên mục

Lào Cai triển khai 04 thủ tục hành chính của Đảng trên môi trường điện tử

Lào Cai triển khai 04 thủ tục hành chính của Đảng trên môi trường điện tử

Ngày 18/6, Ban Thường vụ Tỉnh ủy Lào Cai ban hành Kế hoạch số 93-KH/TU triển khai 04 thủ tục hành chính của Đảng trên môi trường điện tử, nhằm chuẩn hóa, số hóa quy trình xử lý, nâng cao tính công khai, minh bạch, rút ngắn thời gian giải quyết thủ tục, tạo thuận lợi cho tổ chức đảng và đảng viên.

“Mùa hè số cùng VNeID”

“Mùa hè số cùng VNeID”

Với sự tham gia của lực lượng công an, đoàn viên, thanh niên và các tổ công nghệ số cộng đồng, Chiến dịch “Mùa hè số cùng VNeID” do Cục Cảnh sát Quản lý hành chính về Trật tự xã hội phát động đang được nhiều địa phương trên địa bàn tỉnh Lào Cai hưởng ứng và triển khai sâu rộng. Qua đó, góp phần giúp người dân khai thác hiệu quả các tiện ích số.

Người dân biên giới Y Tý hào hứng học kỹ năng số và pháp luật qua sân khấu hóa

Người dân biên giới Y Tý hào hứng học kỹ năng số và pháp luật qua sân khấu hóa

Trong hai ngày (16 - 17/6), Ban Chỉ huy Bộ đội Biên phòng tỉnh Lào Cai phối hợp với các sở: Khoa học và Công nghệ, Tư pháp, Văn hóa, Thể thao và Du lịch tổ chức chương trình tuyên truyền tập trung tại xã Y Tý. Chương trình thu hút hơn 1.000 cán bộ, công chức và đồng bào các dân tộc thiểu số trên địa bàn tham gia, góp phần đưa kiến thức pháp luật và công nghệ số đến gần hơn với người dân khu vực biên giới.

Lào Cai: Khi pháp luật đến với người dân qua không gian số

Lào Cai: Khi pháp luật đến với người dân qua không gian số

Chuyển đổi số đang tạo ra những thay đổi trong công tác phổ biến, giáo dục pháp luật. Tại Lào Cai, việc đưa pháp luật lên không gian số không chỉ là giải pháp đổi mới phương thức tuyên truyền mà còn giúp chính sách đến gần hơn với Nhân dân, nhất là ở vùng sâu, vùng xa, vùng đồng bào dân tộc thiểu số.

“Thôn số” và kỳ vọng đổi thay nơi vùng biên Bát Xát

“Thôn số” và kỳ vọng đổi thay nơi vùng biên Bát Xát

Ngày 08/6 trở thành dấu mốc đặc biệt đối với cán bộ, đảng viên và Nhân dân thôn 4, xã Bát Xát khi chính thức được công nhận là thôn số đạt mức cơ bản đầu tiên của tỉnh Lào Cai. Đây là thành tựu có ý nghĩa quan trọng, đánh dấu bước chuyển từ chủ trương sang hành động cụ thể, đưa chuyển đổi số đi vào đời sống, mở ra kỳ vọng về một không gian số phát triển ngay từ cơ sở.

Người dân chủ động tra cứu và thực hiện nghĩa vụ thuế trên nền tảng số

Người dân chủ động tra cứu và thực hiện nghĩa vụ thuế trên nền tảng số

Trong lộ trình chuyển đổi số quốc gia, ngành thuế đang đẩy mạnh ứng dụng công nghệ nhằm nâng cao chất lượng phục vụ người dân và doanh nghiệp. Một trong những giải pháp nổi bật là ứng dụng eTax Mobile, cho phép người nộp thuế dễ dàng tra cứu thông tin, thực hiện nghĩa vụ thuế và quản lý hồ sơ thuế ngay trên điện thoại thông minh.

Giúp người cao tuổi bắt nhịp chuyển đổi số

Giúp người cao tuổi bắt nhịp chuyển đổi số

Những năm gần đây, cùng với quá trình chuyển đổi số diễn ra mạnh mẽ, nhiều hoạt động trong đời sống như thanh toán, thực hiện thủ tục hành chính, tiếp cận thông tin hay liên lạc hằng ngày đã dần được đưa lên môi trường số. Tuy nhiên, bên cạnh sự thuận tiện, quá trình này cũng tạo ra khoảng cách nhất định giữa các thế hệ, đặc biệt với người cao tuổi - nhóm đối tượng gặp nhiều khó khăn trong việc tiếp cận công nghệ.

Lào Cai phát động phong trào xây dựng “Thôn số” và khai trương Hệ thống theo dõi, giám sát nhiệm vụ của Tỉnh ủy

Lào Cai phát động phong trào xây dựng “Thôn số” và khai trương Hệ thống theo dõi, giám sát nhiệm vụ của Tỉnh ủy

Chiều 11/6, Tỉnh ủy Lào Cai tổ chức phát động phong trào xây dựng “Thôn số” trên địa bàn tỉnh và khai trương Hệ thống theo dõi, giám sát việc thực hiện nhiệm vụ của Tỉnh ủy. Đây là hoạt động nhằm cụ thể hóa Nghị quyết số 57 của Bộ Chính trị về đột phá phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia.

Phó Bí thư Thường trực Tỉnh ủy, Chủ tịch HĐND tỉnh Hoàng Giang dự lễ ra mắt “Thôn số” tại Yên Bình

Phó Bí thư Thường trực Tỉnh ủy, Chủ tịch HĐND tỉnh Hoàng Giang dự lễ ra mắt “Thôn số” tại Yên Bình

Chiều 09/6, xã Yên Bình tổ chức chương trình ra mắt mô hình điểm “Thôn số” tại thôn 6. Đây là mô hình “Thôn số” đầu tiên của địa phương, đánh dấu bước tiến quan trọng trong thực hiện Nghị quyết số 57-NQ/TW của Bộ Chính trị về phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số.

Từ đối tượng bảo tồn đến chủ thể sáng tạo số

Từ đối tượng bảo tồn đến chủ thể sáng tạo số

Ngày nay, cùng với quá trình chuyển đổi số đang lan tỏa mạnh mẽ đến từng thôn bản, người dân không chỉ là đối tượng thụ hưởng mà trở thành chủ thể tham gia sáng tạo nội dung, chủ động giới thiệu và lan tỏa những câu chuyện về cuộc sống, văn hóa và bản sắc của chính quê hương mình.

Rút ngắn khoảng cách "số" ở vùng cao

Rút ngắn khoảng cách "số" ở vùng cao

Lào Cai xác định muốn thu hẹp khoảng cách số phải giải quyết từ gốc rễ các “điểm nghẽn” ngay tại cơ sở. Thông qua các mô hình “Thôn số”, “Người bản số”, tỉnh tập trung thay đổi nhận thức, nâng cao kỹ năng số cho người dân, đầu tư hạ tầng viễn thông và phát huy vai trò của cán bộ, tổ công nghệ số cộng đồng, từng bước đưa chuyển đổi số đi vào thực chất từ thôn, bản.

Bài cuối: Cả hệ thống chính trị vào cuộc

Rút ngắn khoảng cách "số" ở vùng cao Bài cuối: Cả hệ thống chính trị vào cuộc

Tại Lào Cai, tinh thần triển khai Nghị quyết 57-NQ/TW của Bộ Chính trị (Nghị quyết 57) về phát triển khoa học - công nghệ, đổi mới sáng tạo và chuyển đổi số (CĐS) quốc gia đã lan tỏa mạnh mẽ tới từng địa phương, cơ sở, từng bước tháo gỡ các rào cản, “điểm nghẽn” số. Cả hệ thống chính trị đang cùng vào cuộc với quyết tâm đưa CĐS trở thành động lực thúc đẩy phát triển kinh tế - xã hội trong giai đoạn mới.

Bài 1: Giải quyết gốc rễ “điểm nghẽn” số

Rút ngắn khoảng cách "số" ở vùng cao Bài 1: Giải quyết gốc rễ “điểm nghẽn” số

Nghị quyết 57-NQ/TW ngày 22/12/2024 của Bộ Chính trị (Nghị quyết 57) đã xác định khoa học - công nghệ, đổi mới sáng tạo và chuyển đổi số (CĐS) là động lực mang tính đột phá cho phát triển đất nước trong giai đoạn mới. Tại Lào Cai, nghị quyết đang được cụ thể hóa bằng những mô hình sát thực tế, từng bước tháo gỡ những “điểm nghẽn” về nhận thức, kỹ năng và thói quen “số” ở vùng cao.

“Mùa hè số 2026” lan tỏa mạnh ở vùng cao Lào Cai: Hàng trăm đoàn viên, cán bộ đồng loạt ra quân hỗ trợ người dân chuyển đổi số với VNeID

“Mùa hè số 2026” lan tỏa mạnh ở vùng cao Lào Cai: Hàng trăm đoàn viên, cán bộ đồng loạt ra quân hỗ trợ người dân chuyển đổi số với VNeID

Trong hai ngày 04 - 05/6/2026, tại các xã Trịnh Tường, Si Ma Cai, Cốc San và phường Nghĩa Lộ (tỉnh Lào Cai), đồng loạt diễn ra lễ ra quân “Chiến dịch Mùa hè số cùng VNeID”, thu hút hàng trăm cán bộ, đoàn viên, thanh niên tham gia. Chiến dịch nhằm thúc đẩy chuyển đổi số, nâng cao hiệu quả thực hiện Đề án 06, đưa tiện ích số đến gần hơn với người dân ngay tại cơ sở.

fb yt zl tw