CMC đạt tốp 12 thế giới về nhận dạng văn bản

Mô hình CATI-VLM (Visual Document Understanding) do Viện Ứng dụng công nghệ CMC(CMC ATI) phát triển đã vượt qua nhiều đối thủ quốc tế đạt tốp 12 thế giới và tốp 1 Việt Nam trong bảng xếp hạng vừa được Robust Reading Competition (RRC) công bố tháng 6/2025 tại hạng mục Document Visual Question Answering (DocVQA)

Trong bối cảnh và chuyển đổi ứng dụng trí tuệ nhân tạo tại Việt Nam đang diễn ra mạnh mẽ, công nghệ OCR (Nhận dạng ký tự quang học) ngày càng giữ vai trò quan trọng trong việc số hóa tài liệu, tự động hóa quy trình nghiệp vụ, tiết kiệm chi phí và nâng cao hiệu quả quản trị. Tuy nhiên, với đặc thù tiếng Việt có dấu và chữ viết tay, bài toán nhận dạng không chỉ dừng lại ở việc 'đọc chữ', mà đòi hỏi mô hình phải có khả năng hiểu ngữ cảnh toàn diện.

Mới đây, Viện Ứng dụng công nghệ CMC (CMC ATI) đã công bố mô hình CATI-VLM (Visual Document Understanding) - do đội ngũ nghiên cứu phát triển từ kho dữ liệu lớn 5TB, vượt qua nhiều đối thủ quốc tế đạt tốp 12 thế giới và tốp 1 Việt Nam trong bảng xếp hạng vừa được Robust Reading Competition (RRC) công bố tháng 6/2025 tại hạng mục Document Visual Question Answering (DocVQA).

Robust Reading Competition (RRC) là một sân chơi khoa học uy tín, (https://rrc.cvc.uab.es/) được tổ chức bởi Trung tâm Thị giác máy tính (CVC) thuộc Đại học Autònoma de Barcelona (UAB) Tây Ban Nha, một cơ sở nghiên cứu có uy tín của thế giới trong lĩnh vực thị giác máy tính.

Cuộc thi khởi xướng từ năm 2011, được tổ chức thường niên trong khuôn khổ Hội nghị Quốc tế về phân tích và nhận dạng văn bản ICDAR – một trong những diễn đàn hàng đầu thế giới trong lĩnh vực thị giác máy tính. Cuộc thi thu hút đông đảo các nhà nghiên cứu, kỹ sư từ các trường đại học, viện nghiên cứu và các tập đoàn công nghệ lớn như Đại học Thanh Hoa, Hyundai Motor Group, Tencent… Các bài toán của RRC được thiết kế để thúc đẩy tiến bộ công nghệ, gắn chặt với bài toán thực tiễn từ dịch thuật, quản trị dữ liệu doanh nghiệp đến phân tích đô thị và xử lý tài liệu lịch sử.

Tiến sĩ Đặng Minh Tuấn, Viện trưởng CMC ATI chia sẻ: "Chúng tôi rất vui mừng khi năng lực nghiên cứu của đội ngũ CMC được khẳng định qua một sân chơi uy tín toàn cầu như RRC. Chỉ trong thời gian ngắn, đội ngũ nghiên cứu đã đạt thứ hạng cao, cho thấy năng lực cạnh tranh quốc tế với các tên tuổi lớn từ các quốc gia phát triển. Quan trọng hơn, đây là minh chứng rõ ràng cho khả năng làm chủ công nghệ để giải quyết các bài toán đặc thù của tiếng Việt và các lĩnh vực chuyên ngành tại Việt Nam."

Tiến sĩ Đặng Minh Tuấn, Viện trưởng CMC ATI.
Tiến sĩ Đặng Minh Tuấn, Viện trưởng CMC ATI.

CATI-VLM khác biệt so với OCR truyền thống ở chỗ không chỉ trích xuất ký tự, mà còn hiểu nhiều lớp thông tin: nội dung văn bản, yếu tố phi văn bản (ô tick, checkbox, biểu đồ, chữ ký, công thức), bố cục (cấu trúc trang, bảng biểu, form mẫu) và phong cách (font chữ, phần highlight…). Mô hình có thể trả lời câu hỏi trực quan đặt ra trên hình ảnh tài liệu, tương tự ChatGPT, mà không cần học trước từng form cụ thể.

Đáng chú ý, trên bảng xếp hạng RRC, CATI-VLM chỉ với 3 tỷ tham số nhưng đạt độ chính xác cao nhất ở 4/7 bộ dữ liệu, vượt trội nhiều mô hình Big Tech như Deepseek (27 tỷ tham số), GPT-4 Vision Turbo + Amazon Textract OCR (tốp 34) hay Baidu (tốp 22).

Thành tích cũng cho thấy cách tiếp cận thực chất, tập trung làm chủ lõi công nghệ, tối ưu hóa mô hình phù hợp với điều kiện hạ tầng của Việt Nam thay vì chạy theo quy mô tham số.

Ví dụ mẫu đơn tuyển sinh Đại học
Ví dụ mẫu đơn tuyển sinh Đại học
Văn bản đã được nhận dạng từ chữ viết tay ở hình trên.
Văn bản đã được nhận dạng từ chữ viết tay ở hình trên.

Ông Nguyễn Trung Chính, Chủ tịch Hội đồng quản trị, Chủ tịch Điều hành Tập đoàn Công nghệ CMC, nhấn mạnh: "Đây là thành quả của hơn một thập niên kiên trì đầu tư nghiên cứu-phát triển (R&D) công nghệ. Việc CMC đạt thành tích cao tại sân chơi công nghệ quốc tế khẳng định chiến lược làm chủ công nghệ Việt, đi đôi với định hướng Chuyển đổi AI và tiến ra thị trường toàn cầu. Chúng tôi tin trí tuệ Việt Nam hoàn toàn đủ năng lực sánh vai Big Tech toàn cầu, tạo vị thế xứng đáng trên bản đồ công nghệ thế giới."

CATI-VLM sẽ được ứng dụng trong chuỗi sản phẩm thuộc hệ sinh thái C.OpenAI, gồm: Trợ lý ảo CLS rà soát văn bản pháp luật, CMC SmartDoc – nền tảng chuyển đổi số tài liệu, Hệ quản trị tri thức CMC KMS, hệ thống báo cáo tự động cho văn phòng thông minh và các ứng dụng Agentic Documents thế hệ mới.

nhandan.vn

Có thể bạn quan tâm

Tin cùng chuyên mục

Lào Cai tham gia tập huấn triển khai 4 thủ tục hành chính của đảng trên môi trường điện tử

Lào Cai tham gia tập huấn triển khai 4 thủ tục hành chính của đảng trên môi trường điện tử

Sáng 9/12, cùng với các địa phương trên cả nước, tỉnh Lào Cai tham dự Hội nghị tập huấn toàn quốc do Văn phòng Trung ương Đảng tổ chức nhằm triển khai 4 thủ tục hành chính của Đảng trên môi trường điện tử. Hội nghị diễn ra theo hình thức trực tiếp kết hợp trực tuyến, được kết nối từ điểm cầu Trung ương tới các điểm cầu cấp tỉnh, huyện và xã, phường trên toàn quốc.

Số hóa hoạt động bảo tàng

Số hóa hoạt động bảo tàng

Bảo tàng tỉnh là một trong những đơn vị đi đầu khi đẩy mạnh số hóa hệ thống hiện vật, xây dựng kho dữ liệu trực tuyến và đổi mới cách thức đưa lịch sử văn hóa địa phương đến với công chúng. Những đổi mới này giúp người dân và du khách tiếp cận tư liệu mọi lúc, mọi nơi, đồng thời nâng cao hiệu quả giáo dục, nghiên cứu và quảng bá du lịch địa phương.

“Thôn số” ở Bát Xát

“Thôn số” ở Bát Xát

Ngày 28/11, mô hình “Thôn số” được Đảng ủy xã Bát Xát tổ chức ra mắt tại thôn Sơn Hà, chính thức trở thành thôn đầu tiên của địa phương triển khai mô hình “Thôn số”, đánh dấu bước tiến quan trọng trong hành trình đưa chuyển đổi số tới cộng đồng dân cư.

Xã Hợp Thành nâng cao tỷ lệ tích hợp thông tin thẻ BHYT vào Sổ sức khỏe điện tử

Xã Hợp Thành nâng cao tỷ lệ tích hợp thông tin thẻ BHYT vào Sổ sức khỏe điện tử

Xã Hợp Thành đã và đang đẩy mạnh chiến dịch tích hợp thông tin thẻ bảo hiểm y tế (BHYT) vào Sổ sức khỏe điện tử trên ứng dụng VNeID. Đây là nhiệm vụ quan trọng nhằm xây dựng nền tảng dữ liệu số thống nhất, tăng cường kết nối thông tin y tế. Việc ứng dụng công nghệ cũng giúp người dân được thụ hưởng các dịch vụ y tế hiện đại, thuận tiện, đồng thời góp phần nâng cao chất lượng phục vụ của chính quyền địa phương.

Đảng viên tiên phong trong tiến trình chuyển đổi số

Đảng viên tiên phong trong tiến trình chuyển đổi số

Trong tiến trình chuyển đổi số (CĐS), đội ngũ đảng viên trong toàn tỉnh giữ vai trò nòng cốt, gương mẫu trong việc học tập, rèn luyện và ứng dụng kỹ năng số vào thực tiễn công tác. Sự chủ động tiếp cận công nghệ, khai thác dữ liệu và sử dụng các nền tảng số không chỉ thể hiện tinh thần tiên phong mà còn góp phần thiết thực vào xây dựng chính quyền số, thúc đẩy CĐS toàn diện ngay từ cơ sở.

Những người "chép sử” thời đại số

Những người "chép sử” thời đại số

Thời gian qua, với tinh thần “Tuổi trẻ uống nước nhớ nguồn - viết tiếp bản hùng ca”, Đoàn Thanh niên xã Bảo Thắng đã triển khai hoạt động số hóa ký ức lịch sử, đưa lời kể của các cựu chiến binh về “thời hoa lửa” lan tỏa trên không gian mạng. Với cách làm sáng tạo, tuổi trẻ Bảo Thắng đã và đang góp phần lưu giữ giá trị lịch sử bằng phương thức hiện đại, trở thành những “người chép sử” của thời đại số.

Bình dân hoá AI

Bình dân hoá AI

Trí tuệ nhân tạo (AI) đang dần trở thành công cụ gần gũi, dễ tiếp cận với mọi người. Đây là một bước tiến của “bình dân hoá AI”, không chỉ hỗ trợ giáo dục, sinh hoạt và công việc, AI còn mở ra cơ hội sáng tạo, nâng cao năng lực và trải nghiệm cho cộng đồng.

Đào tạo kiến thức AI hình thành lực lượng “hạt nhân số”

Đào tạo kiến thức AI hình thành lực lượng “hạt nhân số”

Trong bối cảnh chuyển đổi số (CĐS) diễn ra mạnh mẽ, tỉnh Lào Cai đang đẩy mạnh trang bị kiến thức về trí tuệ nhân tạo (AI) cho đội ngũ cán bộ, hướng tới hình thành lực lượng nhân sự có tư duy số, kỹ năng số và năng lực làm việc trên nền tảng dữ liệu. Đây được xem là bước đi quan trọng giúp Lào Cai bắt nhịp với kỷ nguyên số, xây dựng nền hành chính hiện đại, hiệu quả và phục vụ người dân ngày càng tốt hơn.

Trường Cao đẳng Lào Cai tổ chức hội thảo "Chuyển đổi số và trí tuệ nhân tạo"

Trường Cao đẳng Lào Cai tổ chức hội thảo "Chuyển đổi số và trí tuệ nhân tạo"

Sáng 26/11, Trường Cao đẳng Lào Cai tổ chức Hội thảo chuyên đề “Chuyển đổi số và trí tuệ nhân tạo”. Tham gia hội thảo có hơn 200 đại biểu là chuyên gia, lãnh đạo các sở, ngành có liên quan; Hiệp hội Giáo dục nghề nghiệp và Nghề công tác xã hội; lãnh đạo, nhà giáo và sinh viên ngành công nghệ thông tin của Trường Cao đẳng Lào Cai, Trường Cao đẳng Nghề Yên Bái, Trường Cao đẳng Lai Châu...

Khu vực Megalive tại Hội chợ Thương mại Quốc tế Việt – Trung (Lào Cai).

Mở rộng không gian số cho hội chợ truyền thống

Chỉ trong 3 ngày phát sóng, khu vực Megalive tại Hội chợ Thương mại Quốc tế Việt - Trung (Lào Cai) đã xử lý trên 2.000 đơn hàng và thu hút hơn 2 triệu lượt xem trên các nền tảng Shopee và TikTok. Từ một góc nhỏ trong không gian hội chợ truyền thống đã mở ra không gian rộng lớn cho các doanh nghiệp tham gia hội chợ.

Lào Cai: Hơn 100 báo cáo viên pháp luật được bồi dưỡng kiến thức chuyển đổi số và kỹ năng số

Lào Cai: Hơn 100 báo cáo viên pháp luật được bồi dưỡng kiến thức chuyển đổi số và kỹ năng số

Sáng 25/11, Sở Khoa học và Công nghệ tỉnh Lào Cai phối hợp với Trường Đại học Công nghệ - Đại học Quốc gia Hà Nội tổ chức chương trình bồi dưỡng kiến thức cơ bản về chuyển đổi số, kỹ năng số và kỹ năng viết tin, bài cho báo cáo viên pháp luật cấp tỉnh năm 2025.

Công nghệ số "gõ cửa" trạm y tế

Công nghệ số "gõ cửa" trạm y tế

Thời gian qua, chất lượng khám chữa bệnh tại các trạm y tế cơ sở đã có nhiều đổi thay rõ nét nhờ chuyển đổi số. Công nghệ được ứng dụng vào quản lý, khám chữa bệnh và truyền thông sức khỏe, giúp nâng cao hiệu quả công việc của cán bộ y tế và chất lượng phục vụ người dân.

fb yt zl tw