Sắp đánh giá, xếp hạng mô hình ngôn ngữ lớn tiếng Việt của các doanh nghiệp

Dự kiến, quá trình đánh giá và xếp hạng mô hình ngôn ngữ lớn tiếng Việt của 6 doanh nghiệp sẽ diễn ra trong tháng 3, với kết quả được Bộ KH&CN công bố vào tháng 4.

Mô hình ngôn ngữ lớn (LLM) là một loại trí tuệ nhân tạo hiện đại, được tạo ra để xử lý, hiểu và viết văn bản giống như cách con người làm. Nó được xây dựng dựa trên một khối lượng dữ liệu khổng lồ và là nền tảng để tạo ra các trợ lý ảo hữu ích trong cuộc sống hằng ngày.

Phát triển LLM tiếng Việt để xây dựng các trợ lý ảo phục vụ người Việt được Bộ TT&TT (nay là Bộ KH&CN) đánh giá là một việc rất quan trọng.

Vì vậy, thời gian qua, nhiều hoạt động đã được thực hiện để thúc đẩy việc phát triển LLM tiếng Việt và các trợ lý ảo dành riêng cho người Việt; trong đó có việc đánh giá, xếp hạng mô hình LLM tiếng Việt của các doanh nghiệp công nghệ số trong nước như Viettel, VNPT, FPT, MISA, VNG...

2.jpg
Được xây dựng dựa trên một khối lượng dữ liệu khổng lồ, mô hình ngôn ngữ lớn là nền tảng để tạo ra các trợ lý ảo hữu ích trong cuộc sống hàng ngày. (Ảnh minh họa)

Thông tin với phóng viên VietNamNet ngày 17/3, Cục Chuyển đổi số quốc gia (Bộ KH&CN) cho hay, đến thời điểm hiện tại, công tác chuẩn bị cho việc đánh giá và xếp hạng các mô hình ngôn ngữ lớn tiếng Việt như chuẩn bị ngân hàng câu hỏi và đề thi, chuẩn bị công cụ tích hợp dịch vụ của doanh nghiệp và kết nối thử nghiệm trước khi đánh giá... đã được cơ bản hoàn thành.

Cũng theo Cục Chuyển đổi số quốc gia, dự kiến quá trình đánh giá sẽ được tiến hành trong tháng 3, và kết quả chính thức sẽ được Bộ KH&CN công bố vào tháng 4 tới. Hội đồng đánh giá sẽ gồm các thành viên là những chuyên gia đến từ các cơ sở đào tạo, Viện nghiên cứu của Việt Nam.

Thông tin thêm về ý nghĩa của việc đánh giá các mô hình ngôn ngữ lớn tiếng Việt, Cục Chuyển đổi số quốc gia cho biết, một mục tiêu hướng tới là cải thiện trải nghiệm người dùng bản địa.

Bởi lẽ, để mô hình ngôn ngữ lớn tiếng Việt phục vụ tốt cho người dùng Việt, việc đánh giá và so sánh với các mô hình khác, là cần thiết. Kết quả đánh giá sẽ giúp nhà phát triển điều chỉnh mô hình để tạo ra phản hồi tự nhiên hơn, câu trả lời đúng ngữ cảnh, phù hợp văn hóa, và dễ hiểu với đa số người dùng. Điều này đặc biệt quan trọng trong những ứng dụng chatbot, trợ lý ảo, hỗ trợ khách hàng bằng tiếng Việt.

Bên cạnh đó, việc đánh giá cũng sẽ thúc đẩy nghiên cứu và phát triển AI nội địa, vì khi có quy trình đánh giá riêng cho tiếng Việt, các nhóm nghiên cứu trong nước sẽ có động lực xây dựng, phát triển bộ dữ liệu chuẩn, bộ tiêu chuẩn đánh giá cũng như kỹ thuật cải tiến mô hình của đơn vị mình. Hoạt động này sẽ tạo ra hệ sinh thái phát triển AI Việt Nam, mở ra nhiều cơ hội hợp tác giữa các tổ chức, doanh nghiệp, trường đại học.

Bên cạnh việc tăng cường năng lực cạnh tranh quốc tế, việc đánh giá các mô hình ngôn ngữ lớn tiếng Việt cũng sẽ mở đường cho ứng dụng thực tiễn phong phú, cụ thể: Mô hình ngôn ngữ lớn khi đã được đánh giá cẩn thận sẽ được tin cậy và dễ dàng triển khai trong nhiều lĩnh vực như giáo dục, y tế, tài chính ngân hàng, chính phủ điện tử...

Ngoài ra, việc đánh giá các mô hình còn đảm bảo khả năng ứng dụng ổn định, bền vững, đáp ứng tốt nhu cầu xã hội.

Trước đó, từ đầu tháng 7/2024, Bộ TT&TT đã ban hành yêu cầu cơ bản và phương pháp đánh giá mô hình ngôn ngữ lớn tiếng Việt và Trợ lý ảo Việt Nam (phiên bản 1.0).

Hướng dẫn này phục vụ việc đánh giá, lựa chọn nền tảng thuộc Chương trình thúc đẩy phát triển và sử dụng các nền tảng số quốc gia phục vụ chuyển đổi số, phát triển Chính phủ số, kinh tế số và xã hội số; đồng thời, triển khai các nhiệm vụ về đánh giá, thúc đẩy phát triển trợ lý ảo thuộc “Chiến lược quốc gia phát triển kinh tế số và xã hội số đến năm 2025, định hướng đến năm 2030” và “Chiến lược phát triển Chính phủ điện tử hướng tới Chính phủ số giai đoạn 2021 - 2025, định hướng đến năm 2030”.

Theo tài liệu nêu trên, về phương pháp đánh giá, các bộ, ngành, địa phương đã được hướng dẫn rõ là cần có: Ngân hàng câu hỏi - đáp phục vụ đánh giá trên 50 lĩnh vực như khoa học tự nhiên, khoa học xã hội, nhân văn, kinh tế, chính trị…; công cụ đánh giá tự động; và Hội đồng đánh giá. Hội đồng có thể tham khảo kết quả đánh giá từ các công cụ tự động, tuy nhiên kết quả đánh giá cuối cùng là của hội đồng.

Theo vietnamnet.vn

Có thể bạn quan tâm

Tin cùng chuyên mục

Bảng xếp hạng của RRC trong hạng mục DocVQA 6/2025.

CMC đạt tốp 12 thế giới về nhận dạng văn bản

Mô hình CATI-VLM (Visual Document Understanding) do Viện Ứng dụng công nghệ CMC(CMC ATI) phát triển đã vượt qua nhiều đối thủ quốc tế đạt tốp 12 thế giới và tốp 1 Việt Nam trong bảng xếp hạng vừa được Robust Reading Competition (RRC) công bố tháng 6/2025 tại hạng mục Document Visual Question Answering (DocVQA)

Tổng Bí thư Tô Lâm và các đồng chí trong Ban Chỉ đạo ấn nút khai trương ra mắt hệ thống 3 nền tảng số phục vụ giám sát triển khai Nghị quyết 57-NQ/TW.

Tập trung cao độ, hành động quyết liệt 8 vấn đề về phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia

Sáng 2-7, tại Hà Nội, Ban Chỉ đạo Trung ương về phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số (Ban Chỉ đạo) tổ chức hội nghị sơ kết 6 tháng đầu năm và triển khai nhiệm vụ trọng tâm 6 tháng cuối năm 2025 theo hình thức trực tiếp kết hợp với trực tuyến với các địa phương. Tổng Bí thư Tô Lâm, Trưởng ban Chỉ đạo Trung ương chủ trì hội nghị.

96,5% dân số Lào Cai được quản lý sức khỏe điện tử

96,5% dân số Lào Cai được quản lý sức khỏe điện tử

Theo thông tin từ Sở Y tế tỉnh, đến thời điểm hiện tại, 96,5% dân số trên địa bàn tỉnh đã được quản lý sức khỏe điện tử, vượt xa mục tiêu đề ra trong Kế hoạch 220/KH-UBND ngày 26/4/2023 về chuyển đổi số ngành y tế giai đoạn 2023 - 2025, định hướng đến năm 2030.

Yên Bái chuyển đổi số để vững bước vào kỷ nguyên mới

Yên Bái chuyển đổi số để vững bước vào kỷ nguyên mới

Xác định chuyển đổi số (CĐS) là xu thế, thời cơ, động lực tạo đột phá trong phát triển, tỉnh Yên Bái đã nỗ lực thúc đẩy CĐS trên nhiều lĩnh vực. Từ đó, làm thay đổi căn bản, toàn diện hoạt động chỉ đạo, điều hành, quản lý của cấp ủy, chính quyền các cấp, hoạt động sản xuất, kinh doanh của doanh nghiệp, phương thức sống, làm việc của người dân theo hướng tích cực, đem lại cuộc sống hiện đại, thông minh, tiện ích.

Nhà báo "tỉnh táo" trước AI

Nhà báo "tỉnh táo" trước AI

Trí tuệ nhân tạo (AI) đang tạo ra những thay đổi mãnh liệt trong lĩnh vực báo chí. Tỉnh táo trước làn sóng thông tin ảo, fake-news do AI tạo ra khi tác nghiệp trở thành đòi hỏi cấp thiết với đội ngũ phóng viên, biên tập viên. Các nhà báo, chuyên gia công nghệ đã chia sẻ vấn đề này với phóng viên báo Tin tức và Dân tộc.

Công nghệ - cầu nối để tiếp cận, giám sát chính sách

Công nghệ - cầu nối để tiếp cận, giám sát chính sách

Nghị quyết số 57-NQ/TW về đột phá phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia và Nghị quyết số 66-NQ/TW về đổi mới công tác xây dựng và thi hành pháp luật đáp ứng yêu cầu phát triển đất nước trong kỷ nguyên mới đang được ngành tư pháp cụ thể hóa bằng những hành động cụ thể.

fb yt zl tw