Đánh giá và xếp hạng mô hình ngôn ngữ lớn tiếng Việt của doanh nghiệp

0
29


Mô hình LLM được xây dựng dựa trên một khối lượng dữ liệu khổng lồ và là nền tảng để tạo ra các trợ lý ảo hữu ích trong cuộc sống hằng ngày. Sự phát triển của AI tạo sinh và các mô hình LLM sẽ đóng vai trò quan trọng trong việc thúc đẩy chuyển đổi số, gia tăng năng suất lao động trong nhiều ngành, lĩnh vực. Các mô hình LLM tiếng Việt có thể giúp việc dịch máy, nhận dạng giọng nói, trả lời câu hỏi và tóm tắt văn bản bằng tiếng Việt trở nên chính xác và hiệu quả hơn.

Mặc dù còn nhiều khó khăn và thách thức, song các mô hình LLM lớn tiếng Việt đang được các doanh nghiệp trong nước phát triển nhằm đón đầu làn sóng công nghệ mới và cũng để phục vụ người dùng Việt Nam. Một mục tiêu LLM tiếng Việt hướng tới là cải thiện trải nghiệm người dùng bản địa.

Việc phát triển LLM tiếng Việt để xây dựng các trợ lý ảo phục vụ người Việt được Bộ TT&TT (nay là Bộ KH&CN) đánh giá là rất quan trọng. Vì vậy, thời gian qua, nhiều hoạt động đã được thực hiện để thúc đẩy việc phát triển LLM tiếng Việt và các trợ lý ảo dành riêng cho người Việt; trong đó có việc đánh giá, xếp hạng mô hình LLM tiếng Việt của các doanh nghiệp công nghệ số trong nước như Viettel, VNPT, FPT, MISA, VNG…

Theo Cục Chuyển đổi số quốc gia (Bộ KH&CN), đến thời điểm hiện tại, công tác chuẩn bị cho việc đánh giá và xếp hạng các mô hình LLM tiếng Việt như chuẩn bị ngân hàng câu hỏi và đề thi, chuẩn bị công cụ tích hợp dịch vụ của doanh nghiệp và kết nối thử nghiệm trước khi đánh giá… đã được cơ bản hoàn thành.

Dự kiến, quá trình đánh giá sẽ được tiến hành trong tháng 3 và kết quả chính thức sẽ được Bộ KH&CN công bố vào tháng 4 tới.

Kết quả đánh giá sẽ giúp nhà phát triển điều chỉnh mô hình để tạo ra phản hồi tự nhiên hơn, câu trả lời đúng ngữ cảnh, phù hợp văn hóa và dễ hiểu với đa số người dùng. Điều này đặc biệt quan trọng trong những ứng dụng Chatbot, trợ lý ảo, hỗ trợ khách hàng bằng tiếng Việt.

Ngoài ra, việc đánh giá cũng sẽ thúc đẩy nghiên cứu và phát triển AI nội địa, vì khi có quy trình đánh giá riêng cho tiếng Việt, các nhóm nghiên cứu trong nước sẽ có động lực xây dựng, phát triển bộ dữ liệu chuẩn, bộ tiêu chuẩn đánh giá cũng như kỹ thuật cải tiến mô hình của đơn vị mình. Hoạt động này sẽ tạo ra hệ sinh thái phát triển AI Việt Nam, mở ra nhiều cơ hội hợp tác giữa các tổ chức, doanh nghiệp, trường đại học.

Bên cạnh việc tăng cường năng lực cạnh tranh quốc tế, việc đánh giá các mô hình LLM tiếng Việt cũng sẽ mở đường cho ứng dụng thực tiễn phong phú. Cụ thể, mô hình LLM khi đã được đánh giá cẩn thận sẽ được tin cậy và dễ dàng triển khai trong nhiều lĩnh vực như giáo dục, y tế, tài chính ngân hàng, chính phủ điện tử… Việc đánh giá các mô hình cũng đảm bảo khả năng ứng dụng ổn định, bền vững, đáp ứng tốt nhu cầu xã hội.

Trước đó, từ đầu tháng 7/2024, Bộ TT&TT đã ban hành yêu cầu cơ bản và phương pháp đánh giá mô hình ngôn ngữ lớn tiếng Việt và Trợ lý ảo Việt Nam (phiên bản 1.0).

Hướng dẫn này phục vụ việc đánh giá, lựa chọn nền tảng thuộc Chương trình thúc đẩy phát triển và sử dụng các nền tảng số quốc gia phục vụ chuyển đổi số, phát triển Chính phủ số, kinh tế số và xã hội số.

Đồng thời, triển khai các nhiệm vụ về đánh giá, thúc đẩy phát triển trợ lý ảo thuộc “Chiến lược quốc gia phát triển kinh tế số và xã hội số đến năm 2025, định hướng đến năm 2030” và “Chiến lược phát triển Chính phủ điện tử hướng tới Chính phủ số giai đoạn 2021 – 2025, định hướng đến năm 2030”.



Nguồn Tin