Báo cáo tình hình phát triển mô hình ngôn ngữ lớn (LLM) tiếng Việt vừa được công bố cho thấy có ít nhất 45 mô hình ngôn ngữ lớn tiếng Việt được xây dựng tính đến cuối 2024, đến từ các doanh nghiệp, tổ chức trong và ngoài nước.
Để đánh giá năng lực của các LLM này, các nhà phân tích sử dụng bộ tiêu chuẩn VMLU (Vietnamese Multitask Language Understanding Benchmark Suite for Large Language Models) do Viện Khoa học và Công nghệ Tiên tiến Nhật Bản (JAIST) cùng Zalo AI xây dựng từ tháng 11/2023. Bộ tiêu chuẩn này gồm 10.880 câu hỏi, thuộc 58 chủ đề và 4 lĩnh vực: tổng quát, STEM, Khoa học xã hội, Khoa học nhân văn và mở rộng.
✨ ĐỌC RỒI, XEM RỒI > chán mắt quá rồi > tìm hiểu ngay đây Wordpress Theme premium nguồn cấp phát sạch Wordpress Plugin freemium tải ngay miễn phí > tại đây nhé !
Theo đó, ở bảng xếp hạng dành cho các From-scratch models, tức các mô hình được huấn luyện từ đầu, Llama-3-70B của Meta dẫn đầu về năng lực tiếng Việt tổng quát với 66,44 điểm, GPT-4 của OpenAI xếp thứ ba với 65,53 điểm. Trong khi đó, sản phẩm của Việt Nam là KiLM-13b-v24.7.1 do Zalo AI phát triển xếp thứ hai, ViGPT-1.6B-v1 của VinBigData xếp thứ tám. Các vị trí còn lại trong top 10 thuộc về LLM như GPT-4o-mini, Gemma, Phi-3-128k của OpenAI, Google, Microsoft.
Dẫn đầu ở năng lực Khoa học Xã hội tiếng Việt là Llama-3 của Meta, năng lực STEM là GPT-4. Trong khi đó, đại diện Zalo AI dẫn đầu ở hạng mục Khoa học Nhân văn.

Bảng xếp hạng LLM theo năng lực tiếng Việt tổng quát dựa trên bài đo VMLU. Ảnh chụp màn hình
Ở bảng xếp hạng LLM fine-tuned models, tức các mô hình được tinh chỉnh từ LLM có sẵn và các dữ liệu chuyên ngành, có 9 LLM do các nhà phát triển trong nước huấn luyện lọt vào Top 10. Trong đó, ba vị trí dẫn đầu là VNPTAI-IO-Large-v2, v3 và CakebyVPBank-Large.
Cộng đồng AI tiếng Việt trên đà phát triển
Các mô hình ngôn ngữ lớn là nền tảng quan trọng để xây dựng ứng dụng AI về ngôn ngữ. Ví dụ để có ChatGPT, OpenAI phải tạo mô hình ngôn ngữ lớn GPT.
Trong 45 LLM tiếng Việt được đánh giá trong bảng xếp hạng, nhiều mô hình từ các trường đại học như ML4U của Trường Đại học Bách khoa (ĐHQG TP HCM), Trường Đại học FPT TP HCM. Ngoài ra, nhiều đơn vị nước ngoài cũng tối ưu LLM cho tiếng Việt như UONLP x Ontocord (Trường Đại học Oregon), DAMO Academy (Alibaba), SDSRV teams (Samsung).
Các chuyên gia đánh giá con số này còn thấp khi so với các nước khác trên thế giới, nhưng trong bối cảnh việc phát triển LLM tiếng Việt gặp nhiều thách thức như thiếu dữ liệu, hạ tầng và nguồn lực, kết quả này “phản ánh nỗ lực tiếp cận công nghệ tiên tiến toàn cầu của các đơn vị, cũng như triển vọng của lĩnh vực này tại Việt Nam”. Ngoài ra, nhiều mô hình do người Việt huấn luyện đạt vị trí cao trong bảng xếp hạng và trực tiếp cạnh tranh với mô hình của “ông lớn” như Llama-3, GPT-4, Gemini.

Ảnh minh họa một LLM tiếng Việt. Ảnh: VinBigdata
“Số lượng mô hình ngôn ngữ lớn tại Việt Nam gia tăng cho thấy sự quan tâm của các tổ chức, cá nhân đối với việc thúc đẩy tính ứng dụng của GenAI. Trong tương lai, xu hướng phát triển LLM tại Việt Nam sẽ thiên về tận dụng những mô hình LLM mở như Llama, từ đó chuyển đổi phù hợp với các bài toán và dữ liệu chuyên ngành”, giáo sư Nguyễn Lê Minh, Giám đốc Trung tâm nghiên cứu Interpretable AI – Viện Khoa học và Công nghệ Tiên tiến Nhật Bản (JAIST) nói.
Thời gian tới, JAIST và Zalo AI cho biết sẽ tiếp tục tối ưu bộ tiêu chuẩn đánh giá năng lực tiếng Việt VMLU để củng cố năng lực huấn luyện LLM cho cộng đồng AI tại Việt Nam, tạo tiền đề cho ứng dụng AI hữu ích cho người Việt.
“Phải có những bộ benchmark tốt, chúng ta mới có căn cứ huấn luyện mô hình chất lượng cao”, tiến sĩ Đặng Trần Thái, Trưởng phòng xử lý ngôn ngữ tự nhiên, Khối công nghệ trợ lý ảo VinBigData, đánh giá.
Lưu Quý
AI Việt so khả năng xử lý ngôn ngữ tiếng Việt với GPT-4, Llama Đón đọc những tin tức mới nhất về trí tuệ nhân tạo: Cập nhật các đột phá công nghệ, ứng dụng thực tiễn, và tác động sâu rộng của AI đến các ngành công nghiệp và đời sống.
Tin cập nhật mới AI: Công Nghệ Đột Phá và Xu Hướng Khởi Nghiệp
Trí tuệ nhân tạo đang dẫn đầu trong các trào lưu công nghệ ngày nay, với những đột phá liên tục và tiềm năng ứng dụng toàn diện. Tin mới nhất liên quan đến AI luôn gây chú ý của cộng đồng khoa học và nhà kinh doanh. AI Việt so khả năng xử lý ngôn ngữ tiếng Việt với GPT-4, Llama Các sáng kiến mới nhất trong lĩnh vực AI bao gồm những bước tiến vượt trội trong học máy, xử lý ngôn ngữ tự nhiên, và thị giác nhân tạo. Các tập đoàn công nghệ hàng đầu như Google, Microsoft Corporation, và International Business Machines đang đầu tư đáng kể vào nghiên cứu và phát triển AI, tạo ra những sản phẩm và tiện ích tiên tiến như trợ lý ảo, hệ thống tự động hóa và phân tích thông minh.
Bạn có biết rằng AI Việt so khả năng xử lý ngôn ngữ tiếng Việt với GPT-4, Llama!
[nguồn: VNEXPRESS] Xin chào bạn đến với AI Việt so khả năng xử lý ngôn ngữ tiếng Việt với GPT-4, Llama Thông Tin Mới Tổng Hợp Khoa Học và Công Nghệ AI Tương Lai, môi trường chúng tôi khám phá và chia sẻ những thị trường mới và đột phá hiện đại trong ngành AI. Với sự phát triển rất nhanh của khoa học và công nghệ, AI đang trở thành một mũi nhọn mạnh mẽ định hình tương lai. tác phẩmAI Việt so khả năng xử lý ngôn ngữ tiếng Việt với GPT-4, Llama Bản quyền báo điện tử vnexpress theo giấy phép chia sẻ phi lợi nhuận số (003-2024/Vnexpress-Vietnam-net) – Tuân thủ Giấy phép Creative Commons (CC = BY-SA-NC)
– Chuyên trang tin tức Tin mới công nghệ AI phân phối tin nhanh công nghệ / kỹ thuật tương lai – bài viết này có quyền tác giả GHI tại đầu hoặc/và cuối chân mỗi trang/bài viết – phi lợi nhuận và không chịu bất cứ trách nhiệm nào với nội dung đang phân phối – có ghi nguồn.
Có thể bạn chưa biết ! Chuyên cung cấp thiết bị, phụ kiện cân điện tử chuyên dụng cân điện tử chính xác nhà cung cấp cân điện tử uy tín và giá tốt nhất tại thành phố Hồ Chí Minh. Với nhiều năm trong nghề và đội ngủ sửa chữa cân, kinh doanh năng động.
* Chào mừng bạn đến thế giới của cân điện tử tiên tiến, được cung cấp bởi CTY Hoa Sen Vàng! Đội ngũ chúng tôi tự hào giới thiệu những thông tin mới nhất về công nghệ cân điện tử kỹ thuật, mang lại các giải pháp hiệu quả và đáng tin cậy cho nhu cầu đo lường và kiểm tra trong môi trường sản xuất.
– Điều này áp dụng cho cân điện tử đã đạt được sự tiến bộ đáng kể, và chúng tôi, Công ty cân Hoa Sen Vàng tại Tp.HCM, cam kết mang đến cho khách hàng những thiết bị và dịch vụ hàng đầu trong lĩnh vực này. Nhờ sự hòa trộn của các công nghệ tiên tiến, sản phẩm của chúng tôi không chỉ đảm bảo độ chính xác cao mà còn tối ưu hóa hiệu suất và tiện ích sử dụng.
* Quảng cáo chất lượng cao !