Báo cáo tình hình phát triển mô hình ngôn ngữ lớn (LLM) tiếng Việt vừa được công bố cho thấy có ít nhất 45 mô hình ngôn ngữ lớn tiếng Việt được xây dựng tính đến cuối 2024, đến từ các doanh nghiệp, tổ chức trong và ngoài nước.
Để đánh giá năng lực của các LLM này, các nhà phân tích sử dụng bộ tiêu chuẩn VMLU (Vietnamese Multitask Language Understanding Benchmark Suite for Large Language Models) do Viện Khoa học và Công nghệ Tiên tiến Nhật Bản (JAIST) cùng Zalo AI xây dựng từ tháng 11/2023. Bộ tiêu chuẩn này gồm 10.880 câu hỏi, thuộc 58 chủ đề và 4 lĩnh vực: tổng quát, STEM, Khoa học xã hội, Khoa học nhân văn và mở rộng.
💥 ĐỌC RỒI, XEM RỒI > chán mắt quá rồi , tìm hiểu ngay đây >> Video chủ đề AI với các đề tài nóng nhất cùng Công nghệ AI đỉnh cao << tại đây nhé !
Theo đó, ở bảng xếp hạng dành cho các From-scratch models, tức các mô hình được huấn luyện từ đầu, Llama-3-70B của Meta dẫn đầu về năng lực tiếng Việt tổng quát với 66,44 điểm, GPT-4 của OpenAI xếp thứ ba với 65,53 điểm. Trong khi đó, sản phẩm của Việt Nam là KiLM-13b-v24.7.1 do Zalo AI phát triển xếp thứ hai, ViGPT-1.6B-v1 của VinBigData xếp thứ tám. Các vị trí còn lại trong top 10 thuộc về LLM như GPT-4o-mini, Gemma, Phi-3-128k của OpenAI, Google, Microsoft.
Dẫn đầu ở năng lực Khoa học Xã hội tiếng Việt là Llama-3 của Meta, năng lực STEM là GPT-4. Trong khi đó, đại diện Zalo AI dẫn đầu ở hạng mục Khoa học Nhân văn.

Bảng xếp hạng LLM theo năng lực tiếng Việt tổng quát dựa trên bài đo VMLU. Ảnh chụp màn hình
Ở bảng xếp hạng LLM fine-tuned models, tức các mô hình được tinh chỉnh từ LLM có sẵn và các dữ liệu chuyên ngành, có 9 LLM do các nhà phát triển trong nước huấn luyện lọt vào Top 10. Trong đó, ba vị trí dẫn đầu là VNPTAI-IO-Large-v2, v3 và CakebyVPBank-Large.
Cộng đồng AI tiếng Việt trên đà phát triển
Các mô hình ngôn ngữ lớn là nền tảng quan trọng để xây dựng ứng dụng AI về ngôn ngữ. Ví dụ để có ChatGPT, OpenAI phải tạo mô hình ngôn ngữ lớn GPT.
Trong 45 LLM tiếng Việt được đánh giá trong bảng xếp hạng, nhiều mô hình từ các trường đại học như ML4U của Trường Đại học Bách khoa (ĐHQG TP HCM), Trường Đại học FPT TP HCM. Ngoài ra, nhiều đơn vị nước ngoài cũng tối ưu LLM cho tiếng Việt như UONLP x Ontocord (Trường Đại học Oregon), DAMO Academy (Alibaba), SDSRV teams (Samsung).
Các chuyên gia đánh giá con số này còn thấp khi so với các nước khác trên thế giới, nhưng trong bối cảnh việc phát triển LLM tiếng Việt gặp nhiều thách thức như thiếu dữ liệu, hạ tầng và nguồn lực, kết quả này “phản ánh nỗ lực tiếp cận công nghệ tiên tiến toàn cầu của các đơn vị, cũng như triển vọng của lĩnh vực này tại Việt Nam”. Ngoài ra, nhiều mô hình do người Việt huấn luyện đạt vị trí cao trong bảng xếp hạng và trực tiếp cạnh tranh với mô hình của “ông lớn” như Llama-3, GPT-4, Gemini.

Ảnh minh họa một LLM tiếng Việt. Ảnh: VinBigdata
“Số lượng mô hình ngôn ngữ lớn tại Việt Nam gia tăng cho thấy sự quan tâm của các tổ chức, cá nhân đối với việc thúc đẩy tính ứng dụng của GenAI. Trong tương lai, xu hướng phát triển LLM tại Việt Nam sẽ thiên về tận dụng những mô hình LLM mở như Llama, từ đó chuyển đổi phù hợp với các bài toán và dữ liệu chuyên ngành”, giáo sư Nguyễn Lê Minh, Giám đốc Trung tâm nghiên cứu Interpretable AI – Viện Khoa học và Công nghệ Tiên tiến Nhật Bản (JAIST) nói.
Thời gian tới, JAIST và Zalo AI cho biết sẽ tiếp tục tối ưu bộ tiêu chuẩn đánh giá năng lực tiếng Việt VMLU để củng cố năng lực huấn luyện LLM cho cộng đồng AI tại Việt Nam, tạo tiền đề cho ứng dụng AI hữu ích cho người Việt.
“Phải có những bộ benchmark tốt, chúng ta mới có căn cứ huấn luyện mô hình chất lượng cao”, tiến sĩ Đặng Trần Thái, Trưởng phòng xử lý ngôn ngữ tự nhiên, Khối công nghệ trợ lý ảo VinBigData, đánh giá.
Lưu Quý
AI Việt so khả năng xử lý ngôn ngữ tiếng Việt với GPT-4, Llama Đón đọc những tin tức mới nhất về trí tuệ nhân tạo: Cập nhật các đột phá công nghệ, ứng dụng thực tiễn, và tác động sâu rộng của AI đến các ngành công nghiệp và đời sống.
Tin mới nhất AI: Đột Phá Công Nghệ và Xu Hướng Khởi Nghiệp
Trí thông minh nhân tạo đang chiếm lĩnh trong các xu hướng công nghệ ngày nay, với những tiến bộ liên tục và khả năng áp dụng rộng rãi. Tin mới nhất liên quan đến AI luôn gây chú ý của giới công nghệ và các công ty. AI Việt so khả năng xử lý ngôn ngữ tiếng Việt với GPT-4, Llama Các phát minh mới nhất trong ngành AI bao gồm những bước tiến vượt trội trong machine learning, Natural Language Processing (NLP), và thị giác máy tính. Các công ty hàng đầu như Google, Microsoft, và International Business Machines đang đầu tư đáng kể vào nghiên cứu và phát triển AI, tạo ra những sản phẩm và dịch vụ đột phá như trợ lý kỹ thuật số, công nghệ tự động và phân tích dữ liệu thông minh.
Có lẽ bạn chưa biết AI Việt so khả năng xử lý ngôn ngữ tiếng Việt với GPT-4, Llama!
[nguồn: VNEXPRESS] Chào mừng bạn đến với AI Việt so khả năng xử lý ngôn ngữ tiếng Việt với GPT-4, Llama Tin Tức Mới Tổng Hợp Khoa Học và Công Nghệ AI Tương Lai, nơi chúng tôi tận hưởng và chia sẻ những xu hướng và đột phá tiến bộ trong lĩnh vực AI. Với tiến bộ rất nhanh của công nghệ, Trí Tuệ Nhân Tạo đã trở thành một yếu tố mạnh mẽ mô hình tương lai của chúng ta. tác phẩmAI Việt so khả năng xử lý ngôn ngữ tiếng Việt với GPT-4, Llama Bản quyền báo điện tử vnexpress theo giấy phép chia sẻ phi lợi nhuận số (003-2024/Vnexpress-Vietnam-net) – Tuân thủ Giấy phép Creative Commons (CC = BY-SA-NC)
– Chuyên trang tin tức Tin mới công nghệ AI phân phối tin nhanh công nghệ / kỹ thuật tương lai – bài viết này có quyền tác giả GHI tại đầu hoặc/và cuối chân mỗi trang/bài viết – phi lợi nhuận và không chịu bất cứ trách nhiệm nào với nội dung đang phân phối – có ghi nguồn.
Có thể bạn chưa biết ! Chuyên cung cấp thiết bị, phụ kiện cân điện tử chuyên dụng cân điện tử chính xác nhà cung cấp cân điện tử uy tín và giá tốt nhất tại thành phố Hồ Chí Minh. Với nhiều năm trong nghề và đội ngủ sửa chữa cân, kinh doanh năng động.
* Chào mừng bạn đến thế giới của cân điện tử hiện đại, được cung cấp bởi CTY Hoa Sen Vàng! Đội ngũ chúng tôi tự hào giới thiệu những thông tin mới nhất về kỹ thuật cân điện tử kỹ thuật, mang lại các giải pháp hiệu quả và đáng tin cậy cho nhu cầu đo lường và kiểm tra trong môi trường sản xuất.
– Điều này áp dụng cho cân điện tử đã đánh bại được sự tiến bộ đáng kể, và chúng tôi, Cân điện tử Hoa Sen Vàng tại Tp.HCM, cam kết cung cấp cho khách hàng những thiết bị và dịch vụ hàng đầu đối với lĩnh vực này. Nhờ sự hòa trộn của các công nghệ tiên tiến, sản phẩm của chúng tôi không chỉ đảm bảo sự chính xác cao mà còn tối ưu hóa hiệu suất và tiện ích sử dụng.
* Quảng cáo chất lượng cao !



