[Tin AI Tứ phương] Apple chê khả năng suy luận của các mô hình AI Đón đọc những tin tức mới nhất về trí tuệ nhân tạo: Cập nhật các đột phá công nghệ, ứng dụng thực tiễn, và tác động sâu rộng của AI đến các ngành công nghiệp và đời sống.
Các LLM từ OpenAI, Google hay Meta được đánh giá có thể tương tác tự nhiên với con người, gần nhất là mô hình OpenAI o1 “với khả năng lập luận”. Dù vậy, theo nhóm nghiên cứu của Apple, chúng chỉ đơn thuần là “khớp mẫu tinh vi” thay vì “thực sự suy luận logic”.
✨ ĐỌC RỒI, XEM RỒI > chán mắt quá rồi > tìm hiểu ngay đây Wordpress Theme premium nguồn cấp phát sạch Wordpress Plugin freemium tải ngay miễn phí > tại đây nhé !
GSM8K hiện là bài kiểm tra phổ biến nhất để đánh giá kỹ năng suy luận của một LLM. Tuy nhiên, cũng do quá phổ biến, công cụ được cho là có thể bị “nhiễm” dữ liệu, khiến LLM có thể biết đáp án do đã được huấn luyện từ dữ liệu đó.
Để kiểm tra giả thuyết này, nhóm nghiên cứu của Apple phát triển một tiêu chuẩn mới gọi là GSM-Symbolic, trong đó giữ nguyên bản chất của vấn đề cần lập luận nhưng thay đổi biến số như tên, số lượng, độ phức tạp, thêm thông tin không liên quan. Thông qua việc thử nghiệm 20 mô hình LLM phổ biến nhất như GPT-4o và o1 của OpenAI, Gemma 2 của Google và Llama 3 của Meta, kết quả cho thấy “sự mong manh đáng ngạc nhiên” trong hiệu suất của LLM.
Trong bài nghiên cứu công bố trên blog tuần này, Apple cho biết mỗi khi thay đổi biến số, hiệu suất mô hình trong thử nghiệm và độ chính xác đều giảm vài phần trăm. Sản phẩm của OpenAI hoạt động tốt hơn so với LLM mã nguồn mở, nhưng chênh lệch không đáng kể.
Nhóm cũng thêm vào những cụm từ không cần thiết để đo phản ứng của mô hình. Ví dụ: “Oliver hái 44 quả kiwi vào Thứ Sáu. Sau đó anh hái 58 quả kiwi vào Thứ Bảy. Vào Chủ Nhật, anh hái gấp đôi số kiwi đã hái vào Thứ Sáu, nhưng 5 quả có kích thước nhỏ hơn mức trung bình. Oliver có bao nhiêu quả kiwi?”.
Kết quả là hiệu suất giảm mạnh trên toàn bộ LLM. OpenAI o1 Preview đạt kết quả tốt nhất, nhưng độ chính xác giảm 17,5%, nhưng vẫn cao hơn LLM Phi 3 của Microsoft với mức giảm 65%.
Trong ví dụ về bài toán tính số quả kiwi, các LLM trừ đi 5 quả kiwi nhỏ hơn mà không “hiểu” kích thước quả không liên quan đến bài toán. “Điều này cho thấy các mô hình có xu hướng chuyển đổi câu nói thành phép toán mà không thực sự hiểu ý nghĩa”, đại diện nhóm nghiên cứu cho biết. “Nó chứng minh giả thuyết LLM tìm kiếm và khớp mẫu để lập luận hơn là hiểu khái niệm”.
Nhóm nhấn mạnh thử nghiệm chỉ ra “điểm yếu nghiêm trọng trong khả năng thực sự hiểu khái niệm toán học và phân biệt thông tin liên quan cho việc giải quyết vấn đề” của LLM. Kết quả cho thấy các mô hình AI đã bắt đầu hình thành khả năng tự suy luận vấn đề, nhưng mức độ thấp và thực tế đang bị cường điệu hóa về nguy cơ của AI.
Các bên chưa đưa ra bình luận sau kết quả nghiên cứu của Apple.
Bảo Lâm
- Apple tạo mô hình AI ‘đọc’ độ sâu 3D từ ảnh 2D
- Apple có thể tính phí 20 USD cho tính năng AI
- Apple tham gia tuân thủ quy tắc AI an toàn
- Lối đi riêng của Apple trong kỷ nguyên AI tạo sinh
Tin cập nhật mới AI: Công Nghệ Đột Phá và Định hướng tương lai
Trí tuệ nhân tạo đang dẫn đầu trong các trào lưu công nghệ ngày nay, với những bước nhảy vọt và khả năng áp dụng rộng rãi. Tin mới nhất liên quan đến AI luôn thu hút của cộng đồng công nghệ và nhà kinh doanh. [Tin AI Tứ phương] Apple chê khả năng suy luận của các mô hình AI Các phát minh mới nhất trong lĩnh vực AI bao gồm những tiến bộ vượt bậc trong học máy, xử lý ngôn ngữ tự nhiên, và computer vision. Các công ty công nghệ lớn như Google, Microsoft Corporation, và International Business Machines đang đầu tư đáng kể vào nghiên cứu AI, tạo ra những sản phẩm và tiện ích sáng tạo như trợ lý ảo, hệ thống tự động hóa và phân tích dữ liệu thông minh.
Như bạn đang đọc [Tin AI Tứ phương] Apple chê khả năng suy luận của các mô hình AI!
# Hân hoan bạn đến với [Tin AI Tứ phương] Apple chê khả năng suy luận của các mô hình AI Thông Tin Mới Tổng Hợp Công Nghệ AI Tương Lai, nơi chúng tôi nghiên cứu và chia sẻ những thị trường mới và cách tiến tiến bộ trong ngành Trí Tuệ Nhân Tạo. Với tiến bộ rất nhanh của công nghệ, Trí Tuệ Nhân Tạo đang trở thành một lực lượng mạnh mẽ định hình tương lai. tác phẩm[Tin AI Tứ phương] Apple chê khả năng suy luận của các mô hình AI Bản quyền báo điện tử vnexpress theo giấy phép chia sẻ phi lợi nhuận số (003-2024/Vnexpress-Vietnam-net) – Tuân thủ Giấy phép Creative Commons (CC = BY-SA-NC)
– Chuyên trang tin tức Tin mới công nghệ AI phân phối tin nhanh công nghệ / kỹ thuật tương lai – bài viết này có quyền tác giả GHI tại đầu hoặc/và cuối chân mỗi trang/bài viết – phi lợi nhuận và không chịu bất cứ trách nhiệm nào với nội dung đang phân phối – có ghi nguồn.
Có thể bạn chưa biết ! Chuyên cung cấp thiết bị, phụ kiện cân điện tử chuyên dụng cân điện tử chính xác nhà cung cấp cân điện tử uy tín và giá tốt nhất tại thành phố Hồ Chí Minh. Với nhiều năm trong nghề và đội ngủ sửa chữa cân, kinh doanh năng động.
* Chào mừng bạn đến với thế giới của đo lường điện tử hiện đại, được cung cấp bởi CTY Hoa Sen Vàng! Đội ngũ chúng tôi tự hào giới thiệu những thông tin mới nhất về công nghệ cân điện tử Bình Thạnh, mang lại những giải pháp hiệu quả và đáng tin cậy cho nhu cầu đo lường và kiểm tra trong môi trường sản xuất.
– Công nghệ cân điện tử đã đạt được sự tiến bộ đáng kể, và chúng tôi, Cân điện tử Hoa Sen Vàng tại Tp.HCM, cam kết mang đến cho khách hàng những thiết bị và dịch vụ hàng đầu đối với lĩnh vực này. Nhờ sự hòa trộn của các công nghệ tiên tiến, sản phẩm của chúng tôi không chỉ đảm bảo sự chính xác cao mà còn tối ưu hóa tính hiệu quả và tiện ích sử dụng.
* Quảng cáo chất lượng cao !