چهارشنبه, ۶ اسفند , ۱۴۰۴ Wednesday, 25 February , 2026 ساعت تعداد نوشته های امروز : 22×

تیتر اخبار آکادمی

نگاهی به مفهوم و ابزارهای خود افشایی هیجانی دریافت گواهینامه صلاحیت حرفه‌ای برای همه معلمان اجباری شد ماهواره «خیام» کاهش پوشش جنگلی اطراف دریاچه سوها را ثبت کرد ابعاد مختلف روان‌شناسی رقابت رکوردشکنی حضور دانش‌آموزان در اعتکاف؛ مشارکت از 800 هزار نفر گذشت حل مسئله در خواب ممکن شد گزارش تلخ نوجوانان از پشت‌پرده تجربه در اینستاگرام بزرگسالان هم باید مثل کودکان بازی کنند! تأکید وزیر آموزش‌وپرورش بر اولویت‌ها و تقویت آموزش قرآن تکذیب شایعه تعطیلی مدارس منطقه 11 تهران پدیده «ماه خونین» در راه است؛ چگونه ماه‌گرفتگی کامل 3 مارس را رصد کنیم رشد هنرستان‌ها و افزایش گرایش به رشته‌های مهارتی جزئیات جدید از 3 ماهواره در حال ساخت ایران بزرگسالان هم باید بازی کنند نتایج نهایی پذیرش بدون آزمون نوبت بهمن ۱۴۰۴ دانشگاه‌ها اعلام شد واکنش وزیر آموزش‌و‌پرروش به فیلم پخش شده توسط یکی از معلمان پیش‌ثبت‌نام مدارس غیردولتی با 3 شرط و سقف 20 درصد شهریه تعویق دوباره پرتاب آرتمیس 2؛ سفر انسان به ماه به فروردین موکول شد پرتاب 28 استارلینک جدید؛ ماهواره‌های اسپیس‌ایکس به‌ مرز 10 هزار رسید PTSD چیست؟ وقتی گذشته هنوز تمام نشده است/ اینفوگرافیک پنجمین جشنواره کشوری هنری سمپاد برگزار می‌شود ارتقای کیفیت آموزشی در مناطق آزاد با ساخت مدارس جدید شهادت 22 دانش‌آموز و 5 معلم در حوادث دی‌ماه برگزاری اردو آموزشی آمادگی کنکوری بیش از ۱۰۰ دانش آموز هرمزگانی بازگشت 39 هزار بازمانده از تحصیل به مدرسه تأکید وزیر آموزش‌وپرورش بر ارتقای شفافیت در صندوق ذخیره فرهنگیان واریز 7 هزار میلیارد ریال سود به حساب بازنشستگان صندوق ذخیره فرهنگیان حمله پانیک چیست؟ هشدار پلیس فتا درباره ترفند جدید کلاهبرداری در “شاد” استرس چگونه بر عملکرد و سلامت کلیه‌های انسان تأثیر می‌گذارد؟ تعطیلات زمستانه مدارس به زودی تصویب می شود امام جمعه بهاباد: قدرت واقعی ملت‌ها در علم و شناخت نهفته است دانش‌آموزان با تکیه بر علم و ایمان، آینده روشن کشور را رقم می‌زنند ۵۰ برگزیده کنکور سراسری سال ۱۴۰۴ در شهرستان بهاباد تجلیل شدند گروه همسالان؛ سکوی خودشناسی یا تهدیدی برای مبارزه با والدین؟ به خاطر سلامت مغزتان هم که شده یادگیری را متوقف نکنید! اجرای 4 برنامه ویژه قرآنی برای معلمان و دانش‌آموزان در ماه رمضان آموزش هوش مصنوعی به 1 میلیون دانش‌آموز در مدارس غیردولتی انتخاب 32 اثر برگزیده در جشنواره ملی کتاب رشد با مشارکت 300 ناشر رونمایی از نشان افتخار نویسندگان رشد در جشنواره کتاب رشد چالش کتاب کودک و نوجوان از نگاه دبیر شورای عالی انقلاب فرهنگی نقشه جامع ترویج کتابخوانی در مدارس تدوین شود توزیع 60 هزار میلیارد سود بین اعضای موسسه صندوق ذخیره فرهنگیان کاظمی: مصرف کتاب در مدارس حلقه کلیدی زنجیره کتاب‌خوانی است جزییات پرداخت اوراق بازنشستگان آموزش و پرورش هلیوم3؛ 12 سال برق رایگانِ ایران با 25 تن خاک ماه غم مادرانه؛ نگاهی به افسردگی پس از زایمان 15 اسفند؛ تاریخ احتمالی ناسا برای اعزام 4 فضانورد به ماه مدارس آینده؛ گامی برای تحقق عدالت آموزشی مدارس آینده باید چندوجهی، منعطف و مبتنی بر مهارت‌آموزی طراحی شوند

محققان اپل: مدل‌های هوش مصنوعی فعلی هنوز توانایی استدلال در سطح AGI را ندارند
1404-10-11
شناسه : 8293
بازدید 39
2

مدل‌های هوش مصنوعی در برابر چالش‌های پیچیده شکست می‌خورند.

ارسال توسط :
پ
پ

با وجود پیشرفت‌های اخیر، رقابت برای رسیدن به هوش جامع مصنوعی (AGI) هنوز راه طولانی در پیش دارد؛ پژوهش تازه اپل نشان می‌دهد که حتی مدل‌های پیشرفته هوش مصنوعی هم هنوز در استدلال دچار ضعف هستند.

مدل‌های زبانی بزرگ (LLM) مانند ChatGPT شرکت OpenAI و Claude شرکت آنتروپیک اخیراً به نسخه‌های دارای توانایی‌های استدلالی (LRM) ارتقا یافته‌اند، اما پژوهشگران اپل در مقاله‌ای با عنوان «توهم تفکر» که اخیراً منتشر شده، می‌گویند قابلیت‌های بنیادی، ویژگی‌های مقیاس‌پذیری و محدودیت‌های این مدل‌ها هنوز به‌خوبی درک نشده‌اند.

به گفته این پژوهشگران، ارزیابی‌های فعلی عمدتاً بر شاخص‌های ریاضیاتی و کدنویسی تمرکز دارند و دقت پاسخ نهایی را ملاک قرار می‌دهند؛ اما این نوع ارزیابی اطلاعات دقیقی از توانایی استدلال مدل‌ها به‌دست نمی‌دهد. این یافته‌ها در تضاد با دیدگاهی است که رسیدن به AGI را در چند سال آینده قابل دستیابی می‌داند.

موانع پیش روی مدل‌های زبانی در مسیر رسیدن به AGI

محققان اپل برای ارزیابی توانایی استدلال، مجموعه‌ای از پازل‌ها را طراحی کردند و مدل‌های مختلف از جمله Claude Sonnet، نسخه‌های o3-mini و o1 از OpenAI، مدل‌های DeepSeek-R1 و V3 را فراتر از ارزیابی‌های ریاضیاتی رایج مورد آزمایش قرار دادند.

نتایج این آزمایش‌ها نشان داد که مدل‌های پیشگام در برابر پیچیدگی‌ها به‌شدت دچار افت عملکرد می‌شوند، توانایی تعمیم در استدلال ندارند و با افزایش پیچیدگی، مزیت آنها از بین می‌رود؛ وضعیتی که با انتظارات از AGI هم‌خوانی ندارد.

اپل در گزارش خود نوشته است:

«ما دریافتیم که مدل‌های استدلالگر در محاسبات دقیق محدودیت دارند؛ آنها نمی‌توانند از الگوریتم‌های صریح استفاده کنند و قابلیت استدلال آنها در حل پازل‌ها ناسازگاری دارد.»

بررسی پاسخ‌ها و دقت بیشتر مدل‌های ساده در مسائل آسان
محققان اپل: مدل‌های هوش مصنوعی فعلی هنوز توانایی استدلال در سطح AGI را ندارند

یکی دیگر از یافته‌های این مطالعه آن است که مدل‌ها دچار نوعی تفکر بیش از حد (Overthinking) می‌شوند. آنها ابتدا پاسخ صحیح تولید می‌کنند اما با ادامه دادن به تفکر به‌سمت استدلال اشتباه کشیده می‌شوند و درنهایت پاسخ نادرست می‌دهند. نتیجه نهایی پژوهش این بود که مدل‌های دارای قابلیت استدلال، درواقع فقط الگوهای استدلالی را تقلید می‌کنند و نمی‌توانند آنها را درونی‌سازی کنند یا تعمیم دهند؛ قابلیتی که لازمه رسیدن به سطح AGI است.

اپل در پایان نوشت:

«این یافته‌ها با فرضیات رایج درباره توانایی مدل‌های استدلالی در تضاد است و نشان می‌دهد رویکردهای فعلی ممکن است به موانع بنیادی در مسیر استدلال تعمیم‌پذیر رسیده باشند.»

 چهار محیط معمایی
محققان اپل: مدل‌های هوش مصنوعی فعلی هنوز توانایی استدلال در سطح AGI را ندارند

هوش جامع مصنوعی یا AGI به‌عنوان هدف نهایی توسعه هوش مصنوعی شناخته می‌شود؛ حالتی که در آن ماشین می‌تواند مانند انسان فکر کند و به سطحی برابر با هوش انسانی برسد. در ژانویه، «سم آلتمن» مدیرعامل OpenAI گفته بود که این شرکت بیش از هر زمان دیگری به ساخت AGI نزدیک شده و ادعا کرده بود: «ما اکنون مطمئنیم که می‌دانیم چگونه می‌توان AGI را به‌گونه‌ای که همیشه درک می‌کردیم، بسازیم.»

در نوامبر نیز «داریو آمودی»، مدیرعامل آنتروپیک، پیش‌بینی کرده بود که AGI در یکی دو سال آینده از توانایی‌های انسانی فراتر خواهد رفت و گفته بود: «اگر نرخ رشد قابلیت‌های فعلی را در نظر بگیریم، رسیدن به AGI تا سال 2026 یا 2027 دور از ذهن نیست.»

ثبت دیدگاه علمی و آموزشی

  • دیدگاه‌های ارسال شده توسط شما، پس از تایید توسط تیم مدیریت در وب منتشر خواهد شد.
  • پیام‌هایی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
  • پیام‌هایی که به غیر از زبان فارسی یا غیرمرتبط باشد منتشر نخواهد شد.