خبر " مدل‌های هوش مصنوعی استدلالگر جدید OpenAI بیشتر دچار توهم می‌شوند " | مجله آموزشی آکادمی علمی eaedu | مجله آموزشی آکادمی علمی

توهم در مدل‌های هوش مصنوعی جدید OpenAI

نکته نگران‌کننده‌تر این است که OpenAI واقعاً نمی‌داند چرا این اتفاق می‌افتد. سازنده ChatGPT در گزارش فنی خود برای o3 و o4-mini می‌نویسد: «به تحقیقات بیشتری نیاز است تا بفهمیم چرا توهمات با پیشرفت مدل‌های استدلالی افزایش یافته است.»

توهم در مدل‌های هوش مصنوعی استدلال‌گر OpenAI

مدل‌های هوش مصنوعی استدلالگر جدید OpenAI بیشتر دچار توهم می‌شوند

O3 و o4-mini در برخی زمینه‌ها ازجمله کارهای مربوط به کدنویسی و ریاضی عملکرد بهتری دارند اما ازآنجایی‌که آنها «درکل ادعاهای بیشتری دارند»، طبق گزارش OpenAI، اغلب همان‌قدر که ادعاهای دقیق‌تری می‌کنند، ادعاهای نادرست و متوهم‌تری نیز ارائه می‌دهند.

OpenAI می‌گوید o3 در پاسخ به 33 درصد سؤالات PersonQA (بنچمارک داخلی شرکت برای سنجش دقت دانش مدل درباره اشخاص) توهم ایجاد می‌کند. این تقریباً دو برابر میزان توهم مدل‌های استدلال‌گر قبلی o1 و o3-mini است که به‌ترتیب امتیاز بنچمارک‌ آنها 16 درصد و 14.8 درصد بود. مدل O4-mini نیز عملکرد بدتری در PersonQA دارد: 48 درصد.

توهمات ممکن است به مدل‌ها کمک کند به ایده‌های جالبی برسند و خلاق باشند اما این امر برای کسب‌وکارها و کاربرانی که نیاز به دقت بالایی در خروجی هوش مصنوعی دارند، مشکل‌ساز است. یکی از روش‌های امیدوارکننده برای افزایش دقت مدل‌ها، داشتن قابلیت جستجوی وب مدل‌هاست؛ برای مثال مدل GPT-4o با قابلیت جستجوی وب، امتیاز 90 درصدی در SimpleQA (یکی دیگر از بنچمارک‌های سنجش دقت) به دست آورد.

مجله آموزشی آکادمی علمی EAedu از سال ۱۳۸۱ با انتشار اخبار و مقالات علمی و آموزشی، آموزش‌های تخصصی و مهارت‌محور را به‌صورت سریع، جذاب و به‌روز ارائه می‌دهد و با رویکردی کاربردی، مسیر پیوند دانش‌آموزان، دانشجویان و علاقه‌مندان به یادگیری را با نیازهای بازار کار هموار می‌کند.

تیتر اخبار آکادمی

مدل‌های هوش مصنوعی استدلالگر جدید OpenAI بیشتر دچار توهم می‌شوند

توهم در مدل‌های هوش مصنوعی جدید OpenAI

اخبار و مقالات علمی و آموزشی مرتبط

بازیابی ارزش از باطله‌ها با تکیه بر هوش مصنوعی

مهلت ارسال مقاله برای ویژه‌نامه «هوش مصنوعی و سیاستگذاری توسعه علمی و فناورانه»

هوش مصنوعی مسیرهای پنهان ساخت نانوبلورهای نیمه‌رسانا را آشکار کرد

ارائه سرویس‌های هوش مصنوعی به کاربران از سوی پلتفرم داخلی

ثبت دیدگاه علمی و آموزشی

بازیابی ارزش از باطله‌ها با تکیه بر هوش مصنوعی

مهلت ارسال مقاله برای ویژه‌نامه «هوش مصنوعی و سیاستگذاری توسعه علمی و فناورانه»

هوش مصنوعی مسیرهای پنهان ساخت نانوبلورهای نیمه‌رسانا را آشکار کرد

ارائه سرویس‌های هوش مصنوعی به کاربران از سوی پلتفرم داخلی

اولین کلینیک هوش مصنوعی جهان؛ رفتن به مطب را فراموش کنید

Runway از «مدل‌های جهانی عمومی» به‌عنوان آینده هوش مصنوعی رونمایی کرد [تماشا کنید]

مدیرعامل شرکت آرم می‌ترسد که انسان‌ها کنترل هوش مصنوعی را از دست بدهند

مایکروسافت مدل زبانی کوچک Phi-2 را معرفی کرد؛ قدرتمندتر از Gemini Nano گوگل

گوگل ظاهراً درحال توسعه دستیار هوش مصنوعی پیشرفته Pixie برای پیکسل 9 است

درآمدزایی از خطر؛ آیا فعالان هوش مصنوعی نگران تهدیدات آن هستند؟

اخبار تحصیل

برنامه مدرسه تلویزیونی ایران برای 23 فروردین اعلام شد

تداوم‌ اسکان اضطراری فرهنگیان تا پایان فروردین

انتشار مجموعه صوتی «از ایرانمان دفاع می‌کنیم» برای دانش‌آموزان

علم فناوری اطلاعات

معاون اجرایی رییس جمهور: دولت بیشترین ضرر را از قطع اینترنت متحمل می‌شود

اینترنت «همراه اول» وصل شد؟

اینترنت «ایرانسل» وصل شد؟

عضو اتاق بازرگانی: اینترنت تجار هنوز وصل نشده

جدیدترین مقالات و اخبار روز علمی

کاربست آیه 139 آل‌عمران در مدیریت تهدیدات ترکیبی

وقتی آنتن خالی نماند و نمایش‌خانگی عقب ماند

سکوت سلبریتی‌ها شکست/ دوران رعب‌آفرینان روبه پایان است

خداقوت رئیس قوه قضاییه به تیم مذاکره‌کننده ایرانی در اسلام‌آباد

توقیف 34 قلم از اموال مدیر شبکه اینترنشنال در ایران

دیدگاه‌های علمی و آموزشی اخیر

Davood