چهارشنبه, ۶ اسفند , ۱۴۰۴ Wednesday, 25 February , 2026 ساعت تعداد نوشته های امروز : 22×

تیتر اخبار آکادمی

نگاهی به مفهوم و ابزارهای خود افشایی هیجانی دریافت گواهینامه صلاحیت حرفه‌ای برای همه معلمان اجباری شد ماهواره «خیام» کاهش پوشش جنگلی اطراف دریاچه سوها را ثبت کرد ابعاد مختلف روان‌شناسی رقابت رکوردشکنی حضور دانش‌آموزان در اعتکاف؛ مشارکت از 800 هزار نفر گذشت حل مسئله در خواب ممکن شد گزارش تلخ نوجوانان از پشت‌پرده تجربه در اینستاگرام بزرگسالان هم باید مثل کودکان بازی کنند! تأکید وزیر آموزش‌وپرورش بر اولویت‌ها و تقویت آموزش قرآن تکذیب شایعه تعطیلی مدارس منطقه 11 تهران پدیده «ماه خونین» در راه است؛ چگونه ماه‌گرفتگی کامل 3 مارس را رصد کنیم رشد هنرستان‌ها و افزایش گرایش به رشته‌های مهارتی جزئیات جدید از 3 ماهواره در حال ساخت ایران بزرگسالان هم باید بازی کنند نتایج نهایی پذیرش بدون آزمون نوبت بهمن ۱۴۰۴ دانشگاه‌ها اعلام شد واکنش وزیر آموزش‌و‌پرروش به فیلم پخش شده توسط یکی از معلمان پیش‌ثبت‌نام مدارس غیردولتی با 3 شرط و سقف 20 درصد شهریه تعویق دوباره پرتاب آرتمیس 2؛ سفر انسان به ماه به فروردین موکول شد پرتاب 28 استارلینک جدید؛ ماهواره‌های اسپیس‌ایکس به‌ مرز 10 هزار رسید PTSD چیست؟ وقتی گذشته هنوز تمام نشده است/ اینفوگرافیک پنجمین جشنواره کشوری هنری سمپاد برگزار می‌شود ارتقای کیفیت آموزشی در مناطق آزاد با ساخت مدارس جدید شهادت 22 دانش‌آموز و 5 معلم در حوادث دی‌ماه برگزاری اردو آموزشی آمادگی کنکوری بیش از ۱۰۰ دانش آموز هرمزگانی بازگشت 39 هزار بازمانده از تحصیل به مدرسه تأکید وزیر آموزش‌وپرورش بر ارتقای شفافیت در صندوق ذخیره فرهنگیان واریز 7 هزار میلیارد ریال سود به حساب بازنشستگان صندوق ذخیره فرهنگیان حمله پانیک چیست؟ هشدار پلیس فتا درباره ترفند جدید کلاهبرداری در “شاد” استرس چگونه بر عملکرد و سلامت کلیه‌های انسان تأثیر می‌گذارد؟ تعطیلات زمستانه مدارس به زودی تصویب می شود امام جمعه بهاباد: قدرت واقعی ملت‌ها در علم و شناخت نهفته است دانش‌آموزان با تکیه بر علم و ایمان، آینده روشن کشور را رقم می‌زنند ۵۰ برگزیده کنکور سراسری سال ۱۴۰۴ در شهرستان بهاباد تجلیل شدند گروه همسالان؛ سکوی خودشناسی یا تهدیدی برای مبارزه با والدین؟ به خاطر سلامت مغزتان هم که شده یادگیری را متوقف نکنید! اجرای 4 برنامه ویژه قرآنی برای معلمان و دانش‌آموزان در ماه رمضان آموزش هوش مصنوعی به 1 میلیون دانش‌آموز در مدارس غیردولتی انتخاب 32 اثر برگزیده در جشنواره ملی کتاب رشد با مشارکت 300 ناشر رونمایی از نشان افتخار نویسندگان رشد در جشنواره کتاب رشد چالش کتاب کودک و نوجوان از نگاه دبیر شورای عالی انقلاب فرهنگی نقشه جامع ترویج کتابخوانی در مدارس تدوین شود توزیع 60 هزار میلیارد سود بین اعضای موسسه صندوق ذخیره فرهنگیان کاظمی: مصرف کتاب در مدارس حلقه کلیدی زنجیره کتاب‌خوانی است جزییات پرداخت اوراق بازنشستگان آموزش و پرورش هلیوم3؛ 12 سال برق رایگانِ ایران با 25 تن خاک ماه غم مادرانه؛ نگاهی به افسردگی پس از زایمان 15 اسفند؛ تاریخ احتمالی ناسا برای اعزام 4 فضانورد به ماه مدارس آینده؛ گامی برای تحقق عدالت آموزشی مدارس آینده باید چندوجهی، منعطف و مبتنی بر مهارت‌آموزی طراحی شوند

تحقیق جدید: مدل‌های زبانی بزرگ می‌توانند اشتباهاتشان را شناسایی کنند
1404-10-18
شناسه : 13270
بازدید 24
1

نتایج این تحقیق می‌تواند به کاهش هذیان گفتن مدل‌های هوش مصنوعی کمک کند.

ارسال توسط :
پ
پ

یکی از مشکلات رایج در مدل‌های زبان بزرگ (LLM) تمایل آن‌ها به تولید اطلاعات نادرست و به‌اصطلاح «هذیان» گفتن است. درحالی‌که تحقیقات زیادی بر روی تجزیه‌وتحلیل این خطاها از دیدگاه کاربر انجام شده است، اما یک تحقیق جدید نشان می‌دهد که این مدل‌ها درک بسیار عمیق‌تری از صداقت نسبت به آنچه قبلاً تصور می‌شد دارند.

این تحقیق توسط محققانی از Technion، مرکز گوگل ریسرچ و اپل انجام شده است و به بررسی عملکرد درونی مدل‌های زبانی بزرگ می‌پردازد. هذیان گفتن یک تعریف واحد جهانی ندارد و عموماً به طیف وسیعی از خطاهای LLM گفته می‌شود. برای انجام این تحقیق، محققان یک تعریف مشخص از هذیان گفتن ارائه دادند که شامل خطاهایی مانند عدم دقت، سوگیری‌ها، شکست‌های استدلال عقل سلیم و سایر خطاهای دنیای واقعی می‌شود.

مدل‌های زبانی بزرگ در سنجش عملکرد خود بسیار باهوش هستند

مدل زبانی بزرگ LLM

بیشتر تحقیقات قبلی در مورد توهمات بر تجزیه‌وتحلیل رفتار خارجی LLM و بررسی نحوه درک کاربران از این خطاها متمرکز شده است. اما چنین روشی بینش محدودی در مورد نحوه کدگذاری و پردازش خطاها در خود مدل‌ها ارائه می‌دهد.

مطالعه جدید اما رویکرد متفاوتی دارد. محققان به‌جای نگاه‌کردن به خروجی نهایی، «نشانه‌های پاسخ دقیق» را تجزیه‌وتحلیل می‌کنند. یعنی نشانه‌های پاسخی که اگر اصلاح شوند می‌توانند صحت پاسخ را تغییر دهند. محققان آزمایش خود را روی چهار مدل Mistral 7B و Llama 2 و در ۱۰ مجموعه داده انجام دادند که وظایف مختلفی مانند پاسخ به سؤال، استنتاج زبان طبیعی، حل مسئله ریاضی و تجزیه‌وتحلیل احساسات را در بر می‌گرفت.

محققان همچنین به مدل‌ها اجازه دادند تا پاسخ‌های نامحدودی را برای شبیه‌سازی استفاده در دنیای واقعی ایجاد کنند. یافته‌های آنها نشان می‌دهد که صحت اطلاعات در نشانه‌های پاسخ دقیق متمرکز است.

برای پیش‌بینی هذیان‌ها، محققان مدل‌های طبقه‌بندی‌کننده را آموزش دادند که آنها را «طبقه‌بندی‌کننده‌های کاوشگر» می‌نامند تا ویژگی‌های مربوط به صحت خروجی‌های تولید شده بر اساس فعال‌سازی‌های داخلی LLM را پیش‌بینی کنند. محققان دریافتند که آموزش طبقه‌بندی‌کننده‌ها بر روی نشانه‌های پاسخ دقیق می‌تواند به میزان قابل‌توجهی تشخیص خطا را بهبود می‌بخشد.

در نهایت، آن‌ها نتیجه‌گیری کردند که مدل‌های زبانی بزرگ می‌توانند اطلاعات مربوط به حقیقت خود را رمزگذاری کنند.

ثبت دیدگاه علمی و آموزشی

  • دیدگاه‌های ارسال شده توسط شما، پس از تایید توسط تیم مدیریت در وب منتشر خواهد شد.
  • پیام‌هایی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
  • پیام‌هایی که به غیر از زبان فارسی یا غیرمرتبط باشد منتشر نخواهد شد.