خبر " تحقیق جدید: مدل‌های زبانی بزرگ می‌توانند اشتباهاتشان را شناسایی کنند " | مجله آموزشی آکادمی علمی eaedu | مجله آموزشی آکادمی علمی

مدل‌های زبانی بزرگ در سنجش عملکرد خود بسیار باهوش هستند

بیشتر تحقیقات قبلی در مورد توهمات بر تجزیه‌وتحلیل رفتار خارجی LLM و بررسی نحوه درک کاربران از این خطاها متمرکز شده است. اما چنین روشی بینش محدودی در مورد نحوه کدگذاری و پردازش خطاها در خود مدل‌ها ارائه می‌دهد.

مطالعه جدید اما رویکرد متفاوتی دارد. محققان به‌جای نگاه‌کردن به خروجی نهایی، «نشانه‌های پاسخ دقیق» را تجزیه‌وتحلیل می‌کنند. یعنی نشانه‌های پاسخی که اگر اصلاح شوند می‌توانند صحت پاسخ را تغییر دهند. محققان آزمایش خود را روی چهار مدل Mistral 7B و Llama 2 و در ۱۰ مجموعه داده انجام دادند که وظایف مختلفی مانند پاسخ به سؤال، استنتاج زبان طبیعی، حل مسئله ریاضی و تجزیه‌وتحلیل احساسات را در بر می‌گرفت.

محققان همچنین به مدل‌ها اجازه دادند تا پاسخ‌های نامحدودی را برای شبیه‌سازی استفاده در دنیای واقعی ایجاد کنند. یافته‌های آنها نشان می‌دهد که صحت اطلاعات در نشانه‌های پاسخ دقیق متمرکز است.

برای پیش‌بینی هذیان‌ها، محققان مدل‌های طبقه‌بندی‌کننده را آموزش دادند که آنها را «طبقه‌بندی‌کننده‌های کاوشگر» می‌نامند تا ویژگی‌های مربوط به صحت خروجی‌های تولید شده بر اساس فعال‌سازی‌های داخلی LLM را پیش‌بینی کنند. محققان دریافتند که آموزش طبقه‌بندی‌کننده‌ها بر روی نشانه‌های پاسخ دقیق می‌تواند به میزان قابل‌توجهی تشخیص خطا را بهبود می‌بخشد.

در نهایت، آن‌ها نتیجه‌گیری کردند که مدل‌های زبانی بزرگ می‌توانند اطلاعات مربوط به حقیقت خود را رمزگذاری کنند.

مجله آموزشی آکادمی علمی EAedu از سال ۱۳۸۱ با انتشار اخبار و مقالات علمی و آموزشی، آموزش‌های تخصصی و مهارت‌محور را به‌صورت سریع، جذاب و به‌روز ارائه می‌دهد و با رویکردی کاربردی، مسیر پیوند دانش‌آموزان، دانشجویان و علاقه‌مندان به یادگیری را با نیازهای بازار کار هموار می‌کند.

تیتر اخبار آکادمی

تحقیق جدید: مدل‌های زبانی بزرگ می‌توانند اشتباهاتشان را شناسایی کنند

مدل‌های زبانی بزرگ در سنجش عملکرد خود بسیار باهوش هستند

اخبار و مقالات علمی و آموزشی مرتبط

بازیابی ارزش از باطله‌ها با تکیه بر هوش مصنوعی

مهلت ارسال مقاله برای ویژه‌نامه «هوش مصنوعی و سیاستگذاری توسعه علمی و فناورانه»

هوش مصنوعی مسیرهای پنهان ساخت نانوبلورهای نیمه‌رسانا را آشکار کرد

ارائه سرویس‌های هوش مصنوعی به کاربران از سوی پلتفرم داخلی

ثبت دیدگاه علمی و آموزشی

بازیابی ارزش از باطله‌ها با تکیه بر هوش مصنوعی

مهلت ارسال مقاله برای ویژه‌نامه «هوش مصنوعی و سیاستگذاری توسعه علمی و فناورانه»

هوش مصنوعی مسیرهای پنهان ساخت نانوبلورهای نیمه‌رسانا را آشکار کرد

ارائه سرویس‌های هوش مصنوعی به کاربران از سوی پلتفرم داخلی

اولین کلینیک هوش مصنوعی جهان؛ رفتن به مطب را فراموش کنید

Runway از «مدل‌های جهانی عمومی» به‌عنوان آینده هوش مصنوعی رونمایی کرد [تماشا کنید]

مدیرعامل شرکت آرم می‌ترسد که انسان‌ها کنترل هوش مصنوعی را از دست بدهند

مایکروسافت مدل زبانی کوچک Phi-2 را معرفی کرد؛ قدرتمندتر از Gemini Nano گوگل

گوگل ظاهراً درحال توسعه دستیار هوش مصنوعی پیشرفته Pixie برای پیکسل 9 است

درآمدزایی از خطر؛ آیا فعالان هوش مصنوعی نگران تهدیدات آن هستند؟

اخبار تحصیل

جدول پخش مدرسه تلویزیونی دانش‌آموزان تا 27 فروردین

سرانه دانش‌آموزی تا سال 1405 به بیش از 16 هزار میلیارد تومان می‌رسد

اهدای بسته فرهنگی کانون پرورش فکری به کودکان آسیب‌دیده از جنگ

علم فناوری اطلاعات

معاون اجرایی رییس جمهور: دولت بیشترین ضرر را از قطع اینترنت متحمل می‌شود

اینترنت «همراه اول» وصل شد؟

اینترنت «ایرانسل» وصل شد؟

عضو اتاق بازرگانی: اینترنت تجار هنوز وصل نشده

جدیدترین مقالات و اخبار روز علمی

اموال مازیار فلاحی توقیف شد

از «مرد سه‌هزارچهره» مهران مدیری چه خبر؟

کلید پیروزی در پیچ‌های سخت زندگی و میدان جهاد

30 روایت از عنایت اهل بیت(ع) در لحظه‌ای که فکرش را نمی‌کنیم

“به کدامین گناه”؛ شهادت نوزادان، مادران و خدمه بیمارستانی در لبنان

دیدگاه‌های علمی و آموزشی اخیر

Davood