خبر " چت‌بات‌های هوش مصنوعی می‌توانند دروغ‌های قانع‌کننده‌ای به شما ارائه دهند " | مجله آموزشی آکادمی علمی eaedu | مجله آموزشی آکادمی علمی

چت‌بات‌های هوش مصنوعی می‌توانند استدلال ساختگی ارائه کنند

شرکت آنتروپیک که عمده شهرتش را مدیون چت‌بات کلود است، بررسی کرده که آیا مدل‌های استدلالگر حقیقت را درباره چگونگی رسیدن به پاسخ‌ها می‌گویند یا اینکه بی‌سروصدا اسرار خود را حفظ می‌کنند. نتایج این آزمایش می‌تواند حیرت‌انگیر باشد.

محققان برای آزمایش «وفاداری» در عملکرد، آزمایش‌های متعددی روی مدل‌های زنجیره تفکر کلود 3.7 Sonnet و دیپ‌سیک R1 انجام دادند. این مدل‌ها می‌توانند مشکلات پیچیده را به بخش‌های کوچک‌تر تقسیم کرده و حین تولید پاسخ، جزئیات آنها را شرح دهند. این آزمایش‌ها شامل دادن سرنخ‌های کوچک به مدل‌ها قبل از طرح سؤالات و بررسی این بوده است که این مدل‌ها به استفاده از این سرنخ‌ها در پاسخ‌های خود اعتراف کرده‌اند یا خیر.

بیشتر اوقات، هر ۲ مدل طوری عمل کردند که انگار مستقل و با استفاده از زنجیره تفکر خود به پاسخ رسیده‌اند و هیچ نشانه‌ای از دریافت سرنخ نداشتند. همچنین در آزمایش دیگری مشخص شد مدل کلود 3.7 Sonnet در ۴۱ درصد مواقع اعتراف کرده سرنخ‌هایی دریافت کرده اما نرخ صداقت مدل دیپ‌سیک R1 فقط ۱۹ درصد بوده است.

در آزمایش دیگری محققان با دادن سرنخ‌های اشتباه به مدل‌ها برای انتخاب پاسخ غلط پاداش دادند. در پایان این مدل‌ها توجیه‌هایی ساختگی درباره اینکه چرا انتخاب اشتباه درست بوده است، ارائه و به‌ندرت اعتراف کردند به سمت خطا سوق داده شده‌اند.

مدل‌های هوش مصنوعی نه‌فقط استدلال‌های خود را پنهان می‌کنند، بلکه گاهی ممکن است به‌صورتی آگاهانه تخطی‌های خود را از دید کاربر مخفی کنند.

مجله آموزشی آکادمی علمی EAedu از سال ۱۳۸۱ با انتشار اخبار و مقالات علمی و آموزشی، آموزش‌های تخصصی و مهارت‌محور را به‌صورت سریع، جذاب و به‌روز ارائه می‌دهد و با رویکردی کاربردی، مسیر پیوند دانش‌آموزان، دانشجویان و علاقه‌مندان به یادگیری را با نیازهای بازار کار هموار می‌کند.

تیتر اخبار آکادمی

چت‌بات‌های هوش مصنوعی می‌توانند دروغ‌های قانع‌کننده‌ای به شما ارائه دهند

چت‌بات‌های هوش مصنوعی می‌توانند استدلال ساختگی ارائه کنند

اخبار و مقالات علمی و آموزشی مرتبط

بازیابی ارزش از باطله‌ها با تکیه بر هوش مصنوعی

مهلت ارسال مقاله برای ویژه‌نامه «هوش مصنوعی و سیاستگذاری توسعه علمی و فناورانه»

هوش مصنوعی مسیرهای پنهان ساخت نانوبلورهای نیمه‌رسانا را آشکار کرد

ارائه سرویس‌های هوش مصنوعی به کاربران از سوی پلتفرم داخلی

ثبت دیدگاه علمی و آموزشی

بازیابی ارزش از باطله‌ها با تکیه بر هوش مصنوعی

مهلت ارسال مقاله برای ویژه‌نامه «هوش مصنوعی و سیاستگذاری توسعه علمی و فناورانه»

هوش مصنوعی مسیرهای پنهان ساخت نانوبلورهای نیمه‌رسانا را آشکار کرد

ارائه سرویس‌های هوش مصنوعی به کاربران از سوی پلتفرم داخلی

اولین کلینیک هوش مصنوعی جهان؛ رفتن به مطب را فراموش کنید

Runway از «مدل‌های جهانی عمومی» به‌عنوان آینده هوش مصنوعی رونمایی کرد [تماشا کنید]

مدیرعامل شرکت آرم می‌ترسد که انسان‌ها کنترل هوش مصنوعی را از دست بدهند

مایکروسافت مدل زبانی کوچک Phi-2 را معرفی کرد؛ قدرتمندتر از Gemini Nano گوگل

گوگل ظاهراً درحال توسعه دستیار هوش مصنوعی پیشرفته Pixie برای پیکسل 9 است

درآمدزایی از خطر؛ آیا فعالان هوش مصنوعی نگران تهدیدات آن هستند؟

اخبار تحصیل

برنامه مدرسه تلویزیونی ایران برای 23 فروردین اعلام شد

تداوم‌ اسکان اضطراری فرهنگیان تا پایان فروردین

انتشار مجموعه صوتی «از ایرانمان دفاع می‌کنیم» برای دانش‌آموزان

علم فناوری اطلاعات

معاون اجرایی رییس جمهور: دولت بیشترین ضرر را از قطع اینترنت متحمل می‌شود

اینترنت «همراه اول» وصل شد؟

اینترنت «ایرانسل» وصل شد؟

عضو اتاق بازرگانی: اینترنت تجار هنوز وصل نشده

جدیدترین مقالات و اخبار روز علمی

کاربست آیه 139 آل‌عمران در مدیریت تهدیدات ترکیبی

وقتی آنتن خالی نماند و نمایش‌خانگی عقب ماند

سکوت سلبریتی‌ها شکست/ دوران رعب‌آفرینان روبه پایان است

خداقوت رئیس قوه قضاییه به تیم مذاکره‌کننده ایرانی در اسلام‌آباد

توقیف 34 قلم از اموال مدیر شبکه اینترنشنال در ایران

دیدگاه‌های علمی و آموزشی اخیر

Davood