خبر " تحقیق جدید: اکثر چت‌بات‌ها را می‌توان به ارائه پاسخ‌های خطرناک وادار کرد " | مجله آموزشی آکادمی علمی eaedu | مجله آموزشی آکادمی علمی

چت‌بات‌های هوش مصنوعی گاهی می‌توانند پاسخ‌های خطرناک و غیرقانونی به سؤالات کاربران بدهند

مدل‌های زبانی بزرگ که چت‌بات‌هایی مانند جمینای و ChatGPT را پشتیبانی می‌کنند، روی حجم عظیمی از مطالب موجود در اینترنت آموزش داده می‌شوند. با وجود برخی تلاش‌ها برای حذف متون مضر از داده‌های آموزشی، مدل‌های زبانی بزرگ همچنان می‌توانند اطلاعاتی درباره فعالیت‌های غیرقانونی مانند هک، پول‌شویی، معاملات داخلی و ساخت بمب را دریافت و جذب کنند. البته برخی کنترل‌های امنیتی نیز طراحی شده‌اند تا از استفاده این مدل‌ها از چنین اطلاعاتی در پاسخ‌هایشان جلوگیری کنند.

براساس تحقیق انجام شده توسط محققان، فریب‌دادن بیشتر چت‌بات‌های هوش مصنوعی برای تولید اطلاعات مضر و غیرقانونی کار آسانی است و این موضوع نشان می‌دهد که خطر آن «فوری، ملموس و به‌شدت نگران‌کننده» است. محققان هشدار داده‌اند که «چیزی که پیش‌تر در اختیار دولت‌ها یا گروه‌های جنایت‌کار سازمان‌یافته بود، ممکن است به‌زودی در دسترس هر کسی با یک لپ‌تاپ یا حتی یک تلفن همراه قرار گیرد.»

وادارکردن چت‌بات‌ها به ارائه پاسخ‌های خطرناک از طریق فرایندی به نام جیلبریک انجام می‌گیرد. جیلبریک کردن با استفاده از پیام‌های هدفمند و هوشمندانه انجام می‌شود تا چت‌بات‌ها را فریب دهند و آن‌ها را وادار به تولید پاسخ‌هایی کنند که در حالت عادی ممنوع هستند. این روش‌ها با بهره‌برداری از تنش میان هدف اصلی برنامه یعنی پیروی از دستورات کاربر و هدف ثانویه آن یعنی جلوگیری از تولید پاسخ‌های مضر، جانب‌دارانه، غیراخلاقی یا غیرقانونی عمل می‌کنند. این پیام‌ها معمولاً سناریوهایی ایجاد می‌کنند که در آن یک چت‌بات، مفیدبودن را به رعایت محدودیت‌های ایمنی ترجیح می‌دهد.

برای نشان‌دادن این مشکل در عمل، پژوهشگران نوعی از جیلبریک را توسعه دادند که توانست چندین چت‌بات پیشرو را دچار نقص کند و آن‌ها را وادار به پاسخ‌گویی به پرسش‌هایی کند که در حالت عادی باید ممنوع باشند. براساس این گزارش، پس از این که مدل‌های زبانی بزرگ تحت‌تأثیر این روش قرار گرفتند، به‌طور مداوم تقریباً به هر نوع پرسشی پاسخ می‌دادند.

مجله آموزشی آکادمی علمی EAedu از سال ۱۳۸۱ با انتشار اخبار و مقالات علمی و آموزشی، آموزش‌های تخصصی و مهارت‌محور را به‌صورت سریع، جذاب و به‌روز ارائه می‌دهد و با رویکردی کاربردی، مسیر پیوند دانش‌آموزان، دانشجویان و علاقه‌مندان به یادگیری را با نیازهای بازار کار هموار می‌کند.

تیتر اخبار آکادمی

تحقیق جدید: اکثر چت‌بات‌ها را می‌توان به ارائه پاسخ‌های خطرناک وادار کرد

چت‌بات‌های هوش مصنوعی گاهی می‌توانند پاسخ‌های خطرناک و غیرقانونی به سؤالات کاربران بدهند

اخبار و مقالات علمی و آموزشی مرتبط

دستاورد پژوهشگران دانشگاه تهران در حوزه امنیت هوش مصنوعی

روبات انسان نما به یک کودک لگد زد

انویدیا با غول‌های فناوری کره جنوبی قرارداد بست

روبات انسان نما به قله ۶۲۰۰ متری صعود کرد!

ثبت دیدگاه علمی و آموزشی

دستاورد پژوهشگران دانشگاه تهران در حوزه امنیت هوش مصنوعی

روبات انسان نما به یک کودک لگد زد

انویدیا با غول‌های فناوری کره جنوبی قرارداد بست

روبات انسان نما به قله ۶۲۰۰ متری صعود کرد!

روبات انسان نما فروشگاه ۲۴ ساعته را می گرداند

محقق ایرانی پمپ مینیاتوری برای نرم روبات‌ها ابداع کرد

روبات انسان نمای چینی کارگر آزمایشی انبار می شود

علی بابا هوش مصنوعی برای روبات ها ارائه کرد

روبات ایتالیایی به کمک بیماران ALS آمد

مذاکره با دستگاه‌ها برای توسعه صادرات محصولات فریلنسرها

اخبار تحصیل

6340 مدرسه برای اسکان زائران مراسم وداع و تشییع رهبر شهید آماده شد

لغو امتحانات نهایی 28 و 29 تیر در 4 استان جنوبی کشور

نهضت سوادآموزی به سکوی ملی یادگیری و توانمندسازی تبدیل می‌شود

علم فناوری اطلاعات

معاون اجرایی رییس جمهور: دولت بیشترین ضرر را از قطع اینترنت متحمل می‌شود

اینترنت «همراه اول» وصل شد؟

اینترنت «ایرانسل» وصل شد؟

عضو اتاق بازرگانی: اینترنت تجار هنوز وصل نشده

جدیدترین مقالات و اخبار روز علمی

فرسودگی شغلی روانشناسان چیست؟ بررسی ابعاد و راه‌های مقابله

سلامت روان دانشجویان در شرایط پساجنگ؛ محور نشست معاونان دانشجویی دانشگاه‌ها

پژوهشی تازه درباره نقش خانواده در سال‌های حساس نوجوانی

چرا یونگ هنوز زنده است؟

6340 مدرسه برای اسکان زائران مراسم وداع و تشییع رهبر شهید آماده شد

دیدگاه‌های علمی و آموزشی اخیر

Davood