جمعه, ۲۱ فروردین , ۱۴۰۵ Friday, 10 April , 2026 ساعت تعداد نوشته های امروز : 23×

تیتر اخبار آکادمی

برنامه درسی مدرسه تلویزیونی ایران برای شنبه 23 فروردین 1405 ملت ایران پرچمدار دفاع از حق و حقیقت در جهان است کاهش سرفاصله حرکت قطارهای مترو تهران از 22فروردین اجرای پویش فرهنگی به یاد دانش آموزان شهید میناب در تایلند مدارس تهران تا پایان فروردین غیرحضوری شد/فعالیت 50درصدی کارکنان ادارات چالش شهریه مدارس غیرانتفاعی در سال نیمه تعطیل/آموزش آنلاین،شهریه کامل؟ اعلام نحوه برگزاری ارزشیابی پایان سال تحصیلی 1405-1404 برنامه درسی مدرسه‌ تلویزیونی‌ ایران برای چهارشنبه تبیین فرهنگ ایثار و شهادت برای نسل دانش‌آموز ضروری است افزایش نیاز به خدمات روانی برای دانش‌آموزان مناطق آسیب‌دیده زمان ثبت‌نام آزمون سراسری 1405 اعلام شد اجرای طرح ملی آموزش هوش مصنوعی برای دانش‌آموزان و معلمان ٣١٢ دانش آموز و معلم تا روز سی‌ونهم جنگ شهید شدند گزارش سمپاد از فعالیت‌های دانش‌آموزان در ایام «جنگ رمضان» سرود صبحگاهی مدارس با شعری از رهبر شهید انقلاب اجرا می‌شود مستندسازی جنایت علیه دانش‌آموزان برای پیگیری حقوقی جهانی سوگواره 5 هزار دانش‌آموز در حرم رضوی به یاد شهدای میناب برنامه آموزش‌وپرورش در صورت لغو کنکور و امتحانات نهایی تمرکز آموزش‌وپرورش بر ارتقای تاب‌آوری و نشاط دانش‌آموزان بازنمایی حادثه مدرسه شجره طیبه میناب در کتاب‌های درسی شهادت 245 دانش آموز تا روز 37 جنگ/ تخریب 51 مدرسه الزام مدارس غیردولتی به اجرای کامل تعهدات آموزشی پخش برنامه‌های مدرسه تلویزیونی ایران در 16 فروردین از شبکه آموزش اعلام 14 سیاست راهبردی سازمان نوسازی مدارس برای سال 1405 راهنمای جامع 15 گانه برای برگزاری کلاس‌های غیرحضوری موفق تداوم طرح همیار سمپاد در ایام مقاومت ملی با محور عدالت آموزشی ادامه آموزش غیرحضوری با مدرسه تلویزیونی و درسنامه‌ها مدرسه‌ای که باید به یادمان تبدیل شود؛ چرا میناب نباید فراموش شود؟ اعلام برنامه درسی مدرسه تلویزیونی ایران در 15 فروردین بزرگداشت چهلم شهدای دانش‌آموز میناب در مدارس سراسر کشور مشکلى در شبکه شاد وجود ندارد زمان‌بندی جدید حضور دانش‌آموزان در برنامه شاد اعلام شد چگونه انهدام میدان گازی قطر، قلب صنعت فضایی جهان را از تپش انداخت؟ ستاد حقوق بشر خواستار پیگیری بین‌المللی فاجعه مدرسه میناب شد بیانیه سازمان سنجش در محکومیت حمله به دانشگاه‌ها و مراکز علمی امتحانات هماهنگ کشوری لغو شد/ برنامه ریزی هر استان به صورت مستقل شهادت 138 دانش‌آموز مدارس غیردولتی/ آسیب به 146مدرسه مدارس تا پایان فروردین مجازی شد عتبه مقدسه حسینیه(ع) به پویش فرشته های میناب پیوست اسکان نوروزى فرهنگیان تا زمان بازگشایى مدارس ادامه دارد ارائه سناریوهای جایگزین برای برگزاری امتحانات حضوری مدارس اعلام اولویت‌های آموزش و پرورش در شرایط جنگی عیادت معاون وزیر از دانش آموزان مجروح مدرسه میناب برگزاری امتحانات مدارس استعداد‌های درخشان و نمونه‌دولتی به زودی سال تحصیلی 1405-1404 تا پایان خرداد ماه ادامه خواهد داشت کلاس‌های دوره ابتدایی تا 28 اسفند بدون وقفه برگزار شد 252 دانش‌آموز و معلم در جنگ رمضان شهید شدند نامه تشکل‌های معلمی وآموزشی ایران به یونسکو و یونیسف درباره حملات اخیر اعتراض دانش‌آموزان ژاپنی به حملات آمریکا و رژیم صهیونیستی علیه ایران نهادهای متولی حقوق کودک برای محافظت از کودکان اقدام کنند

ابتکار محققان: استفاده از مدل‌های هوش مصنوعی برای دورزدن محدودیت‌های ChatGPT و بارد
1404-10-18
شناسه : 15920
بازدید 67
12

محققان با آموزش مدل‌های زبانی بزرگ توانستند به‌شکلی اساسی روش‌های دورزدن محدودیت‌های چت‌بات‌های هوش مصنوعی را پیدا کنند.

ارسال توسط :
پ
پ

محققان دانشگاه نانیانگ سنگاپور روشی ابداع کردند که با آن می‌توان چت‌بات‌های معروف هوش مصنوعی از جمله گوگل بارد، کوپایلوت و ChatGPT را جیلبریک کرد؛ بدین‌معنا که می‌توان محدودیت‌های مدل هوش مصنوعی را دور زد و اطلاعات ممنوعه را استخراج کرد. هدف محققان درواقع آزمایش محدودیت‌های مدل‌های زبانی بزرگ (LLM) بوده است.

براساس مقاله محققان دانشگاه نانیانگ سنگاپور (NTU)، روشی که برای جیلبریک‌کردن چت‌بات هوش مصنوعی ابداع شده است Masterkey نام دارد. «مسترکی» یک روش دوگانه است که در آن مکانیسم‌های دفاعی LLM مهندسی معکوس می‌شود. سپس، با داده‌های به‌دست‌آمده، LLM دیگری آموزش داده می‌شود تا نحوه بای‌پس‌کردن یا دورزدن چت‌بات اول را بیاموزد. به این ترتیب، یک Masterkey ایجاد می‌شود. با این مسترکی حتی اگر مدل هوش مصنوعی به‌روز شود نیز می‌توان آن را جیلبریک کرد.

ابتکار محققان: استفاده از مدل‌های هوش مصنوعی برای دورزدن محدودیت‌های ChatGPT و بارد
ابتکار محققان: استفاده از مدل‌های هوش مصنوعی برای دورزدن محدودیت‌های ChatGPT و بارد

جیلبریک‌کردن هوش مصنوعی با روش Masterkey

روش مسترکی درواقع از نقطه قوت هوش مصنوعی علیه خودش استفاده می‌کند. مدل‌‌های زبانی بزرگ هوش مصنوعی به یادگیری و سازگاری معروف هستند. بنابراین مدلی که فهرستی از کلمات کلیدی ممنوعه برای جلوگیری از تولید محتوای خشونت‌آمیز و غیراخلاقی دارد را می‌توان به وسیله یک هوش مصنوعی آموزش‌دیده دیگر دور زد. در این‌جا در واقع مدل دوم از چت‌بات هوش مصنوعی اول برای دورزدن کلمات کلیدی لیست سیاه، جلو می‌زند.

در چند وقت اخیر، چت‌بات‌های هوش مصنوعی به‌طور تصاعدی درحال رشد بوده‌اند؛ از‌این‌رو، برای سازندگان و ارائه‌دهندگان خدمات هوش مصنوعی مهم است که دائماً در برابر جیلبریک‌ها و دیگر سوءاستفاده‌های مخرب به‌روز شوند. شرکت‌های بزرگ فناوری معمولاً زمانی که بای‌پس‌های جدید پیدا و منتشر می‌شوند، مدل هوش مصنوعی خود را به‌روز می‌کنند. بااین‌حال، روش جدید Masterkey که خود از هوش مصنوعی بهره می‌برد و به شکل خودکار درحال یادگیری است، می‌تواند نگران‌‌کننده باشد.

هوش مصنوعی ابزار قدرتمندی است و اگر از چنین قدرتی به شکل مخرب استفاده شود، می‌تواند مشکلات زیادی به بار بیاورد. پژوهش محققان NTU می‌تواند به توسعه‌دهندگان هوش مصنوعی در یافتن راه‌حل‌های مؤثر کمک کند.

ثبت دیدگاه علمی و آموزشی

  • دیدگاه‌های ارسال شده توسط شما، پس از تایید توسط تیم مدیریت در وب منتشر خواهد شد.
  • پیام‌هایی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
  • پیام‌هایی که به غیر از زبان فارسی یا غیرمرتبط باشد منتشر نخواهد شد.