دوشنبه, ۴ خرداد , ۱۴۰۵ Monday, 25 May , 2026 ساعت تعداد نوشته های امروز : 40×

تیتر اخبار آکادمی

اعلام اولویت‌های پژوهشی سال 1405 شورای عالی آموزش و پرورش واکنش آموزش و پرورش به یک پیشنهاد برای جذب معلمان تدوین محتوای آموزشی با محوریت جنگ تحمیلی سوم و رهبر شهید برای سال 1406 مشارکت 60 درصدی مؤسسان در انتخابات شوراهای مدارس غیردولتی وزارت آموزش و پرورش به دنبال ارتقای کیفیت خدمات آموزشی و تربیتی تداوم آموزش در سمپاد با وجود شرایط ویژه کشور شورای نظارت مدارس غیردولتی از تخلف‌محوری خارج می‌شود ثبت‌نام بیش از یک میلیون دانش‌آموز در طرح «ایران دیجیتال» پایان مدارس هیئت‌امنایی و یک سؤال بی‌جواب! بازتاب حماسه سوم خرداد در کتاب‌های درسی دانش‌آموزان مجازی شدن امتحانات نهایی تکذیب شد کاهش تنوع مدارس، گامی اساسی برای تحقق عدالت آموزشی تمدید مهلت ثبت‌نام آزمون سراسری سال 1405 تا 8 خرداد امروز آخرین مهلت ثبت‌نام آزمون سراسری و دانشجو معلم سامانه شهریه مدارس غیردولتی به‌روز نیست ساماندهی و کاهش تنوع مدارس در شورای‌عالی آموزش‌وپرورش طرح کاهش تنوع مدارس دولتی امسال اجرا نمی‌شود جزئیات تأیید سوابق تحصیلی کنکور 1405 اعلام شد راه‌اندازی 1200 مدرسه حفظ قرآن در سراسر کشور هوش مصنوعی به فوق‌برنامه‌های دانش‌آموزان سمپاد اضافه شد رئیس سازمان سنجش: کنکور 1405 پس از امتحانات نهایی برگزار می‌شود کاظمی: عدالت آموزشی باید گفتمان اول استان‌ها باشد وزیر آموزش‌وپرورش: هوش مصنوعی نیازمند متولی واحد است برگزاری آزمون سراسری حداقل 20 روز پس از امتحانات نهایی تأکید کاظمی بر تشکیل شبکه جهاد تبیین در دانشگاه فرهنگیان ثبت‌نام دانش‌آموزان اتباع تا نیمه خرداد نهایی می‌شود کاظمی: شهید رئیسی رئیس‌جمهور تراز نظام جمهوری اسلامی بود آموزش‌وپرورش آماده اسکان تابستانی فرهنگیان با 9هزار واحد آموزشی مفاهیم قرآنی باید به مهارت‌های زندگی تبدیل شود اعلام جزئیات شروط آموزش و پرورش برای آزمون استخدامی ابلاغ اجرای شیوه مدیریت هیئت امنایی در مدارس دولتی برگزاری حضوری امتحانات خرداد؛ خودسری ناتمام برخی مدارس غیردولتی! اعلام نحوه برگزاری امتحانات پایان سال دانش‌آموزان ابتدایی پرورش استعدادهای درخشان بر 25 شایستگی متمرکز شد دستورالعمل جدید برای نظارت بر لباس دانش‌آموزی ابلاغ شد ترویج جوانی جمعیت با ایجاد ظرفیت گسترده در کتاب‌های درسی ارتقای رتبه همدان در کنکور و امتحانات نهایی کشور پاسخ شورای عالی انقلاب فرهنگی به شبهات کنکور؛ تأکید بر حقوق داوطلبان چاپ بیش از 160 میلیون کتاب درسی برای سال تحصیلی آینده برنامه جبرانی تابستانی برای دانش‌آموزان ابتدایی اجرا می‌شود اجرای برنامه‌های هفته سلامت در 740 منطقه آموزشی کشور سفیران سلامت دانش‌آموزی نقش مهمی در ارتقای سلامت جامعه دارند کمبود نیروی بهداشت مدارس؛ چالش خدمت‌رسانی به 16 میلیون دانش‌آموز 5 میلیون نفر در بحران‌ها غربالگری سلامت روان شدند امتحانات پایه‌های هفتم تا دهم در تهران مجازی برگزار می‌شود چاپ بیش از 160 میلیون جلد کتاب درسی برای سال تحصیلی 1406–1405 فرمانده سنتکام ناخواسته دروغ ترامپ و هگست را برملا کرد آسیب دیدن حدود 1500 واحد آموزشی در جنگ رمضان تشریح جزئیات نحوه و زمان برگزاری امتحانات پایان سال و کنکور عرضه 500 عنوان کتاب انتشارات مدرسه در نمایشگاه مجازی تهران

ابتکار محققان: استفاده از مدل‌های هوش مصنوعی برای دورزدن محدودیت‌های ChatGPT و بارد
1404-10-18
شناسه : 15920
بازدید 103
22

محققان با آموزش مدل‌های زبانی بزرگ توانستند به‌شکلی اساسی روش‌های دورزدن محدودیت‌های چت‌بات‌های هوش مصنوعی را پیدا کنند.

ارسال توسط :
پ
پ

محققان دانشگاه نانیانگ سنگاپور روشی ابداع کردند که با آن می‌توان چت‌بات‌های معروف هوش مصنوعی از جمله گوگل بارد، کوپایلوت و ChatGPT را جیلبریک کرد؛ بدین‌معنا که می‌توان محدودیت‌های مدل هوش مصنوعی را دور زد و اطلاعات ممنوعه را استخراج کرد. هدف محققان درواقع آزمایش محدودیت‌های مدل‌های زبانی بزرگ (LLM) بوده است.

براساس مقاله محققان دانشگاه نانیانگ سنگاپور (NTU)، روشی که برای جیلبریک‌کردن چت‌بات هوش مصنوعی ابداع شده است Masterkey نام دارد. «مسترکی» یک روش دوگانه است که در آن مکانیسم‌های دفاعی LLM مهندسی معکوس می‌شود. سپس، با داده‌های به‌دست‌آمده، LLM دیگری آموزش داده می‌شود تا نحوه بای‌پس‌کردن یا دورزدن چت‌بات اول را بیاموزد. به این ترتیب، یک Masterkey ایجاد می‌شود. با این مسترکی حتی اگر مدل هوش مصنوعی به‌روز شود نیز می‌توان آن را جیلبریک کرد.

ابتکار محققان: استفاده از مدل‌های هوش مصنوعی برای دورزدن محدودیت‌های ChatGPT و بارد
ابتکار محققان: استفاده از مدل‌های هوش مصنوعی برای دورزدن محدودیت‌های ChatGPT و بارد

جیلبریک‌کردن هوش مصنوعی با روش Masterkey

روش مسترکی درواقع از نقطه قوت هوش مصنوعی علیه خودش استفاده می‌کند. مدل‌‌های زبانی بزرگ هوش مصنوعی به یادگیری و سازگاری معروف هستند. بنابراین مدلی که فهرستی از کلمات کلیدی ممنوعه برای جلوگیری از تولید محتوای خشونت‌آمیز و غیراخلاقی دارد را می‌توان به وسیله یک هوش مصنوعی آموزش‌دیده دیگر دور زد. در این‌جا در واقع مدل دوم از چت‌بات هوش مصنوعی اول برای دورزدن کلمات کلیدی لیست سیاه، جلو می‌زند.

در چند وقت اخیر، چت‌بات‌های هوش مصنوعی به‌طور تصاعدی درحال رشد بوده‌اند؛ از‌این‌رو، برای سازندگان و ارائه‌دهندگان خدمات هوش مصنوعی مهم است که دائماً در برابر جیلبریک‌ها و دیگر سوءاستفاده‌های مخرب به‌روز شوند. شرکت‌های بزرگ فناوری معمولاً زمانی که بای‌پس‌های جدید پیدا و منتشر می‌شوند، مدل هوش مصنوعی خود را به‌روز می‌کنند. بااین‌حال، روش جدید Masterkey که خود از هوش مصنوعی بهره می‌برد و به شکل خودکار درحال یادگیری است، می‌تواند نگران‌‌کننده باشد.

هوش مصنوعی ابزار قدرتمندی است و اگر از چنین قدرتی به شکل مخرب استفاده شود، می‌تواند مشکلات زیادی به بار بیاورد. پژوهش محققان NTU می‌تواند به توسعه‌دهندگان هوش مصنوعی در یافتن راه‌حل‌های مؤثر کمک کند.

ثبت دیدگاه علمی و آموزشی

  • دیدگاه‌های ارسال شده توسط شما، پس از تایید توسط تیم مدیریت در وب منتشر خواهد شد.
  • پیام‌هایی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
  • پیام‌هایی که به غیر از زبان فارسی یا غیرمرتبط باشد منتشر نخواهد شد.