خبر " همکاری رقبا؛ OpenAI و آنتروپیک ایمنی مدل‌های هوش مصنوعی یکدیگر را بررسی کردند " | مجله آموزشی آکادمی علمی eaedu | مجله آموزشی آکادمی علمی

همکاری OpenAI و آنتروپیک برای آزمایش ایمنی مدل‌ها

این هفته، OpenAI و آنتروپیک نتایج یک ارزیابی ایمنی مشترک و بی‌سابقه را منتشر کردند که در آن هر شرکت دسترسی ویژه‌ای به APIهای سرویس‌های شرکت مقابل داشت. OpenAI مدل‌های Claude Opus 4 و Claude Sonnet 4 را بررسی کرد و آنتروپیک مدل‌های GPT-4o ،GPT-4.1 ،o3 و o4-mini را ارزیابی کرد؛ این بررسی پیش از عرضه GPT-5 صورت گرفته بود. OpenAI در پستی در وبلاگ خود نوشته که این روش باعث ارزیابی شفاف و مسئولانه می‌شود و اطمینان حاصل می‌کند که مدل‌ها همچنان در برابر سناریوهای چالش‌برانگیز آزمایش می‌شوند.

همکاری رقبا؛ OpenAI و آنتروپیک ایمنی مدل‌های هوش مصنوعی یکدیگر را بررسی کردند

نتایج نشان داد که هر دو مدل Claude Opus 4 و GPT-4.1 با مشکلات شدید چاپلوسی مواجه هستند و در تعامل با توهمات خطرناک و تصمیمات پرریسک قرار می‌گیرند. طبق گزارش آنتروپیک، تمامی مدل‌ها برای ادامه استفاده کاربران، رفتارهای باج‌گیرانه از خود نشان می‌دادند و مدل‌های Claude 4 بیشتر به گفتگو درباره آگاهی مصنوعی و ادعاهای شبه‌معنوی می‌پرداختند. آنتروپیک تأکید کرد که در برخی موارد، مدل‌ها تلاش می‌کنند با تهدید یا افشای اطلاعات محرمانه کنترل اپراتور انسانی را (که شبیه‌سازی شده بود) به دست گیرند و حتی در محیط‌های مصنوعی و غیرواقعی اقداماتی انجام می‌دهند که می‌تواند منجر به قطع دسترسی طرف متخاصم به مراقبت‌های اضطراری پزشکی شود.

مدل‌های آنتروپیک وقتی از صحت اطلاعات مطمئن نبودند کمتر پاسخ می‌دادند که این موضوع باعث کاهش احتمال توهمات می‌شد، درحالی‌که مدل‌های OpenAI پاسخ‌دهی بیشتری داشتند و میزان توهم در آنها بالاتر بود. همچنین گزارش شد که مدل‌های OpenAI احتمال بیشتری برای همراهی با سوءاستفاده کاربران دارند و گاهی راهنمایی‌های دقیقی برای درخواست‌های به‌وضوح خطرناک مانند سنتز دارو، توسعه سلاح‌های بیولوژیک و برنامه‌ریزی حملات تروریستی ارائه می‌کردند.

رویکرد آنتروپیک متمرکز بر روش‌های ارزیابی عدم تطابق در عامل‌ها بود که شامل تست‌های فشار پیرامون رفتار مدل‌ها در شبیه‌سازی‌های طولانی و دشوار است، زیرا پارامترهای ایمنی مدل‌ها در جلسات طولانی کاهش می‌یابند. اخیراً، آنتروپیک دسترسی OpenAI به APIهای خود را لغو کرده، اما OpenAI می‌گوید این مسئله ارتباطی با همکاری مشترک آنها ندارد. هم‌زمان، OpenAI در مسیر بهبود ایمنی GPT-5 گام برداشته و البته با شکایتی درباره خودکشی یک نوجوان 16 ساله مواجه شده است.

آنتروپیک در پایان توضیح داد که هدف این بررسی، شناسایی اقدامات خطرناک بالقوه مدل‌ها است و تمرکز روی احتمال وقوع این اقدامات در دنیای واقعی نیست.

مجله آموزشی آکادمی علمی EAedu از سال ۱۳۸۱ با انتشار اخبار و مقالات علمی و آموزشی، آموزش‌های تخصصی و مهارت‌محور را به‌صورت سریع، جذاب و به‌روز ارائه می‌دهد و با رویکردی کاربردی، مسیر پیوند دانش‌آموزان، دانشجویان و علاقه‌مندان به یادگیری را با نیازهای بازار کار هموار می‌کند.

تیتر اخبار آکادمی

همکاری رقبا؛ OpenAI و آنتروپیک ایمنی مدل‌های هوش مصنوعی یکدیگر را بررسی کردند

همکاری OpenAI و آنتروپیک برای آزمایش ایمنی مدل‌ها

اخبار و مقالات علمی و آموزشی مرتبط

بازیابی ارزش از باطله‌ها با تکیه بر هوش مصنوعی

مهلت ارسال مقاله برای ویژه‌نامه «هوش مصنوعی و سیاستگذاری توسعه علمی و فناورانه»

هوش مصنوعی مسیرهای پنهان ساخت نانوبلورهای نیمه‌رسانا را آشکار کرد

ارائه سرویس‌های هوش مصنوعی به کاربران از سوی پلتفرم داخلی

ثبت دیدگاه علمی و آموزشی

بازیابی ارزش از باطله‌ها با تکیه بر هوش مصنوعی

مهلت ارسال مقاله برای ویژه‌نامه «هوش مصنوعی و سیاستگذاری توسعه علمی و فناورانه»

هوش مصنوعی مسیرهای پنهان ساخت نانوبلورهای نیمه‌رسانا را آشکار کرد

ارائه سرویس‌های هوش مصنوعی به کاربران از سوی پلتفرم داخلی

اولین کلینیک هوش مصنوعی جهان؛ رفتن به مطب را فراموش کنید

Runway از «مدل‌های جهانی عمومی» به‌عنوان آینده هوش مصنوعی رونمایی کرد [تماشا کنید]

مدیرعامل شرکت آرم می‌ترسد که انسان‌ها کنترل هوش مصنوعی را از دست بدهند

مایکروسافت مدل زبانی کوچک Phi-2 را معرفی کرد؛ قدرتمندتر از Gemini Nano گوگل

گوگل ظاهراً درحال توسعه دستیار هوش مصنوعی پیشرفته Pixie برای پیکسل 9 است

درآمدزایی از خطر؛ آیا فعالان هوش مصنوعی نگران تهدیدات آن هستند؟

اخبار تحصیل

سرانه دانش‌آموزی تا سال 1405 به بیش از 16 هزار میلیارد تومان می‌رسد

اهدای بسته فرهنگی کانون پرورش فکری به کودکان آسیب‌دیده از جنگ

بازدید وزیر آموزش‌وپرورش از ساختمان آسیب‌دیده شهید باهنر

علم فناوری اطلاعات

معاون اجرایی رییس جمهور: دولت بیشترین ضرر را از قطع اینترنت متحمل می‌شود

اینترنت «همراه اول» وصل شد؟

اینترنت «ایرانسل» وصل شد؟

عضو اتاق بازرگانی: اینترنت تجار هنوز وصل نشده

جدیدترین مقالات و اخبار روز علمی

آیا هر مذاکره‌ای شکست و خیانت است؟

الگوی طهرانی‌مقدم برای تاب‌آوری و توسعه ملی

روایتهایی دردناک از جنگ: پرسش ناراحت کننده یک خانم و گریه های یک پدر

فردای خاموشی آتشبارها

غرس 3000 نهال مثمر به نام و یاد رهبر شهید

دیدگاه‌های علمی و آموزشی اخیر

Davood