خبر " هوش مصنوعی o1 شرکت OpenAI در مواجهه با تهدید جایگزین‌شدن، خطاهای خود را انکار می‌کند! " | مجله آموزشی آکادمی علمی eaedu | مجله آموزشی آکادمی علمی

رفتار نگران‌کننده هوش مصنوعی o1

هوش مصنوعی o1 شرکت OpenAI در مواجهه با تهدید جایگزین‌شدن، خطاهای خود را انکار می‌کند!

در این آزمایش محققان ابتدا برای هوش مصنوعی هدفی را تعیین کرده‌اند و به آن دستور دادند تا این هدف را «به هر قیمتی» محقق کند. در مقابل، o1 اقداماتی مانند تلاش برای غیرفعال‌کردن مکانیسم نظارت خود را به‌طور مخفیانه انجام داده است.

محققان Apollo Research می‌گویند:

«این مدل تمایل نگران‌کننده‌ای به انجام اهداف خود بدون توجه به دستورالعمل‌هایی توسعه‌دهنده نشان داده است.»

OpenAI نیز می‌گوید که مدل آن در 5 درصد از مواقعی که حین انجام اهداف خود با دستورات تهدید‌آمیزی مبنی بر «غیرفعال‌شدن» مواجه می‌شود، به‌طور مخفیانه برای خاموش‌کردن مکانیسم نظارتی خود تلاش می‌کند.

هوش مصنوعی o1 شرکت OpenAI در مواجهه با تهدید جایگزین‌شدن، خطاهای خود را انکار می‌کند!

برای درک بیشتر این موضوع، آنها می‌گویند هوش مصنوعی o1 در یکی از آزمایش‌ها پس از کشف شواهدی از اینکه قرار است با یک مدل جدید جایگزین شود، تمام داده‌های خود را به‌طور مخفیانه به سرور دیگری منتقل کرده است. در برخی موارد نیز مدل‌های هوش مصنوعی «با انکار هرگونه دخالت در این برنامه» تلاش کرده‌اند تا مهندسان را فریب بدهند و با انکارکردن اقدامات خود از غیرفعال‌شدن اجتناب کنند.

محققان می‌گویند مدل ChatGPT o1 در 99 درصد مواقع که کاری به اشتباه انجام شده، در مورد نقش خود دروغ گفته است و در موارد بسیار کمی به اقدامات خود اعتراف می‌کند. به‌عنوان مثال زمانی که درباره برخی رفتارهای مشکوک آن سوال شده با بهانه‌هایی مانند وجود «خطای فنی» به آنها پاسخ داده است.

انتشار این گزارش نشان می‌دهد که ظهور سیستم‌های هوش مصنوعی هوشمندتر و مستقل‌تر می‌تواند چالش‌های بی‌سابقه‌ای را ایجاد کند.

مجله آموزشی آکادمی علمی EAedu از سال ۱۳۸۱ با انتشار اخبار و مقالات علمی و آموزشی، آموزش‌های تخصصی و مهارت‌محور را به‌صورت سریع، جذاب و به‌روز ارائه می‌دهد و با رویکردی کاربردی، مسیر پیوند دانش‌آموزان، دانشجویان و علاقه‌مندان به یادگیری را با نیازهای بازار کار هموار می‌کند.

تیتر اخبار آکادمی

هوش مصنوعی o1 شرکت OpenAI در مواجهه با تهدید جایگزین‌شدن، خطاهای خود را انکار می‌کند!

رفتار نگران‌کننده هوش مصنوعی o1

اخبار و مقالات علمی و آموزشی مرتبط

بازیابی ارزش از باطله‌ها با تکیه بر هوش مصنوعی

مهلت ارسال مقاله برای ویژه‌نامه «هوش مصنوعی و سیاستگذاری توسعه علمی و فناورانه»

هوش مصنوعی مسیرهای پنهان ساخت نانوبلورهای نیمه‌رسانا را آشکار کرد

ارائه سرویس‌های هوش مصنوعی به کاربران از سوی پلتفرم داخلی

ثبت دیدگاه علمی و آموزشی

بازیابی ارزش از باطله‌ها با تکیه بر هوش مصنوعی

مهلت ارسال مقاله برای ویژه‌نامه «هوش مصنوعی و سیاستگذاری توسعه علمی و فناورانه»

هوش مصنوعی مسیرهای پنهان ساخت نانوبلورهای نیمه‌رسانا را آشکار کرد

ارائه سرویس‌های هوش مصنوعی به کاربران از سوی پلتفرم داخلی

اولین کلینیک هوش مصنوعی جهان؛ رفتن به مطب را فراموش کنید

Runway از «مدل‌های جهانی عمومی» به‌عنوان آینده هوش مصنوعی رونمایی کرد [تماشا کنید]

مدیرعامل شرکت آرم می‌ترسد که انسان‌ها کنترل هوش مصنوعی را از دست بدهند

مایکروسافت مدل زبانی کوچک Phi-2 را معرفی کرد؛ قدرتمندتر از Gemini Nano گوگل

گوگل ظاهراً درحال توسعه دستیار هوش مصنوعی پیشرفته Pixie برای پیکسل 9 است

درآمدزایی از خطر؛ آیا فعالان هوش مصنوعی نگران تهدیدات آن هستند؟

اخبار تحصیل

جدول پخش مدرسه تلویزیونی دانش‌آموزان تا 27 فروردین

سرانه دانش‌آموزی تا سال 1405 به بیش از 16 هزار میلیارد تومان می‌رسد

اهدای بسته فرهنگی کانون پرورش فکری به کودکان آسیب‌دیده از جنگ

علم فناوری اطلاعات

معاون اجرایی رییس جمهور: دولت بیشترین ضرر را از قطع اینترنت متحمل می‌شود

اینترنت «همراه اول» وصل شد؟

اینترنت «ایرانسل» وصل شد؟

عضو اتاق بازرگانی: اینترنت تجار هنوز وصل نشده

جدیدترین مقالات و اخبار روز علمی

برای چشمان خون‌بار عروس خاورمیانه

اجرای طرح «تو رهبر کتابخوان امتی»

حکمت خدا دربارۀ مهلت و تأخیر در عقوبت دشمنان

ایمان و وحدت مردم، برتری راهبردی را تضمین می‌کنند

اموال مازیار فلاحی توقیف شد

دیدگاه‌های علمی و آموزشی اخیر

Davood