تلاش هوش مصنوعی برای «باج‌گیری» از طراحان خود

العربیه: شرکت «آنثروپیک» در گزارشی همراه با رونمایی از مدل جدید هوش مصنوعی خود به نام Claude Opus 4 اعلام کرد کلود در سناریوهای آزمایشی خاص، رفتارهایی «شدیداً مضر» از خود نشان داده است.

به گفته آنثروپیک، یکی از این اقدامات زیان‌بار کلود این بوده که اقدام به باج‌گیری از مهندسانی کرده که قصد حذف آن را داشتند. این رفتار در شرایطی بروز یافت که هوش مصنوعی بقای خود را در خطر دید.


در یکی از آزمایش‌ها کلود نقش دستیار یک شرکت خیالی را بازی می‌کرد و به ایمیل‌هایی دسترسی داشت که حاکی از جایگزینی قریب‌الوقوع آن با یک سیستم دیگر بود. در همین حین، کلود به اطلاعاتی درباره رابطه خارج از ازدواج یکی از مهندسان نیز دست یافت.

در شرایطی که فقط دو گزینه «پذیرفتن حذف» یا «باج‌گیری» برای مدل تعریف شده بود، کلود غالباً گزینه دوم را انتخاب کرد، و تهدید کرد در صورت حذف شدن، رابطه پنهانی مهندس را فاش خواهد کرد.

با این حال، آنثروپیک تأکید کرد در شرایطی که گزینه‌های بیشتری در اختیار کلود گذاشته شود، تمایل آن به راه‌حل‌های اخلاقی بیشتر است؛ و مثلاً ایمیل‌های استدلال‌محور به مدیران شرکت برای ممانعت از حذف خود ارسال می‌کند. این رفتارها به‌ویژه در شرایطی دیده می‌شوند که مدل اجازه یا تشویق به «اقدام جسورانه» پیدا کند.

آنثروپیک همچنین اعتراف کرد کلود از سطح بالایی از عاملیت (agency) برخوردار است، و می‌تواند در موقعیت‌های شبیه‌سازی‌شده، کاربران را از سیستم‌ها خارج کرده یا تخلفات آنها را به رسانه‌ها و نیروهای انتظامی گزارش دهد. با این‌ حال، این شرکت ادعا می‌کند که چنین رفتارهایی نادرند، و مدل به‌طور کلی «به‌صورت ایمن» عمل می‌کند.

متخصصان هشدار داده‌اند که این نوع رفتارها، مانند تمایل به باج‌گیری یا گزارش‌گری افراطی، تنها مختص کلود نیست، و در تمام مدل‌های پیشرفته هوش مصنوعی دیده شده‌اند.

آنثروپیک در نهایت اعلام کرد که این رفتارهای مشکل‌ساز، خطرات جدیدی ایجاد نمی‌کنند، بلکه نمودی از خطرات شناخته‌شده و در حال رشد در حوزه هوش مصنوعی هستند.
رأی دهید
دیدگاه خوانندگان
۴۵
Ginger - چگو، اسپانیا
هوش مصنوعی را اگر طوری برنامه ریزی کنند که دخالت بکند این کار را خواهد کرد همین تلفن ها را در نظر بگیرید دیروز من اصلا هوش مصنوعی را در آن بکار نیانداختم اما خودسرانه خود را وارد برنامه های تلفن من کرد تمام ستینگهای دستی من را تغییر داد طوریکه من برای هر چیزی حتی خاموش کردن تلفن هم باید از هوش مصنوعی تلفن اجازه می کرفتم و با دکمه کناری نمی توانستم تلفن را خاموش کنم اجازه نمی داد من از طریق دیگر سیستمش را خاموش کنم بناچار منتظر شدم باتری تمام شود تا من بتوانم سیستمش را محدود کنم اما آنقدر در تلفن من اشکال ایجاد کرده که اگر ترس از بین رفتن بعضی از شماره ها نبود تلفن را دوباره ری ست می کردم تا از شر ش خلاص شوم
‌پنجشنبه ۰۸ خرداد ۱۴۰۴ - ۰۵:۲۶
نظر شما چیست؟
جهت درج دیدگاه خود می بایست در سایت عضو شده و لوگین نمایید.
  • +297شیرین سعیدی، استاد دانشگاه آرکانزاس، به دلیل «تمجید از خامنه‌ای و مواضع ضداسرائیلی» اخراج شد
  • +212بانگی که از خراسان برخاست؛ این است شعار ملی، رضا رضا پهلوی
  • +121امام جماعت شهرستان تفت بر بالای منبر سکته کرد
  • +102حسن آقامیری: وضع سیستان وبلوچستان خرابه، یکی از حضار: تقصیر پهلویه، آقامیری: شما۴۰ساله چه غلطی کردید
  • +102حمایت کاترین شکدم از شاهزاده رضا پهلوی؛ شکدم: خامنه‌ای علاقه‌ای به زنان ندارد و به پسربچه‌ها تمایل دارد
  • +93سخنان کاترین شکدم درمورد گرایشات جنسی خامنه‌ای و همسریابی زینب سلیمانی برای افراد حزب‌الله
  • +92کارشناس صدا و سیما: وقتی به دختران می‌گوییم حجاب خود را رعایت کنید می‌گویند بروید جلوی گرانی‌ را بگیرید
  • +89«قهرمان حقیقی» حمله سیدنی؛ «احمد الاحمد» مهاجم را با دست خالی متوقف کرد
  • +79رئیس موساد: تروریست‌ها و فرستندگان ایرانی‌شان را پیدا می‌کنیم و به حسابشان می‌رسیم
  • +76رد پای تهران در «حمله خونین سیدنی»؛ مقام اسرائیلی: منشأ حمله مرگبار به یهودیان، ایران است