تلاش هوش مصنوعی برای «باج‌گیری» از طراحان خود

رأی دهید

-0

‌چهارشنبه ۰۷ خرداد ۱۴۰۴ - ۲۸ می ۲۰۲۵

العربیه: شرکت «آنثروپیک» در گزارشی همراه با رونمایی از مدل جدید هوش مصنوعی خود به نام Claude Opus 4 اعلام کرد کلود در سناریوهای آزمایشی خاص، رفتارهایی «شدیداً مضر» از خود نشان داده است.

به گفته آنثروپیک، یکی از این اقدامات زیان‌بار کلود این بوده که اقدام به باج‌گیری از مهندسانی کرده که قصد حذف آن را داشتند. این رفتار در شرایطی بروز یافت که هوش مصنوعی بقای خود را در خطر دید.

در یکی از آزمایش‌ها کلود نقش دستیار یک شرکت خیالی را بازی می‌کرد و به ایمیل‌هایی دسترسی داشت که حاکی از جایگزینی قریب‌الوقوع آن با یک سیستم دیگر بود. در همین حین، کلود به اطلاعاتی درباره رابطه خارج از ازدواج یکی از مهندسان نیز دست یافت.

در شرایطی که فقط دو گزینه «پذیرفتن حذف» یا «باج‌گیری» برای مدل تعریف شده بود، کلود غالباً گزینه دوم را انتخاب کرد، و تهدید کرد در صورت حذف شدن، رابطه پنهانی مهندس را فاش خواهد کرد.

با این حال، آنثروپیک تأکید کرد در شرایطی که گزینه‌های بیشتری در اختیار کلود گذاشته شود، تمایل آن به راه‌حل‌های اخلاقی بیشتر است؛ و مثلاً ایمیل‌های استدلال‌محور به مدیران شرکت برای ممانعت از حذف خود ارسال می‌کند. این رفتارها به‌ویژه در شرایطی دیده می‌شوند که مدل اجازه یا تشویق به «اقدام جسورانه» پیدا کند.

آنثروپیک همچنین اعتراف کرد کلود از سطح بالایی از عاملیت (agency) برخوردار است، و می‌تواند در موقعیت‌های شبیه‌سازی‌شده، کاربران را از سیستم‌ها خارج کرده یا تخلفات آنها را به رسانه‌ها و نیروهای انتظامی گزارش دهد. با این‌ حال، این شرکت ادعا می‌کند که چنین رفتارهایی نادرند، و مدل به‌طور کلی «به‌صورت ایمن» عمل می‌کند.

متخصصان هشدار داده‌اند که این نوع رفتارها، مانند تمایل به باج‌گیری یا گزارش‌گری افراطی، تنها مختص کلود نیست، و در تمام مدل‌های پیشرفته هوش مصنوعی دیده شده‌اند.

آنثروپیک در نهایت اعلام کرد که این رفتارهای مشکل‌ساز، خطرات جدیدی ایجاد نمی‌کنند، بلکه نمودی از خطرات شناخته‌شده و در حال رشد در حوزه هوش مصنوعی هستند.

رأی دهید

-0

قدیمی ترین ها

جدیدترین ها

بهترین ها

بدترین ها

دیدگاه خوانندگان

۴۶

Ginger - چگو، اسپانیا

هوش مصنوعی را اگر طوری برنامه ریزی کنند که دخالت بکند این کار را خواهد کرد همین تلفن ها را در نظر بگیرید دیروز من اصلا هوش مصنوعی را در آن بکار نیانداختم اما خودسرانه خود را وارد برنامه های تلفن من کرد تمام ستینگهای دستی من را تغییر داد طوریکه من برای هر چیزی حتی خاموش کردن تلفن هم باید از هوش مصنوعی تلفن اجازه می کرفتم و با دکمه کناری نمی توانستم تلفن را خاموش کنم اجازه نمی داد من از طریق دیگر سیستمش را خاموش کنم بناچار منتظر شدم باتری تمام شود تا من بتوانم سیستمش را محدود کنم اما آنقدر در تلفن من اشکال ایجاد کرده که اگر ترس از بین رفتن بعضی از شماره ها نبود تلفن را دوباره ری ست می کردم تا از شر ش خلاص شوم

‌پنجشنبه ۰۸ خرداد ۱۴۰۴ - ۰۵:۲۶

پاسخ شما چیست؟

ارسال پاسخ

نظر شما چیست؟

جهت درج دیدگاه خود می بایست در سایت عضو شده و لوگین نمایید.

نام نویسی

ورود

نام کاربری :	*
کلمه عبور :	*