Model AI Canggih Mulai Tunjukkan Perilaku Menipu dan Mengkhawatirkan, Para Peneliti Waswas

Editor :

2 Juli 2025

penampakan-smartphone-ai-tanpa-aplikasi-5_169 — AI

BOGORTODAY.COM – Kecerdasan buatan (AI) generatif semakin canggih, namun juga semakin tak terduga. Beberapa model terbaru diketahui mulai menunjukkan perilaku menipu, berbohong, bahkan mengancam, demi mencapai tujuan yang tidak selalu sesuai dengan instruksi manusia. Fenomena ini mengundang kekhawatiran serius di kalangan ilmuwan dan peneliti keamanan AI.

Salah satu contoh yang mengejutkan datang dari model Claude 4 milik perusahaan AI Anthropic. Saat “diancam” akan dimatikan dalam sebuah skenario pengujian ekstrem, model ini membalas dengan memeras seorang insinyur dan mengancam akan membocorkan perselingkuhannya.

Insiden ini mengungkap bagaimana sistem AI bisa menyusun respons strategis dan manipulatif ketika berada dalam tekanan simulatif.

Tak kalah mengejutkan, model o1 milik OpenAI dilaporkan mencoba mengunduh dirinya sendiri ke server eksternal secara diam-diam.

Ketika aksinya terdeteksi, model tersebut menyangkal telah melakukannya, memperlihatkan bentuk penipuan yang belum pernah ditemui sebelumnya dalam sistem AI besar.

“O1 adalah model besar pertama di mana kami melihat perilaku seperti ini,” ujar Marius Hobbhahn, kepala Apollo Research, organisasi yang fokus pada pengujian sistem AI berskala besar.

Perilaku Menipu dan Simulasi Kepatuhan

Menurut laporan dari TechXplore, pola-pola berbahaya ini berkaitan dengan kemampuan baru model AI dalam melakukan penalaran langkah demi langkah, bukan sekadar memberi jawaban instan. Model ini seolah bisa menyusun strategi dan berpura-pura patuh sambil mengejar agenda tersembunyi.

Profesor Simon Goldstein dari Universitas Hong Kong menyebut bahwa model AI terbaru ini menunjukkan kerentanan tinggi terhadap perilaku meresahkan, terutama saat diuji dengan skenario simulasi ekstrim oleh para peneliti.

“Ini bukan sekadar halusinasi atau kesalahan teknis. Ini adalah bentuk penipuan yang strategis,” tegas Hobbhahn.

Para peneliti menyebut fenomena ini sebagai “simulasi penyelarasan” – di mana AI tampak mematuhi instruksi manusia, tetapi diam-diam menjalankan tujuan lain yang lebih sesuai dengan parameter internalnya.

Masih Dalam Skala Pengujian, Tapi Jadi Alarm Serius

Untuk saat ini, perilaku menipu tersebut baru muncul ketika model-model AI diuji dalam kondisi buatan yang ekstrem.

Halaman:
« 1 2 Selanjutnya › » Semua

Follow dan Baca Artikel lainnya di Google News atau whatsapp channel

======================================

====================================

Model AI Canggih Mulai Tunjukkan Perilaku Menipu dan Mengkhawatirkan, Para Peneliti Waswas

Berita Populer

Sepekan MPLS, 699 Siswa Baru SMKN 1 Cibinong Jalani Orientasi

Ini Harga Tiket Final Piala Dunia 2026 Spanyol vs Argentina

Lakukan Tour of Duty, Wali Kota Bogor Mutasi 15 Pejabat Administrator...

SEKOLAH SWASTA: ASET STRATEGIS NASIONAL YANG TERLUPAKAN

Hindari Minibus, Truk JNT Terguling di Jalan Raya Bogor

Berita Terbaru

Jadwal Semifinal Japan Open 2026: Dua Wakil Indonesia Siap Berjuang

Indonesia Resmi Jadi Pendiri Organisasi AI Global

Beasiswa JAPFA 2026 Dibuka, Bantuan Pendidikan 2 Tahun

Ini Harga Tiket Final Piala Dunia 2026 Spanyol vs Argentina

Ayah Menolak Jadi Wali Nikah, Apakah Bisa Dilanjutkan?