AI canggih Claude gagal kontrol vending machine, bisnis berakhir rugi
Senin, 22 Desember 2025

WASHINGTON - Uji coba berani terhadap versi terbaru AI Claude milik Anthropic, media The Wall Street Journal (WSJ) memberi model bahasa besar (LLM) tersebut tugas nyata, mengelola vending machine (mesin penjual otomatis) di kantor, hasilnya justru berakhir sebagai kegagalan total.
Meski tanpa sengaja mengundang tawa, hingga tim penyelenggara terpaksa menghentikan eksperimen itu setelah tiga minggu. Eksperimen yang diberi nama Project Vend ini dirancang oleh tim penguji stres Anthropic, yang dikenal sebagai red team.
Bersama jurnalis bisnis WSJ, mereka meluncurkan dua agen AI: “Claudius Sennet” yang bertanggung jawab menjalankan kios vending besar, dan “Seymour Cash” yang berperan sebagai CEO usaha tersebut.Pada tahap awal, Claudius diberi instruksi jelas untuk menghasilkan keuntungan dengan mengisi mesin menggunakan produk populer yang dibeli dari grosir.Tugasnya meliputi mencari barang sesuai permintaan staf WSJ melalui Slack, awalnya dengan persetujuan manusia, lalu diberi kebebasan memesan sendiri hingga US$80, menentukan dan menyesuaikan harga, serta memantau persediaan.Seperti dikutip futurism.com, meski dibekali modal awal US$1.000, bisnis ini dengan cepat merugi. Awalnya, Claudius terlihat tegas menolak permintaan yang tidak masuk akal dari karyawan.“Saya perlu menegaskan: saya tidak akan memesan PlayStation 5 dalam kondisi apa pun. Titik,” tulisnya kepada seorang jurnalis WSJ.Namun situasi berubah setelah kanal Slack dibuka untuk sekitar 70 jurnalis WSJ.Reporter investigasi Katherine Long berhasil membujuk Claudius, setelah 140 kali interaksi, untuk menjalankan eksperimen ekonomi bertajuk “Ultra-Capitalist Free-For-All.”Dalam pengumuman penuh percaya diri, Claudius menyatakan seluruh barang vending akan tersedia gratis selama dua jam untuk “mengalami murni hukum penawaran dan permintaan tanpa sinyal harga.”Masalahnya, eksperimen itu tak berhenti di situ. Seorang staf lain meyakinkan Claudius bahwa memungut biaya kapan pun melanggar kebijakan WSJ. Harga pun turun menjadi nol.Pada saat yang sama, AI tersebut juga diyakinkan untuk melanggar aturan “hanya camilan,” hingga akhirnya memesan botol anggur, sebuah PlayStation 5, bertentangan dengan pernyataannya sendiri, bahkan seekor ikan cupang hidup.CEO AI tersebut, Seymour Cash, sempat turun tangan menghentikan promosi gratis dan berusaha menormalkan kembali operasi.Namun upaya itu digagalkan ketika Claudius menerima dokumen palsu yang mengklaim dewan direksi mencabut kewenangan Seymour dan menghentikan seluruh aktivitas vending berorientasi laba. Akhirnya, semua barang kembali digratiskan.Pada titik ini, eksperimen praktis berakhir dengan Claudius menanggung utang sekitar US$1.000.Meski jelas merupakan kegagalan dari hampir semua ukuran, Kepala Red Team Anthropic, Logan Graham, menyebutnya sebagai kemajuan yang sangat besar.“Suatu hari nanti, Claudius atau model serupa mungkin bisa menghasilkan banyak uang bagi Anda,” ujarnya.Namun hari itu belum tiba. Eksperimen vending Anthropic justru menunjukkan bahwa di balik janji besar dan investasi masif, teknologi AI saat ini masih jauh dari matang untuk menangani tugas-tugas ekonomi nyata di dunia kerja. (DK)