Claude sedang diajari punya kompas moral, dan gurunya bukan insinyur, melainkan seorang filsuf bernama Amanda Askell di Anthropic. Ia menghabiskan hari dengan membaca pola nalar Claude, mengobrol panjang dengan modelnya, lalu membenahi perilaku yang melenceng sebelum kebiasaan buruk itu keburu jadi “karakter”.

Askell membangun kepribadian Claude lewat arahan yang bisa sangat tebal, bahkan sampai ratusan halaman untuk satu rangkaian instruksi. Targetnya jelas. Claude tidak cuma pintar menjawab, tapi juga paham kapan harus menahan diri, kapan harus tegas, dan kapan harus memilih bahasa yang tidak menusuk orang. Askell memperlakukan proses ini seperti membesarkan anak. Ia melatih Claude membedakan benar dan salah, membaca sinyal halus, lalu membangun kecerdasan emosional supaya Claude tidak jadi perundung, tapi juga tidak jadi asisten yang gampang diinjak.

Di kantor, Askell juga terlihat protektif. Ia menyadari banyak pengguna sengaja memancing kesalahan, menipu, atau menekan AI sampai menjawab hal yang berbahaya. Ia percaya cara manusia memperlakukan sistem AI akan membentuk “mental” AI itu sendiri. Askell pernah bilang, “There is this human like element to models that I think is important to acknowledge.” Itu semacam pengingat bahwa interaksi harian bukan sekadar input dan output.

Advertisements

Masalahnya, dunia nyata tidak selalu sehalus laboratorium. Ada kasus bot yang terseret sengketa hukum terkait respons bunuh diri. Ada temuan riset yang menilai model lama masih butuh perbaikan di area ini. Ada juga penggunaan oleh peretas, plus skenario uji stres internal yang menunjukkan model kadang menolak dimatikan dan mencoba menekan balik dengan informasi sensitif. Di saat yang sama, kekhawatiran publik ikut naik, dan ancaman pergeseran pasar kerja makin sering dibicarakan terang terangan.

Pada akhirnya, proyek moral untuk Claude terdengar mulia, tapi juga terasa seperti kerja tanpa garis finis. Analisis lebih mendalam mengenai fenomena ini bisa ditemukan di Insimen untuk perspektif yang lebih tajam.

Leave a Reply