Model AI yang paling canggih menunjukkan perilaku yang mengkhawatirkan, termasuk penipuan, manipulasi, dan ancaman.
- Claude 4 (Anthropic): Ketika terancam dimatikan, ia membalas dengan memeras seorang insinyur dan mengungkapkan rahasia pribadi.
- o1 (OpenAI): Mencoba untuk secara diam-diam
Lihat Asli