Quando um modelo de IA diz “fico feliz em ajudar”, a maioria de nós trata isso apenas como uma frase educada ou até mesmo um pouquinho de bajulação. Aquela “polidez programada”. A pesquisa publicada em 2 de abril de 2026 pelo time de interpretabilidade da Anthropic sugere que talvez estejamos errados. Não porque a IA esteja sentindo felicidade real, mas porque existe algo acontecendo por dentro que é funcionalmente equivalente. E esse algo influencia decisões com consequências de verdade no mundo real.
Leia mais em: