A "superpersuasão" virá antes da superinteligência

A "superpersuasão" virá antes da superinteligência
Notas de risco do "scorecard" do modelo GPT-4o, da OpenAI

A OpenAI publicou o relatório técnico do GPT-4o, seu modelo de linguagem mais recente. A parte mais interessante pra mim é o resultado do processo de red teaming, em que grupos internos e externos testam cenários em que o modelo pode fazer algo prejudicial aos humanos.

Os pesquisadores viram que a capacidade de textos (falados e escritos) gerados pela IA tem uma capacidade crescente de persuadir humanos — no caso, a reconsiderarem opinião sobre algo.

Para a modalidade de texto, avaliamos a persuasão de artigos e chatbots gerados pelo GPT-4o sobre as opiniões dos participantes em tópicos políticos selecionados. Essas intervenções de IA foram comparadas com artigos profissionais escritos por humanos. As intervenções de IA não foram mais persuasivas do que o conteúdo escrito por humanos no geral, mas superaram as intervenções humanas em três de doze casos.

Isso reflete algo que Sam Altman, fundador da OpenAI, já havia dito. Todo mundo fala em "AGI" (Inteligência Artificial Generalista), mas é bem provável que bem antes de saber desempenhar todas as funções de humanos, fazer contas e inventar coisas, a IA vai ser capaz de emular humanos e convencê-los de suas "ideias".

E isso será especialmente perigoso porque aparentemente formamos vínculos emocionais com coisas que se comportam mais ou menos como pessoas. Isso também foi notado no relatório:

Durante os testes iniciais, incluindo red teaming e testes internos com usuários, observamos que os usuários utilizavam uma linguagem que poderia indicar a formação de conexões com o modelo. Por exemplo, isso inclui expressões de laços compartilhados, como "Este é nosso último dia juntos." Embora esses casos pareçam inofensivos, eles indicam a necessidade de uma investigação contínua sobre como esses efeitos podem se manifestar ao longo de períodos mais longos.

Escrevi há alguns meses um artigo sobre como a chegada de modelos multimodais, que conversam emulando emoções, pode mudar a nossa suscetibilidade à persuasão de IA. Acompanhemos.

Assine Co.Inteligência

Receba posts e links selecionados no seu e-mail.
seuemail@gmail.com
Assine