A OpenAI e a Meta sinalizaram nesta semana que estão prestes a lançar as próximas versões de seus grandes modelos de linguagem, sistemas que alimentam aplicativos de inteligência artificial generativa (IA generativa), como o ChatGPT, informa o jornal Financial Times.
Segundo executivos das duas empresas, esses novos modelos serão capazes de raciocinar e planejar, etapas essenciais para alcançar a cognição sobre-humana nas máquinas.
De acordo com o FT, a Meta começaria a lançar o Llama 3 nas próximas semanas. Por sua vez, a OpenAi, apoiada pela Microsoft, indicou que seu próximo modelo, que deverá se chamar GPT-5, será lançado “em breve”.
Em entrevista ao jornal britânico, Joelle Pineau, vice-presidente de pesquisa de IA da Meta, afirmou que a empresa de Mark Zuckerberg está “trabalhando arduamente para descobrir como fazer com que esses modelos não apenas falem, mas também raciocinem, planejem, tenham memória”.
O diretor de operações da OpenAI, Brad Lightcap, disse ao Financial Times que a próxima geração do GPT mostraria progresso na solução de “problemas difíceis”, como o raciocínio, e que vamos começar a ver a IA sendo capaz de realizar tarefas mais complexas de forma mais sofisticada.
Segundo Lightcap, os sistemas atuais de Ai são bons em pequenas tarefas, mas ainda são ”bastante limitados” em suas capacidades. Ele acrescentou que a OpenAI teria “mais a dizer em breve” sobre a próxima versão do GPT.
As atualizações da Meta e da OpenAI fazem parte de uma onda de novos modelos de linguagem de grande porte que estão sendo lançados este ano por empresas como Google, Anthropic e Cohere, lembra o FT.
À medida que as empresas de tecnologia correm para criar uma IA generativa cada vez mais sofisticada – software que pode criar palavras, imagens, códigos e vídeos de qualidade indistinguível da produção humana – o ritmo do progresso está acelerando.
O raciocínio e o planejamento são passos importantes em direção ao que os pesquisadores de IA chamam de “inteligência geral artificial” – cognição de nível humano – porque permitem que os chatbots e os assistentes virtuais concluam sequências de tarefas relacionadas e prevejam as consequências de suas ações.
Na terça-feira, em evento realizado em Londres, o cientista-chefe de IA da Meta, Yann LeCun, admitiu que os sistemas de IA atuais “produzem uma palavra após a outra, realmente sem pensar e planejar”. E por terem dificuldade para lidar com questões complexas ou reter informações por um longo período, ainda acabam cometendo “erros estúpidos”.
LeCun ressaltou que acrescentar o raciocínio significaria que um modelo de IA “busca respostas possíveis”, “planeja a sequência de ações” e constrói um “modelo mental de qual será o efeito de [suas] ações”, disse ele. Essa é uma “grande peça que está faltando e na qual estamos trabalhando para que as máquinas alcancem o próximo nível de inteligência”. E contou que está trabalhando em agentes de IA que poderiam planejar e reservar cada etapa de uma viagem, por exemplo.
A Meta planeja incorporar seu novo modelo de IA ao WhatsApp e aos óculos inteligentes Ray-Ban. A empresa está se preparando para lançar o Llama 3 em uma variedade de tamanhos de modelos, para diferentes aplicativos e dispositivos, nos próximos meses.