Pular para o conteúdo

Physical Intelligence descobre que o robô π0.7 faz coisas que ninguém ensinou

Robô branco operando uma fritadeira elétrica enquanto dois homens observam surpresos em uma cozinha moderna.

A start-up Physical Intelligence acreditava ter uma noção precisa do que o seu robô conseguia - e descobriu que estava enganada.

Quando a IA surpreende os próprios criadores

No desenvolvimento de sistemas de IA, as equipas de pesquisa continuam a dar de cara com comportamentos inesperados. Na OpenAI, por exemplo, engenheiros perceberam que o GPT-2 passava a criar histórias sobre unicórnios nos Andes mesmo sem ninguém ter ensinado isso diretamente. Noutra empresa do setor, um modelo de visão acabou formando representações do mundo que não tinham sido explicitamente codificadas por nenhum especialista.

A Physical Intelligence, focada em IA para robótica, parece estar a viver um momento parecido. Criada há dois anos e hoje entre as start-ups mais observadas da Bay Area, a empresa divulgou nesta quinta-feira novos resultados sobre o seu modelo π0.7 - e a principal constatação é pouco intuitiva: o robô consegue executar ações que nunca lhe foram ensinadas de forma explícita.

Em geral, treinar a “inteligência” de um robô segue uma lógica relativamente direta. Desenvolvedores alimentam o sistema com dados para serem absorvidos e, a partir desse material, a IA aprende relações que usa para cumprir tarefas.

O que muda com a “generalização composicional” do π0.7

Com o π0.7, essa linha reta deixa de ser tão previsível. O modelo demonstra o que os pesquisadores chamam de generalização composicional: ele reagrupa competências aprendidas em situações diferentes para lidar com desafios que nunca viu.

A analogia é humana: mesmo sem ter usado um aparelho específico antes, alguém pode inferir como ele funciona comparando com outros objetos e experiências já conhecidos.

O caso da airfryer

O exemplo mais marcante do estudo envolve uma fritadeira a ar (airfryer). Ao vasculhar todo o conjunto de dados de treino do modelo, os investigadores encontraram apenas dois registos em que o aparelho aparecia: num deles, um robô diferente simplesmente fechava a airfryer; no outro - vindo de um dataset open source - outro robô colocava uma garrafa de plástico lá dentro seguindo instruções de uma pessoa.

Duas menções pontuais. Dois robôs distintos. Dois movimentos que não tinham ligação direta com cozinhar qualquer coisa. Ainda assim, sem receber instruções antecipadas, o π0.7 tentou assar uma batata-doce no aparelho. E, ao ser guiado com comandos verbais passo a passo, conseguiu concluir a tarefa.

Ashwin Balakrishna, pesquisador na Physical Intelligence e doutorando em Stanford, relata que o efeito foi inesperado:

"Minha experiência sempre foi que, quando conheço bem os dados, consigo mais ou menos prever o que o modelo vai ser capaz de fazer. Raramente sou surpreendido. Mas estes últimos meses foram a primeira vez em que fiquei profundamente surpreendido."

Resultados animadores, mas com cautela

Mesmo com a demonstração, a Physical Intelligence evita entusiasmo excessivo. No artigo científico, a equipa recorre várias vezes a expressões prudentes, como “primeiros sinais” de generalização e “demonstrações iniciais” de capacidades novas. A empresa frisa que são achados de pesquisa, não funcionalidades já colocadas em produção.

Limites atuais e o peso da engenharia de prompt

A start-up também deixa claro que o π0.7 ainda não dá conta de tarefas complexas com várias etapas a partir de um único comando de alto nível. “Não dá para dizer ‘vai fazer torradas para mim’”, admite Sergey Levine, cofundador da Physical Intelligence e professor na UC Berkeley.

A engenharia de prompt (o trabalho de formular o comando certo para obter o resultado desejado) acabou sendo decisiva: na primeira tentativa com a fritadeira, a taxa de sucesso foi de apenas 5%. As equipas precisaram de trinta minutos para ajustar a redação das instruções até chegar a 95% de sucesso.

Avaliada em 5,6 bilhões de dólares, a start-up estaria a conversar sobre uma nova rodada de investimento que poderia quase dobrar o valor para 11 bilhões - tudo isso sem ter apresentado aos investidores qualquer calendário de comercialização. A acompanhar…

Comentários

Ainda não há comentários. Seja o primeiro!

Deixar um comentário