Robôs agora podem treinar a si mesmos com o novo algoritmo “a prática leva à perfeição”

Publicado em 11/08/24 às 07:07

Pesquisadores desenvolveram um algoritmo que permite que robôs identifiquem autonomamente as fraquezas em suas habilidades e, em seguida, pratiquem sistematicamente para melhorá-las.

O novo algoritmo “Estimar, Extrapolar e Situar” (EES), desenvolvido pelo Laboratório de Ciência da Computação e Inteligência Artificial (CSAIL) do MIT e pelo Instituto de IA, foi recentemente apresentado na conferência “Robotics: Science and Systems”. Veja como ele funciona:

Primeiro, o robô utiliza seu sistema de visão para avaliar o ambiente ao seu redor e a tarefa a ser realizada, como limpar um cômodo. O algoritmo então estima o quão bem o robô consegue executar ações específicas, como manusear uma vassoura para varrer. Se o EES determinar que praticar uma habilidade específica pode melhorar o desempenho geral, ele inicia essa prática.

Os pesquisadores testaram o EES no robô quadrúpede Spot, da Boston Dynamics, que já tem um bom histórico com tarefas desse tipo, especialmente com um braço acoplado em suas costas. Desta vez, no entanto, o robô trabalhou de forma mais inteligente, e não mais árdua.

O algoritmo guiou o robô na prática e no refinamento de habilidades úteis. Em um dos testes, o EES permitiu que o Spot aprendesse a colocar com segurança uma bola e um anel em uma mesa inclinada em cerca de três horas. Em outro, o robô melhorou na tarefa aparentemente aleatória de varrer brinquedos para dentro de uma caixa após aproximadamente duas horas de sessões de prática focadas.

Em frameworks anteriores, provavelmente seriam necessárias mais de 10 horas para que o Spot alcançasse proficiência em qualquer uma dessas habilidades úteis.

Embora essas tarefas fossem relativamente básicas, os pesquisadores observam que essa tecnologia pode, eventualmente, resultar em robôs que aprendem a melhorar seu desempenho em diversos ambientes, como fábricas, cafeterias, residências ou hospitais.

Olhando para o futuro, os pesquisadores esperam integrar simuladores para que os robôs possam combinar sessões de prática virtual e física, potencialmente acelerando o processo de aprendizado. Eles também pretendem desenvolver algoritmos que possam raciocinar sobre sequências de tentativas de prática, em vez de focar apenas em habilidades isoladas.

Permitir que robôs aprendam por conta própria é ao mesmo tempo incrivelmente útil e extremamente desafiador, disse Danfei Xu, professor da Georgia Tech e cientista de pesquisa na Nvidia AI, ao MIT News.

No futuro, robôs domésticos serão vendidos para todos os tipos de lares e serão esperados para realizar uma ampla gama de tarefas. Não podemos programar tudo que eles precisam saber com antecedência, então é essencial que eles possam aprender no trabalho.

Com o apoio de uma plataforma digital como o EES, os robôs do futuro poderão dominar novas habilidades tão facilmente quanto os humanos — através da prática constante. O artigo detalhando este projeto está disponível no Arxiv.