OpenAI lança nova série de modelos de linguagem focados em raciocínio avançado
Por Sandro Felix
Publicado em 13/09/24 às 15:56
A OpenAI anunciou recentemente o lançamento de uma nova série de modelos de inteligência artificial, batizada de “o1”, que promete avanços significativos no raciocínio complexo, especialmente em áreas como ciências, programação e matemática. A empresa, confiante nas melhorias implementadas, redefiniu a contagem de versões, começando do zero após o GPT-4o, e também se distanciou da marca GPT, que vinha sendo usada até então.
O primeiro modelo da série, intitulado “o1-preview”, já está disponível tanto no ChatGPT quanto na API da OpenAI. Embora esteja em fase de prévia, a empresa assegura que atualizações regulares e aprimoramentos estão nos planos, tornando-o um projeto em constante evolução.
Foco no raciocínio e solução de problemas
A principal inovação dos modelos “o1” está na capacidade de aprimorar o processo de solução de problemas. Esses modelos foram treinados para dedicar mais tempo à análise das questões antes de apresentar uma resposta. A estratégia envolve testar diferentes abordagens, identificar possíveis erros e abordar tarefas complexas de maneira mais metódica, semelhante ao raciocínio humano.
Os resultados iniciais, compartilhados pela OpenAI, mostram que os novos modelos estão alcançando um nível de desempenho impressionante. Em testes desafiadores em áreas como física, química e biologia, o “o1-preview” demonstrou habilidades comparáveis às de estudantes de doutorado. Um exemplo notável foi a taxa de precisão de 83% em um exame de qualificação para a Olimpíada Internacional de Matemática, uma grande evolução em relação aos 13% obtidos pelo GPT-4o.
Desempenho e Benchmarking
Apesar dos resultados promissores, a OpenAI reconhece que benchmarks de IA podem ser variáveis. Portanto, o verdadeiro potencial dos modelos “o1” será melhor avaliado à medida que mais usuários testarem a tecnologia em diferentes cenários. No entanto, as primeiras análises sugerem que o “o1” pode representar um marco significativo no desenvolvimento de IA voltada para o raciocínio avançado.
Da Piada ao código: O teste do morango e outras inovações
Curiosamente, a OpenAI também resolveu algumas questões que se tornaram memes na comunidade de IA, como o número correto de “R’s” na palavra “morango” (“strawberry” em inglês). Além disso, a empresa demonstrou as capacidades avançadas do modelo ao gerar com sucesso código Python para um jogo de arcade, enfatizando a evolução dos modelos no domínio da programação.
Há especulações de que a série “o1” seja o resultado do projeto anteriormente codinomeado “Strawberry”, que visava desenvolver modelos capazes de realizar tarefas de raciocínio complexo. Essa conexão torna divertido pensar que o nome do projeto pode ter sido inspirado pelo “teste do morango”.
Reforço na segurança e combate ao “Jailbreaking”
Outro foco da OpenAI com os modelos “o1” é o fortalecimento das defesas contra o “jailbreaking”, uma técnica usada para contornar os mecanismos de segurança das IAs. Segundo a empresa, o “o1-preview” obteve uma pontuação de 84 em 100 em um de seus testes mais rigorosos de jailbreak, superando com folga o GPT-4o, que marcou apenas 22.
Acessibilidade para desenvolvedores e novas funcionalidades
Visando tornar os modelos mais acessíveis, especialmente para desenvolvedores, a OpenAI também está lançando uma versão mais leve, chamada “o1-mini”, focada em tarefas de codificação. Ambas as versões, “o1-mini” e “o1-preview”, já estão sendo disponibilizadas para assinantes dos planos ChatGPT Plus e Teams. Embora as capacidades de raciocínio avançado sejam, por enquanto, uma funcionalidade opcional com limites semanais de uso, a OpenAI planeja expandir a capacidade e introduzir a seleção automática de modelos com base na complexidade do pedido.