O Google anunciou nesta terça-feira (18) o lançamento do Gemini 3, a nova geração de sua inteligência artificial, criada para competir com o GPT-5, modelo de linguagem e “motor” do ChatGPT.
Segundo a empresa, o Gemini 3 é o modelo mais avançado em compreensão multimodal, ou seja, capaz de interpretar simultaneamente diferentes formatos de mensagens, como textos, imagens, áudios e códigos. O Google fala que ele tem raciocínio de alto nível (entenda mais abaixo).
Em coletiva à imprensa, os executivos do Google afirmaram que as respostas do Gemini agora são mais inteligentes, concisas e diretas. “Procuramos garantir que ele evite clichês e bajulação”, disseram. Trata-se de uma abordagem semelhante à que a OpenAI adotou ao anunciar o GPT-5.
Leia mais:A empresa diz que o Gemini 3 e suas soluções para desenvolvedores começam a ser disponibilizados a partir de hoje para todos os usuários.
‘Raciocínio em nível de PhD’
A empresa também está disponibilizando o Gemini 3 Pro para tarefas ainda mais complexas. “O Gemini 3 Pro superou significativamente o Gemini 2.5 Pro em todos os testes de desempenho em IA”, afirmou o Google.
Segundo a companhia, ele alcançou pontuação recorde de 1.501 pontos e demonstrou raciocínio em nível de PhD, com destaque em exames como o Humanity’s Last Exam e GPQA Diamond.
🔎 O que são esses exames citados pelo Google? Humanity’s Last Exam e GPQA Diamond são testes de alto nível que avaliam o desempenho de inteligências artificiais. O objetivo é medir o conhecimento acadêmico e a capacidade de raciocínio dessas tecnologias.
“Suas respostas são inteligentes, concisas e diretas, funcionando como um ‘verdadeiro parceiro de pensamento”, completou a empresa. “Sua alta precisão factual permite resolver problemas complexos em áreas como ciência e matemática”, completou.
A big tech também destacou que sua IA está se tornando mais “visual”, ou seja, capaz de responder a comandos de forma mais interativa.
Um exemplo citado é o aprendizado: em vez de apenas fornecer links para artigos ou vídeos do YouTube, a IA pode gerar flashcards interativos (cartas) que auxiliam o usuário no estudo.
Outro exemplo citado é que a nova geração da IA pode interpretar e traduzir uma receita escrita em outro idioma e transformá-la em um livro digital, que depois pode ser compartilhado com outras pessoas (veja no gif acima).
Outras coisas que o Gemini 3 pode fazer são:
- ➗Problemas complexos: consegue resolver problemas complexos em áreas como ciência e matemática.
- 🤖 Gemini Agente: recurso experimental de agente de IA que pode, por exemplo, organizar automaticamente a caixa de entrada do seu e-mail.
- 🧳 Planejamento de tarefas: é capaz de criar itinerários de viagem detalhados, gerando uma versão visual que inclui imagens, vídeos e tabelas.
- 👩💻 Google Antigravity: por meio dessa plataforma, os agentes de IA do Gemini podem planejar e executar de forma autônoma tarefas de software complexas de ponta a ponta. Eles acessam diretamente o editor, o terminal e o navegador, além de validar seu próprio código.
- 🔎Modo IA no buscador do Google: inclui a função “thinking” na busca, que permite raciocínio mais sofisticado e respostas mais complexas.
