Lançada em dezembro de 2023 pelo Google, a Gemini já chega abalando o conforto da OpenIA, que vinha mantendo o ChatGPT como umas das melhores e mais populares inteligências artificiais disponíveis no mercado.
A Gemini chega com capacidade de identificar, processar, combinar e operar diferentes tipos de mídia ao mesmo tempo: áudio, vídeo, texto, imagens e linguagens de programação. Apresentada pelo Google em três modelos diferentes, promete bom desempenho tanto nas execuções de tarefas mais simples, quanto em tarefas mais complexas:
Gemini Ultra: maior e mais hábil modelo para tarefas altamente complexas;
Gemini Pro: melhor modelo para escalar uma grande variedade de tarefas;
Gemini Nano: modelo mais eficiente para realizar tarefas em dispositivos.
Segundo o Google, a Gemini tem seus modelos constantemente testados para a avaliação de seu desempenho em uma ampla variedades de tarefas, desde compreensão de áudio a raciocínios matemáticos.
“O desempenho do Gemini Ultra excede os resultados atuais de última geração em 30 dos 32 benchmarks acadêmicos amplamente utilizados na pesquisa e desenvolvimento de Grandes Modelos de Linguagem (LLMs, na sigla em inglês). Com uma pontuação de 90.0%, o Gemini Ultra é o primeiro
modelo a superar os especialistas humanos em MMLU (Entendimento de Linguagem Massiva e Multitarefa)” Google.
A Gemini Pro já está disponível para uso, você pode testá-la através do Bard, basta acessar a página do chatbot e fazer login com uma conta Google. Para quem quer acompanhar melhor as novidades da Gemini uma sugestão é definir o inglês como idioma padrão no Chrome, uma vez que a nova
atualização do Bard com a Gemini Pro ainda não está disponível em português.
Fonte: Apresentando o Gemini: nosso maior e mais hábil modelo de IA (blog.google)