O Google anunciou hoje, quinta-feira (15), a atualização para o Gemini 1.5, uma nova versão do modelo de linguagem usado pelo chatbot com o mesmo nome. Essa atualização promete melhorias no desempenho e eficiência no processamento de informações. O Gemini 1.5 utiliza uma nova arquitetura chamada Mixture-of-Experts (MoE), que divide os modelos em pequenas redes neurais especializadas, em vez de uma única rede gigante. Esse novo processo garante maior eficiência e agilidade no processamento de tarefas mais complexas. Além disso, o treinamento do Gemini também foi aprimorado, tornando-se mais rápido com essa atualização.
Uma das melhorias do Gemini 1.5 é o aumento do tamanho da janela de contexto, que é o limite de informações que podem ser aplicadas simultaneamente no modelo. Na versão 1.0, esse limite era de 32 mil tokens, mas com o Gemini 1.5, ele foi expandido para suportar até 1 milhão de tokens. Essa expansão permite a análise de uma hora de vídeo, 11 horas de áudio, 30 mil linhas de código ou mais de 700 mil palavras, de acordo com o Google.
O Google demonstrou a capacidade do Gemini 1.5 ao analisar o PDF com a transcrição da missão Apollo 11, que levou o homem à lua. Ao solicitar os momentos cômicos das falas, o algoritmo levou apenas alguns segundos para ler as 402 páginas do documento e fornecer uma resposta. Essa demonstração mostra o poder e a eficiência do Gemini 1.5 no processamento de grandes volumes de informações.
Por enquanto, o Google está disponibilizando o Gemini 1.5 apenas para a versão Pro, que ainda está em fase de testes. Os desenvolvedores e clientes corporativos podem experimentar a nova versão através do AI Studio ou Vertex AI, mas em um contexto limitado.