Diário de Notícias

DN.

# Geral

Google lança o TurboQuant e vira o mercado de cabeça para baixo: a IA agora "lembra" 6 vezes mais, gastando 6 vezes menos memória

By Redação

13 Abr 2026 0 Views

Imprimir

Uma das maiores barreiras da inteligência artificial sempre foi o dinheiro — especialmente o custo absurdo de manter servidores cheios de memória RAM de última geração para manter os modelos funcionando. O Google pode ter acabado de quebrar essa barreira de vez.

O que é o TurboQuant?

No final de março de 2026, a equipe de pesquisa do Google anunciou o TurboQuant, um algoritmo de compressão que reduz em até 6 vezes a quantidade de memória necessária para operar sistemas de inteligência artificial — e ainda aumenta a velocidade de processamento em até 8 vezes — sem perder nada de qualidade nas respostas. O melhor: ele não exige que os modelos sejam retreinados do zero. Funciona nos modelos que já existem.

Como funciona na prática?

Toda IA conversacional tem o que se chama de KV Cache — uma espécie de "memória de curto prazo" que registra o histórico de uma conversa para não precisar reprocessar tudo do início a cada nova resposta. Quanto mais longa a conversa, mais memória essa cache consome. É por isso que manter chatbots rodando em escala custa uma fortuna em hardware.

O TurboQuant resolve isso de forma elegante: converte os dados para um formato matemático mais compacto usando coordenadas polares, reduzindo cada informação de 16 bits para apenas 3 bits — e ainda aplica uma camada de correção para garantir que nenhum detalhe importante seja perdido no processo.

O impacto foi imediato — e surpreendente

Assim que o anúncio foi feito, as ações de empresas fabricantes de chips de memória como Micron Technology, Western Digital e Seagate despencaram nas bolsas. Afinal, se a IA passou a precisar de 6 vezes menos RAM, quem vende RAM em quantidade industrial tem um problema sério nas mãos.

Instituições financeiras como o Morgan Stanley classificaram a inovação como disruptiva. O Bank of America chegou a comparar o TurboQuant ao chamado "momento DeepSeek" do Google — referência à startup chinesa que provou ser possível fazer IA de alto nível com muito menos recurso do que o mercado imaginava.

Por que isso importa para o mundo real?

Um servidor que hoje precisa de 1 TB de RAM para operar um modelo de IA avançado poderia passar a funcionar com apenas 150 a 250 GB. Isso significa custos menores, IA mais rápida, e modelos poderosos acessíveis a empresas que hoje não conseguem pagar pela infraestrutura necessária.

Os detalhes técnicos serão apresentados na conferência internacional ICLR 2026, e a expectativa é que o TurboQuant seja integrado ao Gemini e a ferramentas de busca semântica do Google em breve.

💡 O detalhe mais curioso: a internet toda começou a chamar o TurboQuant de "Pied Piper" — em referência à startup fictícia da série de TV "Vale do Silício", da HBO, cujo produto era exatamente um algoritmo de compressão revolucionário que mudaria as regras da computação. A brincadeira virou meme em fóruns de tecnologia do mundo todo. A ficção, ao que parece, chegou mais cedo do que ninguém esperava.

0 Comentário(s)

Faça login para comentar.

Lula sempre foi contra a taxa das blusinhas, afirma Haddad

Sobre o Jornal

Diário de Notícias

DN.

Google lança o TurboQuant e vira o mercado de cabeça para baixo: a IA agora "lembra" 6 vezes mais, gastando 6 vezes menos memória

0 Comentário(s)

Jornal do Dia (PDF)

Edição Mais Recente

Mais Lidas da Semana (Últimas Publicadas)

Ibovespa sobe com exterior, enquanto monitora encontro EUA-China e política no Brasil

Consulta do saldo do FGTS disponível para o Novo Desenrola começa em 25 de maio

Três Graças: desfecho de Lígia promete emocionar o público

Navio é apreendido na costa dos Emirados Árabes Unidos e segue em direção ao Irã