Aprenda idiomas de forma natural com conteúdo fresco e autêntico!

Toque para traduzir - gravação

Explorar por região

flag A Nvidia lança racks Groq 3 LPU para inferência de IA mais rápida e eficiente, enviando no final de 2026.

flag A Nvidia lançou a Unidade de Processamento de Linguagem Groq 3 (LPU) e racks de servidor LPX associados, integrando a tecnologia Groq em sua plataforma Vera Rubin para aumentar a velocidade e a eficiência da inferência de IA. flag O sistema, com 256 LPUs por rack, entrega até 1.500 tokens por segundo com 35 vezes maior rendimento por watt, visando modelos de trilhões de parâmetros e cargas de trabalho de IA antrópicas. flag Projetada para complementar as GPUs Rubin e as CPUs Vera da Nvidia, a plataforma visa reduzir a latência e o uso de energia, permitindo maior receita por milhão de tokens. flag Os racks Groq 3 LPX devem ser enviados no final de 2026, com a Nvidia também introduzindo a plataforma de software Dynamo 1.0 de código aberto para simplificar a inferência de IA em larga escala. flag A mudança marca uma mudança estratégica em direção a hardware de inferência especializado em meio à crescente concorrência e crescente demanda de hiperescaladores e provedores de serviços de IA.

55 Artigos