Aprenda idiomas de forma natural com conteúdo fresco e autêntico!

Tópicos populares

Explorar por região

A Nvidia lança racks Groq 3 LPU para inferência de IA mais rápida e eficiente, enviando no final de 2026. Nvidia launches Groq 3 LPU racks for faster, more efficient AI inference, shipping late 2026.

flag A Nvidia lançou a Unidade de Processamento de Linguagem Groq 3 (LPU) e racks de servidor LPX associados, integrando a tecnologia Groq em sua plataforma Vera Rubin para aumentar a velocidade e a eficiência da inferência de IA. flag Nvidia has launched the Groq 3 Language Processing Unit (LPU) and associated LPX server racks, integrating Groq’s technology into its Vera Rubin platform to boost AI inference speed and efficiency. flag O sistema, com 256 LPUs por rack, entrega até 1.500 tokens por segundo com 35 vezes maior rendimento por watt, visando modelos de trilhões de parâmetros e cargas de trabalho de IA antrópicas. flag The system, featuring 256 LPUs per rack, delivers up to 1,500 tokens per second with 35 times higher throughput per watt, targeting trillion-parameter models and agentic AI workloads. flag Projetada para complementar as GPUs Rubin e as CPUs Vera da Nvidia, a plataforma visa reduzir a latência e o uso de energia, permitindo maior receita por milhão de tokens. flag Designed to complement Nvidia’s Rubin GPUs and Vera CPUs, the platform aims to reduce latency and power use while enabling higher revenue per million tokens. flag Os racks Groq 3 LPX devem ser enviados no final de 2026, com a Nvidia também introduzindo a plataforma de software Dynamo 1.0 de código aberto para simplificar a inferência de IA em larga escala. flag The Groq 3 LPX racks are expected to ship in late 2026, with Nvidia also introducing the open-source Dynamo 1.0 software platform to streamline large-scale AI inference. flag A mudança marca uma mudança estratégica em direção a hardware de inferência especializado em meio à crescente concorrência e crescente demanda de hiperescaladores e provedores de serviços de IA. flag The move marks a strategic shift toward specialized inference hardware amid growing competition and rising demand from hyperscalers and AI service providers.