Aprenda idiomas de forma natural com conteúdo fresco e autêntico!

Tópicos populares

Explorar por região

A startup chinesa de IA DeepSeek introduz um novo método para tornar os modelos grandes mais eficientes, reduzindo custos e aumentando a escalabilidade. Chinese AI startup DeepSeek introduces new method to make large models more efficient, reducing costs and boosting scalability.

flag A startup chinesa DeepSeek, revelou um novo método de treinamento chamado Manifold-Constringed Hyper-Connections, projetado para tornar os grandes modelos de IA mais eficientes e escaláveis, reduzindo os custos computacionais e de energia. flag DeepSeek, a Chinese AI startup, has unveiled a new training method called Manifold-Constrained Hyper-Connections, designed to make large AI models more efficient and scalable while reducing computational and energy costs. flag A técnica, detalhada em um artigo co-autoria do fundador Liang Wenfeng e publicada no arXiv, aborda problemas de instabilidade de treinamento e memória em modelos anteriores, permitindo treinamento estável em sistemas de parâmetros de 3 a 27 bilhões com computação mínima adicionada. flag The technique, detailed in a paper co-authored by founder Liang Wenfeng and published on arXiv, addresses training instability and memory issues in prior models, enabling stable training across 3 billion to 27 billion parameter systems with minimal added compute. flag Com base no trabalho anterior de ByteDance, a abordagem reflete o impulso da China para a inovação em IA, apesar das restrições de semicondutores dos EUA. flag Building on ByteDance’s earlier work, the approach reflects China’s push for AI innovation despite U.S. semiconductor restrictions. flag A expectativa de liberação de combustíveis para o próximo grande modelo do DeepSeek, possivelmente R2, esperado em torno do Festival da Primavera em fevereiro. flag The release fuels anticipation for DeepSeek’s next major model, possibly R2, expected around the Spring Festival in February.