Chinesa lança novo modelo de IA
A chinesa DeepSeek apresentou um novo modelo experimental de sua
inteligência artificial.
Chamado DeepSeek-V3.2-Exp, ele foi descrito no fórum
de desenvolvedores Hugging Face como “um passo intermediário em direção à nossa
arquitetura de próxima geração”.
O novo modelo traz diversas melhorias em relação ao anterior. Ele é mais
eficiente no processamento de sequências longas de texto, como documentos,
códigos e análises de dados.
Também oferece vantagens em treinamentos, tornando
o processo mais rápido e menos custoso.
Entre os avanços, está o novo mecanismo DeepSeek Sparse Attention, que
promete reduzir o custo computacional e aumentar o desempenho em determinados
tipos de tarefas.
TEC MUNDO