---
title: "A resposta da China chegou com o DeepSeek V4 rodando liso em hardware da Huawei"
author: "Gabriela P. Torres"
date: "2026-05-04 11:34:00-03"
category: "Inteligência Artificial & Dados"
url: "http://desbugados.scale.press/portal/desbugados/post/2026/05/04/a-resposta-da-china-chegou-com-o-deepseek-v4-rodando-liso-em-hardware-da-huawei/md"
---

No dia 24 de abril de 2026, a startup chinesa DeepSeek liberou a versão preliminar do seu modelo de inteligência artificial V4. A verdadeira notícia aqui não é o ganho de performance em programação ou matemática. O fato que desmonta a estratégia do Departamento de Comércio dos Estados Unidos atende por um nome específico: Ascend 950. O DeepSeek V4 foi projetado para rodar de forma nativa nos processadores da Huawei.

Se a política americana de sanções apostava em sufocar a inteligência artificial chinesa cortando o acesso às placas da Nvidia, o resultado prático foi o oposto. A restrição forçou a criação de uma infraestrutura autossuficiente. O analista Lian Jye Su, da Omdia, verificou os dados e atestou: o desempenho dos modelos no hardware da Huawei já empata com os números registrados nas GPUs da Nvidia. Em setembro do ano anterior, a [empresa já havia sinalizado que descartaria o hardware americano](https://desbugados.com.br/post/2025/09/01/guerra-dos-chips-ia-chinesa-deepseek-manda-recado-e-diz-que-nao-precisa-mais-da-nvidia). Agora, entregou a prova material de sua capacidade técnica.

## Se há limite de hardware, a lógica exige duas versões

A DeepSeek dividiu o lançamento em duas frentes operacionais. Temos a versão Pro e a versão Flash. A versão Pro mira no topo do mercado. Ela compete em tarefas complexas de raciocínio lógico e programação com modelos fechados como o Gemini 3.1 Pro, do Google, e o GPT-5.4, da OpenAI. A versão Flash sacrifica parte desse conhecimento de mundo para ser mais leve. Ambas possuem uma janela de contexto de 1 milhão de tokens.

**Desbugando o jargão:** ter 1 milhão de tokens significa que o sistema consegue processar cerca de 750 mil palavras de uma só vez no prompt. É o equivalente a carregar dez livros inteiros de 300 páginas e pedir para a máquina extrair e cruzar as informações dessas obras na mesma pergunta.

A existência da versão Flash tem uma justificativa matemática e de suprimentos. A [empresa estruturou uma opção comercial acessível](https://desbugados.com.br/post/2026/04/25/deepseek-lanca-novo-modelo-de-inteligencia-artificial-focado-em-ser-potente-e-muito-mais-barato-que-os-rivais) porque operar a versão Pro ainda custa até 12 vezes mais caro. Esse abismo de preço acontece porque a fabricação de chips na China ainda enfrenta limites de volume. A Huawei confirmou que o V4 roda integralmente em seus clusters Ascend supernode e que o hardware local já serviu para treinar a base da versão Flash. O gargalo mudou do desenvolvimento de software para a linha de montagem das fábricas asiáticas.

## A Caixa de Ferramentas

Para desenvolvedores de tecnologia, a movimentação da DeepSeek cria uma rota alternativa ao controle de preços praticado por OpenAI e Google. Se você desenvolve aplicações baseadas em inteligência artificial, comece a testar as APIs da versão Flash para tarefas de rotina, que exigem menos abstração, mas demandam execução rápida e barata. A fabricante chinesa cravou no documento de lançamento que os custos operacionais do V4 Pro vão cair a partir do segundo semestre de 2026. A previsão de queda de preço acompanha o exato momento em que a Huawei agendou a produção em massa da nova geração do processador Ascend 950.