O que é DeepSeek? Conheça IA chinesa que desafia gigantes da tecnologia global.

A DeepSeek, uma startup chinesa de inteligência artificial (IA), está no centro de um debate global sobre o futuro da tecnologia. Recentemente, seu assistente de IA ultrapassou o ChatGPT como o aplicativo mais bem avaliado na App Store dos Estados Unidos, enquanto seu modelo de IA, o DeepSeek-R1, desafia soluções líderes do mercado, como OpenAI e Meta, com custos muito mais baixos e eficiência que vem surpreendendo o mercado – e, consequentemente, afetando as ações de gigantes como Nvidia, Microsoft e Meta.

Veja, a seguir, tudo o que se sabe sobre a nova tecnologia.

O que é DeepSeek?

Fundada em 2023 na China, a DeepSeek começou como um braço de pesquisa da High-Flyer, um fundo quantitativo de US$ 8 bilhões. Desde então, tornou-se uma das startups de IA mais comentadas no mundo. Sua missão inicial era desenvolver modelos de IA eficientes com foco em pesquisa fundamental, em vez de buscar lucro imediato. Isso a diferencia de outras empresas que priorizam a comercialização rápida.

Os modelos de IA da DeepSeek, como o DeepSeek-R1, são projetados para lidar com tarefas complexas de raciocínio e já rivalizam com modelos como o OpenAI o1, segundo o Wall Street Journal. Apesar de usar chips de menor custo e enfrentar restrições de exportação dos EUA, a empresa conseguiu alcançar desempenho competitivo.

O que torna a DeepSeek única?

1. Custo e eficiência

A DeepSeek reduz drasticamente os custos de treinamento de seus modelos. Segundo a revista Nature, o DeepSeek-R1, por exemplo, foi treinado por aproximadamente US$ 6 milhões, enquanto modelos como o Llama 3.1 da Meta custaram mais de US$ 60 milhões para serem desenvolvidos.

2. Inovação tecnológica

A empresa adota estratégias como:

Reinforcement Learning (Aprendizado por Reforço): permite que os modelos aprendam por tentativa e erro.

Mixture-of-Experts Architecture (MoE): ativa apenas uma fração dos parâmetros do modelo para tarefas específicas, economizando recursos computacionais.

Multi-Head Latent Attention (MLA): melhora a capacidade dos modelos de processar dados e identificar padrões complexos.

3. Modelo open-weight

A startup adota um modelo parcialmente aberto, permitindo que pesquisadores acessem seus algoritmos. Isso democratiza o acesso à IA avançada e promove maior colaboração na comunidade global de pesquisa.

Quem está por trás da DeepSeek?

O fundador da DeepSeek é Liang Wenfeng, um gestor de hedge fund conhecido por sua atuação em tecnologia e finanças. Ao criar a startup, ele reuniu uma equipe jovem e talentosa, principalmente formada por recém-formados de universidades de elite chinesas, como Tsinghua e Peking. Essa abordagem permitiu à empresa cultivar uma cultura de inovação e explorar caminhos não convencionais no desenvolvimento de IA.

Em entrevista à publicação chinesa 36Kr, Wenfeng revelou que sua motivação para criar a DeepSeek foi científica, e não comercial. “O retorno financeiro imediato não era o objetivo; queríamos resolver os problemas mais difíceis do mundo”, disse ele.

O que esperar da DeepSeek no futuro?

Especialistas acreditam que a startup pode provocar uma revolução no mercado de IA, levando empresas estabelecidas a reduzir custos e buscar inovações mais sustentáveis. “O sucesso do DeepSeek mostra que eficiência e inovação podem ser tão importantes quanto poder bruto”, disse François Chollet, pesquisador em Seattle, à Nature, ressaltando o impacto geopolítico da DeepSeek no papel estratégico da IA na competição entre China e EUA.


Fonte: InfoMoney.

Postar um comentário

Postagem Anterior Próxima Postagem