Estratégia inovadora da DeepSeek para contornar as limitações do CUDA

187
Ao desenvolver modelos grandes, a DeepSeek adotou uma estratégia inovadora de ir diretamente para o nível PTX, obtendo controle de hardware subjacente mais preciso e computação eficiente. Essa estratégia foi elogiada pela mídia como um "avanço para contornar as limitações do CUDA" e forneceu novas ideias de otimização para a indústria de IA.