虽然目前v4版本没有正式发布,但是根据最新的论文架构可以看出来,在原来的架构下要增加一个存储模块架构,以便节省gpu的重复计算工作。通俗来说就是把算好的结果加载到内存,gpu计算需要的话直接从内存中调取。从模型推理角度来说,后期模型使用需要配的内存容量可能会更大,GPU的内存压力减小,对更高性能的GPU需求减小。
目前deep seekv4还没有发布,散户对其认识还需要一个过程,假如deep se