小米大模型提效新框架训练最高提速%推理最高提速%!之父合作出品
-
小米大模型提效新框架:训练最高提速%,推理最高提速%!之父合作出品
小米AI实验室投稿量子位|公众号QbitAI大模型推理速度提升50%以上,还能保证少样本学习性能!小米大模型团队提出SUBLLM(Subsampling-Upsampling-BypassLargeLanguageModel),国际AI语音大牛、开源语音识别工具Kaldi之父DanielPovey也参与指导。与Llama等模型相比,SUBLLM在训练和推理速度以及降低内存方面都有了显著提升。在大模型训练中,SUBLLM的速度提高了26%,每个GPU的内存减少了10GB。在推理中,它的速度提高了37%,每个GPU的内...