DeepSeek-R1推理腹地跑,7GB GPU体验啊哈时刻?GitHub超2万星
2025-02-11剪辑:KingHZ Aeneas 【新智元导读】黑科技来了!开源LLM微调神器Unsloth近期更新,将GRPO历练的内存使用减少了80%!只需7GB VRAM,腹地就能体验AI「啊哈时刻」。 李飞飞团队仅用16张H100训了26分钟,训出的模子就杰出了o1-preview,摇荡业内。 不错说,DeepSeek-R1依然让环球AI模子走向了推理新期间。 甚而期骗其历练重要GRPO,AI开源界动手了竞赛:看谁能用最少的资本,复现AI的「啊哈时刻」。 而就在刚刚,DeepSeek-R1的推理资本澈