财联社
财经通讯社
打开APP
15:44:33【李飞飞团队训练出媲美DeepSeek R1的推理模型 云计算费用不到50美元】
《科创板日报》6日讯,李飞飞等斯坦福大学和华盛顿大学研究人员近日以不到50美元的云计算费用训练了一个名叫s1的人工智能推理模型。该模型在数学和编码能力测试中的表现与OpenAI的o1和DeepSeek的R1等尖端推理模型类似。
研究人员表示,s1使用通过蒸馏法由Gemini Thinking Experimental模型提炼出来的1000个样本小型数据集,对Qwen2.5-32B-Instruct模型进行监督微调。使用16个英伟达H100 GPU进行了26分钟的训练。
小K注:“不到50美元”仅为云计算服务费用,不包括服务器、显卡等硬件投入费用,因这部分已经由云厂商承担。 (TechCrunch)
人工智能 TMT行业观察
财联社声明:文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。
2025-02-06 15:44:33 1374614 阅读
商务合作
专栏
相关阅读
评论
热度
最新
发送