李飛飛等斯坦福大學(xué)和華盛頓大學(xué)研究人員近日以不到50美元的云計(jì)算費(fèi)用訓(xùn)練了一個名叫s1的人工智能推理模型。該模型在數(shù)學(xué)和編碼能力測試中的表現(xiàn)與OpenAI的o1和DeepSeek的R1等尖端推理模型類似。
研究人員表示,s1是通過蒸餾法由谷歌推理模型Gemini 2.0 Flash Thinking Experimental提煉出來的,使用16個英偉達(dá)H100 GPU進(jìn)行了26分鐘的訓(xùn)練。
小K注:“不到50美元”僅為云計(jì)算服務(wù)費(fèi)用,不包括服務(wù)器、顯卡等硬件投入費(fèi)用,因這部分已經(jīng)由云廠商承擔(dān)。
{{item.content}}