科技新突破 | DeepSeek登上《自然》封面

2025-09-18 10:58:48 來源: 科技日?qǐng)?bào) 點(diǎn)擊數(shù)：

9月17日，梁文鋒團(tuán)隊(duì)在《自然》雜志發(fā)表論文，介紹開源AI模型DeepSeek-R1采用的大規(guī)模推理模型訓(xùn)練方法。研究表明，通過純強(qiáng)化學(xué)習(xí)訓(xùn)練大規(guī)模推理模型，可有效提升大語言模型推理能力并降低人類輸入需求。該模型在數(shù)學(xué)、編程競(jìng)賽及STEM領(lǐng)域研究生水平任務(wù)中表現(xiàn)優(yōu)異，如數(shù)學(xué)基準(zhǔn)測(cè)試得分達(dá)77.9%（DeepSeek-R1-Zero）和79.8%（DeepSeek-R1）。模型以解決問題獲獎(jiǎng)勵(lì)機(jī)制強(qiáng)化學(xué)習(xí)，減少訓(xùn)練成本與復(fù)雜性。團(tuán)隊(duì)稱未來將聚焦優(yōu)化獎(jiǎng)勵(lì)過程以提高推理可靠性。

（科技日?qǐng)?bào)記者張夢(mèng)然岳靚）

責(zé)任編輯：李夢(mèng)一

網(wǎng)友評(píng)論

最熱評(píng)論

沒有更多評(píng)論了

科技新突破 | DeepSeek登上《自然》封面

友情鏈接

抱歉，您使用的瀏覽器版本過低或開啟了瀏覽器兼容模式，這會(huì)影響您正常瀏覽本網(wǎng)頁

您可以進(jìn)行以下操作:

1.將瀏覽器切換回極速模式

2.點(diǎn)擊下面圖標(biāo)升級(jí)或更換您的瀏覽器

3.暫不升級(jí)，繼續(xù)瀏覽

科技新突破 | DeepSeek登上《自然》封面

友情鏈接

抱歉，您使用的瀏覽器版本過低或開啟了瀏覽器兼容模式，這會(huì)影響您正常瀏覽本網(wǎng)頁

您可以進(jìn)行以下操作:

1.將瀏覽器切換回極速模式

2.點(diǎn)擊下面圖標(biāo)升級(jí)或更換您的瀏覽器

3.暫不升級(jí)，繼續(xù)瀏覽

抱歉，您使用的瀏覽器版本過低或開啟了瀏覽器兼容模式，這會(huì)影響您正常瀏覽本網(wǎng)頁

3.暫不升級(jí)，繼續(xù)瀏覽