【美今詩歌集】【作者:童驛采】1999年~2020年 |訪問首頁|
『墨龍』 畫堂 |

【墨聯字畫】

 找回密碼
 註冊發言
搜索
查看: 39|回復: 0

DeepSeek前脚发新论文,奥特曼立马跟上

[複製鏈接]

53

主題

0

回帖

252

積分

中級會員

Rank: 3Rank: 3

積分
252
發表於 2025-4-5 17:44:10 | 顯示全部樓層 |閱讀模式
这不DeepSeek前脚刚刚上新了一篇关于推理时Scaling Law的论文嘛,引得大家纷纷联想是不是R2马上要来了。
然鹅……奥特曼这边却发了一条“变卦”的消息:
现在真的是DeepSeek这边一有点声响,OpenAI那边就得有点动作来紧跟一下了。
在这个小插曲之后呢,我们还是把目光聚焦在DeepSeek这篇新论文身上。
这篇论文的名字叫做Inference-Time Scaling for Generalist Reward Modeling,由DeepSeek和清华大学共同提出黑料网-独家爆料

您需要登錄後才可以回帖 登錄 | 註冊發言

本版積分規則

Archiver|手機版|小黑屋|【墨聯字畫】

GMT+8, 2025-5-19 08:55 , Processed in 0.088864 second(s), 19 queries .

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回復 返回頂部 返回列表