【美今詩歌集】【作者:童驛采】1999年~2020年 |訪問首頁|
『墨龍』 畫堂 |

【墨聯字畫】

 找回密碼
 註冊發言
搜索
查看: 12|回復: 0

树莓派上流畅运行大模型

[複製鏈接]

54

主題

0

回帖

257

積分

中級會員

Rank: 3Rank: 3

積分
257
發表於 2025-4-26 19:24:55 | 顯示全部樓層 |閱讀模式
量子位:介绍一下RockAI的创立背景吧,当时为什么选择做非Transformer架构?黑料不打烊
刘凡平:RockAI成立的工商登记的时间是2023年6月,但其实我们很多年前就在做这些事情了,当时ChatGPT还没有火。
我最早在2016、2017年研究Attention机制时就认识到Transformer存在很多问题。2022年初创业时,我们就坚定走非Transformer路线,主要是因为意识到Transformer又耗算力又耗数据。黑料
在此之前,我们其实也探索过Transformer架构的优化方向,做了线性Attention等改进,但发现这些都没有解决根本问题,所以索性放弃,直接走非Transformer这条路。

您需要登錄後才可以回帖 登錄 | 註冊發言

本版積分規則

Archiver|手機版|小黑屋|【墨聯字畫】

GMT+8, 2025-5-19 20:40 , Processed in 0.092943 second(s), 20 queries .

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回復 返回頂部 返回列表