欧美本精品男人aⅴ天堂_亚洲精品久久久蜜桃_国产精品资源网_亚洲精品在线观看网站

您當前的位置 :創(chuàng)業(yè) >
聯想將單臺服務器運行大模型性能推向新高
2025-03-18 13:38:38   來源:中國經濟網  分享 分享到搜狐微博 分享到網易微博

近日,聯想宣布旗下首款AMD AI大模型訓練服務器聯想問天WA7785a G3在單機部署671B(滿血版) DeepSeek大模型時,可實現極限吞吐量6708token/s,將單臺服務器運行大模型的性能推向了新高。

據悉,依托聯想萬全異構智算平臺,聯想通過訪存優(yōu)化、顯存優(yōu)化、PCIe 5.0全互聯架構創(chuàng)新以及精選SGLang框架中性能最優(yōu)算子等諸多創(chuàng)新方式,對大模型從預訓練、后訓練到推理的全流程進行持續(xù)優(yōu)化,在單臺部署DeepSeek 671B大模型的聯想問天WA7785a G3上實測最高吞吐量達6708 token/s。

在模擬問題對話場景(上下文序列長度128/1K)時,最高可支持并發(fā)數158,TPOT 93毫秒, TTFT 2.01秒;而在模擬代碼生成(上下文序列長度512/4K )時,并發(fā)數可達140,TPOT 100毫秒, TTFT 5.53秒。意味著單臺聯想問天WA7785a G3可以支撐1500人規(guī)模企業(yè)的正常使用,是繼聯想問天WA7780 G3服務器單機部署滿血版DeepSeek大模型總吞吐量突破2500 token/s之后,單機部署該大模型推理性能的又一次突破。

此次突破是聯想中國基礎設施業(yè)務群、聯想研究院ICI實驗室和AMD聯合設計、協(xié)同調優(yōu)、共同實現的。此結果也并非最終結果,聯想與AMD還在持續(xù)嘗試深度調優(yōu)新方法,實現更高調優(yōu)突破。

關鍵詞:


[責任編輯:ruirui]





關于我們| 客服中心| 廣告服務| 建站服務| 聯系我們
 

中國焦點信息網 版權所有 滬ICP備2022005074號-20,未經授權,請勿轉載或建立鏡像,違者依法必究。
 

主站蜘蛛池模板: 久久久天堂国产精品女人| 久久精品国产电影| 欧美日韩精品中文字幕一区二区| 国产精品91在线| 国产传媒久久久| 久久本道综合色狠狠五月| 一区二区三区欧美在线| 国产精品视频久久久| 日韩在线视频观看正片免费网站| 国产精品免费久久久久久| 欧美日韩国产va另类| 91国偷自产一区二区三区的观看方式| 日韩视频中文字幕| 婷婷亚洲婷婷综合色香五月| 99九九视频| 99久久99| 91精品国产91久久久久福利| 国产精品av免费观看| 国模精品娜娜一二三区| 国产又粗又爽又黄的视频| 久久精品美女| 久久99九九| 国产精品香蕉av| 日本视频一区二区不卡| 日本成人中文字幕在线| 欧美日韩视频在线一区二区观看视频| 日本国产高清不卡| 久久偷窥视频| 久久99久久99精品| 国产精品爽爽爽| 国产精品第一视频| 一区中文字幕在线观看| 日韩中文字幕av| 日本亚洲欧洲精品| 久久久久久久国产精品视频| 激情五月开心婷婷| 成人免费网站在线| 天天人人精品| 久久五月天综合| 国产免费一区视频观看免费| 久久久久亚洲精品国产|