開箱即用!DeepSeek+浪潮云帆超融合一體機(jī)強(qiáng)勢(shì)來(lái)襲

  行業(yè)動(dòng)態(tài)     |      2025-02-24 11:00:14


上個(gè)月,DeepSeek發(fā)布了最新開源模型R1,憑借其高性能、低成本的模型特點(diǎn),再次引發(fā)全球用戶與開發(fā)者的廣泛關(guān)注。但在實(shí)際應(yīng)用中,用戶在本地接入DeepSeek時(shí),面臨算力基礎(chǔ)設(shè)施缺失、模型服務(wù)性能不足等眾多挑戰(zhàn)。為此,浪潮企業(yè)云精準(zhǔn)聚焦用戶核心痛點(diǎn),重磅推出集成DeepSeek的浪潮云帆超融合一體機(jī)(智算型-7000 G3),為各行各業(yè)踴躍投身智能浪潮提供強(qiáng)勁動(dòng)力。



開箱即用!提供極致性能體驗(yàn)

浪潮云帆超融合一體機(jī)能夠?yàn)橛脩籼峁牡讓铀懔?、模型服?wù)、推理能力到應(yīng)用開發(fā)的全棧解決方案,實(shí)現(xiàn)模型服務(wù)的本地化部署,打造“開箱即用”的極致體驗(yàn)。

圖片.png

而此次重磅推出的浪潮云帆超融合一體機(jī)(DeepSeek版)將云帆超融合系統(tǒng)、GPU算力與DeepSeek-R1模型進(jìn)行深度融合,為DeepSeek-R1的運(yùn)行提供了本地化穩(wěn)若磐石的算力供給與極致性能。

       
靈活選型!構(gòu)建企業(yè)智能中樞

為滿足用戶從復(fù)雜決策到高并發(fā)交互的全場(chǎng)景需求,浪潮企業(yè)云打造的浪潮云帆超融合一體機(jī)(DeepSeek版)支持從DeepSeek-R1滿血版(671B參數(shù))到輕量化蒸餾版的靈活部署。

滿血版(671B參數(shù)):性能強(qiáng)大、數(shù)據(jù)安全與隱私性程度高、服務(wù)穩(wěn)定性和自主性強(qiáng)。在部署DeepSeek-R1 671B滿血版的場(chǎng)景中,可采用5臺(tái)滿配浪潮云帆超融合一體機(jī),單臺(tái)搭載八張顯存為48G的GPU,共計(jì)可提供1920G顯存,能夠滿足用戶在實(shí)際業(yè)務(wù)場(chǎng)景中對(duì)大模型穩(wěn)定運(yùn)行的需求,確保 DeepSeek-R1 671B版本在復(fù)雜業(yè)務(wù)環(huán)境下的穩(wěn)定、高效運(yùn)行。

蒸餾版:模型輕量、推理效率高、性價(jià)比高。在企業(yè)級(jí)應(yīng)用的常規(guī)智能問(wèn)答系統(tǒng)、內(nèi)容生成平臺(tái)等場(chǎng)景中,推薦搭載14B或32B參數(shù)的模型,單臺(tái)浪潮云帆超融合一體機(jī)(僅使用兩張顯存48G GPU卡,總顯存96G)即可滿足模型搭建需求,具備處理文本生成、簡(jiǎn)單問(wèn)答等基礎(chǔ)任務(wù)的能力,也具備一定的復(fù)雜問(wèn)答和知識(shí)推理能力。

浪潮企業(yè)云打造的浪潮云帆超融合一體機(jī),讓用戶可以充分體驗(yàn)智能時(shí)代高性能大模型的獨(dú)特價(jià)值,擺脫繁瑣的基礎(chǔ)性構(gòu)建工作,專注于使用AI技術(shù)創(chuàng)造實(shí)際價(jià)值。未來(lái),浪潮企業(yè)云將持續(xù)重點(diǎn)打造軟硬結(jié)合的行業(yè)智能體,將復(fù)雜的開發(fā)流程轉(zhuǎn)化為標(biāo)準(zhǔn)化產(chǎn)品,為用戶定制“云+AI”的數(shù)智化解決方案,攜手合作伙伴,共建云帆聯(lián)盟,支撐行業(yè)數(shù)字化轉(zhuǎn)型,助力數(shù)字中國(guó)建設(shè)。


敲重點(diǎn)!全尺寸模型知識(shí)科普

DeepSeek-R1系列模型涵蓋了從輕量級(jí)到超大規(guī)模的多個(gè)版本,適用于不同的應(yīng)用場(chǎng)景。了解各版本在不同量化精度下的顯存和內(nèi)存需求,有助于用戶選擇適合自身硬件配置的模型服務(wù)。

圖片.png

全尺寸模型的顯存與內(nèi)存占用估算

DeepSeek-R1系列涵蓋了從輕量1.5B 到超大規(guī)模 671B 參數(shù)的不同層次模型。參數(shù)規(guī)模越大,對(duì)硬件的要求則越高,顯存需求也呈指數(shù)級(jí)增長(zhǎng)。1.5B - 14B 參數(shù)的版本適用于個(gè)人輕量任務(wù),32B - 70B參數(shù)的版本面向企業(yè)級(jí)復(fù)雜任務(wù),671B參數(shù)的滿血版本則為大規(guī)模研究專用。

小型模型(如 1.5B - 8B):一般情況下,對(duì)顯卡要求不高,甚至僅使用CPU也可推理;若要使用顯卡,推薦16GB 顯存的版本,可處理文本摘要、翻譯等中等復(fù)雜度的自然語(yǔ)言處理任務(wù)。

中型模型(如 14B - 32B):14B 模型推薦使用28GB顯存的顯卡;32B模型則至少需要64GB顯存的顯卡,適用于多模態(tài)任務(wù)預(yù)處理等高精度專業(yè)領(lǐng)域。

大型模型(如 70B - 671B):70B 模型需多卡并行;671B 模型則需多節(jié)點(diǎn)分布式部署,適用于超大規(guī)模研究或通用人工智能探索。