簡(jiǎn)述:如果說您想要托管很多臺(tái)服務(wù)器的話,就可以選擇機(jī)柜租用。IDC機(jī)柜的租賃成本與機(jī)房的硬件設(shè)施水平直接相關(guān)。
百舸一體機(jī)搭載了百舸異構(gòu)計(jì)算平臺(tái),擁有不少硬核產(chǎn)品能力。它能高效管理異構(gòu)資源,提供豐富的資源調(diào)度策略,具備全方位的故障感知與容錯(cuò)機(jī)制,還能實(shí)現(xiàn)極致的存訓(xùn)推一體化加速,以及便捷的多芯適配和業(yè)務(wù)遷移。面向政務(wù)、金融、能源、教育等行業(yè)客戶,它能端到端提供芯片、框架、模型、應(yīng)用的軟硬一體解決方案,而且可以平滑地從單機(jī)擴(kuò)展至大規(guī)模集群。
百舸一體機(jī)產(chǎn)品架構(gòu)
百舸一體機(jī)融合了資源調(diào)度、多芯異構(gòu)、訓(xùn)推加速等多項(xiàng)異構(gòu)算力管理能力,能實(shí)現(xiàn)從模型訓(xùn)練、推理到多角色協(xié)作的全生命周期AI任務(wù)管理。它兼容市場(chǎng)上的主流大模型,像DeepSeek、Llama、Qwen等都不在話下,并且針對(duì)軟硬件進(jìn)行了深度優(yōu)化,大大提升了資源利用率和業(yè)務(wù)迭代效率。具體來看,基礎(chǔ)設(shè)施層支持NVIDIA、昆侖芯等AI加速卡,也兼容CentOS、Ubuntu、麒麟等系統(tǒng);平臺(tái)組件層整合了容器引擎、鏡像管理、BCCL通信庫、AIAK加速套件、AI組件及算力池化技術(shù);能力中心層則提供用戶權(quán)限管理、多形態(tài)資源調(diào)度、大規(guī)模訓(xùn)練任務(wù)管理、彈性模型部署及自動(dòng)化運(yùn)維等功能。
百舸一體機(jī)適用場(chǎng)景
在模型彈性化托管方面,它能提供靈活的模型托管服務(wù),支持模型彈性伸縮,以適應(yīng)不同規(guī)模的業(yè)務(wù)需求。在訓(xùn)練推理加速上,通過算子優(yōu)化,能顯著提升模型訓(xùn)練和推理的速度。對(duì)于資源利用率提升,它提供多種資源調(diào)度策略,確保資源高效分配和使用,幫助企業(yè)降低成本。輕量快速交付也是其一大優(yōu)勢(shì),通過容器化和輕量級(jí)部署,能實(shí)現(xiàn)快速交付和上線,縮短業(yè)務(wù)迭代周期,同時(shí)還提供從單機(jī)到集群的平滑擴(kuò)展方案。
百舸一體機(jī)擴(kuò)展方案
有一體機(jī)擴(kuò)展方案和高可用方案可供選擇。一體機(jī)擴(kuò)展方案適用于已交付百舸DeepSeek一體機(jī)的客戶,無需重新部署就能擴(kuò)展異構(gòu)算力資源,包括高性能存儲(chǔ)、高性能網(wǎng)絡(luò)。其優(yōu)勢(shì)在于,單機(jī)使用后,企業(yè)可根據(jù)實(shí)際業(yè)務(wù)場(chǎng)景逐步增加資源,計(jì)算、網(wǎng)絡(luò)、存儲(chǔ)都能根據(jù)需求彈性擴(kuò)展,相對(duì)靈活簡(jiǎn)便。高可用方案則面向完整建設(shè)異構(gòu)計(jì)算平臺(tái)的企業(yè),能提供管控面高可用、一體化網(wǎng)絡(luò)及存儲(chǔ)(并行文件存儲(chǔ)、對(duì)象存儲(chǔ))等能力,還可對(duì)接鏡像中心等客戶自有平臺(tái)。該方案的優(yōu)勢(shì)是提供全功能、高可用的完整版產(chǎn)品功能,能一次性滿足小、中、大規(guī)模異構(gòu)資源管理建設(shè)訴求。
百舸一體機(jī)還有昆侖版和NV版兩個(gè)版本。昆侖版支持訓(xùn)練推理全場(chǎng)景,算力采用“Intel/海光4號(hào)CPU+百度自研的昆侖芯P800加速卡模組”,集成了5大組件技術(shù),支撐7大能力中心。它深度適配DeepSeek V3&R1及蒸餾模型,提供友好的用戶界面及多種部署訪問方式,交付上線快,能加速客戶AI應(yīng)用落地,其預(yù)置功能包括資源中心(根據(jù)任務(wù)需求智能分配算力、存儲(chǔ)等資源)、用戶中心(提供自定義用戶、角色方便組織管理)、運(yùn)維中心(提供豐富的可觀測(cè)指標(biāo)及多維度事件統(tǒng)計(jì))、訓(xùn)練任務(wù)(提供針對(duì)模型的訓(xùn)練、微調(diào)及加速能力)、模型部署(提供靈活、便捷的模型部署及加速能力)、聯(lián)網(wǎng)搜索(提供輕量化聯(lián)網(wǎng)搜索能力對(duì)接)等。
NV版同樣支持訓(xùn)練推理全場(chǎng)景,算力采用“Intel+4/8張Nvidia H20/L20 GPU卡加速卡”,也集成了5大組件技術(shù),支撐7大能力中心,并且深度適配DeepSeek V3&R1及蒸餾模型,提供友好的用戶界面及多種部署訪問方式,交付上線快,能加速客戶AI應(yīng)用落地。
騰佑科技是百度云服務(wù)中心,有需求可以咨詢我們,為您提供行業(yè)一體解決方案,價(jià)格優(yōu)惠,詳情留言咨詢。
鄭州騰佑科技有限公司(以下簡(jiǎn)稱“騰佑科技”)成立于2009年, 總部位于鄭州,是 一家致力于互聯(lián)網(wǎng)服務(wù)業(yè)的高新技術(shù)企業(yè),公司主營業(yè)務(wù)以互聯(lián)網(wǎng)數(shù)據(jù)中心、云計(jì)算、人 工智能、軟件開發(fā)、安全服務(wù)“互聯(lián)網(wǎng)+”行業(yè)解決方案及行業(yè)應(yīng)用等相關(guān)業(yè)務(wù)。
售前咨詢熱線:400-996-8756
備案提交:0371-89913068
售后客服:0371-89913000
搜索詞
熱門產(chǎn)品推薦