在(zai)江苏(su)省南京市中国(guo)电(dian)信吉山(shan)数(shu)(shu)据(ju)中心(xin),一(yi)辆(liang)(liang)白色(se)的大(da)型卡(ka)车吸(xi)引了众多来(lai)访者的注意,然(ran)而(er)这(zhei)辆(liang)(liang)看(kan)似普通的卡(ka)车却(que)内藏乾坤(kun),蕴含(han)大(da)量智能(neng)(neng)算力。这(zhei)辆(liang)(liang)车名为(wei)“智能(neng)(neng)算力车”,由(you)中国(guo)电(dian)信联合(he)烽火(huo)通信打造(zao),以满足客(ke)户数(shu)(shu)据(ju)不出域、灵(ling)活训(xun)练大(da)模(mo)型的算力需求(qiu),实(shi)现全国(guo)调度、随用(yong)随到、安全可靠。
“智能算力车”创新概念由中国电信首次提出,顾名思义是将计算资源整合至车载平台,搭建算力网络,通过对算力资源的有序调度来满足数据敏感类客户在特定场景下,对高安全性、高私密性、快速部署的算力任务需求,为用户提供便捷高效的移动计算能力服务。
烽火通信承(cheng)接了(le)“智能算(suan)力车”集装箱微模块部(bu)分的(de)设计、制(zhi)造及(ji)(ji)交付(fu)。单体(ti)移动(dong)算(suan)力车搭载了(le)8台烽火FitSever G440K V2高性能训练服务(wu)(wu)器(qi),每台设备配备了(le)8张高性能训练卡(ka),通过底层(ceng)交换架构实现多(duo)卡(ka)互联,充分加速中小型(xing)规模的(de)模型(xing)训练任务(wu)(wu)。同(tong)时,车内(nei)还集成(cheng)了(le)配电和(he)UPS两大(da)模块,以及(ji)(ji)制(zhi)冷(leng)和(he)监控(kong)两大(da)系统(tong),全(quan)方位(wei)为(wei)算(suan)力车内(nei)外(wai)部(bu)提(ti)供动(dong)能支持和(he)状态监控(kong),保障稳定(ding)运行。
相较(jiao)传(chuan)统(tong)机房高(gao)额(e)的(de)建设投入、漫(man)长的(de)建设周期(qi)(qi)与复杂的(de)后期(qi)(qi)维护(hu),“智能算力车”具有灵活部署、安全可靠、便捷省(sheng)心的(de)特点,并具备独立节(jie)点与集群组(zu)网(wang)两种(zhong)解决方案。
在独立节(jie)点方案(an)下,以(yi)一组算力车为完整计算单元(yuan),基本十天左右可完成特(te)定行业的模型训练任务,做到(dao)完全物(wu)理隔(ge)离,保障用户数据的私密性和安全性;同(tong)时对环境要(yao)求低,仅需(xu)提(ti)供车辆(liang)停放场地(di)和自来水水源,即(ji)停即(ji)用,同(tong)城(cheng)可实现(xian)24小(xiao)时内部(bu)署(shu)完成,本省异地(di)城(cheng)市区域隔(ge)日抵达(da),支(zhi)持全国调度。
在(zai)多(duo)(duo)车(che)集群(qun)组网方案下,采(cai)用Spine-Leaf架构,实(shi)现多(duo)(duo)车(che)算(suan)力(li)(li)互联(lian),支持中大(da)型(xing)模(mo)型(xing)的训练任务,集群(qun)扩展能力(li)(li)可(ke)弹性伸缩,客户可(ke)根据需求灵活增(zeng)减算(suan)力(li)(li)规(gui)模(mo)。
近日,“智能算力(li)车”解决方案(an)首(shou)次(ci)在江苏落地,随后(hou)将驶往雄(xiong)安(an)电信数据中心(xin)开展交通大模型(xing)训练。
烽火(huo)通信将(jiang)携手中国电信,持(chi)续(xu)深(shen)化算力(li)车(che)功能定(ding)制与开(kai)发(fa)适(shi)配层面(mian)(mian)的(de)合(he)作(zuo),共同推动其在应急通信、重大工(gong)程外场保(bao)障(zhang)方面(mian)(mian)的(de)应用,并(bing)坚(jian)持(chi)技术(shu)创新,不断探索多车(che)互联、训推一体等方案从试点到(dao)规模商用。