日本高清免费一本视频100禁_在线不卡欧美精品一区二区三区_国产一区二区好的精华液_中文综合在线_国产啊啊啊视频在线观看_大地资源网免费观看高清

IT之道-艾銻知道

您當(dāng)前位置: 主頁 > IT服務(wù) > 服務(wù)器服務(wù) >

IT服務(wù)器運(yùn)維教你選擇異構(gòu)服務(wù)器的基本原則


2020-04-09 17:24 作者:艾銻無限 瀏覽量:

IT服務(wù)器運(yùn)維 | 選擇異構(gòu)服務(wù)器的基本原則


 
日常我們?cè)谶M(jìn)行一些服務(wù)器架構(gòu)的選型階段會(huì)根據(jù)項(xiàng)目解決方案要求來選擇不同配置的異構(gòu)服務(wù)器來實(shí)現(xiàn)需求。不同類型AI服務(wù)器之比較分析,通過下面這張二維圖中我們可以對(duì)不同架構(gòu)的服務(wù)器進(jìn)行簡單的比較。

 

 
首先看下不同類型AI服務(wù)器的比較,從左上方到右下角依次是CPU、GPU、FPGA、TPU、ASIC,從橫軸來看,越往右性能(Performance)越好。縱軸Programmability/Flexibility是指服務(wù)器的可編程性和靈活性, ASIC的性能最好,因?yàn)樗菍⑺惴ü袒谛酒?,算法是比較固定的,所以它的性能最好的,但是它的編程性和靈活性就相對(duì)比較弱。而CPU的靈活性和編程性最好,但性能最弱。總的來說,GPU的靈活性比CPU弱,但它的性能更好。往下依次是FPGA、TPU以及ASIC。在實(shí)際選擇時(shí)需要考慮到功耗、成本、性能、實(shí)時(shí)性等各方面因素,尤其是一些具有專用目的的處理器,如果算法已經(jīng)固化并且很簡單,可以考慮ASIC,因?yàn)锳SIC性能好且功耗低。如果是在訓(xùn)練或者通用情況下,GPU則是更好的選擇。

選擇GPU服務(wù)器的基本原則

在介紹選擇GPU服務(wù)器的基本原則之前,先來跟大家介紹下常見的GPU和GPU服務(wù)器。常見的GPU,按總線接口類型可以分為NV-Link接口、傳統(tǒng)總線接口以及傳統(tǒng)PCI-e總線三種。NV-Link接口類型的GPU典型代表是NVIDIA V100,采用SXM2接口,在DGX-2上有SXM3的接口。NV-Link總線標(biāo)準(zhǔn)的GPU服務(wù)器可以分為兩類,一類是NVIDIA公司設(shè)計(jì)的DGX超級(jí)計(jì)算機(jī),另一類是合作伙伴設(shè)計(jì)的NV-Link接口的服務(wù)器。DGX超級(jí)計(jì)算機(jī)不僅僅提供硬件,還有相關(guān)的軟件和服務(wù)。傳統(tǒng)總線接口的GPU,目前主流的有這幾款產(chǎn)品,比如采用了PCI-e接口的V100、 P40(P開頭指的是上一代PASCAL架構(gòu))和P4,以及最新的圖靈架構(gòu)T4等。其中比較薄和只占一個(gè)槽位的P4和T4,通常用于Inference,目前也已經(jīng)有成熟的模型進(jìn)行推理和識(shí)別。傳統(tǒng)PCI-e總線的GPU服務(wù)器也分為兩類,一類是OEM服務(wù)器,比如曙光、浪潮、華為等其他國際品牌;另一類是非OEM的服務(wù)器,也包括很多種類。選擇服務(wù)器時(shí)除了分類,還要考慮性能指標(biāo),比如精度、顯存類型、顯存容量以及功耗等,同時(shí)也會(huì)有一些服務(wù)器是需要水冷、降噪或者對(duì)溫度、移動(dòng)性等等方面有特殊的要求,就需要特殊的服務(wù)器。選擇GPU服務(wù)器時(shí)首先要考慮業(yè)務(wù)需求來選擇適合的GPU型號(hào)。在HPC高性能計(jì)算中還需要根據(jù)精度來選擇,比如有的高性能計(jì)算需要雙精度,這時(shí)如果使用P40或者P4就不合適,只能使用V100或者P100;同時(shí)也會(huì)對(duì)顯存容量有要求,比如石油或石化勘探類的計(jì)算應(yīng)用對(duì)顯存要求比較高;還有些對(duì)總線標(biāo)準(zhǔn)有要求,因此選擇GPU型號(hào)要先看業(yè)務(wù)需求。GPU服務(wù)器人工智能領(lǐng)域的應(yīng)用也比較多。在教學(xué)場景中,對(duì)GPU虛擬化的要求比較高。根據(jù)課堂人數(shù),一個(gè)老師可能需要將GPU服務(wù)器虛擬出30甚至60個(gè)虛擬GPU,因此批量Training對(duì)GPU要求比較高,通常用V100做GPU的訓(xùn)練。模型訓(xùn)練完之后需要進(jìn)行推理,因此推理一般會(huì)使用P4或者T4,少部分情況也會(huì)用V100。當(dāng)GPU型號(hào)選定后,再考慮用什么樣GPU的服務(wù)器。這時(shí)我們需要考慮以下幾種情況:

第一、在邊緣服務(wù)器上需要根據(jù)量來選擇T4或者P4等相應(yīng)的服務(wù)器,同時(shí)也要考慮服務(wù)器的使用場景,比如火車站卡口、機(jī)場卡口或者公安卡口等;在中心端做Inference時(shí)可能需要V100的服務(wù)器,需要考慮吞吐量以及使用場景、數(shù)量等。

第二、需要考慮客戶本身使用人群和IT運(yùn)維能力,對(duì)于BAT這類大公司來說,他們自己的運(yùn)營能力比較強(qiáng),這時(shí)會(huì)選擇通用的PCI-e服務(wù)器;而對(duì)于一些IT運(yùn)維能力不那么強(qiáng)的客戶,他們更關(guān)注數(shù)字以及數(shù)據(jù)標(biāo)注等,我們稱這類人為數(shù)據(jù)科學(xué)家,選擇GPU服務(wù)器的標(biāo)準(zhǔn)也會(huì)有所不同。

第三、需要考慮配套軟件和服務(wù)的價(jià)值。

第四、要考慮整體GPU集群系統(tǒng)的成熟程度以及工程效率,比如像DGX這種GPU一體化的超級(jí)計(jì)算機(jī),它有非常成熟的從底端的操作系統(tǒng)驅(qū)動(dòng)Docker到其他部分都是固定且優(yōu)化過的,這時(shí)效率就比較高。


 

 
以上內(nèi)容由北京艾銻無限科技發(fā)展有限公司整理
 

相關(guān)文章

IT外包服務(wù)
二維碼 關(guān)閉
主站蜘蛛池模板: 阳谷县| 日土县| 甘德县| 满城县| 北票市| 密山市| 翁牛特旗| 融水| 鹤峰县| 尼勒克县| 读书| 婺源县| 福泉市| 彰武县| 衡阳县| 墨竹工卡县| 富源县| 滁州市| 类乌齐县| 扬中市| 江北区| 拉萨市| 盐池县| 苗栗市| 布尔津县| 唐海县| 铁岭县| 沁水县| 青阳县| 莲花县| 定陶县| 罗山县| 松溪县| 满洲里市| 承德县| 香港 | 中卫市| 海城市| 阿图什市| 中方县| 栾城县|