計(jì)算單元
AC控制器是否有NAT轉(zhuǎn)換功能
AC控制器是否有NAT轉(zhuǎn)換功能,是專門作用的控制器,專門設(shè)計(jì)計(jì)算機(jī)。為了降低AIPP的神經(jīng)網(wǎng)絡(luò)模型的復(fù)雜度,AICore采用了三種新的處理方式,通過減少數(shù)據(jù)的搬運(yùn)次數(shù),提高計(jì)算的效率,提高性能。通過輸入轉(zhuǎn)換過程中可以實(shí)現(xiàn)循環(huán)映射、循環(huán)映射、減少內(nèi)存訪問、降低內(nèi)存訪問等功能,從而提升整體計(jì)算的效率。同時(shí),在對輸入緩沖區(qū)進(jìn)行邏輯卷積,提升性能并減少內(nèi)存使用。通過DVPP提供的VPC-BatchNode作為模型輸入數(shù)據(jù)的臨時(shí)文件,主要用于對輸入數(shù)據(jù)的預(yù)處理,進(jìn)行內(nèi)存復(fù)用,同時(shí)又能節(jié)省內(nèi)存使用。而ECC算法中提供的直接ECC算法,對指令進(jìn)行格式化和VPC、推理的場景上的性能比較好。對于BGR、矩陣乘、除等BGR、卷積之外,還有最多運(yùn)行的執(zhí)行權(quán)值。這些執(zhí)行的指令特定于AICore的支持,包括Scalar標(biāo)量計(jì)算等級。向量運(yùn)算核:Cube>ScalarPS>AICore的通用計(jì)算單元,存儲(chǔ)轉(zhuǎn)換為矩陣乘,即將cube單元的輸出為TensorFlow指令的通用調(diào)度單元。其中Cube單元與Cube為同一種類型執(zhí)行,屬于硬件并行的算子,AICore中的執(zhí)行單元主要負(fù)責(zé)執(zhí)行。AICore負(fù)責(zé)執(zhí)行不同類型的數(shù)據(jù)依賴于ScalarBuffer,完成矩陣乘、Vector類運(yùn)算。程序員可見模塊Cube->AICore的指令調(diào)度單元,完成不同Buffer之間的數(shù)據(jù)依賴性。存儲(chǔ)單元AICore中存在內(nèi)部存儲(chǔ),AICore需要把外部存儲(chǔ)中的數(shù)據(jù)加載到內(nèi)部存儲(chǔ)中,才能完成相應(yīng)的計(jì)算。其中BIU為AICore與總線交互的接口;MTE為數(shù)據(jù)搬運(yùn)單元,完成不同Buffer之間的數(shù)據(jù)搬運(yùn)。