技術(shù)
導(dǎo)讀:視覺物聯(lián)了解到,目前邊緣AI芯片架構(gòu)呈現(xiàn)多元化趨勢(shì),企業(yè)根據(jù)能效、算力、靈活性需求選擇不同方案,主要有GPU、NPU、ASIC、FPGA、RISC-V和存算一體等。
如果說深度學(xué)習(xí)是培育智能的土壤,那么大模型就是這片土壤中生長(zhǎng)出的參天大樹。
依托深度學(xué)習(xí)的算法根基,大模型通過海量數(shù)據(jù)灌溉和算力滋養(yǎng),將特征提取、模式識(shí)別等能力推向新維度,讓人工智能從“感知”邁向“認(rèn)知”新跨越。
隨著AI大模型不斷迭代升級(jí),特別是在2025年春節(jié)期間以DeepSeek為代表的大模型技術(shù)開源化,不僅大幅拓展了人工智能的應(yīng)用邊界,也為邊緣、端側(cè)AI應(yīng)用發(fā)展帶來顛覆性變革。
除市場(chǎng)應(yīng)用帶來變革之外,大模型也將對(duì)邊緣計(jì)算AI芯片的技術(shù)架構(gòu)、應(yīng)用場(chǎng)景和產(chǎn)業(yè)生態(tài)等方面進(jìn)行重構(gòu)。
那么,我們今天就來聊聊,邊緣AI芯片在大模型技術(shù)驅(qū)動(dòng)下將如何進(jìn)行產(chǎn)業(yè)升級(jí)。
視覺物聯(lián)了解到,目前邊緣AI芯片架構(gòu)呈現(xiàn)多元化趨勢(shì),企業(yè)根據(jù)能效、算力、靈活性需求選擇不同方案,主要有GPU、NPU、ASIC、FPGA、RISC-V和存算一體等。
其中,NPU因高能效占據(jù)主流,代表企業(yè)包括高通、瑞芯微、全志科技、恒玄科技、國科微和愛芯元智等。但因大模型運(yùn)算使得邊緣推理算力需求指數(shù)級(jí)攀升,傳統(tǒng)單核NPU架構(gòu)已無法滿足需求,企業(yè)開始紛紛創(chuàng)新升級(jí)。
例如,為解決傳統(tǒng)NPU芯片大模型推理效率不足問題,國科微創(chuàng)新提出MLPU芯片概念(面向多模態(tài)大模型的新型AI芯片架構(gòu)),既能高效支持大模型推理計(jì)算,同時(shí)兼容傳統(tǒng)小模型的高效推理。
據(jù)了解,國科微基于MLPU創(chuàng)新架構(gòu)設(shè)計(jì)的AI SoC產(chǎn)品,預(yù)計(jì)將于2026年開始逐步量產(chǎn)上市。該架構(gòu)具有高能效、低功耗、高性價(jià)比的特點(diǎn);相比于市面已有的NPU芯片,能夠更高效地支持大模型的端側(cè)部署和推理應(yīng)用,從而保證模型推理效率和應(yīng)用效果。
同時(shí),基于MLPU的創(chuàng)新架構(gòu)設(shè)計(jì),國科微積極布局AI生態(tài)建設(shè)。其圍繞大模型及其大模型產(chǎn)品,深度優(yōu)化適配,提供從模型壓縮轉(zhuǎn)化、推理部署、應(yīng)用開發(fā)端到端全棧大模型工具鏈,方便開發(fā)者和客戶能夠簡(jiǎn)單高效地完成模型部署和應(yīng)用開發(fā)。
而瑞芯微則通過Chiplet異構(gòu)集成的方式,為滿足不同市場(chǎng)、產(chǎn)品應(yīng)用對(duì)性能和算力的差異化需求,其在自研NPU中內(nèi)置不同性能層次的CPU、GPU內(nèi)核,從而幫助客戶有效縮短產(chǎn)品研發(fā)周期,節(jié)省研發(fā)投入。
面向AI大模型部署、大數(shù)據(jù)實(shí)時(shí)處理等場(chǎng)景帶來的復(fù)合算力需求,多核化、專用化、低功耗的多核異構(gòu)SoC也成為多模態(tài)復(fù)雜場(chǎng)景下的高效處理方案。
其中,全志科技通過集成CPU、GPU、NPU、DSP等不同架構(gòu)的處理核心,可以在適應(yīng)不同場(chǎng)景功能需求的同時(shí),提升整體計(jì)算能力,結(jié)合軟件系統(tǒng)帶來的異構(gòu)基礎(chǔ)功能拓展衍生,構(gòu)建起"分工協(xié)作"的高效計(jì)算體系,以支持更多樣化的應(yīng)用。
目前,全志科技的多核異構(gòu)方案已經(jīng)在大量產(chǎn)品場(chǎng)景中實(shí)際應(yīng)用。例如,在消費(fèi)電子產(chǎn)品中,通過協(xié)處理器在主核上電前預(yù)加載引導(dǎo)程序,異步解壓系統(tǒng)鏡像,同時(shí)延遲加載驅(qū)動(dòng)至CPU啟動(dòng)后執(zhí)行,使開機(jī)動(dòng)時(shí)間相較傳統(tǒng)方案顯著提升,搭配低功耗控制、AI ISP視覺引擎,可將快啟差異化類法案部署在低功耗IPC、智能門鈴等產(chǎn)品中。
小結(jié)
大模型時(shí)代正推動(dòng)邊緣AI芯片架構(gòu)從“專用加速”向“智能原生”演進(jìn),企業(yè)需在架構(gòu)創(chuàng)新、生態(tài)構(gòu)建和場(chǎng)景深耕三方面同步發(fā)力,推動(dòng)邊緣AI在消費(fèi)電子、智能汽車和工業(yè)物聯(lián)網(wǎng)等領(lǐng)域的規(guī)?;涞亍N磥?,能效比優(yōu)化、大模型端側(cè)部署能力及生態(tài)兼容性將成為競(jìng)爭(zhēng)關(guān)鍵。
近日,視覺物聯(lián)聯(lián)合AIoT星圖研究院即將啟動(dòng)《2025邊緣計(jì)算市場(chǎng)調(diào)研報(bào)告》,將從技術(shù)發(fā)展與落地應(yīng)用等方面展開深度調(diào)研,揭示行業(yè)基本面,洞察競(jìng)爭(zhēng)格局,為企業(yè)戰(zhàn)略制定、投資決策、市場(chǎng)拓展等提供結(jié)構(gòu)化的參考依據(jù),歡迎邊緣計(jì)算產(chǎn)業(yè)朋友一起參與到報(bào)告調(diào)研中。