人工智能正在許多新應(yīng)用程序中部署,從提高性能、降低各種終端設(shè)備的功耗到發(fā)現(xiàn)數(shù)據(jù)移動(dòng)中的異常情況。雖然大多數(shù)人都熟悉使用機(jī)器學(xué)習(xí)和深度學(xué)習(xí)來區(qū)分貓和狗,但新興的應(yīng)用程序展示了如何以不同的方式使用這種能力。例如,數(shù)據(jù)優(yōu)先級(jí)和分區(qū)可用于優(yōu)化芯片的功率和性能,而無需人工干預(yù)。并且可以在整個(gè)設(shè)計(jì)和制造流程中使用各種類型的人工智能來捕捉人類無法捕捉到的錯(cuò)誤或缺陷。但是所有這些新組件和功能也使設(shè)計(jì)芯片更加復(fù)雜,因?yàn)楦怕嗜〈擞邢薜拇鸢覆⑶易兞吭黾恿恕?/span>Rambus產(chǎn)品管理高級(jí)總監(jiān) Frank Ferro 表示:“當(dāng)你將 AI 移到邊緣時(shí),邊緣開始看起來像數(shù)據(jù)中心?;鶐?zhí)行許多相同的處理功能。在內(nèi)存要求方面,我們看到很多 5G 客戶的帶寬不足,并希望在網(wǎng)絡(luò)邊緣使用 HBM。但是,網(wǎng)絡(luò)中有更多的可配置性,您可以管理工作負(fù)載,而不是去云端。平衡這些工作量非常重要。”盡管如此,正如 AI 芯片設(shè)計(jì)師所了解的那樣,AI 世界中沒有什么是簡單的?!霸?AI 設(shè)計(jì)中,有許多問題需要回答,” Synopsys戰(zhàn)略營銷經(jīng)理 Ron Lowman 說. “在人工智能設(shè)計(jì)中,有許多問題需要回答。你想處理什么算法?你的功率預(yù)算是多少?你想達(dá)到什么樣的精度?在圖像識(shí)別應(yīng)用程序中,你可能不需要32位浮點(diǎn)處理器。低成本的16位圖像芯片可能很好。如果你只需要92%的精度,低成本芯片可能會(huì)降低你的總體預(yù)算。如果你知道你想實(shí)現(xiàn)什么,那么采用 IP 方法將有很多優(yōu)勢。您可以選擇正確的 AI 處理器、正確類型的內(nèi)存(SRAM 或 DDR)I/O 和安全性。選擇正確的 IP 很重要,但進(jìn)行建模和基準(zhǔn)測試也將幫助開發(fā)人員優(yōu)化 AI 解決方案并減少錯(cuò)誤?!?/span>對于任何高級(jí)芯片,設(shè)計(jì)挑戰(zhàn)都可能迅速增加,更多的變量需要更好的模型、更多的工藝步驟和更多的時(shí)間。弗勞恩霍夫 IIS設(shè)計(jì)方法負(fù)責(zé)人 Roland Jancke 說:“你從一個(gè)非常復(fù)雜的芯片將要執(zhí)行的概念開始,然后你會(huì)看到對芯片的不同部分是否有不同的要求。在過去,你只會(huì)設(shè)計(jì)一些東西,開發(fā)它,然后把它錄下來,看看它是否有效。那已經(jīng)不可行了?,F(xiàn)在需要一個(gè)集成的流程。從一開始,就需要考慮可能的故障模式。甚至可能需要從一開始就使用有限元方法進(jìn)行仿真,這在過去通常沒有做過。過去,從非常粗糙的模型開始,并且想要集成的功能。因此如果你有一個(gè) MATLAB 模型,那并不能反映芯片不同部分之間的物理交互。你需要在開發(fā)過程的早期整合不同的模型——物理模型、功能模型——看看你的概念是否足夠?qū)嵱??!?/span>隨著移動(dòng)部件的增多,這變得更加困難,特別是當(dāng)這些塊針對特定數(shù)據(jù)類型和用例進(jìn)行定制或半定制時(shí)。但好處是,更好的算法和計(jì)算元素還允許在更小的空間內(nèi)處理更多數(shù)據(jù),并且與過去的實(shí)現(xiàn)相比,功耗要低得多。反過來,這使得處理可以更接近數(shù)據(jù)源,在那里它可以用來確定哪些數(shù)據(jù)是重要的,在任何特定時(shí)間點(diǎn)應(yīng)該在哪里處理這些數(shù)據(jù),以及可以丟棄哪些數(shù)據(jù)。
一個(gè)轉(zhuǎn)折點(diǎn)
大多數(shù)這些變化本身是漸進(jìn)式和漸進(jìn)式的,但總體而言,它們允許在邊緣進(jìn)行推斷和訓(xùn)練,在邊緣,一系列異構(gòu)體系結(jié)構(gòu)開始出現(xiàn)。通過利用各種類型的神經(jīng)網(wǎng)絡(luò),可以為特定目的加快處理速度,為不同的應(yīng)用提供不同的精度和精度。
對于任何執(zhí)行復(fù)雜算法和計(jì)算的 AI 芯片,都有幾個(gè)關(guān)鍵要求。首先,他們需要能夠并行處理數(shù)據(jù),使用多個(gè)計(jì)算元素和寬數(shù)據(jù)路徑來減少延遲。在許多情況下,這還涉及一些與計(jì)算元素非常接近的局部內(nèi)存,以及高帶寬內(nèi)存。其次,這些設(shè)備需要針對尺寸、成本和功率預(yù)算進(jìn)行優(yōu)化,這通常需要根據(jù)預(yù)計(jì)工作負(fù)載調(diào)整大小的高吞吐量架構(gòu)。反過來,這需要一些權(quán)衡,需要針對特定用例進(jìn)行平衡。第三,這些架構(gòu)通常涉及混合處理器來管理復(fù)雜的數(shù)據(jù)流和電源管理方案,其中可能包括 CPU、GPU、FPGA、eFPGA、DSP、NPU、TPU 和 IPU。
“在設(shè)計(jì)中,開發(fā)人員需要考慮培訓(xùn)、推理、低功耗、連接性和安全性的要求,”英飛凌物聯(lián)網(wǎng)、無線和計(jì)算業(yè)務(wù)部首席軟件產(chǎn)品營銷經(jīng)理 Danny Watson 說,“種方法可以實(shí)現(xiàn)需要本地快速?zèng)Q策的新用例,同時(shí)滿足當(dāng)今物聯(lián)網(wǎng)產(chǎn)品的功耗預(yù)算?!?Watson 指出,關(guān)鍵是收集正確的數(shù)據(jù),以便應(yīng)用程序可以利用這些數(shù)據(jù),從而使他們能夠利用技術(shù)改進(jìn)。
無處不在的人工智能
對于芯片公司來說,這都是一件大事。根據(jù) Precedence Research 的最新報(bào)告,整個(gè)人工智能市場將從 2021 年的 870 億美元增長到 2030 年的超過 1.6 萬億美元。這包括數(shù)據(jù)中心和邊緣設(shè)備,但增長速度非???。事實(shí)上,人工智能是當(dāng)今如此熱門的領(lǐng)域,幾乎所有主要科技公司都在投資或制造人工智能芯片。它們包括蘋果、AMD、Arm、百度、谷歌、Graphcore、華為、IBM、英特爾、Meta、NVIDIA、高通、三星和臺(tái)積電。這個(gè)市場五年前幾乎不存在,十年前大多數(shù)公司都在考慮云計(jì)算和高速網(wǎng)關(guān)。但是隨著帶有更多傳感器的新設(shè)備的推出——無論是汽車、智能手機(jī),甚至是內(nèi)置某種程度智能的電器,正在生成如此多的數(shù)據(jù),因此需要圍繞數(shù)據(jù)的輸入、處理、移動(dòng)和存儲(chǔ)設(shè)計(jì)架構(gòu)。“在人工智能應(yīng)用中,正在部署各種技術(shù),”Arteris IP高級(jí)技術(shù)營銷經(jīng)理 Paul Graykowski 說?!白罱囊晃豢蛻糸_發(fā)了一種復(fù)雜的多通道 ADAS SoC,它可以處理四個(gè)傳感器數(shù)據(jù)通道,每個(gè)通道都有自己的專用計(jì)算和 AI 引擎來處理數(shù)據(jù)。同樣,新的 AI 芯片架構(gòu)也會(huì)不斷變化,以滿足新應(yīng)用的需求。”