精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

當前位置:芯片市場動態 → 正文

人工智能重塑芯片設計

責任編輯:zsheng |來源:企業網D1Net  2018-11-09 11:33:56 本文摘自:機器之能

隨著架構師開始利用 AI 提高性能和降低功耗,并為未來芯片的開發、制造和更新奠定基礎,人工智能也開始影響半導體設計。

人工智能、機器學習、深度學習可以極大改善芯片某項特定功能的控制和性能。架構師既可以基于現有設備進行分層設計,也可以整合到新設計中,以實現更多功能或某個特定功能。

人工智能技術帶來很多好處,比如:

通過稀疏算法或數據壓縮來改變特定函數精度,增加粒度,提高芯片性能和降低功耗。

識別數據模式而不是單個比特,有效提高計算的抽象性,增加軟件密度。

允許以矩陣的形式執行處理和內存讀/寫操作,大大加快操作速度。

但是我們也需要好好反思如何在芯片上或者在芯片之間遷移(或不遷移)數據。畢竟,無論是用于邊緣計算還是數據中心,訓練還是推斷,需要加以處理和存儲的數據量都是最大的。

新起點

從好的方面來說,通過使用更多更低精度的元素,人工智能提供了一種平衡結果精度與準度的方法。比如,語音識別對精度的要求,遠沒有自動駕駛中安全應用與目標識別嚴苛。根據特定需要而展現的自適應能力,才是人工智能的價值所在。

與其說人工智能的起點是硬件和軟件,不如說是數據的質量、數量和遷移。這需要用一種不同的方式來看待設計,包括過去通常沒有合作的團隊之間的協作。

「計算真的很便宜,壓縮/解壓數據也很便宜,但在內存中存儲和加載數據卻一點不便宜。要構建這些系統,需要特定領域的專家、機器學習專家、優化與性能專家,這三個領域的專家都需要。」Arm 研究員杰姆•戴維斯(Jem Davies)表示。

他指出,機器學習可以影響系統中的所有東西,其中很多東西隱藏在視線之外。「有些是用戶看不見的,」戴維斯說,「它被用來延長電池壽命。相機里也有機器學習。」

采用神經形態計算和不同的內存架構,AI 效果最好,因為在這些情況下,數據可以進行矩陣處理。為達到最優工作狀態,除了對處理器有要求外,還需要良好的系統架構、超大的數據吞吐量及內存變化過程中的數據對齊。

「許多架構改進是軟硬件的結合,雖然不一定會提高單個處理器的整體性能,但會更節能,內存效率也更高。縮小一點,內存大小就能減半。」鏗騰電子(Cadence)音頻和語音 IP 產品市場總監 Gerard Andrews 表示。

實際上,這使得軟件設計密度更高,并加速了數據在內存中的移動。「問題是,內存不會有效地收縮,單詞識別的錯誤率正在上升,我們都在探索算法的稀疏性,以降低功耗、提高性能。」Andrews 說。

這僅僅是快速變革的皮毛。

「內存子系統中發生的變化是不連續的、突然的。這一切與延遲和帶寬,以及如何滿足芯片內外的龐大需求有關。由于需要大量數據管道,因此,我們開發了許多關于如何移動數據的架構。在此之前,你要考慮的是添加多少內存,如何高效使用內存。但是,現在要建造巨大的管道,較少地使用內存。」Achronix 的系統架構師 Kent Orthner 說。

嘗試減少數據流量的新方法之一是脈沖神經網絡。它們不是持續發射信號,而是以類似大腦峰值的方式發射信號。

「脈沖神經網絡是下一代神經網絡。」BrainChip 營銷和業務開發高級副總裁 Bob Beachler 說,「卷積使用線性代數。出現峰值時,數據以尖峰的形式輸入。你可以通過尖峰進行訓練,如果有很多尖峰,可以選擇加強或抑制它們。對于專用于訓練閾值的位,你可以用非常低的權重來做到這一點。」

據估計,約有 70 家人工智能初創公司正在研究不同辦法。最重要的是,幾乎所有主要的芯片制造商、IP(知識產權)供應商和工具公司都有涉足 AI 的某個方面。

人工智能的風險和困惑

但是,人工智能也存在一定的風險,這取決于應用程序和精確度。

過去,電子系統的設計是建立在完全可預測性的邏輯之上的,其中大部分是硬連線。人工智能用可接受行為的分布代替了計算精度,人們也在會議上討論這對芯片設計意味著什么。目前尚不清楚的是,現有工具或方法提供的置信度能否滿足設備需求,特別是在系統遭到破壞或退化的情況下,檢測任何異常行為的速度如何。

對于如何應用人工智能,人們也有一定困惑。有專門為人工智能設計的芯片,以及一些不是專門為 AI 開發但可用于 AI 的芯片,對這些芯片進行修改和疊加后,就能更有效地利用人工智能。

總的來說,這符合人工智能的主題,全行業都在爭相以相同或更低功率來提升性能。根據摩爾定律,在 16/14 納米工藝后,每個節點的能耗和性能的提高比例都下降到 20%,因此,大家都在尋找替代或補充的新方法。

對于針對 AI 訓練或推理的芯片,或者芯片中發揮 AI 能力的處理器和加速器,人們的普遍共識是,不同量級的程序指令可能使用不同的芯片架構。但它不適用于所有情況,還有一些變量,比如訓練數據的大小和價值,它們可能會使 AI 在某些應用程序中失效,而在其他情況下,性能提升 100 倍甚至被認為過于保守。

這就是人們要花很長時間才能把一些新架構推向市場的原因。隨著芯片行業初見端倪,人們也在進行大量的架構探索和實驗。

「應用程序和算法都面臨挑戰,處理器和內存芯片也面臨挑戰。」Synopsy 的戰略營銷經理 Ron Lowman 說:

「這使得對 AI 架構的探索變得更加重要,這也是 CCIX(緩存一致性互聯加速器)變得如此流行的原因之一。探索新架構的客戶越來越多。每個人都在嘗試建立人腦仿生的新架構。

除此之外,有一些新的非易失性存儲器技術正在開發中。還有一種趨勢是,將更小的處理器置于較小的存儲器旁邊,有時,這種處理器會與針對不同數據類型、定制的新型加速器相關聯。另外,還有很多關于數據壓縮和量化的工作。

「人們正在研究從 32 位浮點數到 8 位浮點數,」Lowman 說,「現在的問題是,你是否能精確到單比特量化。」

量化涉及到將一大組輸入值映射到一小組輸出值,最大的問題是,什么是可接受的精度損失。

理論上,有了足夠傳感器或數據輸入,就可將錯誤率的影響降到最低,但這非常依賴于應用程序。

沿著這些思路的另一種方法涉及到源代碼同步,特別是針對數據中心的 AI 芯片,促使芯片的網絡拓撲結構發生變化。網絡中的所有目標都是接收相同的數據,較之廣播,使用多播方法能更好地針對性使用數據。

「通過多播,可以向多個目的地發送一封郵件。」Arteris IP 的營銷副總裁 Kurt Shuler 說,「它通常被用來做權重。好處是,你可以更好地利用片上網絡帶寬,因此路上的車也越來越少了。

AI 芯片有一個問題:它們往往非常大。「最大的問題是時鐘樹,」Shuler 說,「這需要同步通信,異步處理通信會占用很多空間。另外,大型芯片更容易出現路由堵塞。解決這個問題的方法是創建虛擬通道連接,減少線路數量并通過一組線路共享通信。這就需要通過仲裁來匹配數據流。」

計劃性淘汰

這只是設計的一部分。另一方面,還要保持算法的時效性。

目前,深度學習算法還在定期更新,這會影響到 AI 芯片添加何種處理器。每一次變化,都可能對芯片內部數據遷移、以及處理這些數據的處理器造成影響。

CPU 和 GPU 具有軟件可編程性,DSP 和 FPGA 具有固件/硬件可編程性。嵌入式 FPGA 將可編程性直接添加到 SoC 或多芯片包中。

處理器的選擇也取決于終端市場的應用。例如,汽車或工業環境中的重要安全應用,也需要有足夠通用性與反應性,以便與其他車輛或設備兼容。

「當我們討論未來時,問題不在于它是否有效。」eSilicon 的創新高級主管 Carlos Macián 說,「TPU(張量處理單元)是一個開拓者,它表明性能可以得到數量級提高。但是對于新的工作負載,如果沒有 ASIC 的優化,你可能只會提高 3 倍。」

前提是,假設數據是干凈、有用的,這也是情況變得復雜的地方。

「AI 非常適用于處理非結構化的數據,」Macián 說,「如果你給出現在 Facebook 上的人打標簽,你就知道這很適合人工智能。但它不是結構化數據。所以,AI 天生就不準確,有時它還是錯的。」

并非所有事情都要面向未來。在一些市場,比如手機,消費者希望每隔幾年就更換一次手機。在其他市場,電子產品被寄予厚望——全部的功能能夠順暢運行二十年之久。

提高數據質量是有幫助的,這有助于解釋算法為何變化如此之快,也有助于解釋為什么對于一些設備而言,現場升級的能力至關重要。但是,這些變化也會影響性能,如果不在硬件中添加一些可編程性,就無法解釋這些變化。問題是,可編程性有多高,因為可編程邏輯明顯慢于(軟件)已調優的硬件。

結論

與其他許多成長型半導體市場不同,AI 是一種橫向技術,可以應用于各種垂直市場,也可以用來為這些市場開發芯片,還可以用來提高現有芯片的效率。

這只是 AI 革命的開始,但其影響已經很大了。

隨著設計團隊越來越精通這項技術,這將對如何設計芯片、以及這些芯片如何與其他芯片交互產生重大影響,也會給工具開發人員、硬件開發人員、軟件開發人員創造新的機會,也可能帶來一個全新的市場。

關鍵字:設計芯片智能

本文摘自:機器之能

x 人工智能重塑芯片設計 掃一掃
分享本文到朋友圈
當前位置:芯片市場動態 → 正文

人工智能重塑芯片設計

責任編輯:zsheng |來源:企業網D1Net  2018-11-09 11:33:56 本文摘自:機器之能

隨著架構師開始利用 AI 提高性能和降低功耗,并為未來芯片的開發、制造和更新奠定基礎,人工智能也開始影響半導體設計。

人工智能、機器學習、深度學習可以極大改善芯片某項特定功能的控制和性能。架構師既可以基于現有設備進行分層設計,也可以整合到新設計中,以實現更多功能或某個特定功能。

人工智能技術帶來很多好處,比如:

通過稀疏算法或數據壓縮來改變特定函數精度,增加粒度,提高芯片性能和降低功耗。

識別數據模式而不是單個比特,有效提高計算的抽象性,增加軟件密度。

允許以矩陣的形式執行處理和內存讀/寫操作,大大加快操作速度。

但是我們也需要好好反思如何在芯片上或者在芯片之間遷移(或不遷移)數據。畢竟,無論是用于邊緣計算還是數據中心,訓練還是推斷,需要加以處理和存儲的數據量都是最大的。

新起點

從好的方面來說,通過使用更多更低精度的元素,人工智能提供了一種平衡結果精度與準度的方法。比如,語音識別對精度的要求,遠沒有自動駕駛中安全應用與目標識別嚴苛。根據特定需要而展現的自適應能力,才是人工智能的價值所在。

與其說人工智能的起點是硬件和軟件,不如說是數據的質量、數量和遷移。這需要用一種不同的方式來看待設計,包括過去通常沒有合作的團隊之間的協作。

「計算真的很便宜,壓縮/解壓數據也很便宜,但在內存中存儲和加載數據卻一點不便宜。要構建這些系統,需要特定領域的專家、機器學習專家、優化與性能專家,這三個領域的專家都需要。」Arm 研究員杰姆•戴維斯(Jem Davies)表示。

他指出,機器學習可以影響系統中的所有東西,其中很多東西隱藏在視線之外。「有些是用戶看不見的,」戴維斯說,「它被用來延長電池壽命。相機里也有機器學習。」

采用神經形態計算和不同的內存架構,AI 效果最好,因為在這些情況下,數據可以進行矩陣處理。為達到最優工作狀態,除了對處理器有要求外,還需要良好的系統架構、超大的數據吞吐量及內存變化過程中的數據對齊。

「許多架構改進是軟硬件的結合,雖然不一定會提高單個處理器的整體性能,但會更節能,內存效率也更高。縮小一點,內存大小就能減半。」鏗騰電子(Cadence)音頻和語音 IP 產品市場總監 Gerard Andrews 表示。

實際上,這使得軟件設計密度更高,并加速了數據在內存中的移動。「問題是,內存不會有效地收縮,單詞識別的錯誤率正在上升,我們都在探索算法的稀疏性,以降低功耗、提高性能。」Andrews 說。

這僅僅是快速變革的皮毛。

「內存子系統中發生的變化是不連續的、突然的。這一切與延遲和帶寬,以及如何滿足芯片內外的龐大需求有關。由于需要大量數據管道,因此,我們開發了許多關于如何移動數據的架構。在此之前,你要考慮的是添加多少內存,如何高效使用內存。但是,現在要建造巨大的管道,較少地使用內存。」Achronix 的系統架構師 Kent Orthner 說。

嘗試減少數據流量的新方法之一是脈沖神經網絡。它們不是持續發射信號,而是以類似大腦峰值的方式發射信號。

「脈沖神經網絡是下一代神經網絡。」BrainChip 營銷和業務開發高級副總裁 Bob Beachler 說,「卷積使用線性代數。出現峰值時,數據以尖峰的形式輸入。你可以通過尖峰進行訓練,如果有很多尖峰,可以選擇加強或抑制它們。對于專用于訓練閾值的位,你可以用非常低的權重來做到這一點。」

據估計,約有 70 家人工智能初創公司正在研究不同辦法。最重要的是,幾乎所有主要的芯片制造商、IP(知識產權)供應商和工具公司都有涉足 AI 的某個方面。

人工智能的風險和困惑

但是,人工智能也存在一定的風險,這取決于應用程序和精確度。

過去,電子系統的設計是建立在完全可預測性的邏輯之上的,其中大部分是硬連線。人工智能用可接受行為的分布代替了計算精度,人們也在會議上討論這對芯片設計意味著什么。目前尚不清楚的是,現有工具或方法提供的置信度能否滿足設備需求,特別是在系統遭到破壞或退化的情況下,檢測任何異常行為的速度如何。

對于如何應用人工智能,人們也有一定困惑。有專門為人工智能設計的芯片,以及一些不是專門為 AI 開發但可用于 AI 的芯片,對這些芯片進行修改和疊加后,就能更有效地利用人工智能。

總的來說,這符合人工智能的主題,全行業都在爭相以相同或更低功率來提升性能。根據摩爾定律,在 16/14 納米工藝后,每個節點的能耗和性能的提高比例都下降到 20%,因此,大家都在尋找替代或補充的新方法。

對于針對 AI 訓練或推理的芯片,或者芯片中發揮 AI 能力的處理器和加速器,人們的普遍共識是,不同量級的程序指令可能使用不同的芯片架構。但它不適用于所有情況,還有一些變量,比如訓練數據的大小和價值,它們可能會使 AI 在某些應用程序中失效,而在其他情況下,性能提升 100 倍甚至被認為過于保守。

這就是人們要花很長時間才能把一些新架構推向市場的原因。隨著芯片行業初見端倪,人們也在進行大量的架構探索和實驗。

「應用程序和算法都面臨挑戰,處理器和內存芯片也面臨挑戰。」Synopsy 的戰略營銷經理 Ron Lowman 說:

「這使得對 AI 架構的探索變得更加重要,這也是 CCIX(緩存一致性互聯加速器)變得如此流行的原因之一。探索新架構的客戶越來越多。每個人都在嘗試建立人腦仿生的新架構。

除此之外,有一些新的非易失性存儲器技術正在開發中。還有一種趨勢是,將更小的處理器置于較小的存儲器旁邊,有時,這種處理器會與針對不同數據類型、定制的新型加速器相關聯。另外,還有很多關于數據壓縮和量化的工作。

「人們正在研究從 32 位浮點數到 8 位浮點數,」Lowman 說,「現在的問題是,你是否能精確到單比特量化。」

量化涉及到將一大組輸入值映射到一小組輸出值,最大的問題是,什么是可接受的精度損失。

理論上,有了足夠傳感器或數據輸入,就可將錯誤率的影響降到最低,但這非常依賴于應用程序。

沿著這些思路的另一種方法涉及到源代碼同步,特別是針對數據中心的 AI 芯片,促使芯片的網絡拓撲結構發生變化。網絡中的所有目標都是接收相同的數據,較之廣播,使用多播方法能更好地針對性使用數據。

「通過多播,可以向多個目的地發送一封郵件。」Arteris IP 的營銷副總裁 Kurt Shuler 說,「它通常被用來做權重。好處是,你可以更好地利用片上網絡帶寬,因此路上的車也越來越少了。

AI 芯片有一個問題:它們往往非常大。「最大的問題是時鐘樹,」Shuler 說,「這需要同步通信,異步處理通信會占用很多空間。另外,大型芯片更容易出現路由堵塞。解決這個問題的方法是創建虛擬通道連接,減少線路數量并通過一組線路共享通信。這就需要通過仲裁來匹配數據流。」

計劃性淘汰

這只是設計的一部分。另一方面,還要保持算法的時效性。

目前,深度學習算法還在定期更新,這會影響到 AI 芯片添加何種處理器。每一次變化,都可能對芯片內部數據遷移、以及處理這些數據的處理器造成影響。

CPU 和 GPU 具有軟件可編程性,DSP 和 FPGA 具有固件/硬件可編程性。嵌入式 FPGA 將可編程性直接添加到 SoC 或多芯片包中。

處理器的選擇也取決于終端市場的應用。例如,汽車或工業環境中的重要安全應用,也需要有足夠通用性與反應性,以便與其他車輛或設備兼容。

「當我們討論未來時,問題不在于它是否有效。」eSilicon 的創新高級主管 Carlos Macián 說,「TPU(張量處理單元)是一個開拓者,它表明性能可以得到數量級提高。但是對于新的工作負載,如果沒有 ASIC 的優化,你可能只會提高 3 倍。」

前提是,假設數據是干凈、有用的,這也是情況變得復雜的地方。

「AI 非常適用于處理非結構化的數據,」Macián 說,「如果你給出現在 Facebook 上的人打標簽,你就知道這很適合人工智能。但它不是結構化數據。所以,AI 天生就不準確,有時它還是錯的。」

并非所有事情都要面向未來。在一些市場,比如手機,消費者希望每隔幾年就更換一次手機。在其他市場,電子產品被寄予厚望——全部的功能能夠順暢運行二十年之久。

提高數據質量是有幫助的,這有助于解釋算法為何變化如此之快,也有助于解釋為什么對于一些設備而言,現場升級的能力至關重要。但是,這些變化也會影響性能,如果不在硬件中添加一些可編程性,就無法解釋這些變化。問題是,可編程性有多高,因為可編程邏輯明顯慢于(軟件)已調優的硬件。

結論

與其他許多成長型半導體市場不同,AI 是一種橫向技術,可以應用于各種垂直市場,也可以用來為這些市場開發芯片,還可以用來提高現有芯片的效率。

這只是 AI 革命的開始,但其影響已經很大了。

隨著設計團隊越來越精通這項技術,這將對如何設計芯片、以及這些芯片如何與其他芯片交互產生重大影響,也會給工具開發人員、硬件開發人員、軟件開發人員創造新的機會,也可能帶來一個全新的市場。

關鍵字:設計芯片智能

本文摘自:機器之能

電子周刊
回到頂部

關于我們聯系我們版權聲明隱私條款廣告服務友情鏈接投稿中心招賢納士

企業網版權所有 ©2010-2024 京ICP備09108050號-6 京公網安備 11010502049343號

^
  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 沙坪坝区| 嫩江县| 巴东县| 遵义市| 湘潭市| 泽州县| 滕州市| 蒙阴县| 田阳县| 清远市| 延津县| 晋江市| 枞阳县| 磐石市| 黄骅市| 雷山县| 宜昌市| 广安市| 阿城市| 当雄县| 太和县| 株洲县| 大渡口区| 左云县| 徐闻县| 佛冈县| 阿瓦提县| 奉贤区| 青岛市| 吴江市| 哈巴河县| 聂荣县| 原平市| 鄯善县| 江永县| 清水河县| 广元市| 达日县| 方正县| 兴和县| 华安县|