電工為完成這些計算,芯片設計中,會增加很多運算單元,如幾千到幾萬個運算單元。隨著運算單元數目的增加,每個運算單元能夠使用的存儲器的帶寬和大小都在減小。因此,存儲器會成為計算瓶頸。
由于深度學習并不屬于通用計算的范疇,馮·諾伊曼(John von Neuman)架構的存儲和計算分離,已經不適合數據驅動的人工智能應用需求。頻繁的數據搬運,導致的算力瓶頸以及功耗瓶頸,已經成為更先進算法探索的限制因素。類似于腦神經結構的存內計算架構,將數據存儲單元和計算單元融合為一體,這樣能顯著減少數據搬運,提高計算并行度和能效。而計算存儲一體化,在硬件架構方面的革新,也將突破AI算力瓶頸。筆者在《神龍飛天,國士王堅》中,曾經介紹過在阿里神龍服務器和飛天操作系統的加持下,阿里、乃至整個云服務中的虛擬化層,所帶來的損耗,正在被不斷降低。
云服務憑借其標準化、彈性化的優勢,使得用戶只需專注應用開發,無需關注基礎設施及基礎服務。而且,通過云原生的資源交付方式,計算效率、易用性、用戶的計算和運維成本都會得到優化。可以說,云服務變得像電力和自來水一樣無處不在,它還會成為數字經濟時代基礎設施。