人工智能行業分析

科技互聯網
Banner Img
March 15, 2023

ChatGPT近期的火爆在全球範圍內掀起又一輪AI熱潮。業界感嘆AI行業向通用人工智能邁出一大步的同時也引發了人工智能未來會如何重塑各行各業的討論與暢想。根據IDC公司預測,到2026年,與AI相關的行業規模將達到3280億美元。

摘要

  • ChatGPT的核心壁壘包括龐大的預訓練數據、底層Transformer算法以及跨模態的深度學習。
  • 人工智能算法需要GPU(圖形處理器)運行大規模數據進行訓練與推理。其中ChatGPT單次訓練的成本為450萬美元。推理的成本則由每日活躍用戶數決定,1300萬每日活躍用戶需要4億美金的服務器成本和每日約28萬美金的雲服務租用成本來維持系統的運行。
  • 高昂的成本抬高了AI行業的進入門檻,其中微軟通過與OPEN AI的戰略合作暫時領先其他科技巨頭,輝達在GPU芯片的壟斷技術使其成為AI技術進步的受益者之一。

ChatGPT的算法壁壘

2022年11月30日,由OpenAI開發的聊天機器人ChatGPT推出並席捲了整個行業,短短5天註冊數就超過100萬,僅兩個月活躍用戶數已經破億。與之前的AI聊天機器人相比,ChatGPT能夠理解上下文並給出合理的回復,對話連續性大幅提升,可以稱為人工智能發展史上的劃時代產品。

ChatGPT的核心壁壘之一就是其使用了龐大的預訓練數據。ChatGPT前身GPT-3使用了3000億單詞、超過40T的數據進行訓練,ChatGPT在此基礎上加入人工打分反饋機制使最終結果更貼切對話內容。在人工智能領域,數據量與深度學習的準確度有很大的正相關性,同時數據量的大小對於運算計算機算力的要求呈指數級別增長,使得訓練成本高昂。

AI算力呈現指數級別的增長,來源:騰訊雲
算力需求的發展模式,來源:OPEN AI 

模型訓練方面,ChatGPT採用的底層技術是Transformer算法,取代了原有的RNN循環神經網絡算法。RNN算法的模型通過前一句推斷後一句從而創造邏輯鏈條,Transformer算法引入了注意力機制使得模型可以將前後甚至上下的文本均作為輸入進行訓練,大幅提高了學習效率。

Transformer模型與其他模型的對比,來源:CSDN

第三個壁壘是OpenAI團隊使用的跨模態深度學習CLIP,主要作用是將文字和圖像進行關聯,同時進行自然語言處理(NLP)和計算機視覺分析(CV),從而使得文字圖片能夠找到對話的交界點,極大減少在人工智能內容生成上數據標注的工作量。

CLIP算法示意圖,來源:GitHub

人工智能行業成本分析


ChatGPT包括將來類似產品都無法避開成本這個核心問題。2019年2月發佈的GPT2使用參數共15億,GPT3使用的參數為1750億。2022年11月發佈的ChatGPT(GPT3.5)預估至少在3000億以上。因此隨著產品性能的上升,成本也將不斷向上疊加。

GPT系列模型比較,來源:arxiv

ChatGPT成本主要可以拆分成訓練和推理兩個階段。

GPU(圖形處理器)是運行大規模 AI 訓練的根本,與單線程的CPU (中央處理器)相比,GPU芯片擁有更多的核心因此能夠並行處理數據,更適合運行機器學習算法。GPT-3/4/5 大小的模型通常需要數萬個GPU進行訓練,訓練週期從數周到數月不等。

據統計,OPEN AI 的ChatGPT模型單次需花費訓練成本約450萬美元,Google 的PaLM 模型需花費訓練成本約1120 萬美元。

訓練模型的成本佔據大頭,來源:Open AI

 推理方面,若以輝達目前性能第二高的DGX A1OO 服務器作為計算資源,

(1) 單台服務器售價20 萬美元(單機有8 個A100 系列GPU)。

(2) 採用亞馬遜AWS雲服務單天成本約為460 美元。

輝達三檔芯片算力與價格對比,來源:輝達 

23年1月份ChatGPT每日活躍用戶數約為1300萬人,每人平均 1000 字的問題將合計產生約130 億字,假設24小時平均分配任務, 需要602 台DGX A100 服務器才能夠滿足這些訪問量,因此最終成本:

(1) 自建服務器:購買602台服務器疊加數據中心其餘成本,初始投入需4億美元以上

(2) 雲服務:若僅滿足每日活躍用戶1300萬的需求,單日雲服務成本為28 萬美元,一年約1億美元

ChatGPT 生成一條資訊的成本在 1.3 美分左右,是目前傳統搜尋引擎的 3 – 4 倍。2022 年 OpenAI 淨虧損總額達5.45 億美元。

人工智能搜索引擎的成本高昂,來源:摩根史坦利

行業推動者&受益者

開發AI高昂的成本以及對於龐大數據中心的需求將篩選掉絕大部分的公司,因此我們認為未來能夠推動、受益於行業發展並間接或直接參與市場份額的企業只有科技巨頭公司:谷歌、亞馬遜、微軟、Meta、蘋果以及輝達。

AI技術未來的推動者業務一覽,來源:摩根史坦利

目前走在最前列的微軟高度重視人工智能領域,已經與 OPEN AI 形成了密切的合作關係,兩者優勢互補、合作共贏。

  • 資金投入: 2019 年,微軟向OPEN AI 投資 10 億美元; 2021 年,微軟再次向 OPEN AI 投資; 2023 年 1 月,微軟宣佈將通過一項花費數年、數十億美金的投資深化與 OPENAI 的合作,該投資可能高達 100 億美元。
  • 計算資源:微軟 Azure 是OPEN AI 的獨家雲供應商,微軟將加大在超級計算機方面的投資以支持 OPEN AI 的發展,同時 OPEN AI 也可以反哺增強微軟 Azure 的 AI 能力。
  • 應用開發:微軟已率先推出基於 OPEN AI 模型的Edge 瀏覽器和 Bing 搜索引擎,且微軟表示未來所有產品將全線整合ChatGPT ,包括Office 三件套、 Azure 雲服務等。
微軟與OPEN AI深度綁定,來源:平安證券 

人工智能的算法需要GPU提供的數據並行處理的支持,而輝達在GPU領域擁有壟斷技術。AI需要海量高性能的GPU芯片支撐,算力越高的芯片也能給輝達帶來更高的邊際收益。隨著越來越多的公司伴隨ChatGPT熱潮投資人工智能領域,作為芯片渠道方的輝達有很大機會從中受益。目前輝達在顯卡領域的市場佔有率達到86%,其次為AMD以及英特爾。

Nvida的GPU市占率不斷走高,來源:HardWareTimes

其餘幾間巨頭公司也正加速在人工智能領域的發展:

谷歌

• AI:谷歌比微軟更早佈局AI產業,已積累多年的底層技術

• 搜索:每1% 的AI搜索轉化率的增加能使穀歌的EBIT提高6%

• YouTube:生成式AI 工具、改進的算法匹配和廣告歸因可以帶來更高的參與度和變現能力

• 雲:下一代人工智能工具將推動更持久的公共雲

谷歌與微軟在服務器的建設最為完善,來源:Dell’Oro

亞馬遜

• 頻率:改進的個性化推薦引擎可以推動訪問頻率增加,能提高EBIT 12% 以上

• 品類擴展:生成式 AI 能使購物更具互動性,擴大了對以前滲透不足的品類的訪問

• 廣告:人工智能通過更好的優化和定位能力為廣告商帶來更高的轉化率

• 成本:AI能夠有效較低單位運輸成本,提高運營效率和工程生產力

Meta

• 收入:內容推薦和 AI 驅動的廣告改進(包括拍賣機制)能夠帶來兩位數的收入增長

• 提高參與度:AI 可以改進創作者工具,提高客戶參與度

• 廣告工具:人工智能通過更好的定位和優化能力為廣告商帶來更高的轉化率

蘋果

• 收入:蘋果能夠支持邊緣 AI 應用程序的激增,加速份額增長

• 芯片性能:針對蘋果芯片優化的新 AI 應用程序可提高性能並支持新用戶比例

數據中心將佔據科技巨頭75%的資本支出,來源:摩根史坦利 

免責聲明

  1. 本網站內容僅旨在向專業投資者(定義見《證券及期貨條例》(香港法例第571章)或者該條例下制定的規章)提供。

  2. 本網頁內之資料只可作為資訊的用途,並不構成提供服務的建議或報價。

  3. 本網頁內之所有資料不可視為專業或投資意見。因此,閣下應尋求獨立的專業意見。任何使用本網頁及其內容的風險由閣下自負。

  4. 本公司可隨時終止或更改本網頁所提供之資料,產品或服務,而毋須事先通知閣下。

  5. 非經取得作者授權,不得任意轉載或公開傳輸任何內網站之內容。