當前位置：首頁> 新聞資訊> 人工智能應用> 大模型企業發展麵臨的問題與困境-算力資金人才

大模型企業發展麵臨的問題與困境-算力資金人才

來源：甲子光年編輯：創澤時間：2024/6/20 主題：其他[ 加盟]

1 大模型訓練和應用麵臨著算力和能耗算力方麵的挑戰

大模型需要大量計算資源，導致全球算力需求指數級增長，對全社會信息基礎設施和眾多企業、科研機構的大模型研發帶來巨大壓力。

能耗方麵，大模型對能源的巨大需求導致人工智能能源消耗占全球能源消耗的3%左右，到2025年將消耗全球15%的電能，給全球環境治理帶來挑戰。我國大模型發展帶來的高能耗可能增加碳達峰、碳中和壓力。

算力短缺：大模型通常需要具有數十億乃至上萬億個參數，訓練時用到數萬億個Token，這就需要消耗巨大的算力。算力需求隨著大模型的發展而呈指數級增長，對全球算力規模提出了巨大的要求。大型預訓練模型的訓練和調優過程需要消耗巨大的算力資源。例如，訓練ChatGPT所需的算力相當於64個英偉達A100 GPU訓練1年的時間。此外，大模型的日常運營和優化也需要大量的算力投入。預計到2030年，全球算力總規模將達到56ZFlops，其中智能算力成為推動算力增長的主要動力。這對於社會的信息基礎設施建設和企業、科研機構的大模型研發都帶來了巨大的挑戰。 ? 根據工信部的數據，2022年全球智能算力中，美國占45% 的份額，中國占28%的份額，美國智能算力規模為我國的 1.6倍，在中美算力競爭中，我國仍然處於相對劣勢的一方。

能耗巨大：大模型對算力的巨大需求，帶來了對能源的巨大消耗。人工智能服務器的功率較普通服務器高6至 8倍，訓練大模型所需的能耗是常規雲工作的3倍。據估計，目前人工智能的能源消耗占全球能源消耗的3％左右，到2025 年，人工智能將消耗全球 15％的電能。人工智能的快速發展將對能源消耗和環境產生巨大影響。 ? 據估計，GPT-4一次訓練的耗電量相當於1200個中國人一年的用電量，僅占模型實際使用時的40 ％，實際運行階段將消耗更多能源。一些大型模型運行時的碳排放量巨大，給全球環境治理帶來挑戰。我國大模型發展的高能耗可能增加碳達峰和碳中和的壓力。

2 大模型在數據和資金方麵也麵臨著挑戰

大模型麵臨的挑戰包括數據獲取便利性、數據來源合法性、數據質量可靠性、數據使用安全性、資金投入等方麵的挑戰。

資金投入方麵，大模型成本高昂，包括模型開發成本、訓練成本、算力成本、數據成本、運維成本等，對普通企業和科研機構而言，資金成為難以逾越的“門檻”。

數據規模與質量待提高：數據獲取方麵，專用類大模型需要專業數據，而這些數據往往屬於企業、研究機構等實體，增加了訓練難度。 ? 數據來源合法性方麵，個人信息保護意識的提高使得數據合法使用成為問題。 ? 數據質量可靠性方麵，開源數據集雖然數量巨大，但質量良莠不齊，從中提取符合預訓練要求的高質量數據麵臨很大挑戰。 ? 數據使用安全性方麵，如何保證使用的數據不帶偏見，以及如何保證人工智能製造的數據本身的安全性，都是需要解決的問題。

資金緊缺：大模型訓練開發成高昂，其成本主要由模型開發成本、訓練成本、算力成本、數據成本、運維成本等構成，僅訓練成本便動輒高達數百萬美元。以Meta大語音模型LLaMA為例，在多達1.4萬億的數據集上，使用 2000多個英偉達A100 GPU，訓練了21天，花費或高達1000萬美元。根據華為公布的消息，開發和訓練一次人工智能大模型的成本高達 1200萬美元。 ? 大模型巨大的資金投入，更是將很多小型研究機構和中小型企業拒之門外，導致大模型研發都集中在頭部企業和研發機構，加劇了不平等現象。 ? 在大模型的投資方麵，根據美國斯坦福大學2022年的報告，美國和中國位列全球投資總額的前兩位，但美國的投資是中國的3倍，中國在資金投入方麵還有較大差距。

3 大模型發展在技術和人才方麵也麵臨著挑戰

針對大模型技術，國內企業與歐美國家存在差距，主要體現在底層架構設計和硬件技術方麵。在底層架構設計方麵，國內尚無類似的底層架構，大模型的預訓練方麵隻能“在別人的地基上蓋房子”；在硬件技術方麵，美國占據絕對領先地位，我國自研能力不足，對美國進口依賴程度高，存在“卡脖子”風險。

在人才方麵，國內大模型人才數量嚴重不足，與美國相比頂尖人才數量少，製約了大模型研發的快速發展。具體表現為人才數量不足、人才質量不夠高和人才外流嚴重。針對以上挑戰，需要加強國內大模型技術的研發，提高自研能力，降低對美國進口的依賴程度；同時，需要加強人才培養，提高人才質量，減少頂尖人才的流失。

技術存在差距：大模型技術涉及軟件和硬件兩方麵： ? 從軟件技術看，國內企業與歐美國家存在差距。底層架構設計方麵，國內尚無類似穀歌的Transformer模型，對大模型的預訓練隻能依賴外部技術。在迭代升級和更新換代方麵，國內企業也落後於歐美企業，競爭劣勢明顯。 ? 從硬件技術看，在人工智能GPU方麵，美國占據絕對領先地位，我國自研能力不足，對進口依賴較高，存在風險。當前大部分大模型訓練所用的 GPU由美國英偉達公司生產，國產GPU與其性能差距明顯。美國已禁止向中國銷售A100，而英偉達推出了性能更強的H100，並將優先部署在自家服務器上。

頂尖人才嚴重不足：國內大模型人才數量嚴重不足，與美國相比頂尖人才數量少，製約了大模型研發發展。 ? 首先，人才數量嚴重不足。我國人工智能人才缺口超過500萬，供需比例嚴重失衡，人工智能成為“最缺人”的行業。 ? 其次，人才質量不夠高。與美國相比，國內缺乏頂尖算法人才，數量嚴重不足。美國在全球最具影響力的人工智能學者榜單中占據主導地位，中國學者數量遠遠落後。 ? 此外，人才外流問題也十分嚴重。許多國內優秀人才選擇出國深造並留在國外，導致頂尖人才的流失。這加大了國內大模型研發與美國的差距，給我國大模型研發帶來嚴峻挑戰。

大模型企業發展麵臨的問題與困境-算力資金人才

中國大模型開源生態體係代表性廠商—華為,鵬程·盤古

大模型開源生態體係的創新主體與創新機製-開源是未來

人工智能技術架構的演變與新趨勢-七大核心能力

發展人工智能產業的重要性與新機遇

人工智能開源大模型生態研究-開源為先場景突破

重塑與創造： Al+ 洞察報告2024-AI產業的發展現狀

2023生成式人工智能道德&合規風險白皮書：如何理解和應對生成式人工智能引發的數據合規風險

AIoT白皮書：解鎖未來商業價值的關鍵_AIoT產業智能白皮書2023

AI時代來襲：中小企業如何抓住千載難逢的發展機遇

銀行保險金融機構生成式人工智能戰略報告-探討並評估這些大語言模型的綜合性能

國家礦山安全監察局發布《礦山智能化標準體係框架》2023年第2號

南露天煤礦 5G+無人駕駛係統-新疆天池能源有限責任公司

服務機器人(迎賓、講解、導診...)

智能消毒機器人

機器人開發平台

大模型企業發展麵臨的問題與困境-算力 資金 人才

服務機器人(迎賓、講解、導診...)

智能消毒機器人

機器人開發平台

大模型企業發展麵臨的問題與困境-算力資金人才