創澤機器人
CHUANGZE ROBOT
當前位置: 首頁> 新聞資訊> 人工智能標準> 大模型專題一:中國人工智能係列白皮書——大模型技術-2023版

大模型專題一:中國人工智能係列白皮書——大模型技術-2023版

來源: 中國人工智能學會編輯: 創澤時間:2023/12/9 主題: 其他[ 加盟]

語言大模型由於在大規模通用領域數據預訓練通常缺乏對特定任務或領域的知識,因此需要適配微調。微調可以幫助模型更好地適應特定需求,如對敏感數據(如醫療記錄)的處理,同時不暴露原始數據。此外,微調可以提高部署效率、減少計算資源需求。指令微調和參數高效學習是適配微調的關鍵技術。

指令微調(Instruction Tuning)[21],是一種可以幫助語言大模型實現人類語言指令遵循的能力,在零樣本設置中泛化到未見任務上的學習方法。指令微調學習形式與多任務提示微調相似,但與提示微調讓提示適應語言大模型並且讓下遊任務對齊預訓練任務不同,其是讓語言大模型對齊理解人類指令並按照指令要求完成任務,即在給定指令提示的情況下給出特定的回應,其中提示可以選擇性包含一條解釋任務的指令。指令微調研究涉及指令理解、指令數據獲取和指令對齊等內容。

(1)指令理解,指語言大模型準確理解人類語言指令的能力,是語言大模型執行指令完成任務的前提。為了增強對指令的理解,許多工作采用多任務提示方式對基於指令描述的大量任務集上對語言大模型進行微調,如FLAN[50]、InstructGPT[21]等,這些模型在未見的任務上顯示出優越的零樣本性能。

(2)指令數據獲取,指如何構建包含多樣性的任務指令數據。指令數據構建常見有三種方式:i)基於公開人工標注數據構建,代表指令數據集包括1616種不同任務的Super-Natural Instruction[51]、2000種不同NLP任務的OPT-IML[52]。ii)借助語言大模型的自動生成構建,如Unnatural Instructions[53],通過種子指令作為提示讓語言大模型生成新的指令描述和問題,然後再輸入到模型讓其輸出回答。iii)基於人工標注方法,如ChatGPT在人工標注指令的基礎上通 過GPT-3、InstructGPT等在線平台收集用戶真實指令數據。




附件:大模型專題一:中國人工智能係列白皮書——大模型技術-2023版






中國信通院聯合發布《數據清洗、去標識化、匿名化業務規程(試行)》

指導行業主體組織開展數據清洗,去標識化,匿名化處理等及相應的技術測試評估,支撐數據共享,交易,開放等流通活動合規,有序進行

深圳市地方標準《多功能智能杆係統施工技術規範》

本文件規定了多功能智能杆係統組成、總體施工要求、施工安全、基礎設施施工要求、杆體安裝施工要求、掛載設備施工要求、管理平台組建、係統及掛載設備調試、係統工程驗收和資料移交

北京市海澱區人民政府印發《關於加快中關村科學城人工智能大模型創新發展的若幹措施》的通知

海行規發〔2023〕4號;打造2300億元核心產業規模,集聚100家大模型企業機構,以及60家國家級專精特新小巨人企業,以及新培育5-10家獨角獸企業,打造四大人工智能產業園

中國首個AIGC管理辦法 《生成式人工智能服務管理暫行辦法》

明確了訓練數據處理活動和數據標注等要求;規定了生成式人工智能服務規範,明確生成式人工智能服務提供者應當采取有效措施防範未成年人用戶過度依賴或者沉迷生成式人工智能服務

中國新一代人工智能發展戰略研究院劉剛教授發布了《中國新一代人工智能科技產業發展 2023》

我國的人工智能產業集群表現為新型創新區→城市→區域→全國→全球的空間結構特征,依托狹小的物理空間打造無限的網絡空間產業創新生態

五大科技倫理十類人工智能倫理準則

增進人類福祉:以人為本,可持續性;尊重生命權利:合作,隱私;堅持公平公正:公平,共享;合理控製風險:共享;合理控製風險:外部安全,內部安全

中國人工智能倫理相關國內政策法規文件

《新一代人工智能發展規劃》,《促進新一代人工智能產業發展三年行動計劃(2018-2020年)》,《關於加強科技倫理治理的意見》,《中國關於加強人工智能倫理治理的立場文件》

人工智能倫理相關國際政策

《算法透明性和可問責性的聲明》,《2018年惡意偽造禁令法案》,《美國人工智能倡議》,《國家人工智能研究與發展戰略計劃》,《2019年深度偽造報告法案》

人工智能產業集群網絡結構的三個極點:北京市、廣東省和上海市

從技術合作關係的密度看,北京市,廣東省和上海市構成了人工智能產業集群網絡結構的三個極點;北京,廣東,上海,江蘇,安微,四川,湖北,湖南,重慶,山東和福建之間存在密集的人工智能技術合作關係

中國人工智能產業集群分布:京津冀、長江三角洲、珠江三角洲和川渝地區

排第一的是長江三角洲地區,占比 30.95%;排第二的是京津 冀地區,占比 29.36%;排第三的是珠江三角洲地區,占比 26.45%;排第四的是川渝地區,占比 3.55%

人工智能產業集群的基本構成

構成具有全球競爭力人工智能產業集群的首要因素是企業簇群及其產業創新生態;人工智能產業集群發展所倚重的科技創新要素不僅包括數據生態 算力 算法和人才

《中國新一代人工智能科技產業發展 2023》 建設具有全球競爭力的人工智能產業集群

劉剛教授發布了《中國新一代人工智能科技產業發展 2023》人工智能企業及其創新活動構成了人工智能產業集群發展的微觀基礎,我國人工智能企業數量超過3000家
資料獲取
人工智能標準
==最新資訊==
大模型專題一:中國人工智能係列白皮書——
AIoT白皮書:解鎖未來商業價值的關鍵_
AI時代來襲:中小企業如何抓住千載難逢的
人工智能時代的製造業進展與期望-人工智能
從規則走向實踐,2023 AI浪潮下的秘
十大趨勢重塑未來企業!超越想象的數字變革
喜訊!創澤集團榮膺“國家知識產權示範企業
中國信通院聯合發布《數據清洗、去標識化、
“好客山東 好品山東”丨創澤集團受邀參加
ICRA 自然語義引導的機器人技能操作
2023語義增強可編程知識圖譜SPG白皮
2023 中國人工智能係列白皮書--人工
2023中國人工智能係列白皮書《人工智能
AI大模型市場研究報告(2023)邁向通
深圳2023人工智能發展白皮書-人工智能
==機器人推薦==
迎賓講解服務機器人

服務機器人(迎賓、講解、導診...)

智能消毒機器人

智能消毒機器人

機器人開發平台

機器人開發平台


機器人底盤Disinfection Robot消毒機器人講解機器人迎賓機器人移動機器人底盤商用機器人智能垃圾站智能服務機器人大屏機器人霧化消毒機器人紫外線消毒機器人消毒機器人價格展廳機器人服務機器人底盤核酸采樣機器人機器人代工廠智能配送機器人噴霧消毒機器人圖書館機器人導引機器人移動消毒機器人導診機器人迎賓接待機器人前台機器人消殺機器人導覽機器人
版權所有 必威主頁中國運營中心:北京 清華科技園九號樓5層 中國生產中心:山東日照太原路71號
銷售1: 4006-935-088銷售2: 4006-937-088客服電話: 4008-128-728

Baidu
map