三維不規則數據常常出現在許多領域的研究中,比如社會科學中的社會網絡、大腦成像中的功能網絡,又或者在我們接下來要提到的研究三維形狀的計算機圖形學中,這樣的不規則數據在現實生活中幾乎是無處不在的。
近年來,基於這種三維不規則數據的深度學習發展迅速,而圖卷積神經網絡應對三維不規則數據的表現尤為突出[2]。
在計算機圖形學中,為了虛擬化真實世界的物體(如人或者動物等),三維形狀通常需要離散化為網格(mesh),用於真實感渲染。但是,因為設備的差異或采集方式的不同,很難針對單個三維形狀得到的相同的離散化方式(固定的分辨率和連接關係)。這種同一個形狀具有不同的離散化方式是計算機圖形學有別於其他學科的一個重要特點,而現有的圖神經網絡無法有效統一不同離散化下的特征,這極大地限製了圖神經網絡在圖形學領域的發展。
那麼,如何解決這一問題呢?
自動化所團隊提出了一種新穎的多尺度圖卷積神經網絡,重點解決了傳統圖卷積神經網絡中圖節點學習到的特征對圖分辨率和連接關係敏感的問題。該方法可以實現在低分辨率的三維形狀上學習特征,在高低分辨率形狀之上進行測試,並且保持不同分辨率特征的一致性。
01 研究背景
傳統的圖卷積神經網絡通常聚集1-鄰域(GCN),k-環鄰域(ChebyGCN)或k-近鄰鄰域(DGCNN)的信息,所以其感受野與分辨率或者圖連接關係是相關的。也就是說,在三維形狀的不同離散化下,卷積的感受野對應的形狀語義範圍產生了較大的變化。如何解決這種卷積方式未考慮到針對不同離散化情況所產生的問題,存在較大的挑戰。
02 方法簡述
為解決現有圖卷積神經網絡的問題,團隊設計了一種多尺度圖卷積神經網絡(multiscale graph convolutional network,MGCN)。如圖1所示,我們發現,針對不同分辨率和連接關係的離散化,三維圖譜小波函數表現出極佳的魯棒性,並且不需要計算測地距離。因此,我們設計將多尺度的小波函數嵌入到圖卷積神經網絡的學習當中。
2020年5月底OpenAI發布了有史以來最強的NLP預訓練模型GPT-3,最大的GPT-3模型參數達到了1750億個參數
達摩院金榕教授介紹了語音、自然語言處理、計算機視覺三大核心AI技術的關鍵進展,並就AI技術在在實際應用中的關鍵挑戰,以及達摩院應對挑戰的創新實踐進行了解讀
新一代移動端深度學習推理框架TNN,通過底層技術優化實現在多個不同平台的輕量部署落地,性能優異、簡單易用。騰訊方麵稱,基於TNN,開發者能夠輕鬆將深度學習算法移植到手機端高效的執行,開發出人工智能 App,真正將 AI 帶到指尖
新加坡國立大學NExT中心的王翔博士分析了知識圖譜在個性化推薦領域的應用背景,並詳細介紹了課題組在個性化推薦中的相關研究技術和進展,包括基於路徑、基於表征學習、基於圖神經網絡等知識圖譜在推薦係統中的融合技術
根據各種指法的具體特點,對時頻網格圖、時域網格圖、頻域網格圖劃分出若幹個不同的計算區域,並以每個計算區域的均值與標準差作為指法自動識別的特征使用,用於基於機器學習方法的指法自動識別
Tube Feature Aggregation Network(TFAN)新方法,即利用時序信息來輔助當前幀的遮擋行人檢測,目前該方法已在 Caltech 和 NightOwls 兩個數據集取得了業界領先的準確率
姚霆指出,當前的多模態技術還是屬於狹隘的單任務學習,整個訓練和測試的過程都是在封閉和靜態的環境下進行,這就和真實世界中開放動態的應用場景存在一定的差異性
優酷智能檔突破“傳統自適應碼率算法”的局限,解決視頻觀看體驗中高清和流暢的矛盾
通過使用仿真和量化指標,使基準測試能夠通用於許多操作領域,但又足夠具體,能夠提供係統的有關信息
基於內容圖譜結構化特征與索引更新平台,在結構化方麵打破傳統的數倉建模方式,以知識化、業務化、服務化為視角進行數據平台化建設,來沉澱內容、行為、關係圖譜,目前在優酷搜索、票票、大麥等場景開始進行應用
NVIDIA解決方案架構師王閃閃講解了BERT模型原理及其成就,NVIDIA開發的Megatron-BERT
自然語言處理技術的應用和研究領域發生了許多有意義的標誌性事件,技術進展方麵主要體現在預訓練語言模型、跨語言 NLP/無監督機器翻譯、知識圖譜發展 + 對話技術融合、智能人機交互、平台廠商整合AI產品線