創澤機器人
CHUANGZE ROBOT
當前位置: 首頁> 新聞資訊> 機器人開發> 基於深度學習和傳統算法的人體姿態估計,技術細節都講清楚了

基於深度學習和傳統算法的人體姿態估計,技術細節都講清楚了

來源: AI科技大本營編輯: 創澤時間:2020/5/29 主題: 其他[ 加盟]

計算機視覺的一大研究熱點是人體姿態估計,還有很多問題急需解決,比如遮擋,交互等等。在最近的CVPR2020裏邊也有很多這方麵的工作。本文站長主要是想談談基於深度學習的實時多人姿態估計。


人體姿態估計要幹嘛?

關於人類活動規律的研究,必定是計算機視覺領域首要關注的內容。其中,人體姿態估計便是計算機視覺領域現有的熱點問題,其主要任務是讓機器自動地檢測場景中的人“在哪裏”和理解人在“幹什麼”。

隨著信息化時代的迅速發展,人類每時每刻都在通過多種多樣的手段和途徑獲得海量的可視化圖像數據,這使得基於自然場景圖像的人姿態估計研究在現實生活中擁有很多潛在的應用價值。圖1展示了自然場景圖像中人體姿態估計的研究應用。

Fig.1: 自然場景圖像人體姿態估計的研究應用

在信息化的時代,視頻監控正在銀行、超市以及公安機關等關乎人民財產、人身安全的重要場所發揮著舉足輕重的角色。麵對海量的視頻圖像序列,為了及時地製止現場事故的進一步發生,工作人員必須長時間且精神高度集中地觀察視頻監控畫麵並對異常事件作出處理。

除了工作人員很難長時間地保持高度警惕外,長期投入大量的人力來監測小概率發生的事件也不是單位機構提倡的做法。因此,實現視頻監控的智能化成為一種互聯網時代的必然趨勢。但是,實現智能視頻監控的前提條件是讓機器自動地識別視頻圖像序列中的人體姿態,從而進一步分析視頻圖像中人類的行為活動。

這就涉及到了我們下麵所要說的人體行為分析了。


人體行為分析又為那般?

人體行為分析理解成為了近幾年研究的熱點之一。在人體行為分析理解的發展過程中,研究人員攻克了很多技術上的難關,並形成了一些經典算法,但仍有很多尚未解決的問題。從研究的發展趨勢來看,人體行為分析的研究正由采用單一特征、單一傳感器向采用多特征、多傳感器的方向發展。而人體姿態估計作為人體行為識別的一個重要特征,是進行人體行為分析的基礎,是人體行為分析領域備受關注的研究方向之一。

人體姿態估計是指從圖像中檢測人體各部分的位置並計算其方向和尺度信息。人體行為分析是基於多幀圖像的前後關係進行分析理解,而人體姿態識別是針對單幀靜態圖像進行處理。正確識別出多幀連續的靜態圖像的姿態信息,為實現正確的行為分析理解提供了可能。因此,人體姿態估計的準確性與實時性直接影響人體行為分析的準確性和實時性,確保實時準確的姿態識別是進行下一步行為分析的基礎。

現在,我們的人體姿態估計課題的發展已越來越貼近實際,例如在步態分析、人機交互以及視頻監控等領域,人體姿態估計均具有廣泛的應用前景。所以呢,研究人體姿態估計還是蠻有意思的,好玩 !


當前姿態估計算法有哪些?

目前主流的人體姿態估計算法可以劃分為傳統方法和基於深度學習的方法。

基於傳統方法的人體姿態估計

傳統方法一般是基於圖結構和形變部件模型,設計2D人體部件檢測器,使用圖模型建立各部件的連通性,並結合人體運動學的相關約束不斷優化圖結構模型來估計人體姿態。

其缺點是什麼?

First,傳統方法雖然擁有較高的時間效率,但是由於其提取的特征主要是人工設定的HOG和SHIFT特征,無法充分利用圖像信息,導致算法受製於圖像中的不同外觀、視角、遮擋和固有的幾何模糊性。同時,由於部件模型的結構單一,當人體姿態變化較大時,部件模型不能精確地刻畫和表達這種形變,同一數據存在多個可行的解,即姿態估計的結果不唯一,導致傳統方法適用範圍受到很大限製。
Second,另一方麵,傳統方法很多是基於深度圖等數字圖像提取姿態特征的算法,但是由於采集深度圖像需要使用專業的采集設備,成本較高,所以很難適用於所有的應用場景,而且采集過程需要同步多個視角的深度攝像頭以減小遮擋問題帶來的影響,導致人體姿態數據的獲取過程複雜困難。因此這種傳統的基於手工提取特征,並利用部件模型建立特征之間聯係的方法大多數是昂貴和低效的。
基於深度學習的人體姿態估計算法

隨著大數據時代的到來,深度學習在計算機視覺領域得到了成功的應用。因此,考慮如何將深度學習用於解決人體姿態估計問題,是人體姿態估計領域的學者們繼圖結構模型後所要探索的另一個重點。早期利用深度學習估計人體姿態的方法,都是通過深度學習網絡直接回歸出輸入圖像中關節點的坐標。

總結

六階段雙分支網絡結構在關節點預測精度上略高於現有傳統的的人體姿態估計算法。本次站長采用的算法利用自底向上的思想,首先預測出所有骨點位置,並將骨點連接形成圖結構,通過圖優化實現多人體姿態估計。算法運行效率方麵,由於網絡同時預測出關節點位置和關節點之間的空間關係,為多人姿態估計算法提供更加稀疏的二分圖,降低二分圖優化複雜度而達到了實時的效果。





傳統目標檢測算法對比

SIFT、PCA-SIFT、SURF 、ORB、 VJ 等目標檢測算法優缺點對比及使用場合比較

基於深度學習目標檢測模型優缺點對比

深度學習模型:OverFeat、R-CNN、SPP-Net、Fast、R-CNN、Faster、R-CNN、R-FCN、Mask、R-CNN、YOLO、SSD、YOLOv2、416、DSOD300、R-SSD

如何更高效地壓縮時序數據?基於深度強化學習的探索

大型商用時序數據壓縮的特性,提出了一種新的算法,分享用深度強化學習進行數據壓縮的研究探索

滴滴機器學習平台調度係統的演進與K8s二次開發

滴滴機器學習場景下的 k8s 落地實踐與二次開發的技術實踐與經驗,包括平台穩定性、易用性、利用率、平台 k8s 版本升級與二次開發等內容

人工智能和機器學習之間的差異及其重要性

機器學習就是通過經驗來尋找它學習的模式,而人工智能是利用經驗來獲取知識和技能,並將這些知識應用於新的環境

麵向動態記憶和學習功能的神經電晶體可塑性研究

神經形態結構融合學習和記憶功能領域的研究主要集中在人工突觸的可塑性方麵,同時神經元膜的固有可塑性在神經形態信息處理的實現中也很重要

CVPOS自助收銀的挑戰以及商品識別算法工程落地方法和經驗

針對結算收銀場景中商品識別的難點,從商品識別落地中的模型選擇、數據挑選與標注、前端和雲端部署、模型改進等方麵,進行了深入講解

內容流量管理的關鍵技術:多任務保量優化算法實踐

通過分析其中的關鍵問題,建立了新熱內容曝光敏感模型,並最終給出一種曝光資源約束下的多目標優化保量框架與算法

百變應用場景下,優酷基於圖執行引擎的算法服務框架築造之路

優酷推薦業務,算法應用場景眾多,需求靈活多變,需要一套通用業務框架,支持運行時的算法流程的裝配,提升算法服務場景搭建的效率

餓了麼推薦算法的演進及在線學習實踐

餓了麼算法專家劉金介紹推薦業務背景,包括推薦產品形態及算法優化目標;然後是算法的演進路線;最後重點介紹在線學習是如何在餓了麼推薦領域實踐的

拯救渣畫質,馬賽克圖秒變高清,杜克大學提出AI新算法

杜克大學的一種 AI 算法PULSE可以將模糊、無法識別的人臉圖像轉換成計算機生成的圖像,其細節比之前任何時候都更加精細、逼真

如何搭建一個GPU加速的分布式機器學習係統,遇到的問題和解決方法

能快速將現有算法在實際生產環境落地,並能利用GPU加速實現大規模計算,我們自己搭建了一個GPU加速的大規模分布式機器學習係統,取名小諸葛
資料獲取
機器人開發
==最新資訊==
ChatGPT:又一個“人形機器人”主題
ChatGPT快速流行,重構 AI 商業
中國機器視覺產業方麵的政策
中國機器視覺產業聚焦於中國東部沿海地區(
從CHAT-GPT到生成式AI:人工智能
工信部等十七部門印發《機器人+應用行動實
全球人工智能企業市值/估值 TOP20
必威主頁第十一期上
諧波減速器和RV減速器比較
機器人減速器:諧波減速器和RV減速器
人形機器人技術難點 高精尖技術的綜合
機器人大規模商用麵臨的痛點有四個方麵
青島市機器人產業概況:機器人企業多布局在
六大機器人產業集群的特點
機械臂-高度非線性強耦合的複雜係統
==機器人推薦==
迎賓講解服務機器人

服務機器人(迎賓、講解、導診...)

智能消毒機器人

智能消毒機器人

機器人開發平台

機器人開發平台


機器人招商Disinfection Robot機器人公司機器人應用智能醫療物聯網機器人排名機器人企業機器人政策教育機器人迎賓機器人機器人開發獨角獸消毒機器人品牌消毒機器人合理用藥地圖
版權所有 必威主頁中國運營中心:北京 清華科技園九號樓5層 中國生產中心:山東日照太原路71號
銷售1: 4006-935-088銷售2: 4006-937-088客服電話: 4008-128-728

Baidu
map