動一動就認清你 機器說可以

2017-11-13 08:57:59|來源:科技日報|編輯:韓俁 |責編:韓俁

  近日,谷歌發佈AVA (Atomic Visual Actions)數據庫,由YouTube公開的視頻集組成,這些視頻可以用80個原子動作進行標注,例如走路、握手、踢東西等,所有動作具有時空定位,累計有5.76萬個視頻片段,9.6萬個人類動作,以及21萬個動作標簽。谷歌稱,此次發佈的AVA技術將幫助谷歌分析多年的視頻,還能幫助廣告商更好地瞄準消費者。他們的最終目標是教電腦社交視覺智慧化,即“理解人類在做什麼,下一步該做什麼,以及他們想要實現什麼目標。”

  目前,國內一些科研院所和企業也已經在行為識別相關領域進行重點投入,以解決視頻監控數據理解這一瓶頸問題,但要達到讓機器通過行為“理解”人類這個最終目標,還需要很多努力。“目前,人體行為識別大多還處在動作識別階段,對於實際應用而言,識別人的動作,還是一個巨大的挑戰。”11月8日,濟南大學模式識別與智慧系統研究所所長李金屏教授告訴科技日報記者。動一動,機器就能發現你?有關專家表示,現階段,這是一件“可以有”的事。

  應用:

  安防等領域大展神威

  李金屏告訴記者,動作識別可以看成是特徵提取和分類器設計相結合的過程。養老院中,如果出現老人摔倒,行為識別系統可以立刻向工作人員發出警報,甚至直接與醫院進行聯繫;黑科技滿滿的《碟中諜5》,安保系統的最後一道防線是步態識別……儘管技術難點重重,行為識別目前仍然在相關領域獲得了應用。

  浙江大學人工智慧研究所所長吳飛教授告訴記者,這項最早被蘋果和微軟應用於遊戲的技術,還在公檢法(在押人員審訊看護)、電力(風力發電、國家電網的安全生產)、銀行(業務區域智慧安防)、醫院(病人狀態監護)等多個場景有更廣的應用空間。尤其在安防等領域,以行為識別為基礎的應用更廣泛。

  比如通過人的走路方式來識別身份的步態識別,雖然屬於身份識別,但是也是行為識別和身份識別的一種有效交叉。步態識別是一種通過人們走路姿態進行的身份識別,分為人形檢測、分割、識別、跟蹤四個部分,而這些部分最具挑戰的環節都離不開以行為識別為基礎的研究。

  在近年來尋找失蹤人口和嫌犯追逃的工作中,步態識別已經發揮了不小的作用。《機智過人》節目中,銀河水滴科技成功通過步態識別現場“嫌疑人”,加大難度後,還靠步態識別出狗的剪影。

  銀河水滴科技創始人兼CEO黃永禎說,通過步態識別來實現異常行為分析,這是步態識別相比于其他生物特徵識別的重要優勢之一。異常行為的應有之義就包括可以通過視覺觀察目標體形和動作狀態,來發現是否有異常行為,通常會涉及到目標檢測、分割、關鍵點定位、識別、跟蹤等技術環節,而這些技術環節也是步態識別的核心底層技術。目前,他們已能很好地完成遠距離非受控模式識別。

  難點:

  定位、跟蹤、場景步步為艱

  “行為識別的難點,首先表現為從連續視頻流中對人體運動的定位難、追蹤難。”吳飛說,在視頻行為識別中,要找到一個連續動作的起點和終點,即將連貫動作從視頻流中定位出來,在視頻識別中是非常困難的。而在找到某個連貫動作的起點後,對這個動作進行魯棒跟蹤也比較困難。比如一個跳躍動作,要實現追蹤動作持續展開的過程就不容易,還要考慮場景的複雜性以及背景動態變化或者攝像頭晃動等因素。

  不僅如此,場景識別也是一大難點。首先,即使是同一類動作,在不同時刻、不同場景也具有很大差異性。吳飛舉例說,比如不同的人在不同時刻行走,速度、姿態和場景遮擋等方面都有差異。不同類別動作之間更是如此。李金屏表示,“與靜態對象不同,動作會隨著時間的推移而展開,會有更多不確定因素。”比如一幅人的“跑步”照片,實際上有可能只是這個人在跳躍的動作,只有看到更多畫面,才有可能清楚地知道到底發生了什麼。可見人在場景中的動態是多麼複雜。因此某一動作的識別方法很難直接用在另一動作的識別上。“一個動作,人類辨識兩三遍就可以了,但要讓機器記住並識別,則需要大量的訓練數據。”李金屏說。

  此次谷歌發佈的AVA與其他數據集相比,通過在相關場景中提供具有精細時空粒度的多個標簽,將極大推動人們對於相關模型的深入研究,最終不但能夠實現人的複雜活動精確建模,還將進一步獲得實際應用。

  展望:

  設備平臺、理論模型方興未艾

  “在行為識別領域,中國未來五年、十年的發展後勁非常強,建議在設備和平臺方面進行攻關,現在國內好多團隊的設備還是採用微軟等國外企業的設備和平臺,希望國家在這方面給予一定的支援和政策引導。”李金屏說。

  在吳飛看來,中國的科研團隊和企業還應該在理論模型、數據驅動等基礎理論方面進行深耕。“一個行為動作的過程要經歷多個狀態(對應很多時間幀),人體在每個時刻也呈現出不同的姿態,那麼,是不是每一幀在動作判別中的重要性都相同呢?對於行為動作的判別,是不是每個關節點在動作判別中都同等重要呢?這些都需要理論模型等基礎理論的完善。”吳飛說。

分享到:

國際線上版權與資訊產品內容銷售的聲明:

1、“國際線上”由中國國際廣播電臺主辦。經中國國際廣播電臺授權,國廣國際線上網路(北京)有限公司獨家負責“國際線上”網站的市場經營。

2、凡本網註明“來源:國際線上”的所有資訊內容,未經書面授權,任何單位及個人不得轉載、摘編、複製或利用其他方式使用。

3、“國際線上”自有版權資訊(包括但不限于“國際線上專稿”、“國際線上消息”、“國際線上XX消息”“國際線上報道”“國際線上XX報道”等資訊內容,但明確標注為第三方版權的內容除外)均由國廣國際線上網路(北京)有限公司統一管理和銷售。

已取得國廣國際線上網路(北京)有限公司使用授權的被授權人,應嚴格在授權範圍內使用,不得超範圍使用,使用時應註明“來源:國際線上”。違反上述聲明者,本網將追究其相關法律責任。

任何未與國廣國際線上網路(北京)有限公司簽訂相關協議或未取得授權書的公司、媒體、網站和個每人平均無權銷售、使用“國際線上”網站的自有版權資訊產品。否則,國廣國際線上網路(北京)有限公司將採取法律手段維護合法權益,因此產生的損失及為此所花費的全部費用(包括但不限于律師費、訴訟費、差旅費、公證費等)全部由侵權方承擔。

4、凡本網註明“來源:XXX(非國際線上)”的作品,均轉載自其他媒體,轉載目的在於傳遞更多資訊,豐富網路文化,此類稿件並不代表本網贊同其觀點和對其真實性負責。

5、如因作品內容、版權和其他問題需要與本網聯繫的,請在該事由發生之日起30日內進行。