求真百科歡迎當事人提供第一手真實資料,洗刷冤屈,終結網路霸凌。

中國圖象圖形學學會國際合作與交流工作委員會檢視原始碼討論檢視歷史

事實揭露 揭密真相
前往: 導覽搜尋

來自 搜狐網 的圖片

中國圖象圖形學學會國際合作與交流工作委員會與國際圖像圖形組織、區域性組織及各國相關機構和學會開展交流與合作;組織、參加相關的國際會議及雙邊與多邊學術研討會;為學會及其會員的國際學術合作交流、參觀考察提供信息、渠道等方面的指導和服務。

相關資訊

「志存高遠,追求卓越」 ----訪中國圖象圖形學學會副理事長、中國科學院自動化所研究員王亮

王亮研究員是中國圖象圖形學學會的副理事長、國際電子電氣工程師學會會士(IEEE Fellow)、國際模式識別學會會士(IAPR Fellow)。曾主持國家傑出青年科學基金[1]、國家重點研發計劃項目等,入選國家第四批萬人計劃科技創新領軍人才,獲得第十四屆中國青年科技獎。主要從事計算機視覺、模式識別、機器學習、數據挖掘等領域的研究,在遠距離行人檢測與識別、視覺-語言理解、時序數據建模等方面取得了一系列研究成果,突破了跨視角、小樣本、低分辨率等核心技術難題,與華為、騰訊、京東、高德等知名企業進行技術研發或應用合作。已孵化銀河水滴科技(北京)有限責任公司,創造了良好的社會和經濟效益

2022年8月30日,受中國圖象圖形學學會委託,學會成員黃岩副研究員線下採訪了王亮研究員,以下為訪談的主要內容。

問題1:您團隊的主要研究方向是什麼?可以介紹下最具有代表性的研究成果嗎?

我的團隊隸屬於智能感知與計算研究中心四大主要研究方向之一,即「多模態智能計算」,主要針對文本、圖像、視頻等多模態數據,開展模式識別、計算機視覺、機器學習、數據挖掘等方向的理論及應用研究,主要包括:(1)多模態智能監控:面向海量監控視頻的智能分析需求,研究大範圍複雜場景中的目標檢測與跟蹤、行人屬性與身份識別、行為分析與事件識別等關鍵技術,解決國家公共安全中海量目標檢索、異常檢測等難點問題。(2)網絡多模態數據挖掘:面向公共安全和企業應用的實際需求,研究多模態大數據的時序預測、情境建模、用戶畫像、事實驗證等核心問題,服務國家網絡信息安全和商業智能場景應用。(3)多模態學習及智能分析:面向複雜場景多模態語義理解現實需求,研究認知機理啟發的多模態數據融合、對齊、生成等關鍵技術,突破語義表示弱、結構推理難、關聯標註少等核心難題,服務於無人自主平台的多模態交互場景等應用。

團隊最具有代表性的研究成果之一,是遠距離行人檢測與識別,即步態識別。大家或許很少聽說步態識別這個概念,但是相信大家在生活中早已用過步態識別。例如,我們經常在遠處還未來得及看清對方面孔時,就能通過走路姿態辨別出自己熟悉的親朋好友。我們在2000年就開始步態識別研究,截止目前已經取得了多個 「第一」,包括:發表了國際上第一篇關於步態識別的國際頂級期刊TPAMI文章;創建國際上第一個多視角步態識別數據庫(CASIA-A);培養了中國第一位步態識別博士;第一次在模式識別國際大會(ICPR)上舉辦步態識別講習班;創立了國際上第一家步態識別公司(銀河水滴)等。

問題2:您提到了步態識別,相對於其它生物特徵識別技術,它有哪些優勢?在研究過程中遇到哪些難題?

步態識別目前是遠距離複雜場景下幾乎唯一可用於身份識別的生物特徵識別技術。相比人臉、虹膜等生物特徵,具有以下優點:(1)適用距離廣,普通高清攝像機下可達50米;(2)全視角,無需配合,360度行人均可識別;(3)抗干擾,不受面部化妝與遮擋等影響,對光照變化相對魯棒。

在研究過程中,我們遇到了很多現實難題。首先,最初國際上的步態識別研究工作很少,可以參考的資料幾乎沒有。其次,缺少一定規模的公開步態數據庫,無法順利開展實驗。在這種情況下,想在步態識別方向做出成果,難度可想而知。我們憑着一股韌勁,選擇自己構建步態數據庫,從零開始鑽研算法。在不懈的努力下,早期提出了一種基於人體剪影分析的步態識別方法,發表在了國際頂級期刊TPAMI上,這也是該期刊收錄的第一篇步態識別研究論文。俗話說的好,萬事開頭難,當我們邁出了成功的第一步,很快我們又提出許多新的步態識別方法,相繼發表在圖像處理國際頂級期刊TIP及計算機視覺頂級會議ICCV、ECCV等。在深度學習技術剛剛興起之時,團隊的吳子豐博士便率先將深度學習引入到步態識別中,在跨視角步態識別方面取得突破,提高了30%的準確率,該項研究成果再次發表在TPAMI上,近期介紹我們創建的CASIA-E步態數據集及系統算法評估的論文再一次被TPAMI接收。一項研究成果從實驗室走向實用需要歷經很多階段,我們用了超過17年的長期不懈努力才初步完成了步態識別技術的產業化落地。2016年,我們嘗試將步態識別技術進行產業化,成立了銀河水滴科技(北京)有限公司。目前步態識別技術已廣泛部署到安防刑偵第一線,產生了良好的社會和經濟價值。

問題3:您團隊構建了很多各有特色且具有影響力的數據庫,為什麼數據庫對於算法研究來說如此重要?您認為一個好的數據庫需要具備哪些標準?

機器學習與深度學習的一個最大特點就是利用訓練數據來擬合複雜模型的參數。所以對於一個特定的研究任務來說,沒有合適的數據集,就很難開展相應的算法研究。仍以步態識別為例,我們在步態數據庫建設方面起步很早,也一直走在國際前列。在2001年,為了解決多視角步態識別問題,我們建設了國際上第一個多視角步態數據庫CASIA-A,為跨視角步態識別算法研究提供了數據基礎。到了2005年,隨着算力水平的不斷提高,我們建設了一個規模更大、視角更多的步態數據庫CASIA-B。為了解決夜間步態識別問題,我們建設了夜間紅外步態數據庫CASIA-C。為了探索人的步態與足印之間的關係,我們在2009年建設了足印步態數據庫CASIA-D。考慮到深度學習對於數據的需求更大,在2016年,我們建設了一個超大規模的步態數據庫CASIA-E,包含1014人在3種不同場景下、在26個不同視角下、變換3種着裝共70餘萬段步態視頻。

從CASIA-A到CASIA-E的建設過程可以看出,好的數據庫可以直接加速研究的進程,而數據庫自身也能在新的研究需求下不斷完善。總體來說,好的數據庫需要具備三個重要標準:數據規模大、內容多樣性豐富、符合實際使用需求。例如,ImageNet數據庫是一個用於視覺目標識別算法研究的大規模數據庫,很多經典算法(例如AlexNet、VGGNet、ResNet、DenseNet等)都是在它的基礎上發展而來,大大推動了相關算法的實用化發展。後來,由於目標識別的精度已經超越人類水平,一個比ImageNet標註規模更大、內容多樣性更強的Visual Genome數據庫出現了,有力支撐了相關算法向更有挑戰的實際任務上進行拓展。

問題4:您曾在國外多所高校從事科研工作,在您看來,國內外科研方式和條件與國內相比有何不同?

2004年,我在中科院自動化所獲得博士學位。2004~2009年,先後在英國帝國理工學院、澳大利亞莫納什大學、澳大利亞墨爾本大學從事博士後研究工作。2009年開始在巴斯大學作為講師工作,拿到終身教職。要玩就玩得痛快,要學就學得踏實。這是我所感受到的國外科研工作者對工作和生活態度的真實寫照。他們通常將工作和生活劃分得很清楚,例如國外導師在周末或度假的時候幾乎是不會處理工作事情的。但是,我發現他們不管多忙,每周都會認真閱讀學生的工作周報並給出意見和建議,同時每周也會留出固定時間與每位學生面對面交流,這是一種很好的科研交流方式。通過比較國內外的科研環境,我認為國內的硬件設施並不比國外差,但軟實力可能還有待提升,比如科研基礎和創新思維等。目前,雖然國內很多技術在國際上已經處於領先地位,但部分領域仍缺少原創性成果,存在卡脖子的問題。未來,我們希望能夠潛心科研,做出更多具有國際影響力的、學術原創性的、應用潛力強的新工作。

問題5:在回國之前,您已經拿到了英國巴斯大學的終身教職,後來是什麼原因讓您放棄國外教職轉而回到國內重新開始呢?

我是在國內讀的博士,畢業後之所以選擇出國主要是想出去體驗國外的風土人情,以及了解國外的學習、科研、工作等方式。但是,在國外呆得久了之後,原本的好奇和新鮮感逐漸褪去,於是便動了回國效力的念頭。如果自己所學能為自己的國家作點貢獻,哪怕只是一點點,心裡的滿足感也將是不可言喻的。我忘不了當時辭職時系主任驚愕的表情,他說全球經濟不太景氣,能找到正式工作是多麼不易,一再問我你確定辭職嗎?在2010年,我還是堅定地辭退了巴斯大學的終身教職,以中科院百人計劃回國工作。回國後,我全身心投入到計算機視覺與模式識別領域的研究工作中,並在2014年被授予「國際模式識別學會會士」榮譽稱號,在2019年被授予「國際電氣與電子工程師[2]協會會士」榮譽稱號。

參考文獻

  1. 國家傑出青年科學基金項目,國家自然科學基金委員會
  2. 工程師分為哪幾個等級?,搜狐,2022-05-16