COCO 2017競賽,在曠視科技首席科學家、研究院院長孫劍博士的帶領下,曠視研究院一舉奪得三個冠軍:參與了COCO物體檢測、物體分割和人體關鍵點檢測三項任務的挑戰,取得了兩項第一(物體檢測、人體關鍵點),一項第二(物體分割);還在Places語義分割環節戰勝谷歌奪得第一。孫劍博士也是深度殘差網絡ResNet作者之一,最近倍受關注的AlphaGo Zero的一個關鍵技術便是ResNet。
2017年11月8日,孫劍博士出席了由新智元舉辦的 AI World 2017世界人工智能大會上,并發表了《視覺端計算:從ResNet到ShuffleNet》的主題演講。

孫劍博士此前提到,曠視成功的秘訣是創新,不斷地創新,持續不斷地創新。在接受新智元專訪時,他分享了如何做到本質創新的秘訣:本質創新是希望能觸及問題的本質,但也分兩個層次。
“大層次來看,算法要解決問題,有兩種: 一種是定義問題、理解問題。今天,人工智能很多問題是不清楚的,因為人工智能屬于跨學科的研究,以機器學習為基礎,有計算機視覺、語音處理等等問題牽扯在一起,其中很多問題沒有定義清楚。所以在講算法創新的時候,首先要看需要解決什么問題。我認為最高層次的算法創新是對問題的理解以及新的看法。所以首先要理解清楚問題,才能夠有本質創新。換句話說,只有方向正確了,才可能做出好的算法,這是比較高的層次。
另外,對問題的理解需要挺長時間。如果想真正深刻理解一個問題的話,非常聰明的人可能要花兩三年,不聰明的人可能需要五年,這樣才可能對問題有非常深刻的理解。理解以前都做了什么?你現在做的這個東西是不是有意義的?這是上一層的算法創新,深入理解和清楚定義問題本質之后,算法才有意義。
下面一層的算法創新是說,今天在一定時期內發現了一個新問題,然后去找一個算法把這個問題又快又好地解決。
這里遵守兩條準則,第一條準則是這個算法必須有一定的推廣性,不能太特殊。比如說做物體識別,舉個例子,原來我們曾經做過貓頭檢測,利用貓的耳朵比較尖的特性做了算法,這個問題解決了,但沒有通用性,影響力就不大。
第二個原則就是別人會不會用、會不會重復使用你的算法。如果你是在學術界或者要公開算法的話,只有別人主動愿意用你的算法,才能形成網絡效應。你自己很看好,但是別人不看好,或者說別人并不去主動用你這個東西,說明你的這個東西沒有觸到用戶的痛點。其實,你的同行也是你算法的用戶,如果他們不得不主動使用你的算法,這就說明真正觸及到了問題的本質,這條是非常重要的。我們以前在大公司做的一些算法,今天還有很多人用。我們今天在Face++做的算法(ShuffleNet),第二天就有公開的開源社區,去實現這個算法,他們在不少大公司和創業公司都第一時間用了這個算法。這就說明你的算法特別好用,這樣的東西就是本質性創新。”
曠視研究院院長的帶兵之道:讀《孫子兵法》,鼓勵出論文,不在乎數量
孫劍博士曾談到,在帶領團隊拿到COCO競賽冠軍方面,做好了三件事:建團隊、激勵團隊、培養團隊。在接受新智元專訪時,孫劍詳細分享了如何帶領好一個團隊,吸引更多的人才。
他說:“帶團隊這件事情其實是多層次的。我最近看《孫子兵法》上講的,為將者首先要智勇雙全,要仁、要嚴、要信,還要做到明,誰做得對、誰做得不對要非常明。大致就是建立一個很好的文化,建立一些大的框架,哪些是我們應該做的,哪些是不應該做的。要圍繞著我們公司的價值觀,我們公司價值觀叫“追求、極致、簡單、可靠”,這幾個字對一個團隊非常重要。“追求、極致”有兩個含義,一個是說我們要做到最好,另一個是說做這件事情的時候要付出最大的努力,把所有的潛力都發揮出來。”
“從人才觀上的話,我們當然是希望找最聰明的人,我們要求并不高,你只要數學還不錯就可以。你如果線性代數還可以,編程還可以的話就可以做這件事情。我們的環境非常扁平化,所有的數據代碼基本上都是共享的,所有的知識都是共通的,包括我們內部的MegBrain。你如果想了解每個細節,就可以找MegBrain的開發者,他會給你講細節,到底MegBrain怎么設計的、怎么優化,你會學到這些東西,可以有一個很自由的空間來做這件事情。還有一個很大的因素,讓大家覺得創新是安全的,是他愿意冒風險去做的。我大多數時候都不會說不要做這個、不要做那個,而是說你試試看,這樣讓大家有一個安全的、愿意探索的環境,提高命中率。”
在AI人才非常稀缺的今天,孫劍表示,在研究院,我們鼓勵出論文。這在國內外的創業公司里面應該是少數現象。“因為很多優秀人才希望他們的工作一部分可以被看到。我們通過這樣的方式吸引人才”,他說。
但是,曠視對論文數量沒有要求。“我們對任何的事情都沒有數量要求,哪怕你只有一篇論文,但只要滿足創新的兩條原則,第一它是通用的,第二別人愿意用,只要有一篇這樣的論文就可以。我以前自己做研究,每次會議投稿時會花很長時間只做兩篇論文,我自己主做一篇,另一篇讓學生做,或者跟別人一起做一篇。我們不追求數量,只要有一篇了不起的論文就可以。”
以下是曠視科技Face++首席科學家孫劍博士在新智元AI World 2017世界人工智能大會上的演講:
孫劍AI WORLD 2017世界人工智能大會演講:
《視覺端計算:從ResNet到ShuffleNet 》
孫劍:各位好,非常高興新智元提供了這樣一個機會把我們做計算機視覺研究的人聚在一起,也非常高興見到以前的老朋友,比如騰訊的賈佳亞博士,我們之前曾經一起做計算機圖形學和計算機攝影學。剛才賈佳亞展示了一張圖:那是2004年我們倆合作的第一篇siggraph論文。當時非常難,不亞于今天去 COCO 或者 ImageNet拿一個冠軍。今天到場的嘉賓中,華先勝博士也是我在微軟的同事。計算機視覺在深度學習的推動下,發生了天翻地覆的變化,今天也在此分享一些我最近的工作。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。