跳到主要內容

為助計算機視覺實現新突破,谷歌發布全球最大的人工和自然地標數據集






長按識別二維碼,報名2018十大突破性技術中國區線下解讀會


圖像分類技術在過去幾年中取得了顯著的進步,這在一定程度上體現在Imagenet 分類挑戰上,機器的誤差率每年都在大幅下降。


為了繼續推進計算機視覺技術的先進水平,許多研究人員現在更多地關注細粒度和實例級的識別問題,而不是識別一般實體,如建築物、山脈,當然還有貓,許多人正在設計能夠識別 埃菲爾鐵塔、富士山或波斯貓的機器學習算法。


然而,這一領域研究的一個重大障礙是缺乏大量帶註釋的數據集。


而就在今天,谷歌在其官方博客宣布,發布 Google-Landmarks 數據集來推進實例級的識別,這也是世界上最大的人工和自然地標識別數據集。



Google-Landmarks 將作為 Kaggle 網站上地標識別和地標檢索挑戰發布,這將是 CVPR 18 地標研討會的重點。


該數據集包含二百萬多幅圖像,描繪了來自世界各地的三萬處獨特的地標,數據集類別的數量比常用的數據集大 30 倍。 此外,為了促進這一領域的研究,我們是開源的深度本地特徵( DELF ),我們認為這是一種非常好的本地特徵描述方法,特別適合於這類任務。


地標識別與其他問題有一些顯著的區別。 例如,即使在大型帶標註的數據集中,對於一些不太熱門的地標,也可能沒有太多的訓練數據。 此外,由於地標通常是不動的物體,所以內部變化很小(換句話說,地標的外觀在不同的圖像中變化不大)。



因此,變化只會由於圖像捕獲條件而產生,如遮擋、不同的視角、天氣和光照,這與其他圖像識別數據集不同,其中特定類別的圖像(如狗)的變化可能更大。 這些特徵也與其他實例級識別問題(如藝術品識別)有共同之處,


因此,谷歌希望這個新的數據集也能對其他圖像識別問題的研究有所幫助。


這兩項 Kaggle 挑戰將為研究人員解決這些問題提供了獲取帶標註的數據的途徑。 識別軌跡挑戰是在測試集中建立識別正確地標的模型,而檢索挑戰則要求參與者檢索包含相同地標的圖像。 通過 Kaggle 網站就能訪問到這個新的數據集。


-End-


編輯:LXQ  校審:黃珊


參考:


https://research.googleblog.com/2018/03/google-landmarks-new-dataset-and.html?m=1








http://www.buzzfunnews.com/2018037763.html

更多有趣新聞請上:http://www.buzzfunnews.com

留言

這個網誌中的熱門文章

實木床的挑選技巧 軟木床和實木床哪個好

床,對我們每一個人而言都是一個非常重要的生活用具,睡眠的好壞與我們每天睡的床息息相關。 那麼實木床的挑選技巧有哪些、軟木床和實木床到底哪個更好呢,下面,小編就來給大家進行一下介紹吧。 床,對我們每一個人而言都是一個非常重要的生活用具,睡眠的好壞與我們每...

這一次,卷福終於不演天才了

去年一年, “卷福”本尼迪克特·康伯巴奇 非常忙碌。 除了與邁克爾·珊農在熱門的歷史劇《戰爭法》中有合作之外,他去年還花了很多時間參與了大片《復仇者聯盟3:無限戰爭》的拍攝。 另外,康伯巴奇繼續發展著他的製作公司SunnyMarch,並投入到他們迄今為止最大的一筆投資——一部新...

2018華為P20法國巴黎新品發布會視頻直播 3月27日北京時間

日前,華為官方已經宣布將於3月27日在法國·巴黎召開新品發布會,但是並沒有公佈更具體的時間,現在,華為高級副總裁在微博上宣布,華為P20全球發布會將於北京 時間3月27日20:30在法國巴黎舉行,屆時華為視頻會對全程進行視頻直播。    余承東:華為P20發布會3月27日晚8點半(圖片引自微博...