Google圖片數據集發布最新 V3 版，涵蓋600個對象類的標記邊框

archieyang 發布于2019-04-25 18:22 / 2071人閱讀

摘要：日前，谷歌發布開發圖片數據集的版，比起今年月份發布的版，這一版本的邊框數和圖像層級標簽數都大大增加。大部分的人工驗證都已經在谷歌內部手工完成了，另外一小部分是通過在上進行眾包驗證來完成的。

日前，谷歌發布 Open Images Dataset （開發圖片數據集）的 V3 版，比起今年7月份發布的 V2 版，這一版本的邊框（bounding box）數和圖像層級標簽（image-level label）數都大大增加。

圖： Open Images Dataset 中的標注圖像

Open Images Dataset 包含900萬張圖片 URL，里面的圖片都已經被標注，帶有標簽和邊框，橫跨成千上萬個類。大家現在可以到 https://github.com/cvdfoundation/open-images-dataset 進行下載。

該數據集包括一個訓練集(9,011,219張圖像)、一個驗證集(41,620張圖像)和一個測試集(125,436張圖像)。在 V2 版本中， V1 版本的驗證集被分割成驗證集和測試集，這是為了更易于評估。圖像的標簽和邊框描述如下：

圖像層級標簽

下表是不同數據集中圖像層級標簽的概況，可以通過類似于 Google Cloud Vision API 的計算機視覺模型自動生成所有圖片的圖像層級標簽。

驗證集和測試集中的所有圖像，以及訓練集中的一部分圖像都帶有經過人工驗證的圖像層級標簽。大部分的人工驗證都已經在谷歌內部手工完成了，另外一小部分是通過在Image Labeler（Crowdsource app, g.co/imagelabeler）上進行眾包驗證來完成的。這種人工驗證雖然可以消除掉錯誤信息，但卻不能發現漏報情況，所以圖像中可能會缺失某些標簽。產生樣本的模型不只是上面提到的自動生成標簽的模型，還覆蓋其他很多計算機視覺模型，所以類的數量大大增加了。

在數據集中，共有19,995個帶有圖像層級標簽的不同的類，其中19,693個類中至少有一個經過人類驗證的標簽，7870個類中帶有機器生成的標簽。

邊框

下表是在所有數據集中邊框標記的概況，其中包括600個對象類。這個數量遠遠大于在 ILSVRC 和 COCO 挑戰賽中涵蓋的類，另外還增加了諸如 fedora 帽和雪人等新的對象。

Google 為驗證集和測試集中的所有對象實例提供完整的邊界框注釋，這些都是在公司內部通過手工標記的。此外，他們還盡可能地嘗試在語義層次（semantic hierarchy）上將邊框標記得足夠具體。

例如，汽車有兩輛，一輛是兒童豪華轎車，一輛是貨車。豪華轎車（limousine）和貨車（van）被標記為limousine和van，而所有其他類型的汽車（car）被標記為汽車（car）。

此外，注解者還為每個邊框標記了一組屬性，例如指示對象是否被遮擋。驗證集和測試集中的每個圖像平均大約有5個邊框。

Data Formats數據格式

數據原始碼包含如下文件：

images.csv

在訓練集、驗證集和測試集中的每個子集中都會有這樣的文件。這里面包含圖片URL、OpenImage ID、標題、作者和許可信息:

ImageID,Subset,OriginalURL,OriginalLandingURL,License,AuthorProfileURL,Author,Title,

OriginalSize,OriginalMD5,Thumbnail300KURL

...

000060e3121c7305,train,https://c1.staticflickr.com/5/4129/5215831864_46f356962f_o.jpg,

https://www.flickr.com/photos/brokentaco/5215831864,

https://creativecommons.org/licenses/by/2.0/,

"https://www.flickr.com/people/brokentaco/","David","28 Nov 2010 Our new house."

211079,0Sad+xMj2ttXM1U8meEJ0A==,https://c1.staticflickr.com/5/4129/5215831864_ee4e8c6535_z.jpg

...

每個圖片中都有一個惟一的64位指定 ID，在 CSV 文件中，它們顯示成十六進制整數（用零填充），例如000060e3121c7305。

annotations-machine.csv

這是通過機器生成的圖像層級標簽（每個訓練集、驗證集和測試集中都有）。

ImageID,Source,LabelName,Confidence

000002b66c9c498e,machine,/m/05_4_,0.7

000002b66c9c498e,machine,/m/0krfg,0.7

000002b66c9c498e,machine,/m/01kcnl,0.5

000002b97e5471a0,machine,/m/05_5t0l,0.9

000002b97e5471a0,machine,/m/0cgh4,0.8

000002b97e5471a0,machine,/m/0dx1j,0.8

000002b97e5471a0,machine,/m/039jbq,0.8

000002b97e5471a0,machine,/m/03nfmq,0.8

000002b97e5471a0,machine,/m/03jm5,0.7

...

這些是通過與 Google Cloud Vision API 類似的計算機視覺模型生成的。

annotations-human.csv

這是通過人工驗證的圖像層級標簽（每個訓練集、驗證集和測試集中都有）。

ImageID,Source,LabelName,Confidence

000026e7ee790996,verification,/m/04hgtk,0

000026e7ee790996,verification,/m/07j7r,1

000026e7ee790996,crowdsource-verification,/m/01bqvp,1

000026e7ee790996,crowdsource-verification,/m/0csby,1

000026e7ee790996,verification,/m/01_m7,0

000026e7ee790996,verification,/m/01cbzq,1

000026e7ee790996,verification,/m/01czv3,0

000026e7ee790996,verification,/m/01v4jb,0

000026e7ee790996,verification,/m/03d1rd,0

...

這些源代碼指示了標簽是如何生成的：

"verification"是人工驗證的圖像層級標簽。

"crowdsource-verification"是通過Crowdsource（眾包） APP進行人工驗證的標簽。

annotations-human-bbox.csv

這是有邊框坐標的人工標簽（每個訓練集、驗證集和測試集中都有）

訓練集標簽和邊框坐標如下所示：

ImageID,Source,LabelName,Confidence,XMin,XMax,YMin,YMax

000002b66c9c498e,activemil,/m/0284d,1,0.560250,0.951487,0.696401,1.000000

000002b66c9c498e,activemil,/m/052lwg6,1,0.543036,0.907668,0.699531,0.995305

000002b66c9c498e,activemil,/m/0fszt,1,0.510172,0.979656,0.641628,0.987480

000002b66c9c498e,verification,/m/01mzpv,1,0.018750,0.098438,0.767187,0.892187

000002b66c9c498e,xclick,/m/01g317,1,0.012520,0.195618,0.148670,0.588419

000002b66c9c498e,xclick,/m/0284d,1,0.528951,0.924883,0.676056,0.965571

000002b66c9c498e,xclick,/m/02wbm,1,0.530516,0.923318,0.668232,0.976526

000002b66c9c498e,xclick,/m/052lwg6,1,0.516432,0.928012,0.651017,0.985915

000002b66c9c498e,xclick,/m/0fszt,1,0.525822,0.920188,0.669797,0.971831

...

驗證集和測試集的額外屬性也給出來了：

ImageID,Source,LabelName,Confidence,XMin,XMax,YMin,YMax,IsOccluded,IsTruncated,IsGroupOf,IsDepiction,IsInside

000026e7ee790996,freeform,/m/07j7r,1,0.071905,0.145346,0.206591,0.391306,0,1,1,0,0

000026e7ee790996,freeform,/m/07j7r,1,0.439756,0.572466,0.264153,0.435122,0,1,1,0,0

000026e7ee790996,freeform,/m/07j7r,1,0.668455,1.000000,0.000000,0.552825,0,1,1,0,0

000062a39995e348,freeform,/m/015p6,1,0.205719,0.849912,0.154144,1.000000,0,0,0,0,0

000062a39995e348,freeform,/m/05s2s,1,0.137133,0.377634,0.000000,0.884185,1,1,0,0,0

0000c64e1253d68f,freeform,/m/07yv9,1,0.000000,0.973850,0.000000,0.043342,0,1,1,0,0

0000c64e1253d68f,freeform,/m/0k4j,1,0.000000,0.513534,0.321356,0.689661,0,1,0,0,0

0000c64e1253d68f,freeform,/m/0k4j,1,0.016515,0.268228,0.299368,0.462906,1,0,0,0,0

0000c64e1253d68f,freeform,/m/0k4j,1,0.481498,0.904376,0.232029,0.489017,1,0,0,0,0

class-descriptions.csv

通過查閱class-descriptions.csv，可以將標簽的MID轉換成相關短描述

...

/m/025dyy,Box

/m/025f_6,Dussehra

/m/025fh,Professor x

/m/025fnn,Savannah Sparrow

/m/025fsf,Stapler

/m/025gg7,Jaguar x-type

/m/02_5h,Figure skating

/m/025_h00,Solid-state drive

/m/025_h88,White tailed prairie dog

/m/025_hbp,Mercury monterey

/m/025h_m,Yellow rumped Warbler

/m/025khl,Sp?tzle

...

需要注意逗號、引號等，該文件格式遵循標準的CSV格式，示例如下：

/m/02wvth,"Fiat 500 ""topolino"""

/m/03gtp5,Lamb"s quarters

/m/03hgsf0,"Lemon, lime and bitters"

classes.txt

這是19,995個圖像層級類的清單

/m/0100nhbf

/m/0104x9kv

/m/0105jzwx

/m/0105ld7g

/m/0105lxy5

/m/0105n86x

/m/0105ts35

/m/0108_09c

/m/01_097

/m/010dmf

...

classes-trainable.txt

這是5000個可訓練的圖像層級類的清單

classes-bbox.txt

這是600個邊框層級類的清單

classes-bbox-trainable.txt

這是545個可訓練邊框層級類的清單

歡迎加入本站公開興趣群

商業智能與數據分析群

興趣范圍包括各種讓數據產生價值的辦法，實際應用案例分享與討論，分析工具，ETL工具，數據倉庫，數據挖掘工具，報表系統等全方位知識

QQ群：81035754

云服務器 GPU云服務器 cowc數據集標記類的對象對象集圖片邊框

文章版權歸作者所有，未經允許請勿轉載,若此文章存在違規行為，您可以聯系管理員刪除。

轉載請注明本文地址：http://m.specialneedsforspecialkids.com/yun/4690.html

發表評論

登陸后可評論

0條評論

archieyang

男|高級講師

我要關注我要私信

TA的文章

常見的編譯器

閱讀 2913·2021-10-14 09:42
寶塔面板安裝pdftoolbox – 一個好用的PDF在線工具箱

閱讀 1260·2021-09-24 10:32
C語言深層理解：函數中棧幀的創建與銷毀

閱讀 2977·2021-09-23 11:21
阿里云：云上年中鉅惠 - 輕量應用服務器60元/年 ECS云服務器72元/年

閱讀 2854·2021-08-27 13:10
CSS動畫優雅降級的簡單總結

閱讀 3343·2019-08-29 18:41
flask基礎之一

閱讀 2207·2019-08-29 15:16
這些國外前端周刊值得你收藏一下

閱讀 1217·2019-08-29 13:17
多圖片展開收縮實例

閱讀 901·2019-08-29 11:22

国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務器低至59元/年，更有多臺、長期優惠，快來選購！

Google圖片數據集發布最新 V3 版，涵蓋600個對象類的標記邊框

相關文章

發表評論

0條評論

archieyang

男|高級講師

TA的文章

常見的編譯器

寶塔面板安裝pdftoolbox – 一個好用的PDF在線工具箱

C語言深層理解：函數中棧幀的創建與銷毀

阿里云：云上年中鉅惠 - 輕量應用服務器60元/年 ECS云服務器72元/年

CSS動畫優雅降級的簡單總結

flask基礎之一

這些國外前端周刊值得你收藏一下

多圖片展開收縮實例

最新活動