COCO 2014 データセットのダウンロード(Windows 上)
Windows での COCO 2014 データセット のダウンロードと展開の手順を説明する.
COCO (Common Object in Context) データセット
COCO(Common Object in Context)データセットは,物体検出やセグメンテーション,キーポイント検出,姿勢推定,画像分類,キャプショニング等の多様なタスクに対応可能な画像データセットとして,2014年にMicrosoftにより公開された.これは,人間や自動車,家具,食品等,多岐にわたるカテゴリのオブジェクトを含む数十万枚以上の画像から構成され,それぞれの画像は,80種類のカテゴリに対応する形でアノテーションが施されている. COCO は次の URL で公開されているデータセット(オープンデータ)である.
COCO は,以下の特徴がある.
- 328,000枚の画像,うち,200,000枚以上がラベル付け済み.
- 1,500,000 個のオブジェクト
- オブジェクトのカテゴリ数:80
- オブジェクトのバウンディングボックス,セグメンテーション結果
- 画像ごとのキャプション数: 5
- 250,000 名の人物に,キーポイントが付いている.(左目、鼻、右腰、右足首などの 17のキーポイント)
- 39,000枚以上の画像と56,000個以上の人物に対する Dense pose アノテーション.
- 2014, 2017 などの種類がある.2014 と比べると,2017 では,訓練,検証,テストの分割が異なる,panoptic segmenation についてのアノテーションが追加されているなどの違いがある.
COCO の 80 のクラスのラベルは次の通りである.
['person', 'bicycle', 'car', 'motorcycle', 'airplane', 'bus', 'train', 'truck', 'boat', 'traffic light', 'fire hydrant', 'stop sign', 'parking meter', 'bench', 'bird', 'cat', 'dog', 'horse', 'sheep', 'cow', 'elephant', 'bear', 'zebra', 'giraffe', 'backpack', 'umbrella', 'handbag', 'tie', 'suitcase', 'frisbee', 'skis', 'snowboard', 'sports ball', 'kite', 'baseball bat', 'baseball glove', 'skateboard', 'surfboard', 'tennis racket', 'bottle', 'wine glass', 'cup', 'fork', 'knife', 'spoon', 'bowl', 'banana', 'apple', 'sandwich', 'orange', 'broccoli', 'carrot', 'hot dog', 'pizza', 'donut', 'cake', 'chair', 'couch', 'potted plant', 'bed', 'dining table', 'toilet', 'tv', 'laptop', 'mouse', 'remote', 'keyboard', 'cell phone', 'microwave', 'oven', 'toaster', 'sink', 'refrigerator', 'book', 'clock', 'vase', 'scissors', 'teddy bear', 'hair drier', 'toothbrush']
【文献】
Tsung-Yi Lin, Michael Maire, Serge Belongie, Lubomir Bourdev, Ross Girshick, James Hays, Pietro Perona, Deva Ramanan, C. Lawrence Zitnick, Piotr Dollr, Microsoft COCO: Common Objects in Context, CoRR, abs/1405.0312, 2014.
https://arxiv.org/pdf/1405.0312v3.pdf
【サイト内の関連ページ】
COCO 2017 データセットのダウンロードとカテゴリ情報や画像情報の確認(Windows 上): 別ページ »で説明
【関連する外部ページ】
- Papers With Code の COCO データセットのページ: https://paperswithcode.com/dataset/coco
- PyTorch の COCO データセット: https://pytorch.org/vision/stable/datasets.html#torchvision.datasets.CocoDetection
- TensorFlow データセット の COCO データセット: https://www.tensorflow.org/datasets/catalog/coco
ダウンロード手順
- 7-Zip のインストール(Windows 上)
7-Zipは,ファイル圧縮・展開(解凍)ツール
- Windows で,コマンドプロンプトを管理者権限で起動する(例:Windowsキーを押し,「cmd」と入力し,「管理者として実行」を選択)
- 次のコマンドを実行
次のコマンドは,7-Zip圧縮・展開(解凍)ツールをインストールするものである.
winget install --scope machine 7zip.7zip powershell -command "$oldpath = [System.Environment]::GetEnvironmentVariable(\"Path\", \"Machine\"); $oldpath += \";c:\Program Files\7-Zip\"; [System.Environment]::SetEnvironmentVariable(\"Path\", $oldpath, \"Machine\")"
【関連する外部ページ】
- 7-Zip の公式ページ: https://7-zip.opensource.jp/
- COCO データセットの公式ページから,
2014 Train images, 2014 Val images, 2014 Train/Val annotations をダウンロード
コマンドプロンプトを管理者として開き ダウンロードと展開のため,次のコマンドを実行
cd /d c:%HOMEPATH% mkdir coco2014 mkdir coco2014\coco cd /d c:%HOMEPATH%\coco2014 ECHO アノテーションファイルのダウンロード curl -O http://images.cocodataset.org/annotations/annotations_trainval2014.zip ECHO 学習用画像データのダウンロード curl -O http://images.cocodataset.org/zips/train2014.zip ECHO 検証用画像データのダウンロード curl -O http://images.cocodataset.org/zips/val2014.zip # cd /d c:%HOMEPATH%\coco2014\coco "c:\Program Files\7-Zip\7z.exe" x ..\annotations_trainval2014.zip # cd /d c:%HOMEPATH%\coco2014\coco\images "c:\Program Files\7-Zip\7z.exe" x ..\..\train2014.zip "c:\Program Files\7-Zip\7z.exe" x ..\..\val2014.zip
- ファイルの配置は次のようになる.(確認中)
├── images │ └── ... ├── annotations │ └── ... └── imageLists ├── all.txt ├── test.txt └── train.txt