Yolo学習用データセットの作成ツール:labelImg

Yolo学習用データセットの作成法のメモ。Yoloの学習データを作成するときは、画像からオブジェクトの領域を矩形で指定する必要がある。そのためのツールとしては、BBox-Label-Toolがあるが、使いづらい上に、矩形領域のテキストファイルをYolo用に変更しなければならず手間が多い。Yolo用のテキストファイルも生成できるtzutalinさんのlabelImgを紹介する。

GitHubリポジトリ

インストール (Ubuntu16.04, python3)

  • cd src
  • git clone https://github.com/tzutalin/labelImg.git
  • sudo apt install python3-pip
  • cd labelImg
  • sudo pip3 install -r requirements/requirements-linux-python3.txt
  • sudo apt install pyqt5-dev-tools
  • make qt5py3

事前準備

  • 一枚の画像に一つのオブジェクトだけが写っている画像を多く準備する。一オブジェクトについて千枚程度は必要。
  • ここでは、20オブジェクトを準備して次のディレクトリに配置した。
    • ~/data/robocup
  • robocupディレクトリの中に各オブジェクト名のディレクトリを作成する。この例では次のディレクトリを作成した。
    • 1doritos, 2pringles, 3potato_chips, 4lays, 5milk_tea, 6pepsi, 7apple_juice, 8dr_pepper, 9cup_noodle, 10meal_block, 11sandwich, 12lemon, 13avocado, 14paprika, 15cascade_pod, 16spoon, 17fork, 18cup, 19bowl, 20dish

 

実行方法

  • 好きなエディタを使ってクラスのラベルテキストファイルclass.txtを作る。一行に一つのクラスラベルにする。つまり、20クラスある場合は、20行になる。以下はコマンド例。この例では~/data/robocupに画像ディレクトリがあるものとする。この例のclass.txtはここ。
    • cd ~/data/robocup
    • gedit  class.txt
  • 作業しやすいようにlabelImg/dataディレクトリ内にコピーする。
    • cp class.txt ~/src/labelImg/data/predefined_classes.txt
  • 実行コマンドは次のとおり。私の環境では画像ファイルのあるパスとクラスのラベルテキストファイルを指定しないとうまく動作しない場合があつた。
    • python3 labelImg.py [画像ファイルのあるパス]
    • 以下は実行例。labelImgはラベルイメージなのでl(エル)の次は大文字のI(アイ)。打ち間違いに注意。
      • cd ~/src/labelImg
      • python3 labelImg.py ~/data/image
  • [重要] 左にあるツールバーの下矢印をクリックして、隠れているツールを出す。標準ではPascal/VOCとなっている箇所をクリックしてYoloにする。これでYolo用のファイルができる。

    • なお、Yolo用の設定では、右にある[default class]、[difficult]は無効となる。
  • GUI操作でもデータを作成できるが、作業を効率化するための設定をする。上のメニュー[View]をクリックして、[Auto Saving]と[Single Class Mode]にチェックを入れる。
  • アノテーションファイルを保存する場所を設定する。左メニューのChange Save Dirをクリックして保存するディレクトリをセットする。前回、作業したディレクトリがセットされているので、必ずこの作業が必要。
  • 領域を選択するために「wキー」を押す、縦、横の直線が出たら始点を合わせて左マウスボタンをクリックして、そのままオブジェクト領域の終点までカーソールを移動して指を離す。先ほど、Auto Savingモードに設定したので、この時点でファイルが保存される。最初だけ保存先を聞かれるので画像ファイルと同じディレクトにする。
  • 次の画像にするために「dキー」を押す。画像が変わったら「wキー」を押して領域を選択できるようにし、マウス操作で矩形領域を決める。なお、ご本家様の説明にはないが、「dキー」と「wキー」を同時に押すとこの作業を高速化できる。以下ひたすらこの繰り返し。

キー操作

Ctrl + u  ディレクトリからすべての画像ファイルを読み込む
Ctrl + r  アノテーションのディレクトリを変更
Ctrl + s  保存
Ctrl + d  現在のラベルと矩形をコピー
Space  現在の画像を検証したとフラグをつける
w  矩形の生成
d  次の画像
a  前の画像
del  選択した矩形の消去
Ctrl++  ズームイン
Ctrl–  ズームアウト
↑→↓←  矢印キー:選択した矩形の移動

画像ファイルとアノテーションファイルの一致

  • 画像ファイルとアノテーションファイル数は一致しないと学習できない。以下はその調べ方。
  • $ for i in `find . -name “*.jpg”`; do echo ${i%.jpg}; done | sort > files_jpg

  • $ for i in `find . -name “*.txt”`; do echo ${i%.txt}; done | sort > files_txt

  • $ diff files_jpg files_txt
    • 表示されたjpgファイルを消す
  • 終わり。お疲れ様!

コメント

タイトルとURLをコピーしました