ai_image_gazou_ninshiki
今後の商品開発のために機械学習の調査をしています。
ここではネコのフリー素材で画像を学習して、テスト用の画像で予測できるか試します。
近頃注目されているAIですが、AIに推論してもらうにために学習データを作る必要があります。
YOLOv5を用いて学習データの作成をしてみました。


実行環境は以下の通りです。
-------------------------
OS Windows10
CPU Intel i7-5960X
GPU RTX 2080 Ti

CUDA ver 11.8
python 3.9.13
pytorch 1.13
YOLOv5
-------------------------
学習データを作るために、まず教師データを作成します。
教師データとは機械学習を行う際に、学習したい元データに対してラベル付を行ったデータです。
今回は300枚のネコの写真を使用しました。
次にアノテーションという処理を行います。
これはネコの顔を手作業でバウンディングボックスで囲んで、画像の中で『これがネコの顔だよ』ということを教えてあげます。
この座標データが教師データと呼ばれるものです。
これを300枚分行いました。
(大変だった…)

img1
元画像と教師データを用いて機械学習を行います。
今回は300回繰り返しで学習させました。

その後
出来上がった学習データを用いてテスト画像の推論を行いました。
結果がこちら
↓↓↓

img2
しっかりとネコの顔を認識できました!



しかし…

元々入っていたサンプル画像が…

img3
確かに…猫顔…?

調整が甘いようです。
学習する画像が少ないのかパラメータの設定が悪いのか

まだまだ勉強が必要そうです…