YOLOv8で推論した結果を見ると 1x50x8400
みたいな内容が得られたが、これをどうパースしたらいいものかわからない。
どうやらこれは バッチサイズxクラス数xキーポイント
ということらしい。
- バッチサイズはほぼ1固定っぽい、1個ずつ画像入れたらそりゃそうか
- クラス数は構築したモデルによる、学習したクラスが多ければ増えるし
- キーポイントは中心座標x,yと、幅高さw,hと、確立が入っている、クラスごと?に
参考リンク
- How to detect objects in videos in a web browser using YOLOv8 neural network and JavaScript - DEV Community
- Understanding output of .pt file of YOLOv8 · Issue #8421 · ultralytics/ultralytics
- Getting yolov8-pose onnx model output 1 x 56 x 8400 ? What’s the possible fix in Javascript? · Issue #11204 · ultralytics/ultralytics