はじめに
画像分類や物体検出などの画像認識タスクでは、バックボーンと呼ばれる画像特徴抽出を担うモデルの部分が最終的な精度に大きく影響します。
世界中の研究者たちが高性能なモデルを次々と発表する中で、「どのバックボーンを選べばよいのか」という課題が生まれています。
バックボーン選択が難しい理由
まず、ResNet、EfficientNet、Vision Transformer など、選択肢となるアーキテクチャが非常に多いことが挙げられます。さらに、パラメータ数や推論速度といった実用上の制約に適合するモデルを見つけるのも一苦労です。
また、最新の研究で高い性能を示したモデルが、実際の…
Source link
Views: 0