SA-1B Dataset

SA-1B は、Segment Anything の training に使われた大規模 segmentation dataset です。SAM の汎用性は、architecture と同じくらい、この dataset の規模と質に支えられています。

何が新しかったのか

従来の segmentation dataset は、

という構成でした。これでは、「未知の object を segment する」 model を training することは難しいです。

SA-1B は、

という構成にすることで、「class を意識せず、任意の object を切り出す」 prior を model に学習させました。

これだけ大規模な dataset を、人手だけで作るのは現実的ではありません。Meta は data engine という考え方を導入しました。

大まかには次の三段階です。

これは、model と annotator が互いに改善しあうループです。Model が良くなるほど annotation の効率が上がり、annotation が増えるほど model が良くなります。

SA-1B 自体は 2D image の dataset ですが、3D Reconstruction では次のような場面で間接的に効いてきます。

つまり、SA-1B の規模感が、「3D pipeline の前処理として SAM を当たり前に使える」状況を可能にしています。