JEPA Overview
Joint Embedding Predictive Architecture の基本思想と、生成モデル・contrastive learning との違いを整理します。
I-JEPA
Image-based Joint Embedding Predictive Architecture の masking、context / target block、semantic representation を整理します。
V-JEPA
Video Joint Embedding Predictive Architecture の feature prediction、video representation、world model との関係を整理します。
V-JEPA 2
V-JEPA 2 の world model 化、物理理解、robotics / planning への接続を整理します。
JEPA vs Generative Models
JEPA と MAE、contrastive learning、diffusion model、world model の違いを整理します。