Skip to main content

Low-dimensional Supports in GAN

GAN の training が難しい理由の一つは、real distribution prp_r と generated distribution pgp_g の support が、高次元空間の中の低次元 manifold 上に存在しやすいことです。

Manifold と Support

用語説明
Manifold各点の近傍が局所的に Euclidean space と似ているような topological space です。次元が nn であるとき、nn-manifold と呼びます。
Supportある function や probability distribution が 00 ではない値を持つ domain の部分集合です。

Real data distribution は低次元に集中しやすい

現実の dataset は、一見すると非常に高次元に見えます。たとえば、画像は多数の pixel から構成されるため、高次元の vector として表現できます。

しかし、実際の自然画像は、その高次元空間全体に一様に広がっているわけではありません。犬の画像には犬らしい制約があり、建物の画像には建物らしい制約があります。このような制約によって、real data distribution prp_r は低次元の manifold の近くに集中していると考えられます。

Generated distribution も低次元に集中しやすい

Generator が作る distribution pgp_g も、同じように低次元の manifold 上に存在しやすくなります。たとえば、100 次元の noise vector から 64×6464 \times 64 の画像を生成する場合、出力空間は非常に高次元です。しかし、Generator が作り出せる画像は、noise vector と network によって強く制約されます。

そのため、pgp_g も高次元空間全体を埋めるわけではありません。

Low-dimensional manifolds

画像出典: Lilian Weng, “From GAN to WGAN”。高次元空間の中の低次元 manifold は、ほとんど重なりを持ちません。

Disjoint support がもたらす問題

高次元空間の中にある二つの低次元 manifold は、ほとんどの場合に交わりません。したがって、prp_rpgp_g の support は disjoint になりやすくなります。

Support が disjoint であると、real sample と fake sample を完全に分ける Discriminator が存在しやすくなります。これは一見よいことのように見えますが、Generator にとっては大きな問題です。Discriminator が完璧になりすぎると、Generator が受け取る gradient が弱くなり、training が進みにくくなるためです。

関連ページ