- 120*120:
- 256*144:
- 橙色图:采用的数据集是resize之后的120*120的数据集。
- 上面这张图描述的是雪地场景下,圆形gate和方形gate基本处于同一位姿下的相同序号间的余弦相似度数据分布。
- 下面这张图描述的是雪地场景下,圆形gate和方形gate图像数据集分别经过VAE编码后得到的潜空间z之间相同序号的余弦相似度数据分布。
- 数据分析:统计分析结果表明,余弦相似度在0.9 <= cosin <= 1的区间占比经过潜空间变化后明显上升,从0.611到0.727。
- 蓝色图:采用的数据集256*144的数据集。
- 上面这张图描述的是雪地场景下,圆形gate和方形gate基本处于同一位姿下的相同序号间的余弦相似度数据分布。
- 下面这张图描述的是雪地场景下,圆形gate和方形gate图像数据集分别经过VAE编码后得到的潜空间z之间相同序号的余弦相似度数据分布。
- 数据分析:统计分析结果表明,余弦相似度在0.9 <= cosin <= 1的区间占比经过潜空间变化后明显上升,从0.524到0.705。
-
MMD分析:
- 橙色图(120*120):该图中计算出来的MMD为0.0411,表示着snow场景相同位姿圆形gate与方形gate的余弦相似度分布
与经过VAE编码后潜空间z的余弦相似度分布的最大均值差异为0.0411,表示这两个分布间比较相似,但仍然会有一个正值,说明存在着差异,而这个差异主要是在高值区间体现。
- 蓝色图(256*144):该图中计算出来的MMD为0.066
-
KL散度分析:
- 橙色图(120*120):上面计算的KL1_3的值为0.00037,KL3_1的值为0.027,KL1_3<KL3_1。该值意味着以潜空间z的余弦相似度分布为参照snow场景相同位姿圆形gate与方形gate的余弦相似度分布与经过VAE编码后潜空间z的余弦相似度分布的差异,要比编码前余弦相似度为参照snow场景相同位姿圆形gate与方形gate的余弦相似度分布与经过VAE编码后潜空间z的余弦相似度分布的差异小。
- 蓝色图(256*144):上面计算的KL2_4的值为0.00389,KL4_2的值为0.01389,KL2_4<KL4_2。该值意味着以潜空间z的余弦相似度分布为参照snow场景相同位姿圆形gate与方形gate的余弦相似度分布与经过VAE编码后潜空间z的余弦相似度分布的差异,要比编码前余弦相似度为参照snow场景相同位姿圆形gate与方形gate的余弦相似度分布与经过VAE编码后潜空间z的余弦相似度分布的差异小。
综上所述:未经VAE编码前的余弦相似度分布会比编码后更集中一点,经过VAE编码后会稍微分散一些,会将中间的值分散到更低或者更高的区间。
- 方形gate在desert和snow场景
- 圆形gate在desert和snow场景
- MMD分析:
- 橙色图(256*144):该图中计算出来的MMD为0.36789,表示着方形gate相同位姿desert和snow两个场景余弦相似度分布与经过VAE编码后潜空间z的余弦相似度分布的最大均值差异为0.36789,表示这两个分布相似性较低,主要体现在在原始分布中,余弦相似度主要集中在[0.75,1]区间,经过编码后余弦相似度更加分散,分布在[0.25,1]。
- 蓝色图(256*144):该图中计算出来的MMD为0.37367,表示着圆形gate相同位姿desert和snow两个场景余弦相似度分布与经过VAE编码后潜空间z的余弦相似度分布的最大均值差异为0.37367,表示这两个分布相似性较低,主要体现在在原始分布中,余弦相似度主要集中在[0.75,1]区间,经过编码后余弦相似度更加分散,分布在[0,1]。
- KL分析:
- 橙色图(120*120):上面计算的KL1_3的值为0.1229,KL3_1的值为0.6585,KL1_3<KL3_1。该值意味着以潜空间z的余弦相似度分布为参照方形gate在desert和snow这两个不同场景余弦相似度分布与经过VAE编码后潜空间z的余弦相似度分布的差异,要比编码前余弦相似度为参照方形gate在desert和snow这两个不同场景余弦相似度分布与经过VAE编码后潜空间z的余弦相似度分布的差异小。
- 蓝色图(256*144):上面计算的KL2_4的值为0.1049,KL4_2的值为0.4322,KL2_4<KL4_2。该值意味着以潜空间z的余弦相似度分布为参照圆形gate在desert和snow这两个不同场景余弦相似度分布与经过VAE编码后潜空间z的余弦相似度分布的差异,要比编码前余弦相似度为参照圆形gate在desert和snow这两个不同场景余弦相似度分布与经过VAE编码后潜空间z的余弦相似度分布的差异小。
综上所述:未经VAE编码前的余弦相似度分布会比编码后更集中,经过VAE编码后会分散,将较高部分分散到其它区间。经过编码后得到的潜空间值的余弦相似度分布更分散,这意味着在不同场景下,图像之间的潜在特征具有更高的差异性和多样性。这可能是由于VAE编码过程中引入了一定的噪声和变形,使得原始图像的信息被压缩和扭曲,从而增加了图像之间的差异性。