Dual-fusion GAN:SAR图像语义分割中的光学辅助

Dual-fusion GAN:SAR图像语义分割中的光学辅助

对应文献:Li等,A Dual-fusion Semantic Segmentation Framework With GAN For SAR Images. arXiv, 2022.

1. 算法思路

该方法面向SAR语义分割。SAR影像 语义可解释性较弱,光学影像 具有更强视觉语义。论文公开摘要显示,其基本思路是先用GAN从SAR生成光学风格影像 ,再将SAR和生成/真实光学特征融合用于分割。

整体流程可写为:

其中 是SAR-to-optical生成器, 是分割网络。

2. GAN生成阶段

生成器 将SAR映射到光学域,判别器 判断输入是否为真实光学:

标准对抗损失可写为:

若使用重建约束,可加入:

总生成损失为:

公开摘要未列出完整损失细节,以上是GAN类SAR-to-optical方法的标准形式化,不代表原文一定使用完全相同权重。

3. 分割融合阶段

对SAR和生成光学分别提取特征:

最简单融合为拼接:

若加入注意力,可计算权重:

融合特征为:

分割输出:

4. 分割损失

语义分割常用交叉熵:

若类别不平衡,可加入Dice损失:

总训练目标可写为:

如果生成器和分割器分阶段训练,则先优化 ,再固定或微调 优化

5. 方法贡献

该方法的关键在于把光学辅助分成两步:先生成光学风格表征,再融合到SAR分割。它缓解了SAR语义弱的问题,使分割网络能够利用更接近人类视觉的结构和纹理。

文献截图

下图来自 Dual-fusion GAN 论文第2页,展示双融合语义分割框架,包括GAN生成光学表征以及后续语义分割网络。

Dual-fusion GAN 框架图

下图来自论文第4页,展示消融实验和分割效果对比,可用于观察生成光学辅助、注意力融合等模块对结果的影响。

Dual-fusion GAN 消融与效果图

6. 局限

生成光学可能产生幻觉,尤其在SAR与真实光学并非一一对应时。如果 中出现错误纹理,注意力模块可能放大错误信息。公开摘要没有完整列出数据划分、损失权重和消融细节,因此使用时应进一步查全文。