图像分割实战-系列教程 总目录
语义分割与实例分割概述
Unet系列算法
虽然用的不是很多,在16年特别火,在医学领域、小目标领域做分割,其实到现在为止也还在用,因为在深度学习中网络越简单越好,这篇内容也会介绍Unet++版和Unet最新版
相比于yolo、maskrcnn、fastrcnn这些,Unet远比这些网络简单。网络越大的时候,感受野也越大,实际上就会更加适合一些大目标。

如图的网络架构中,左边从上到下,仍然是一层一层卷积的过程,三层卷积一个block,这个过程也就是图像长宽减小、通道变多的过程。一直到最底下的一层,tensor维度从(572,572,1)变成了(28,28,1024),当然这个过程从代码中打印出来会比较清晰。
这整个过程相当于编码和解码的过程,整个网络呈现一个U字形,Unet在医学领域一直有不错的发挥



如图所示,第一层中 x 0 , 1 x^{0,1} x0,1、 x 0 , 2 x^{0,2} x0,2、 x 0 , 3 x^{0,3} x0,3、 x 0 , 4 x^{0,4} x0,4等4个位置都参与了损失计算,由于很多位置都参与了损失计算可以再各个阶段都获取一个比较好的效果,使得最终的结果更好。


这里看清楚了,是有3个+,其实这方面的论文有不少,4+和5+都有,实际上大同小异。
低阶特征(长宽大、特征图数少,如图 X E n 1 X^1_{En} XEn1、 X E n 2 X^2_{En} XEn2)通过maxpooling降维,
高阶特征(长宽大、特征图数少,如图 X E n 4 X^4_{En} XEn4、 X E n 5 X^5_{En} XEn5)通过线性插值增维,
统一变成nn64的维度,然后全部拼接在一起,这里就是nn645 = nn*320
图像分割实战-系列教程 总目录
语义分割与实例分割概述
Unet系列算法