发新帖

利用 DeepLab 在 Tensorflow 中进行语义图像分割

[复制链接]
335 0

快来加入 TensorFlowers 大家庭!

您需要 登录 才可以下载或查看,没有帐号?加入社区

x
发布人:Google Research 软件工程师 Liang-Chieh Chen 和 Yukun Zhu

语义图像分割,也就是将“道路”、“天空”、“人”和“狗”等语义标签分配给图像中每一个像素的任务,可以实现大量的新应用,例如 Pixel 2 与 Pixel 2 XL 智能手机人像模式中附带的合成浅景深效果,以及移动实时视频分割。分配这些语义标签需要标出对象的轮廓,因此,它对定位精度的要求比其他视觉实体识别任务(例如图像级分类或边界框级检测)更加严格。

image1.png


我们高兴地宣布将 Google 最新、性能最好的语义图像分割模型 DeepLab-v3+ [1](在 Tensorflow 中实现)开源。此次发布包括基于一个强大的卷积神经网络 (CNN) 骨干架构 [2, 3] 构建的 DeepLab-v3+ 模型,这些模型可以获得最准确的结果,预期用于服务器端部署。作为此次发布的一部分,我们还将分享 Tensorflow 模型训练与评估代码,以及已在 Pascal VOC 2012 和 Cityscapes 基准语义分割任务中预先训练的模型。

自从我们 DeepLab 模型 [4] 的第一个版本在三年前发布以来,优化的 CNN 特征提取器、更好的对象比例建模、对情景信息的仔细同化、改进的训练过程,以及越来越强大的硬件和软件令 DeepLab-v2 [5] 和 DeepLab-v3 [6] 取得了提升。在 DeepLab-v3+ 中,我们在 DeepLab-v3 的基础上添加了一个简单有效的解码器模型以优化分割结果,尤其是对象边界处的结果。我们进一步将深度可分离卷积应用到孔空间金字塔池化 [5, 6] 和解码器模块,从而形成更快、更强大的语义分割编码器-解码器网络。

image2.png


得益于方法、硬件和数据集的发展,基于卷积神经网络 (CNN) 构建的现代语义图像分割系统的准确性已经达到五年前难以想象的水平。我们希望与社区公开分享自己的系统可以让学术界和产业界的其他团队更轻松地重现并进一步改进最先进系统,使用新数据集训练模型,以及为此技术构想新的应用。

内容详见:谷歌开发者中文博客
本楼点评(0) 收起
您需要登录后才可以回帖 登录 | 加入社区

本版积分规则

主题

帖子

5

积分
快速回复 返回顶部 返回列表