投稿指南
一、稿件要求: 1、稿件内容应该是与某一计算机类具体产品紧密相关的新闻评论、购买体验、性能详析等文章。要求稿件论点中立,论述详实,能够对读者的购买起到指导作用。文章体裁不限,字数不限。 2、稿件建议采用纯文本格式(*.txt)。如果是文本文件,请注明插图位置。插图应清晰可辨,可保存为*.jpg、*.gif格式。如使用word等编辑的文本,建议不要将图片直接嵌在word文件中,而将插图另存,并注明插图位置。 3、如果用电子邮件投稿,最好压缩后发送。 4、请使用中文的标点符号。例如句号为。而不是.。 5、来稿请注明作者署名(真实姓名、笔名)、详细地址、邮编、联系电话、E-mail地址等,以便联系。 6、我们保留对稿件的增删权。 7、我们对有一稿多投、剽窃或抄袭行为者,将保留追究由此引起的法律、经济责任的权利。 二、投稿方式: 1、 请使用电子邮件方式投递稿件。 2、 编译的稿件,请注明出处并附带原文。 3、 请按稿件内容投递到相关编辑信箱 三、稿件著作权: 1、 投稿人保证其向我方所投之作品是其本人或与他人合作创作之成果,或对所投作品拥有合法的著作权,无第三人对其作品提出可成立之权利主张。 2、 投稿人保证向我方所投之稿件,尚未在任何媒体上发表。 3、 投稿人保证其作品不含有违反宪法、法律及损害社会公共利益之内容。 4、 投稿人向我方所投之作品不得同时向第三方投送,即不允许一稿多投。若投稿人有违反该款约定的行为,则我方有权不向投稿人支付报酬。但我方在收到投稿人所投作品10日内未作出采用通知的除外。 5、 投稿人授予我方享有作品专有使用权的方式包括但不限于:通过网络向公众传播、复制、摘编、表演、播放、展览、发行、摄制电影、电视、录像制品、录制录音制品、制作数字化制品、改编、翻译、注释、编辑,以及出版、许可其他媒体、网站及单位转载、摘编、播放、录制、翻译、注释、编辑、改编、摄制。 6、 投稿人委托我方声明,未经我方许可,任何网站、媒体、组织不得转载、摘编其作品。

基于改进空洞卷积神经网络的丘陵山区田间道路

来源:湖北农机化 【在线投稿】 栏目:期刊导读 时间:2021-07-09 13:37
作者:网站采编
关键词:
摘要:0 引 言 丘陵山区占中国国土面积的 70%左右,是中国粮油糖作物及薯类、果桑茶麻、蔬菜、青饲料等特色经济作物的重要生产基地[1]。农村劳动力的缺乏以及生产率提升的迫切需求,使

0 引 言

丘陵山区占中国国土面积的 70%左右,是中国粮油糖作物及薯类、果桑茶麻、蔬菜、青饲料等特色经济作物的重要生产基地[1]。农村劳动力的缺乏以及生产率提升的迫切需求,使得丘陵山区亟需各种自动化程度高、安全性好的智能农业机械。机器视觉系统是智能农机搭载的主要环境感知装备之一,其主要任务是完成对可行驶区域、障碍物或作物的检测。丘陵山区田间道路场景复杂,道路宽度不一、曲率变化大、形态复杂,路内路边杂草泥土等障碍物散布,给智能农机的自主导航与避障带来较大的困难。因此,针对丘陵山区田间道路的复杂场景识别研究变得尤为重要。

根据识别的内容和范围,基于图像处理的道路场景识别可分为低层次的道路识别和高层次的道路场景理解[2]。道路识别一般采用图像分割法将道路区域和非道路区域区分开。道路场景理解则是在像素级对场景中检测到的各类对象进行语义分割,能够更精确地识别出道路区域及周围的环境对象,为自主导航和避障提供支持。在道路场景识别方法中,深度学习具有精准性高、鲁棒性强等优点,成为道路场景识别的重要发展方向[3]。

近年来在道路场景理解研究中,Oliveira等[4]使用卷积神经网络(convolutional neural networks,CNN)算法学习场景中的高阶特征进行单目道路场景分割,通过应用在一个普通图像数据集上的训练算法对其他测试图像进行分类,生成训练标签;然后使用基于颜色层融合的新纹理描述子来获取道路区域的最大一致性;最后将离线和在线信息结合起来对城市道路区域进行检测。Coombes等[5]提出基于HSV(hue saturation value)色彩空间的语义分割算法,使用CNN来分割解释场景,通过训练基于颜色的贝叶斯网络分类器对每个分割的聚类进行语义分类,利用亮度特征识别飞机场滑行道上的表面线,然后与 CNN分割相融合,给出改进的分类结果。Wang等[6]提出一种利用相对位置先验信息和语义分割相联合的方法来估计城市道路布局和分割城市场景。Cordts等[7]和Zhang等[8]利用多传感器信息融合技术提高城市交通道路场景理解的准确性。Chen等[9]提出了一种基于视差建议的检测方法,在立体视差的基础上快速提取检测对象的候选帧,保证了候选帧在不同扰动下的鲁棒性。

上述文献的场景理解方法基本上是为解决特定结构化场景下的智能导航问题而提出,具有特定的功能,仅适用于特定的环境。由于基于卷积神经网络的深度学习能够自动学习图像的层级特征,在物体识别和像素标注上表现出优秀性能,因此成为图像语义分割的重要方法之一。轩永仓[10]将大田场景对象分为 7类,采用基于全卷积神经网络 VGG-16结构的 FCN-32s、FCN-16s和FCN-8s 3种模型进行语义分割,测试结果表明 FCN-8s的总体效果最好,在大田应用场景下的统计像素准确率可达90.87%。该模型应用场景为平原大田环境,图像较为简单,训练集分辨率为 256×256像素,对分割的细节要求不高。张利刚[11]将VGG-16中的18层卷积层和池化层均改为空洞卷积层和空洞池化层,构建了全空洞卷积神经网络,使用该网络在MIT Scene Parsing Dataset下训练测试,统计像素准确率达到 72.81%,比 FCN-8s高1.49%。该方法未保留池化层,网络采用了大量膨胀信息,对一些大物体有较好分割效果,但对小物体的分割不够准确,边缘也较模糊。

本文针对丘陵山区田间道路无车道线、边界模糊、环境复杂多变等特点,利用全卷积神经网络 VGG-16结构,融合空洞卷积构造预测精度更高的前端模块,并利用不同膨胀系数空洞卷积层的级联进行多尺度上下文聚合,构建了基于改进空洞卷积神经网络的田间道路场景识别模型,对复杂非结构化田间道路图像进行语义分割,以获取道路的可行区域和障碍物等信息,为后续丘陵山区智能农机的自主导航奠定基础。

1 丘陵山区田间道路场景对象分类

道路一般分为结构化道路和非结构化道路[12]。目前针对结构化道路的图像识别技术相对成熟。非结构化道路一般指无车道线和无明显边界的非主干道或乡村道路。对非结构化道路的准确识别是当前道路环境感知的主要研究内容之一[13]。

随着丘陵山区农田整治与农田基础设施建设的推进,田间、居民点、仓库之间普遍建立起0.8~1.2 m宽的田间便道[14](如图1所示)。

图1 丘陵山区田间道路场景图像语义分割实例Fig.1 Example of semantic segmentation of field road scene in hilly areas

这些道路属于典型的非结构化道路,主要特点包括:1)道路形状变化多样,蜿蜒曲折,坡度大;2)路况复杂,道路两旁多为不同类型的作物和杂草,道路边缘多被杂草和作物枝叶覆盖,路面上的阴影千差万别;3)路面状况受季节和天气的影响较大,不同季节和天气情况下道路的颜色和纹理特征差异较大。这些复杂的场景特征为田间道路及道路上障碍物的识别带来较大困难。因此,要实现智能农机在田间道路上基于机器视觉的自主导航,需通过多重处理区分出田间道路、周围环境,以及道路上的物体。

文章来源:《湖北农机化》 网址: http://www.hbnjhzz.cn/qikandaodu/2021/0709/1515.html



上一篇:农机和农艺技术结合中存在的问题及措施探讨
下一篇:农机液压技术应用方式及常见故障问题分析

湖北农机化投稿 | 湖北农机化编辑部| 湖北农机化版面费 | 湖北农机化论文发表 | 湖北农机化最新目录
Copyright © 2018 《湖北农机化》杂志社 版权所有
投稿电话: 投稿邮箱: