本文将对论文 Towards End-to-End Lane Detection: an Instance Segmentation Approach 进行解读。这篇论文是于2018年2月挂在arxiv上的。 文中提出了一种端到端的车道线检测算法,包括LaneNet和H-Net两个网络模型。其中,LaneNet是一种将 语义分割 和 对像素进行向量表示 结合起来的多任务模型,负责对图片中的车道线进行 实例分割 ;H-Net是由卷积层和全连接层组成的网络模型,负责预测转换矩阵H,使用转换矩阵H对属于同一车道线的像素点进行回归(我的理解是对使用坐标y对坐标x进行修正)。 根据论文中的实验结果,该算法在图森的车道线数据集上的准确率为,在NVIDIA 1080 TI上的处理速度为52FPS。 如图1所示,对于同一张输入图片,LaneNet输出实例分割的结果,为每个车道线像素分配一个车道线ID,H-Net输出一个转换矩阵H,使用转换矩阵H对车道线像素进行修正,并对修正的结果拟合出一个三阶的多项式作为预测得到的车道线。 论文中将实例分割任务拆解为 语义分割 和 聚类 两部分,如图2所示,LaneNet中decoder分为两个分支,Embedding branch对像素进行嵌入式表示,训练得到的embedding向量用于聚类,Segmentation branch负责对输入图像进行语义分割(对像素进行二分类,判断像素属于车道线还是背景)。最后将两个分支的结果进行结合得到实例分割的结果。 在设计语义分割模型时,论文主要考虑了以下两个方面: 1.在构建label时,为了处理遮挡问题,论文对被车辆遮挡的车道线和虚线进行了还原; 2. Loss使用 交叉熵 ,为了解决样本分布不均衡的问题(属于车道线的像素远少于属于背景的像素),参考论文 ENet: A Deep Neural Network Architecture for Real-Time Semantic Segmentation ,使用了boundedinverse class weight对loss进行加权: 其中,p为对应类别在总体样本中出现的概率,c是超参数(ENet论文中是,使得权重的取值区间为[1,50])。 为了区分车道线上的像素属于哪条车道,embedding_branch为每个像素初始化一个embedding向量,并且在设计loss时, 使得属于同一条车道线的像素向量距离很小,属于不同车道线的像素向量距离很大 。 这部分的loss函数是由两部分组成:方差loss(L_var)和距离loss(L_dist): 其中,x_i为像素向量,μ_c为车道线的均值向量,[x]+ = max(0,x) 为了方便在推理时对像素进行聚类,在图4中实例分割loss中设置δ_d > 6*δ_v。 在进行聚类时,首先使用mean shift聚类,使得簇中心沿着密度上升的方向移动,防止将离群点选入相同的簇中;之后对像素向量进行划分:以簇中心为圆心,以2δ_v为半径,选取圆中所有的像素归为同一车道线。重复该步骤,直到将所有的车道线像素分配给对应的车道。 LaneNet是基于 ENet 的encoder-decoder模型,如图5所示,ENet由5个stage组成,其中stage2和stage3基本相同,stage1,2,3属于encoder,stage4,5属于decoder。 如图2所示,在LaneNet中,语义分割和实例分割两个任务 共享stage1和stage2 ,并将stage3和后面的decoder层作为各自的分支(branch)进行训练;其中, 语义分割分支(branch)的输出shape为W*H*2,实例分割分支(branch)的输出shape为W*H*N,W,H分别为原图宽和高,N为embedding vector的维度;两个分支的loss权重相同。 LaneNet的输出是每条车道线的像素集合,还需要根据这些像素点回归出一条车道线。传统的做法是将图片投影到鸟瞰图中,然后使用2阶或者3阶多项式进行拟合。在这种方法中,转换矩阵H只被计算一次,所有的图片使用的是相同的转换矩阵,这会导致地平面(山地,丘陵)变化下的误差。 为了解决这个问题,论文训练了一个可以预测转置矩阵H的神经网络H-Net, 网络的输入是图片 , 输出是转置矩阵H : 由图6可以看出,转置矩阵H只有6个参数,因此H-Net的输出是一个6维的向量。H-Net由6层普通卷积网络和一层全连接网络构成,其网络结构如图7所示: Curve fitting的过程就是通过坐标y去重新预测坐标x的过程:LaneNet和H-Net是分别进行训练的。在论文的实验部分,两个模型的参数配置如下所示: • Dataset : Tusimple • Embedding dimension = 4 • δ_v= • δ_d=3 • Image size = 512*256 • Adam optimizer • Learning rate = 5e-4 • Batch size = 8 • Dataset : Tusimple • 3rd-orderpolynomial • Image size =128*64 • Adam optimizer • Learning rate = 5e-5 • Batch size = 10
车道线检测算法通常分为两种类型:一种是基于基于视觉特征来做语义分割或者实例分割,例如 LaneNet 和 SCNN ;另一种是通过视觉特征来预测车道线所在位置的点,以此来解决 no-visual-clue 问题的模型,比如本文提到的 Ultra-Fast-Lane-Detection 。
offical github : paper : Ultra Fast Structure-aware Deep Lane Detection
下图展示了整个模型的结构,基本可以分为三个部分: Backbone 、 Auxiliary 部分和用于车道线候选点选择的 Group Classification 部分。可以看出,由于整个 pipeline 中参与最终 inference 的部分只进行了下采样而不像分割模型还进行了多轮的上采样,因此模型整体的计算量是相当低的,根据论文给出的结果可以达到 300FPS 。
Backbone 部分采用了较小的 ResNet18 或者 ResNet34 ,下采样到 4X 的部分作为最终的特征,这里其实是较为浅层的特征,一般分割模型要下采样到 16x 或者 32x 。论文里也提到了使用较大的感受野就可以达到不错的检测效果,这样就可以极大的提高模型的推理速度。
Auxiliary 部分对三层浅层特征进行了 concat 和上采样,用来进行实例分割。其目的是在训练过程中增强视觉特征,不参与推理。
Group Classification 部分如下所示,论文称之为 row-based selecting method based on global image features ,即在全局特征上进行行索引来计算候选点,这样的方法将先验假设融入到了车道线检测的任务中。
在分割任务上,最终的特征图的大小是 HxWxC 。分类是要沿着 C 方向的, C 方向的向量代表一个像素位置的特征向量属于哪一个类别;在本方法中,最终的特征图的大小是 hx(w+1)xC 。 h 是要在垂直方向上采样的行的数量( row anchor ), h 文章中使用的 Loss 函数分为三部分,分别是多分类损失 L_cls , 分割损失 L_seg 和车道结构化损失 L_str 。其中 L_cls 和 L_seg 是常用的分类、分割任务中常用的两种损失。 结构损失的目的是利用车道结构的先验知识来约束预测出来的车道线的形状。其中 L_sim 为相似度损失, L_shp 为形状损失。 相似度损失的出发点是同一个车道中,相邻的两个点之间的距离应该尽可能的近,这里使用 L1 范式来进行距离的约束。 形状损失的出发点是基于大多的的车道线都是直线,即使是曲线其大部分也是近似的直线。对于同一条车道线,在相邻 row achor 上的车道线的候选点的位置的选择应该尽可能的相近。理想的状况下它的值应该为 0 。 Loc 函数的含义是第 i 条车道的第 j 个 row anchor 中车道点的期望。 Prob 代表的是第 i 条车道的第 j 个 row anchor 中,第 k 个位置是车道点的概率。因为背景不被计算在内,因此 k 的取值从 1 开始。 论文给出 metric 结果如下所示,其评估硬件应该为 NVIDIA GTX 1080TI 。该方法在保证精度接近的情况下,极大的提升了推理速度,很适合实时检测的任务。 为了测试其真实的推理性能,我在 NVIDIA RTX 3070+CUDA11+ 的环境性进行了测试。模型的 backbone 为 resnet18 ,输入尺寸为 (288, 800, 3) 的情况下, Ultra-Fast-Lane-Detection 的推理性能如下所示,单 batch 推理速度约为 350FPS ,其性能与论文给出的结果基本一致。 本文将对论文 Towards End-to-End Lane Detection: an Instance Segmentation Approach 进行解读。这篇论文是于2018年2月挂在arxiv上的。 文中提出了一种端到端的车道线检测算法,包括LaneNet和H-Net两个网络模型。其中,LaneNet是一种将 语义分割 和 对像素进行向量表示 结合起来的多任务模型,负责对图片中的车道线进行 实例分割 ;H-Net是由卷积层和全连接层组成的网络模型,负责预测转换矩阵H,使用转换矩阵H对属于同一车道线的像素点进行回归(我的理解是对使用坐标y对坐标x进行修正)。 根据论文中的实验结果,该算法在图森的车道线数据集上的准确率为,在NVIDIA 1080 TI上的处理速度为52FPS。 如图1所示,对于同一张输入图片,LaneNet输出实例分割的结果,为每个车道线像素分配一个车道线ID,H-Net输出一个转换矩阵H,使用转换矩阵H对车道线像素进行修正,并对修正的结果拟合出一个三阶的多项式作为预测得到的车道线。 论文中将实例分割任务拆解为 语义分割 和 聚类 两部分,如图2所示,LaneNet中decoder分为两个分支,Embedding branch对像素进行嵌入式表示,训练得到的embedding向量用于聚类,Segmentation branch负责对输入图像进行语义分割(对像素进行二分类,判断像素属于车道线还是背景)。最后将两个分支的结果进行结合得到实例分割的结果。 在设计语义分割模型时,论文主要考虑了以下两个方面: 1.在构建label时,为了处理遮挡问题,论文对被车辆遮挡的车道线和虚线进行了还原; 2. Loss使用 交叉熵 ,为了解决样本分布不均衡的问题(属于车道线的像素远少于属于背景的像素),参考论文 ENet: A Deep Neural Network Architecture for Real-Time Semantic Segmentation ,使用了boundedinverse class weight对loss进行加权: 其中,p为对应类别在总体样本中出现的概率,c是超参数(ENet论文中是,使得权重的取值区间为[1,50])。 为了区分车道线上的像素属于哪条车道,embedding_branch为每个像素初始化一个embedding向量,并且在设计loss时, 使得属于同一条车道线的像素向量距离很小,属于不同车道线的像素向量距离很大 。 这部分的loss函数是由两部分组成:方差loss(L_var)和距离loss(L_dist): 其中,x_i为像素向量,μ_c为车道线的均值向量,[x]+ = max(0,x) 为了方便在推理时对像素进行聚类,在图4中实例分割loss中设置δ_d > 6*δ_v。 在进行聚类时,首先使用mean shift聚类,使得簇中心沿着密度上升的方向移动,防止将离群点选入相同的簇中;之后对像素向量进行划分:以簇中心为圆心,以2δ_v为半径,选取圆中所有的像素归为同一车道线。重复该步骤,直到将所有的车道线像素分配给对应的车道。 LaneNet是基于 ENet 的encoder-decoder模型,如图5所示,ENet由5个stage组成,其中stage2和stage3基本相同,stage1,2,3属于encoder,stage4,5属于decoder。 如图2所示,在LaneNet中,语义分割和实例分割两个任务 共享stage1和stage2 ,并将stage3和后面的decoder层作为各自的分支(branch)进行训练;其中, 语义分割分支(branch)的输出shape为W*H*2,实例分割分支(branch)的输出shape为W*H*N,W,H分别为原图宽和高,N为embedding vector的维度;两个分支的loss权重相同。 LaneNet的输出是每条车道线的像素集合,还需要根据这些像素点回归出一条车道线。传统的做法是将图片投影到鸟瞰图中,然后使用2阶或者3阶多项式进行拟合。在这种方法中,转换矩阵H只被计算一次,所有的图片使用的是相同的转换矩阵,这会导致地平面(山地,丘陵)变化下的误差。 为了解决这个问题,论文训练了一个可以预测转置矩阵H的神经网络H-Net, 网络的输入是图片 , 输出是转置矩阵H : 由图6可以看出,转置矩阵H只有6个参数,因此H-Net的输出是一个6维的向量。H-Net由6层普通卷积网络和一层全连接网络构成,其网络结构如图7所示: Curve fitting的过程就是通过坐标y去重新预测坐标x的过程:LaneNet和H-Net是分别进行训练的。在论文的实验部分,两个模型的参数配置如下所示: • Dataset : Tusimple • Embedding dimension = 4 • δ_v= • δ_d=3 • Image size = 512*256 • Adam optimizer • Learning rate = 5e-4 • Batch size = 8 • Dataset : Tusimple • 3rd-orderpolynomial • Image size =128*64 • Adam optimizer • Learning rate = 5e-5 • Batch size = 10 本文将对论文 Towards End-to-End Lane Detection: an Instance Segmentation Approach 进行解读。这篇论文是于2018年2月挂在arxiv上的。 文中提出了一种端到端的车道线检测算法,包括LaneNet和H-Net两个网络模型。其中,LaneNet是一种将 语义分割 和 对像素进行向量表示 结合起来的多任务模型,负责对图片中的车道线进行 实例分割 ;H-Net是由卷积层和全连接层组成的网络模型,负责预测转换矩阵H,使用转换矩阵H对属于同一车道线的像素点进行回归(我的理解是对使用坐标y对坐标x进行修正)。 根据论文中的实验结果,该算法在图森的车道线数据集上的准确率为,在NVIDIA 1080 TI上的处理速度为52FPS。 如图1所示,对于同一张输入图片,LaneNet输出实例分割的结果,为每个车道线像素分配一个车道线ID,H-Net输出一个转换矩阵H,使用转换矩阵H对车道线像素进行修正,并对修正的结果拟合出一个三阶的多项式作为预测得到的车道线。 论文中将实例分割任务拆解为 语义分割 和 聚类 两部分,如图2所示,LaneNet中decoder分为两个分支,Embedding branch对像素进行嵌入式表示,训练得到的embedding向量用于聚类,Segmentation branch负责对输入图像进行语义分割(对像素进行二分类,判断像素属于车道线还是背景)。最后将两个分支的结果进行结合得到实例分割的结果。 在设计语义分割模型时,论文主要考虑了以下两个方面: 1.在构建label时,为了处理遮挡问题,论文对被车辆遮挡的车道线和虚线进行了还原; 2. Loss使用 交叉熵 ,为了解决样本分布不均衡的问题(属于车道线的像素远少于属于背景的像素),参考论文 ENet: A Deep Neural Network Architecture for Real-Time Semantic Segmentation ,使用了boundedinverse class weight对loss进行加权: 其中,p为对应类别在总体样本中出现的概率,c是超参数(ENet论文中是,使得权重的取值区间为[1,50])。 为了区分车道线上的像素属于哪条车道,embedding_branch为每个像素初始化一个embedding向量,并且在设计loss时, 使得属于同一条车道线的像素向量距离很小,属于不同车道线的像素向量距离很大 。 这部分的loss函数是由两部分组成:方差loss(L_var)和距离loss(L_dist): 其中,x_i为像素向量,μ_c为车道线的均值向量,[x]+ = max(0,x) 为了方便在推理时对像素进行聚类,在图4中实例分割loss中设置δ_d > 6*δ_v。 在进行聚类时,首先使用mean shift聚类,使得簇中心沿着密度上升的方向移动,防止将离群点选入相同的簇中;之后对像素向量进行划分:以簇中心为圆心,以2δ_v为半径,选取圆中所有的像素归为同一车道线。重复该步骤,直到将所有的车道线像素分配给对应的车道。 LaneNet是基于 ENet 的encoder-decoder模型,如图5所示,ENet由5个stage组成,其中stage2和stage3基本相同,stage1,2,3属于encoder,stage4,5属于decoder。 如图2所示,在LaneNet中,语义分割和实例分割两个任务 共享stage1和stage2 ,并将stage3和后面的decoder层作为各自的分支(branch)进行训练;其中, 语义分割分支(branch)的输出shape为W*H*2,实例分割分支(branch)的输出shape为W*H*N,W,H分别为原图宽和高,N为embedding vector的维度;两个分支的loss权重相同。 LaneNet的输出是每条车道线的像素集合,还需要根据这些像素点回归出一条车道线。传统的做法是将图片投影到鸟瞰图中,然后使用2阶或者3阶多项式进行拟合。在这种方法中,转换矩阵H只被计算一次,所有的图片使用的是相同的转换矩阵,这会导致地平面(山地,丘陵)变化下的误差。 为了解决这个问题,论文训练了一个可以预测转置矩阵H的神经网络H-Net, 网络的输入是图片 , 输出是转置矩阵H : 由图6可以看出,转置矩阵H只有6个参数,因此H-Net的输出是一个6维的向量。H-Net由6层普通卷积网络和一层全连接网络构成,其网络结构如图7所示: Curve fitting的过程就是通过坐标y去重新预测坐标x的过程:LaneNet和H-Net是分别进行训练的。在论文的实验部分,两个模型的参数配置如下所示: • Dataset : Tusimple • Embedding dimension = 4 • δ_v= • δ_d=3 • Image size = 512*256 • Adam optimizer • Learning rate = 5e-4 • Batch size = 8 • Dataset : Tusimple • 3rd-orderpolynomial • Image size =128*64 • Adam optimizer • Learning rate = 5e-5 • Batch size = 10 1、< 蔡自兴教授已在国内外发表论文和科技报告等860多篇。2010年: Zixing. Research on navigation control and cooperation of mobile robots (Plenary Lecture 1). 2010 Chinese Control and Decision Conference, New Century Grand Hotel, Xuzhou, China, May 26- 28, Zixing. Research on navigation control and cooperation of mobile robots (Plenary Lecture 1). 2010 Chinese Control and Decision Conference, New Century Grand Hotel, Xuzhou, China, May 26-28, . Chen Baifan,Zi-Xing Cai, Zhi-Rong Zou. A Hybrid Data Association Approach for Mobile Robot SLAM. International Conference on Control, Automation and Systems, October 27-30, 2010, KINTEX, Gyeonggi-do, KOREA (Accepted).4. Guo Fan,Cai Zixing, Xie Bin, Tang Jin. Automatic Image Haze Removal Based on Luminance Component. The International conference on Signal and Image Processing (SIP 2010).May 2010 (Accepted).5. Linai. Kuang,Zixing. System based Redeployment Scheme for Wireless Sensor Networks[C].In proceeding of 1st IET International Conference on Wireless Sensor Network. Beijing, China, November,. Lingli YU,Zixing CAI, A Study of Multi-Robot Stochastic Increment Exploration Mission Planning [J]. Frontiers of Electrical and Electronic Engineering in China, (Received).7. Liu Hui,Cai Zixing, and Wang Yong. Hybridizing particle swarm optimization with differential evolution for constrained numerical and engineering optimization. Applied Soft Computing, 2010,10(2): 629–. LIU Xian-ru,CAI Zi-xing. Advanced obstacles detection and tracking by using fusing radar and image sensor data. International Conference on Control, Automation and Systems,2010/10/27,. Liu Xianru,Cai zixing. Advanced obstacles detection and tracking by using fusing Radar and Image Sensor Data[C]. International Conference on Control, Automation and Systems. (October 27-30,2010, KINTEX, Gyeonggi-do, KOREA).10. Ren Xiaoping,Zixing Cai. Kinematics Model of Unmanned Driving Vehicle. Proceedings of the 8th World Congress on Intelligent Control and Automation, July 6-9 2010, Jinan, China, 2010: . Suqin Tang,Zixing Cai: Tourism Domain Ontology Construction from the Unstructured Text Documents. The 9th IEEE International Conference on Cognitive Informatics, Beijing, . Suqin Tang,Zixing Cai: Using the Format Concept Analysis to Construct the Tourism Information Ontology. The 2010 Seventh International Conference on Fuzzy Systems and Knowledge Discovery (FSKD'10),Yantian, , . Tan Ping,Zixing Cai. An Adaptive Particle Filter Based on Posterior Distribution. Proceedings of the 8th World Congress on Intelligent Control and Automation, July 6-9 2010, Jinan, China, 2010: . Wang Yong,Cai Zixing, Zhang Qingfu. Differential evolution with composite trial vector generation strategies and control parameters. IEEE Transactions on Evolutionary Computation, Accept, regular . Wang Yong,Cai Zixing. Constrained evolutionary optimization by means of (mu+lambda)-differential evolution and improved adaptive trade-off model. Evolutionary Computation, in . Wang Yong, Combining multiobjective optimization with differential evolution to solve constrained optimization problems. IEEE Transactions on Evolutionary Computation, (regular paper, Accepted).17. Xianru Liu,Zixing Obstacles Detection and tracking by Fusing Millimeter Wave Radar and Image Sensor Data,International IEEE Intl Coference on Control,Automation and Systems , Korea, 2010, 22:. Xie Bin, Fan Guo,Zixing Cai. Improved Single Image Dehazing Using Dark Channel Prior and Multi-Scale Retinex. 2010 International Conference on Intelligent System Design and Engineering Application, Changsha, China, 2010. (Accepted) .19. YU Ling-li,CAI Zi-xing, GAO Ping-an, LIU Xiao-ying. A spatial orthogonal allocation and heterogeneous cultural hybrid algorithm for multi-robot exploration mission planning. Journal of control theory and applications (Received) .20.蔡自兴,陈白帆,刘丽珏. 智能科学基础系列课程国家级教学团队的改革与建设. 计算机教育,2010,(127):40-44 .21.蔡自兴,任孝平,李昭.一种基于GPS/INS组合导航系统的车辆状态估计方法. , .蔡自兴。智能科学技术课程教学纵横谈. 计算机教育,2010,(127):.蔡自兴,蒋冬冬,谭平,安基程。中快速运动估计算法的一种改进方案;计算机应用研究2010,27(4):.蔡自兴; 任孝平; 邹磊; 匡林爱. 一种簇结构下的多移动机器人通信方法.小型微型计算机系统,2010,31(3):. 陈爱斌,蔡自兴.一种基于目标和背景加权的目标跟踪方法,控制与决策,2010,25(8):. 陈爱斌;蔡自兴; 文志强; 董德毅. 一种基于预测模型的均值偏移加速算法. 信息与控制 2010,39(2): . 陈爱斌; 董德毅;杨勇;蔡自兴. 基于目标中心定位和NMI特征的跟踪算法.计算机应用与软件,2010,27(4):. 陈白帆,蔡自兴,刘丽珏. 人工智能课程的创新性教学探索——人工智能精品课程建设与改革. 计算机教育,2010,(127):. 官东,蔡自兴,孔志周. 一种基于推荐证据理论的网格信任模型.系统仿真学报,2010,22(8):.郭璠,蔡自兴,谢斌, 唐琎. 图像去雾技术研究综述与展望. 计算机应用, 2010, 30(9):. 郭璠,蔡自兴, 谢斌, 唐琎. 一种基于亮度分量的自动图像去雾方法. 中国图象图形学报. 2010年3月(录用).32. 江中央,蔡自兴,王勇. 一种新的基于正交实验设计的约束优化进化算法. 计算机学报, 2010,33(5):. 江中央,蔡自兴,王勇.求解全局优化问题的混合自适应正交遗传算法.软件学报, 2010,21(6):. 匡林爱,蔡自兴. 基于遗传算法的无线传感器网络重新部署方法. 控制与决策,2010,25(9):. 匡林爱,蔡自兴.一种簇机构下的多移动机器人通讯方法.小型微型计算机系统.,2010,31(3):. 匡林爱,蔡自兴.一种带宽约束的无线传感器网络节点调度算法.高技术通讯,2010,20(3):. 刘丽珏,蔡自兴,唐琎. 人工智能双语教学建设. 计算机教育,2010,(127):. 刘献如,蔡自兴. 基于SAD与UKF-Mean shift的主动目标跟踪. 模式识别与人工智能,2010,23(5):. 刘献如,蔡自兴. 结构化道路车道线的鲁棒检测与跟踪. 光电子.激光,2010,21(12):. 刘献如,蔡自兴.UKF 与Mean shift 相结合的实时目标跟踪.中南大学学报,2009年录用.41. 刘晓莹;蔡自兴; 余伶俐; 高平安. 一种正交混沌蚁群算法在群机器人任务规划中的应用研究. 小型微型计算机系统, 2010,31(1):. 蒙祖强,蔡自兴,黄柏雄. 课程交叉教学在应用型人才培养中的实践探索. 计算机教育,2010,(127):. 潘薇;蔡自兴; 陈白帆. 复杂环境下多机器人协作构建地图的方法;四川大学学报(工程科学版) . 任孝平,蔡自兴,邹磊,匡林爱.“中南移动二号”多移动机器人通信系统.中南大学学报(自然科学版),2010,41(4):. 任孝平,蔡自兴.四种虚拟力模型在传感器网络覆盖中的性能分析.信息与控制,2010,39(4):. 任孝平;蔡自兴; 陈爱斌. 多移动机器人通信系统研究进展. 控制与决策 2010,(3): .唐素勤,蔡自兴,王驹,蒋运承: 基于gfp语义的描述逻辑系统FLE的有穷基,计算机研究与发展,2010,47(9):. 唐素勤,蔡自兴,王驹,蒋运承: 描述逻辑非标准推理, 模式识别与人工智能,2010,23(4):. 肖赤心,蔡自兴,王勇. 字典序进化算法用于组合优化问题. 控制理论与应用,2010,27(4):. 谢斌,蔡自兴. 基于MATLAB Robotics Toolbox的机器人学仿真实验教学. 计算机教育,2010,(127):. 余伶俐,蔡自兴,谭平,段琢华.基于多模态Rao-Blackwellized进化粒子滤波器的移动机器人航迹推算系统的故障诊断. 控制与决策,2010,25(12):. 余伶俐,蔡自兴,谭平,进化粒子滤波器对比研究及其在移动机器人故障诊断的应用. 信息与控制,2010,39(5):. 余伶俐,蔡自兴,肖晓明. 智能控制精品课程建设与教学改革研究. 计算机教育,2010,(127):. 余伶俐,焦继乐,蔡自兴. 一种多机器人任务规划算法及其系统实现. 计算机科学,2010,37(6):.周涛;蔡自兴。 信息审计中短消息中心实验环境的仿真[J].科学技术与工程 2010,10(6): . 邹磊,蔡自兴,任孝平.一种基于虚拟力的自组织覆盖算法.计算机工程,2010,36(14):93-95 .2009年:57. Gao Ping-an,Cai Zi-xing. Evolutionary Computation Approach to Decentralized Multi-robot Task Allocation. Proc. of the 5th International Conference on Natural Computation, IEEE Computer Society, 2009,. Wang Yong,Cai Zixing, Zhou Yuren. Accelerating adaptive trade-off model using shrinking space technique for constrained evolutionary optimization, International Journal for Numerical Methods in Engineering, 2009, 77(11):. Wang Yong,Cai Zixing, Zhou Yuren, Fan Zhun. Constrained optimization based on hybrid evolutionary algorithm and adaptive constraint-handling technique, Structural and Multidisciplinary Optimization, 2009, 37(1): . Wang Yong,Cai Zixing. A hybrid multi-swarm particle swarm optimization to solve constrained optimization problems, Frontiers of Computer Science in China, 2009,3(1):. Wang Yong,Cai Zixing. Constrained evolutionary optimization by applying (mu+lambda)-differential evolution and improved adaptive trade-off model. Evolutionary Computation, . Liu Hui,Cai Zixing, and Wang Yong. Hybridizing particle swarm optimization with differential evolution for constrained numerical and engineering Soft Computing, 2010,10(2):629–. Liu Limei,Cai Zixing. An Improvement of Hough Transform for Building Feature . Limei Liu, Zixing Cai, Method Based on Uncertain Information of Sonar Sensor[C]. The 9th International Conference for Young Computer Scientists,2009,. YU Ling-li,CAI Zi-xing. Robot Detection Mission Planning Based on Heterogeneous Interactive Cultural Hybrid Algorithm. Proc. of the 5th International Conference on Natural . Ren Xiaoping,Cai Distributed Actor Deployment Algorithm for Maximum Connected Coverage in WSAN. Proc. of the 2009 Fifth International Conference on Natural Computation, 2009,. 王勇,蔡自兴,周育人,肖赤心.约束优化进化算法.软件学报, 2009,20(1): . 陈白帆,蔡自兴, 潘薇. 基于声纳和摄像头的动态环境地图创建方法.高技术通讯, 2009, 19(4): . 陈白帆,蔡自兴, 袁成. 基于粒子群优化的移动机器人SLAM方法研究.机器人, 2009, 31(6):. 高平安,蔡自兴. 多移动机器人任务负载均衡分组规划方法.高技术通讯,2009, 19(5):. 高平安,蔡自兴. 一种基于多子群的动态优化算法.中南大学学报(自然科学版) 2009, 40(3): . 刘献如,;蔡自兴. 一种基于Integral Imaging和与模拟退火相结合的深度测量方法研究. 系统仿真学报. 2009,21(8):2303~. 刘利枚,蔡自兴,潘薇.一种基于声纳信息的地图创建方法.计算机工程,2009,35(7):. 余伶俐,蔡自兴. 基于异质交互式文化混合算法的机器人探测任务规划.机器人.2009, 31(2):. 余伶俐,蔡自兴,刘晓莹,高平安. 均分点蚁群算法在群集机器人任务规划中的应用研究[J].高技术通讯. 2009,19(10),. 余伶俐,蔡自兴. 改进混合离散粒子群的多种优化策略算法.中南大学学报,2009, 40(4): . 余伶俐,蔡自兴,高平安,刘晓莹. 当代学习自适应混合离散粒子群算法研究. 小型微型计算机系统. 2009, 30(9):. 余伶俐,蔡自兴. 基于当代学习离散粒子群的多机器人高效任务分配算法研究. 计算机应用研究. 2009, 26(5):.蔡自兴; 谢斌; 魏世勇; 陈白帆. 《机器人学》教材建设的体会. 2009年全国人工智能大会(CAAI-13),北京:北京邮电大学出版社,252-255,2009年9月.80.蔡自兴,郭璠. 密码学虚拟实验平台的设计与实现.中国人工智能进展(2009),中国人工智能大会(CAAI-13)论文集,北京:北京邮电大学出版社,432-438,2009年9月.81.蔡自兴,任孝平,邹磊.分布式多机器人通信仿真系统.智能系统学报,2009,4(4): . 任孝平,蔡自兴.基于阿克曼原理的车式移动机器人运动学建模.智能系统学报, 2009,4(6);.蔡自兴; 任孝平; 邹磊. 分布式多机器人通信仿真系统.智能系统学报, 2009,4(4);. 文志强;蔡自兴. 一种目标跟踪中的模糊核直方图. 高技术通讯, 2009,19(2):.刘星宝;蔡自兴. 种子检测器刺激-应答变异算法研究. 高技术通讯, 2009,19(3):. 刘星宝;蔡自兴. 负选择算法中的检测器快速生成策略. 小型微型计算机系统, . 刘星宝;蔡自兴. 异常检测系统的漏洞分析.中南大学学报(自然科学版), . 潘薇;蔡自兴; 陈白帆. 一种非结构环境下多机器人构建地图的方法. 高技术通讯, . 孔志周;蔡自兴; 官东. 两种模糊密度确定方法的实验比较. 小型微型计算机系统, . 江中央;蔡自兴; 王勇. 用于全局优化的混合正交遗传算法. 计算机工程, . 肖赤心;蔡自兴; 王勇; 周经野. 一种基于佳点集原理的约束优化进化算法. 控制与决策, 2009-02-15 .92. 官东;蔡自兴; 孔志周. 一种基于网格技术的HLA分布仿真实现方法. 系统仿真学报, 2009,21(5):.刘慧;蔡自兴; 王勇. 基于佳点集的约束优化进化算法. 系统仿真学报, 2009-03-20 .94. 潘薇;蔡自兴; 陈白帆. 基于遗传算法的多机器人协作建图方法. 计算机应用研究, . 任孝平;蔡自兴; 卢薇薇. 一种基于扫描相关度的LSB算法. 计算机应用, .胡强;蔡自兴. 一种基于改造时钟系统的Linux实时化方案. 计算机工程, . 袁成;蔡自兴; 陈白帆. 粒子群优化的同时定位与建图方法. 计算机工程, . 王勇;蔡自兴. “智能优化算法及其应用”课程教学的实践与探索. 计算机教育, . 任孝平;蔡自兴; 卢薇薇. 网络可重构的多机器人仿真系统. 计算机应用研究, . 袁湘鹏;蔡自兴; 刘利枚. 基于声纳的移动机器人环境建图的设计与实现. 计算机应用研究, . 官东;蔡自兴; 孔志周.网格服务本体匹配算法研究. 小型微型计算机系统, 2009,30(8):. 邹磊;蔡自兴; 任孝平. 基于簇的多移动机器人通信系统. 计算机应用研究, .蔡自兴. 从严施教,精心育才,培养高素质人才. 计算机教育, . 肖晓明; 旷东林;蔡自兴. 单亲遗传算法种群初始化方法分析. 电脑与信息技术, . 刘丽珏; 陈白帆; 王勇; 余伶俐;蔡自兴. 精益求精建设人工智能精品课程. 计算机教育, . 陈爱斌;蔡自兴; 安基程. 一种基于摄像机视角的立体视觉定位方法.中南大学学报(自然科学版), . 唐素勤;蔡自兴; 江中央; 肖赤心. 用于求解约束优化问题的自适应佳点集进化算法. 小型微型计算机系统,2009,第9期,.胡扬;桂卫华;蔡自兴. 多元智能算法控制结构综述. 计算机科学, .蔡自兴. 《混沌系统的模糊神经网络控制理论与方法》评介. 计算技术与自动化, . 陈爱斌;蔡自兴; 安基程. 一种基于摄像机视角的立体视觉定位方法. 2009年中国智能自动化会议论文集(第六分册)[中南大学学报(增刊)], . 于金霞;蔡自兴; 段琢华. 复杂地形下移动机器人运动学建模研究. 2009中国控制与决策会议论文集(1), . 刘献如,蔡自兴,杨欣荣. Integral Imaging与模拟退火相结合的深度测量方法研究. 系统仿真学报,2009,21(8):2303-2307. 1、传感器技术:自动驾驶汽车上,前后左右装有认识周围环境、道路、交通状况的各种传感器。光学摄像头包括单摄像头、多摄像头,多普勒雷达包括短距离雷达、远距离雷达,还有激光雷达就是车顶上那个旋转的机器,GPS定位装置,等等,构成汽车认识环境的眼睛。2、芯片技术:也就是能够处理多个传感器采集的数据,并能整合的类似小计算机的超级芯片,使汽车的“总计算机”体积、成本大为减小,并能应用于汽车成为可能。否则汽车里将没有人坐的地方、老百姓也买不起这些庞大计算机群的汽车。3、操作系统:计算机控制系统将处理结果与操作硬件结合起来,实现加速减速、刹车停车、变向避让,以及人机对话等等。无人驾驶汽车具备了替代人工操纵的能力。4、网络技术:无人驾驶汽车要能上路,必须具备与互联网、局域网联络和识别功能,包括车与车的联络对话、车与卫星通讯、车与天气预报的联络、车与交通指挥网的联络,才能正确识别和选择道路、正确服从交通警察的指挥、正确决定通过交叉路口、正确避让危险和安全行车。总之,万里长征刚走了第一步,距离进入百姓家庭,还相当遥远。比如,那个车顶上老是旋转的东西就让人感到很不雅观。汽车制造商真的搞无人驾驶,自己把自己推给了芯片公司、计算机公司、网络公司,沦为装配厂的一员,也是很不情愿的事。 车道线检测算法通常分为两种类型:一种是基于基于视觉特征来做语义分割或者实例分割,例如 LaneNet 和 SCNN ;另一种是通过视觉特征来预测车道线所在位置的点,以此来解决 no-visual-clue 问题的模型,比如本文提到的 Ultra-Fast-Lane-Detection 。 offical github : paper : Ultra Fast Structure-aware Deep Lane Detection 下图展示了整个模型的结构,基本可以分为三个部分: Backbone 、 Auxiliary 部分和用于车道线候选点选择的 Group Classification 部分。可以看出,由于整个 pipeline 中参与最终 inference 的部分只进行了下采样而不像分割模型还进行了多轮的上采样,因此模型整体的计算量是相当低的,根据论文给出的结果可以达到 300FPS 。 Backbone 部分采用了较小的 ResNet18 或者 ResNet34 ,下采样到 4X 的部分作为最终的特征,这里其实是较为浅层的特征,一般分割模型要下采样到 16x 或者 32x 。论文里也提到了使用较大的感受野就可以达到不错的检测效果,这样就可以极大的提高模型的推理速度。 Auxiliary 部分对三层浅层特征进行了 concat 和上采样,用来进行实例分割。其目的是在训练过程中增强视觉特征,不参与推理。 Group Classification 部分如下所示,论文称之为 row-based selecting method based on global image features ,即在全局特征上进行行索引来计算候选点,这样的方法将先验假设融入到了车道线检测的任务中。 在分割任务上,最终的特征图的大小是 HxWxC 。分类是要沿着 C 方向的, C 方向的向量代表一个像素位置的特征向量属于哪一个类别;在本方法中,最终的特征图的大小是 hx(w+1)xC 。 h 是要在垂直方向上采样的行的数量( row anchor ), h 文章中使用的 Loss 函数分为三部分,分别是多分类损失 L_cls , 分割损失 L_seg 和车道结构化损失 L_str 。其中 L_cls 和 L_seg 是常用的分类、分割任务中常用的两种损失。 结构损失的目的是利用车道结构的先验知识来约束预测出来的车道线的形状。其中 L_sim 为相似度损失, L_shp 为形状损失。 相似度损失的出发点是同一个车道中,相邻的两个点之间的距离应该尽可能的近,这里使用 L1 范式来进行距离的约束。 形状损失的出发点是基于大多的的车道线都是直线,即使是曲线其大部分也是近似的直线。对于同一条车道线,在相邻 row achor 上的车道线的候选点的位置的选择应该尽可能的相近。理想的状况下它的值应该为 0 。 Loc 函数的含义是第 i 条车道的第 j 个 row anchor 中车道点的期望。 Prob 代表的是第 i 条车道的第 j 个 row anchor 中,第 k 个位置是车道点的概率。因为背景不被计算在内,因此 k 的取值从 1 开始。 论文给出 metric 结果如下所示,其评估硬件应该为 NVIDIA GTX 1080TI 。该方法在保证精度接近的情况下,极大的提升了推理速度,很适合实时检测的任务。 为了测试其真实的推理性能,我在 NVIDIA RTX 3070+CUDA11+ 的环境性进行了测试。模型的 backbone 为 resnet18 ,输入尺寸为 (288, 800, 3) 的情况下, Ultra-Fast-Lane-Detection 的推理性能如下所示,单 batch 推理速度约为 350FPS ,其性能与论文给出的结果基本一致。 论文的总结应该怎么写(通用6篇) 在学习、工作生活中,大家都有写论文的经历,对论文很是熟悉吧,论文一般由题名、作者、摘要、关键词、正文、参考文献和附录等部分组成。相信许多人会觉得论文很难写吧,下面是我整理的论文的总结应该怎么写,欢迎大家借鉴与参考,希望对大家有所帮助。 1、首先我们肯定要选着一个自己熟悉的题目,且要准确 有句话说的不错,看菜不误磨刀工嘛。毕业论文写作都是一样的道理,选一个自己熟悉的题目,在写论文会有一种得心应手的感觉。选题的时候,我们不关熟悉就可以啦,还考虑很多其他因素,既要符合理论的发展趋势,紧跟时代的步伐,一定的创新,也要有一定的学术价值;这也是对自己专业知识的一种考验。在选题时一定要进行深入的论证,有要结合自身情况,量体裁衣,确定题目。题目一旦论证确定,就要树立目标和信心,坚定的写下去,在写作过程中遇到困难在所难免,没有谁会一气呵成,不关有还是没有,反正我是不信会有的。我们只有面对困难,寻求解决困难的办法,切忌信念不坚定,不敢下手,一定要相信自己,选定的题目是经过深思熟虑,跟访考虑的。自己有能力有信心写下去,这一点,信心最重要,这是我们论文写作的动力和支撑。 2、思路清晰 题目确定了,我们就题目进行深入的论述证明,要确定好思维导图,这样就会有明确的条理。毕业论文写作,思路决定你的写法,是按什么顺序,这根据自己论文的实际情况而定,只有做到研究思路清晰,才能围绕主体开展论述,这也是从总体上对论文的一个把握,不会让论文写作偏离主题,我们可以列出论文的各级标题。 3、论点要言简意赅 毕业论文写作中,要善于用简明扼要的话总结自己的观点,就是在论文下级标题对自己的观点要有所体现,切忌把观点隐藏在正文中间,要做到导师看了你的纲目,就知道你写了什么,表达了怎样的观点。不要把自己观点藏起来,别人都看不到,谁知道你写的什么? 4、论据要充分 毕业论文,重在论证。把道理讲明白,为什么是这样的观点,论据一定要充分。举例子进行论证,只要是发生过存在的,都可以用来论证,论据充分了,我们的论文才显得丰满,论点才能站得住脚。 5、合理借鉴和引用他人的成果 叫借鸡下蛋,也就是说借势,让自己论证有着坚实的后盾。在引用他人的研究成果时,一般要遵循一个原则,引用了人家的论点,就不能引证人家的论据,引用了论据,就不能引用论点,这样可以避免不必要的麻烦。 6、文中脚注和参考文献要全面 在毕业论文写作中,不可能不引用别人的观点,不过要在论文中标注出来了,这是研究的需要,不能算抄。但一定要有下注,要标明文献的出处,具体到页码,不然很容易有抄袭的嫌疑。一般在引用中,不能出现大段的引用,最好是转化为自己的语言,把意思表达出来。这样才能通过论文查重,不然你没标注,就会检测出你的论文是抄袭的,所以标注很重要。 7、论文的总结范文 在新年前夕终于把毕业论文草稿搞定了,也许是这段时间最值得高兴的事儿。论文写作大约花了将近一个学期的时间,从开学到十一,我完成了原来提纲的前三章,共计三万多字。之后屁颠屁颠的给老师看的时候很悲惨的被驳回重写。十一假期结束以后,痛定思痛,重新修改论文大纲。中间经历过一段非常纠结、痛苦的时间,实在无法下笔写下去。但是,仍然坚持了下来,我想这对于我来说是一场艰难的战争。 论文草稿字数共计七万五千字。在我看来这已经非常多了,谁曾想今天拿给导师看的时候,他拿着打印稿,看着我,随意的说:“才这么点啊。”我滴脑门儿顿时滴下了三粒汗珠。 论文的失误地方有很多,而且写的很干,与我原本想的洋洋洒洒上万言大不相同,磕磕绊绊的有的没的。按照习惯,现将论文总结备案如下: 1、在写作论文之前,资料一定要准备充分。对于原始文献资料一定要滚瓜烂熟,比如我写南北朝道教造像,一定要把南北朝道经的目录先整理出来,伪经要先挑出来,不能作为参考资料。还要把道经按照时间顺序排列开来,以兹进行线性对比,更能让你对某些词汇有一定的敏捷性。如此才来由此及彼,进行广泛性的探讨。对于图像,一是要找考古报告翻阅,编号;二是要对图像的细节部分做到烂熟于心。如此方能掌控图像特征。 2、在写作过程中会遇到很多问题,暂且放下,该干嘛干嘛。我论文中遇到过很多坎,很多时候都越不过去,不要老纠结于一点。写吧,只有写才能让论文更加丰富。论文的写作过程就是一个不断修改的过程,一路写过去,一路改过去才是正常情况。 3、资料的积累不是正道,只有有自己的想法才能出奇制胜。在我开始写作论文的时候就不愿意落入俗套,想要尝试以多个视角去阐述问题,当然,事实上我是做的不够的,但是只有做了才知道行不行。 毕业论文是实现大学培养目标的重要教学环节,是本科教学计划的组成部分,是本科生的一门必修课。我的毕业论文写作现已告一段落,细细回想自己的写作历程,这其中离不开指导教师王希辉老师的精心指导和热忱的帮助,才使得毕业论文的顺利完成,在此再一次向王老师以及给予我帮助的所有老师、朋友们表示衷心的感谢。通过此次论文写作,使我获得颇多的感受和收获。 首先,广博的理论知识是毕业论文写作的关键。毕业论文是对大学学习的最后检验,是对四年知识的总结和提升。因此,有充分的理论知识是毕业论文能否顺利完成的关键。可以说,拥有广博的理论知识,将意味着你的毕业论文写作已经成功了一半。 其次,熟练的写作能力和信息的搜集能力是毕业论文写作的重要条件。毕业论文体现的不仅仅是对知识的掌握,也是对语言的组织能力和表达能力的检验。一篇优秀的论文不是写出来的,而是修改出来的,这需要的是耐心,还要用心。在论文写作过程中,我遇到的问题很多,有些是在自己知识范围之外,每当无法继续写作的时候,我就会出现浮躁的情绪,但是我没有放弃,而是适时地调节自己的心态,在同学老师的帮助下,完成了初稿。越是不懂的东西才要去学,在写作的过程中你会收获很多,其中一点就是互相学习是最好的学习途径,在学习之后你会感觉到很有成就感,这也是我在完成论文写作之后体会到的。另外,能够广泛的搜集资料,查阅相关文献,掌握第一手原始资料,这将大大地充实论文的论证材料,提高论文的说服力。 最后,遵守学术道德规范是毕业论文写作的最起码原则。毕业论文的写作是一件神圣而严肃的事情,是体现大学生最起码的人格品质诚实。因此,对待毕业论文的写作,必须要有严谨的学术精神,自觉严格的遵守学术道德规范,可以参考和引用别人的学术成果,但决不能抄袭。 毕业论文完成之后,还以写一份毕业论文总结报告,这对自己来说,是一个总结,也是一个提醒。因为毕业论文的完成,既为大学四年划上了一个完美的句号,也为将来的人生之路做好了一个很好的铺垫。 我所选论文题目是“教育技术专业英语课程网站设计”,之所以选择这个题目,是因为我自己感觉它具有挑战性,越是自己薄弱的环节越要去尝试。在论文写作以及网站制作过程中,有时感觉很辛苦,有时还会产生放弃的念头,但是最终坚持了下来,出色的完成了我的毕业设计,为了自己的目标,更为了自己的选择。 开始是搜集资料。在指导老师的指点下,通过各种渠道开始准备工作—通过网络、图书馆搜集相关学术论文、核心期刊、书籍等。通过一个月的深入学习,搜集了一大堆与毕业设计相关的资料,在张老师的指导下,摒弃了一些无关紧要的内容,保留了有参考价值的资料作为备用。在这段时期,我整天出入图书馆。在中国知网上,我搜索了一些学术论文和期刊文章;在Springer上,我搜索了外文文献资料,参考了一些毕业论文样本和一些毕业论文设计总结;在常见的搜索引擎中,我了解到一些相关的知识,同时特意浏览了大量的外文网站,并将这些内容列成提纲,便于以后查询,以减少后期工作量。 接下来,我开始对所搜集的资料进行整理、分析研究,并制作了课题研究的方案及网站设计规划,开题报告完成之后随即进入紧张而有序的写作及网站创作之中。根据取其精华,去其糟粕的原则,我撰写了初稿,并加入了自己新颖的见解,特别是在制作网站的过程中,吸取其它外文网站的优点,并加入自己的创新点。在此期间,我多次与张老师电话或短信以及利用E—mail进行沟通,听取老师好的建议,积极采纳。 老师将初稿修改后及时反馈给我,看了之后才发现论文中的论文漏洞很多,特别是论文的格式,而就设计的网站规划来说,提出了几点建议,如不要全盘覆盖课本上的知识,用一个章节作为典型来表达你的创新点就可以了。至此,我发现,要干好一件事并非那么简单,但也不是很难,敷衍了事是万万不可的,对待任何事情都要认真去思考,用思想来完成任务。 一篇优秀的论文不是写出来的,而是修改出来的,这需要的是耐心,还要用心。在网站的制作过程中,我遇到的问题很多,有些是在自己技术所在范围之外,每当无法实现自己的想法或者运行不下去的时候,我就会出现浮躁的情绪,但是我没有放弃,而是适时地调节自己的心态,在同学老师的帮助下,完成了初次的设计。越是不懂的东西才要去学,在学习的过程中你会收获很多,其中一点就是互相学习是最好的学习途径,在学习之后你会感觉到很有成就感,这也是我在完成网站制作之后体会到的。 各方面工作都做好之后就剩毕业论文答辩了,在未进行之前,我自己感觉论文答辩可能很难,心里难免有些许担心。真正经历之后才发现,任何在你认为难得事情都是因为你没有很好把握或者是准备工作没有做好。毕业论文答辩稿是我花了两天的时间写的,在答辩的过程中,自我感觉还是不错的,虽然开始有些紧张,两分钟之后就进入状态,因为是自己在讲解自己做的东西,感觉轻车熟路,流畅地给老师同学们论述了我的毕业设计。 在整个毕业论文设计的过程中我学到了做任何事情所要有的态度和心态,首先我明白了做学问要一丝不苟,对于出现的任何问题和偏差都不要轻视,要通过正确的途径去解决,在做事情的过程中要有耐心和毅力,不要一遇到困难就打退堂鼓,只要坚持下去就可以找到思路去解决问题的。在工作中要学会与人合作的态度,认真听取别人的意见,这样做起事情来就可以事倍功半。 论文的顺利完成,首先我要感谢我的指导老师张永芳老师以及周围同学朋友的帮助,感谢他们提出宝贵的'意见和建议。另外,要感谢在大学期间所有传授我知识的老师,是你们的悉心教导使我有了良好的专业课知识,这也是论文得以完成的基础。 当我终于完成了所有打字、绘图、排版、校对的任务后整个人都很累,但同时看着电脑荧屏上的毕业设计稿件我的心里是甜的,我觉得这一切都值了。这次毕业论文的制作过程是我的一次再学习,再提高的过程。在论文中我充分地运用了大学期间所学到的知识。 我不会忘记这难忘的几个月的时间。毕业论文的制作给了我难忘的回忆。在我徜徉书海查找资料的日子里,面对无数书本的罗列,最难忘的是每次找到资料时的激动和兴奋;亲手设计电路图的时间里,记忆最深的是每一步小小思路实现时那幸福的心情;为了论文我曾赶稿到深夜,但看着亲手打出的一字一句,心里满满的只有喜悦毫无疲惫。这段旅程看似荆棘密布,实则蕴藏着无尽的宝藏。我从资料的收集中,掌握了很多单片机、LED显示屏的知识,让我对我所学过的知识有所巩固和提高,并且让我对当今单片机、LED显示屏的最新发展技术有所了解。在整个过程中,我学到了新知识,增长了见识。在今后的日子里,我仍然要不断地充实自己,争取在所学领域有所作为。 脚踏实地,认真严谨,实事求是的学习态度,不怕困难、坚持不懈、吃苦耐劳的精神是我在这次设计中最大的收益。我想这是一次意志的磨练,是对我实际能力的一次提升,也会对我未来的学习和工作有很大的帮助。 在这次毕业设计中也使我们的同学关系更进一步了,同学之间互相帮助,有什么不懂的大家在一起商量,听听不同的看法对我们更好的理解知识,所以在这里非常感谢帮助我的同学。 在此我要感谢我的导师和专业老师,是你们的细心关怀和指导,才使我能够顺利的`完成毕业论文。在我的学业和论文的研究工作中无不倾注着老师们辛勤的心血和汗水。老师的严谨的治学态度、博学的知识、无私的奉献精神使我深受启迪。从尊敬的导师身上,我不仅学到了扎实、宽广的专业知识,也学到了做人的道理。在此我要向我的导师致以最衷心的感谢和深深的敬意。 毕业论文是对我们大学四年来学习成果的一次综合考量,是衡量我们是否能够成为一个合格毕业生的标尺,也是我们在大学生活中最后一次的自我展示。 20xx年9月,我开始了我的毕业论文工作,时至今日,论文基本完成。从最初的茫然,到慢慢的进入状态,再到对思路逐渐的清晰,在整个写作过程中,我不断进行精心的修改,不断地去研究各方面的资料,拥有了无数宝贵的经验和收获。9月上旬,在与导师的交流讨论中我的题目定了下来,是:童话中的“角落创造”与儿童创新思维的培养。当论文题目定下来之后,我便立刻在学校的图书馆收集资料。当时面对众多网络资料库的文章真是有些不知所措,不知如何下手。我将这一困难告诉了指导老师,在老师的细心的指导下,终于使我了解了应该怎么样利用学校的浩瀚的资源找到自己需要的相关方面的资源。我大概找了xx0篇左右相关的论文,认真的阅读,总结笔记,为自己的论文打好基础。主要是为了发现过去那些论文之中的观点,然后避免有重复的观点出现,争取从一个全新的角度去研究这一课题。 在搜集资料后,我在电脑中都进行分类的整理,然后针对自己不同部分的写作内容进行归纳和总结。尽量使我的资料和论文的内容符合,这有利于论文的撰写。我还准备了一本笔记本,将一些重要的资料和关键要点摘录在笔记本上。然后及时与指导老师进行沟通,听取老师的意见后再进行修改。老师的意见总是很宝贵的,可以很好的指出我的资料收集的不足以及需要什么样的资料来完善文章。 xx月初,资料已经查找完毕了,我开始着手论文初稿的写作。初稿的写作显得逻辑结构不清晰,总是想到哪就写到哪,文章显得有点凌乱,层次不够分明,结构不够紧密。遇到这些问题,我及时和导师联系,并和同学互相交流,请教专业课老师。在大家的帮助下,经过反复的修改,论文终于慢慢成型。 在整个论文的写作过程中,我经历了失败和挫折,也享受了克服困难、走出困境的成就感和喜悦之情。通过查阅大量的相关资料,与同学交流经验和自学,并向老师请教等方式,我经历了不少艰辛,但同时也学到了不少知识,积累了大量的经验,收获巨大。也培养了我独立工作的能力,树立了对自己能力的信心,相信这些对我今后的学习、工作都会有非常重要的影响。 大学生活随着毕业论文的完成已经接近尾声了。这次毕业论文的撰写过程中,我得到了老师、同学和的家人教诲、帮助和鼓励。在这里,我要对他们表达我深深的谢意! 感谢我的指导老师,没有您的悉心指导就没有这篇论文的顺利完成。从开始选题到中期修正,再到最终定稿,马老师在忙碌的教学工作中挤出时间,悉心指导、循循善诱,给我提供了许多宝贵建议,帮助我解决撰写论文过程中所遇到的困难。 感谢班主任老师,感谢您这四年来给予我们学习和生活上的关心与帮助。感谢所有教授过我课程的老师们,是你们的诲人不倦才有了现在的我。感谢我的父母,没有你们,就没有我的今天,你们的支持与鼓励,永远是支撑我前进的最大动力。你们是我力量的源泉,是我最坚实的后盾。只要有你们,不管面对什么样的的困难,我都不会害怕。 最后,感谢陪伴在我身边的所有的同学和朋友们,谢谢你们一直以来的相伴以及对我的宽容和关照,与你们在一起的点点滴滴、分分秒秒,将会成为我一生中难以抹去的记忆。 为期三个多月的毕业论文写作已经结束,大学的四年受学生涯也走向了尾声。本次毕业论文是在浙江科技学院生化材料实验室司完成的。这是我的第一份正式工作,虽然以前也曾做过一段时间的兼职工作,但相对于这段正式的工作经历,完全是两种不同的体验,因为身处一个企业,就要从不同的角度思考问题,并解决问题;这也将会是我以后工作必须面对的,从而对我能够更好的融入以后的工作有了一定的帮助。 基于之前的技术实践,我能够更好地将这次的毕业论文完成。在朱老师的指导下,我对实验和毕业论文有了一定地准备。在领导和同事的热心帮助下,实验顺利地进行,并成功地完成了毕业论文内容。通过工作,我很好地利用了所学的理论知识,从而在实践和理论学习两方面都增长了见识和知识。 本次毕业论文的主要内容是蜡类抛光剂的制备和性能研究。以石蜡、蜂蜡和巴西棕榈蜡为原料,在span80和tween80两种乳化剂和起固化、交联作用的氨基硅油的作用下制备了乳化蜡,并研究了乳化剂含量和乳化条件对乳化蜡外观色泽、气味和ph值、颗粒大小、分散性和稳定性的影响。抛光蜡有着很大的用途,可以用于汽车、家具、各种设备表面的保护和提高光泽度。同时,我国有着比较丰富的蜡资源,所以抛光蜡的发展前景很广阔。 经过这三个多月的实践学习,除了学到很多的专业技术外,更重要的是培养了我对工作的责任心,对于自己的工作任务,以饱满的精神去做,并按时完成。在完成工作的过程中,我秉着严谨的工作作风,不管是实验工作,还是其他诸如仪器保养,实验安全防范等都认真地对待,从而对自己的工作树立一个良好标准。总体来说最主要的还是工作能力的学习。实验的目的除了让我们认真地完成毕业论文外,还对我们应届毕业生的社会工作能力的提高起到相当重要的作用,如何做到学以至用,给我们一次将自己在大学期间所学习的各种书本知识运用到实际操作和演练当中的机会。自从开始工作,我本着积极肯干,虚心好学、工作认真负责的态度,积极主动的参与公司的各项工作与实验。对抛光蜡产品有了深入的了解。单位的反馈情况表明,在工作期间,我具有乐观进取的心态,有较强的适应能力,同时具备了较强的责任心和一定的沟通能力,能够很好地完成毕业设计论文。总之,通过这段时间的工作,使我获得了人生第一份宝贵的工作经验,为我的大学生活增添了一段倍感受用的经历,因此非常感谢浙江科技学院生化学院的各位领导以及指导老师对我的帮助。虽然即将步入社会,还有很多的东西需要我去学习,很多的坎坷需要我去面对,但我想我已经做好了足够的准备。欢迎未来对我的考验! 车道线检测算法通常分为两种类型:一种是基于基于视觉特征来做语义分割或者实例分割,例如 LaneNet 和 SCNN ;另一种是通过视觉特征来预测车道线所在位置的点,以此来解决 no-visual-clue 问题的模型,比如本文提到的 Ultra-Fast-Lane-Detection 。 offical github : paper : Ultra Fast Structure-aware Deep Lane Detection 下图展示了整个模型的结构,基本可以分为三个部分: Backbone 、 Auxiliary 部分和用于车道线候选点选择的 Group Classification 部分。可以看出,由于整个 pipeline 中参与最终 inference 的部分只进行了下采样而不像分割模型还进行了多轮的上采样,因此模型整体的计算量是相当低的,根据论文给出的结果可以达到 300FPS 。 Backbone 部分采用了较小的 ResNet18 或者 ResNet34 ,下采样到 4X 的部分作为最终的特征,这里其实是较为浅层的特征,一般分割模型要下采样到 16x 或者 32x 。论文里也提到了使用较大的感受野就可以达到不错的检测效果,这样就可以极大的提高模型的推理速度。 Auxiliary 部分对三层浅层特征进行了 concat 和上采样,用来进行实例分割。其目的是在训练过程中增强视觉特征,不参与推理。 Group Classification 部分如下所示,论文称之为 row-based selecting method based on global image features ,即在全局特征上进行行索引来计算候选点,这样的方法将先验假设融入到了车道线检测的任务中。 在分割任务上,最终的特征图的大小是 HxWxC 。分类是要沿着 C 方向的, C 方向的向量代表一个像素位置的特征向量属于哪一个类别;在本方法中,最终的特征图的大小是 hx(w+1)xC 。 h 是要在垂直方向上采样的行的数量( row anchor ), h 文章中使用的 Loss 函数分为三部分,分别是多分类损失 L_cls , 分割损失 L_seg 和车道结构化损失 L_str 。其中 L_cls 和 L_seg 是常用的分类、分割任务中常用的两种损失。 结构损失的目的是利用车道结构的先验知识来约束预测出来的车道线的形状。其中 L_sim 为相似度损失, L_shp 为形状损失。 相似度损失的出发点是同一个车道中,相邻的两个点之间的距离应该尽可能的近,这里使用 L1 范式来进行距离的约束。 形状损失的出发点是基于大多的的车道线都是直线,即使是曲线其大部分也是近似的直线。对于同一条车道线,在相邻 row achor 上的车道线的候选点的位置的选择应该尽可能的相近。理想的状况下它的值应该为 0 。 Loc 函数的含义是第 i 条车道的第 j 个 row anchor 中车道点的期望。 Prob 代表的是第 i 条车道的第 j 个 row anchor 中,第 k 个位置是车道点的概率。因为背景不被计算在内,因此 k 的取值从 1 开始。 论文给出 metric 结果如下所示,其评估硬件应该为 NVIDIA GTX 1080TI 。该方法在保证精度接近的情况下,极大的提升了推理速度,很适合实时检测的任务。 为了测试其真实的推理性能,我在 NVIDIA RTX 3070+CUDA11+ 的环境性进行了测试。模型的 backbone 为 resnet18 ,输入尺寸为 (288, 800, 3) 的情况下, Ultra-Fast-Lane-Detection 的推理性能如下所示,单 batch 推理速度约为 350FPS ,其性能与论文给出的结果基本一致。 本文将对论文 Towards End-to-End Lane Detection: an Instance Segmentation Approach 进行解读。这篇论文是于2018年2月挂在arxiv上的。 文中提出了一种端到端的车道线检测算法,包括LaneNet和H-Net两个网络模型。其中,LaneNet是一种将 语义分割 和 对像素进行向量表示 结合起来的多任务模型,负责对图片中的车道线进行 实例分割 ;H-Net是由卷积层和全连接层组成的网络模型,负责预测转换矩阵H,使用转换矩阵H对属于同一车道线的像素点进行回归(我的理解是对使用坐标y对坐标x进行修正)。 根据论文中的实验结果,该算法在图森的车道线数据集上的准确率为,在NVIDIA 1080 TI上的处理速度为52FPS。 如图1所示,对于同一张输入图片,LaneNet输出实例分割的结果,为每个车道线像素分配一个车道线ID,H-Net输出一个转换矩阵H,使用转换矩阵H对车道线像素进行修正,并对修正的结果拟合出一个三阶的多项式作为预测得到的车道线。 论文中将实例分割任务拆解为 语义分割 和 聚类 两部分,如图2所示,LaneNet中decoder分为两个分支,Embedding branch对像素进行嵌入式表示,训练得到的embedding向量用于聚类,Segmentation branch负责对输入图像进行语义分割(对像素进行二分类,判断像素属于车道线还是背景)。最后将两个分支的结果进行结合得到实例分割的结果。 在设计语义分割模型时,论文主要考虑了以下两个方面: 1.在构建label时,为了处理遮挡问题,论文对被车辆遮挡的车道线和虚线进行了还原; 2. Loss使用 交叉熵 ,为了解决样本分布不均衡的问题(属于车道线的像素远少于属于背景的像素),参考论文 ENet: A Deep Neural Network Architecture for Real-Time Semantic Segmentation ,使用了boundedinverse class weight对loss进行加权: 其中,p为对应类别在总体样本中出现的概率,c是超参数(ENet论文中是,使得权重的取值区间为[1,50])。 为了区分车道线上的像素属于哪条车道,embedding_branch为每个像素初始化一个embedding向量,并且在设计loss时, 使得属于同一条车道线的像素向量距离很小,属于不同车道线的像素向量距离很大 。 这部分的loss函数是由两部分组成:方差loss(L_var)和距离loss(L_dist): 其中,x_i为像素向量,μ_c为车道线的均值向量,[x]+ = max(0,x) 为了方便在推理时对像素进行聚类,在图4中实例分割loss中设置δ_d > 6*δ_v。 在进行聚类时,首先使用mean shift聚类,使得簇中心沿着密度上升的方向移动,防止将离群点选入相同的簇中;之后对像素向量进行划分:以簇中心为圆心,以2δ_v为半径,选取圆中所有的像素归为同一车道线。重复该步骤,直到将所有的车道线像素分配给对应的车道。 LaneNet是基于 ENet 的encoder-decoder模型,如图5所示,ENet由5个stage组成,其中stage2和stage3基本相同,stage1,2,3属于encoder,stage4,5属于decoder。 如图2所示,在LaneNet中,语义分割和实例分割两个任务 共享stage1和stage2 ,并将stage3和后面的decoder层作为各自的分支(branch)进行训练;其中, 语义分割分支(branch)的输出shape为W*H*2,实例分割分支(branch)的输出shape为W*H*N,W,H分别为原图宽和高,N为embedding vector的维度;两个分支的loss权重相同。 LaneNet的输出是每条车道线的像素集合,还需要根据这些像素点回归出一条车道线。传统的做法是将图片投影到鸟瞰图中,然后使用2阶或者3阶多项式进行拟合。在这种方法中,转换矩阵H只被计算一次,所有的图片使用的是相同的转换矩阵,这会导致地平面(山地,丘陵)变化下的误差。 为了解决这个问题,论文训练了一个可以预测转置矩阵H的神经网络H-Net, 网络的输入是图片 , 输出是转置矩阵H : 由图6可以看出,转置矩阵H只有6个参数,因此H-Net的输出是一个6维的向量。H-Net由6层普通卷积网络和一层全连接网络构成,其网络结构如图7所示: Curve fitting的过程就是通过坐标y去重新预测坐标x的过程:LaneNet和H-Net是分别进行训练的。在论文的实验部分,两个模型的参数配置如下所示: • Dataset : Tusimple • Embedding dimension = 4 • δ_v= • δ_d=3 • Image size = 512*256 • Adam optimizer • Learning rate = 5e-4 • Batch size = 8 • Dataset : Tusimple • 3rd-orderpolynomial • Image size =128*64 • Adam optimizer • Learning rate = 5e-5 • Batch size = 10车道线检测国内外发展论文
车道线检测相关论文极简笔记
近期车道线检测论文阅读总结