作为计算机视觉三大任务(图像分类、目标检测、图像分割)之一,目标检测任务在于从图像中定位并分类感兴趣的物体。传统视觉方案涉及霍夫变换、滑窗、特征提取、边界检测、模板匹配、哈尔特征、DPM、BoW、传统机器学习(如随机森林、AdaBoost)等技巧或方法。在卷积神经网络的加持下,目标检测任务在近些年里有了长足的发展。其应用十分广泛,比如在自动驾驶领域,目标检测用于无人车检测其他车辆、行人或者交通标志牌等物体。
目标检测的常用框架可以分为两类,一类是 two-stage/two-shot 的方法,其特点是将兴趣区域检测和分类分开进行,比较有代表性的是R-CNN,Fast R-CNN,Faster R-CNN;另一类是 one-stage/one-shot 的方法,用一个网络同时进行兴趣区域检测和分类,以YOLO(v1,v2,v3)和SSD为代表。
Two-stage的方式面世比较早,由于需要将兴趣区域检测和分类分开进行,虽然精度比较高,但实时性比较差,不适合自动驾驶无人车辆感知等应用场景。因而此次我们主要介绍一下SSD和YOLO系列框架。
SSD与2016年由W. Liu et al.在 SSD: Single Shot MultiBox Detector 一文中提出。虽然比同年提出的YOLO(v1)稍晚,但是运行速度更快,同时更加精确。
SSD的框架在一个基础CNN网络(作者使用VGG-16,但是也可以换成其他网络)之上,添加了一些额外的结构,从而使网络具有以下特性:
用多尺度特征图进行检测 作者在VGG-16后面添加了一些特征层,这些层的尺寸逐渐减小,允许我们在不同的尺度下进行预测。越是深层小的特征图,用来预测越大的物体。
用卷积网络进行预测 不同于YOLO的全连接层,对每个用于预测的 通道特征图,SSD的分类器全都使用了 卷积进行预测,其中 是每个单元放置的先验框的数量, 是预测的类别数。
设置先验框 对于每一个特征图上的单元格,我们都放置一系列先验框。随后对每一个特征图上的单元格对应的每一个先验框,我们预测先验框的 维偏移量和每一类的置信度。例如,对于一个 的特征图,若每一个特征图对应 个先验框,同时需要预测的类别有 类,那输出的大小为 。(具体体现在训练过程中) 其中,若用 表示先验框的中心位置和宽高, 表示预测框的中心位置和宽高,则实际预测的 维偏移量 是 分别是:
下图是SSD的一个框架,首先是一个VGG-16卷积前5层,随后级联了一系列卷积层,其中有6层分别通过了 卷积(或者最后一层的平均池化)用于预测,得到了一个 的输出,随后通过极大值抑制(NMS)获得最终的结果。
图中网络用于检测的特征图有 个,大小依次为 , , , , , ;这些特征图每个单元所对应的预置先验框分别有 , , , , , 个,所以网络共预测了 个边界框,(进行极大值抑制前)输出的维度为 。
未完待续
参考: chenxp2311的CSDN博客:论文阅读:SSD: Single Shot MultiBox Detector 小小将的知乎专栏:目标检测|SSD原理与实现 littleYii的CSDN博客:目标检测论文阅读:YOLOv1-YOLOv3(一)
作者的其他相关文章: 图像分割:全卷积神经网络(FCN)详解 PointNet:基于深度学习的3D点云分类和分割模型 详解 基于视觉的机器人室内定位
论文原文:
YOLO(you only look once)是继RCNN、faster-RCNN之后,又一里程碑式的目标检测算法。yolo在保持不错的准确度的情况下,解决了当时基于深度学习的检测中的痛点---速度问题。下图是各目标检测系统的检测性能对比:
如果说faster-RCNN是真正实现了完全基于深度学习的端到端的检测,那么yolo则是更进一步,将 目标区域预测 与 目标类别判断 整合到单个神经网络模型中。各检测算法结构见下图:
每个网格要预测B个bounding box,每个bounding box除了要回归自身的位置之外,还要附带预测一个confidence值。这个confidence代表了所预测的box中含有object的置信度和这个box预测的有多准两重信息,其值是这样计算的:
其中如果有object落在一个grid cell里,第一项取1,否则取0。第二项是预测的bounding box和实际的groundtruth之间的IoU值。
每个bounding box要预测(x, y, w, h)和confidence共5个值,每个网格还要预测一个类别信息,记为C类。即SxS个网格,每个网格除了要预测B个bounding box外,还要预测C个categories。输出就是S x S x (5*B+C)的一个tensor。(注意:class信息是针对每个网格的,即一个网格只预测一组类别而不管里面有多少个bounding box,而confidence信息是针对每个bounding box的。)
举例说明: 在PASCAL VOC中,图像输入为448x448,取S=7,B=2,一共有20个类别(C=20)。则输出就是7x7x30的一个tensor。整个网络结构如下图所示:
在test的时候,每个网格预测的class信息和bounding box预测的confidence信息相乘,就得到每个bounding box的class-specific confidence score:
等式左边第一项就是每个网格预测的类别信息,第二三项就是每个bounding box预测的confidence。这个乘积即encode了预测的box属于某一类的概率,也有该box准确度的信息。
得到每个box的class-specific confidence score以后,设置阈值,滤掉得分低的boxes,对保留的boxes进行NMS(非极大值抑制non-maximum suppresssion)处理,就得到最终的检测结果。
1、每个grid因为预测两个bounding box有30维(30=2*5+20),这30维中,8维是回归box的坐标,2维是box的confidence,还有20维是类别。其中坐标的x,y用bounding box相对grid的offset归一化到0-1之间,w,h除以图像的width和height也归一化到0-1之间。
2、对不同大小的box预测中,相比于大box预测偏一点,小box预测偏一点肯定更不能被忍受的。而sum-square error loss中对同样的偏移loss是一样。为了缓和这个问题,作者用了一个比较取巧的办法,就是将box的width和height取平方根代替原本的height和width。这个参考下面的图很容易理解,小box的横轴值较小,发生偏移时,反应到y轴上相比大box要大。其实就是让算法对小box预测的偏移更加敏感。
3、一个网格预测多个box,希望的是每个box predictor专门负责预测某个object。具体做法就是看当前预测的box与ground truth box中哪个IoU大,就负责哪个。这种做法称作box predictor的specialization。
4、损失函数公式见下图:
在实现中,最主要的就是怎么设计损失函数,坐标(x,y,w,h),confidence,classification 让这个三个方面得到很好的平衡。简单的全部采用sum-squared error loss来做这件事会有以下不足:
解决方法:
只有当某个网格中有object的时候才对classification error进行惩罚。只有当某个box predictor对某个ground truth box负责的时候,才会对box的coordinate error进行惩罚,而对哪个ground truth box负责就看其预测值和ground truth box的IoU是不是在那个cell的所有box中最大。
作者采用ImageNet 1000-class 数据集来预训练卷积层。预训练阶段,采用网络中的前20卷积层,外加average-pooling层和全连接层。模型训练了一周,获得了top-5 accuracy为(ImageNet2012 validation set),与GoogleNet模型准确率相当。
然后,将模型转换为检测模型。作者向预训练模型中加入了4个卷积层和两层全连接层,提高了模型输入分辨率(224×224->448×448)。顶层预测类别概率和bounding box协调值。bounding box的宽和高通过输入图像宽和高归一化到0-1区间。顶层采用linear activation,其它层使用 leaky rectified linear。
作者采用sum-squared error为目标函数来优化,增加bounding box loss权重,减少置信度权重,实验中,设定为\lambda _{coord} =5 and\lambda _{noobj}= 。
作者在PASCAL VOC2007和PASCAL VOC2012数据集上进行了训练和测试。训练135轮,batch size为64,动量为,学习速率延迟为。Learning schedule为:第一轮,学习速率从缓慢增加到(因为如果初始为高学习速率,会导致模型发散);保持速率到75轮;然后在后30轮中,下降到;最后30轮,学习速率为。
作者还采用了dropout和 data augmentation来预防过拟合。dropout值为;data augmentation包括:random scaling,translation,adjust exposure和saturation。
YOLO模型相对于之前的物体检测方法有多个优点:
1、 YOLO检测物体非常快
因为没有复杂的检测流程,只需要将图像输入到神经网络就可以得到检测结果,YOLO可以非常快的完成物体检测任务。标准版本的YOLO在Titan X 的 GPU 上能达到45 FPS。更快的Fast YOLO检测速度可以达到155 FPS。而且,YOLO的mAP是之前其他实时物体检测系统的两倍以上。
2、 YOLO可以很好的避免背景错误,产生false positives
不像其他物体检测系统使用了滑窗或region proposal,分类器只能得到图像的局部信息。YOLO在训练和测试时都能够看到一整张图像的信息,因此YOLO在检测物体时能很好的利用上下文信息,从而不容易在背景上预测出错误的物体信息。和Fast-R-CNN相比,YOLO的背景错误不到Fast-R-CNN的一半。
3、 YOLO可以学到物体的泛化特征
当YOLO在自然图像上做训练,在艺术作品上做测试时,YOLO表现的性能比DPM、R-CNN等之前的物体检测系统要好很多。因为YOLO可以学习到高度泛化的特征,从而迁移到其他领域。
尽管YOLO有这些优点,它也有一些缺点:
1、YOLO的物体检测精度低于其他state-of-the-art的物体检测系统。
2、YOLO容易产生物体的定位错误。
3、YOLO对小物体的检测效果不好(尤其是密集的小物体,因为一个栅格只能预测2个物体)。
论文名称:Rich feature hierarchies for accurate object detection and semantic segmentation 提出时间:2014年 论文地址: 针对问题: 从Alexnet提出后,作者等人思考如何利用卷积网络来完成检测任务,即输入一张图,实现图上目标的定位(目标在哪)和分类(目标是什么)两个目标,并最终完成了RCNN网络模型。 创新点: RCNN提出时,检测网络的执行思路还是脱胎于分类网络。也就是深度学习部分仅完成输入图像块的分类工作。那么对检测任务来说如何完成目标的定位呢,作者采用的是Selective Search候选区域提取算法,来获得当前输入图上可能包含目标的不同图像块,再将图像块裁剪到固定的尺寸输入CNN网络来进行当前图像块类别的判断。 参考博客: 。 论文题目:OverFeat: Integrated Recognition, Localization and Detection using Convolutional Networks 提出时间:2014年 论文地址: 针对问题: 该论文讨论了,CNN提取到的特征能够同时用于定位和分类两个任务。也就是在CNN提取到特征以后,在网络后端组织两组卷积或全连接层,一组用于实现定位,输出当前图像上目标的最小外接矩形框坐标,一组用于分类,输出当前图像上目标的类别信息。也是以此为起点,检测网络出现基础主干网络(backbone)+分类头或回归头(定位头)的网络设计模式雏形。 创新点: 在这篇论文中还有两个比较有意思的点,一是作者认为全连接层其实质实现的操作和1x1的卷积是类似的,而且用1x1的卷积核还可以避免FC对输入特征尺寸的限制,那用1x1卷积来替换FC层,是否可行呢?作者在测试时通过将全连接层替换为1x1卷积核证明是可行的;二是提出了offset max-pooling,也就是对池化层输入特征不能整除的情况,通过进行滑动池化并将不同的池化层传递给后续网络层来提高效果。另外作者在论文里提到他的用法是先基于主干网络+分类头训练,然后切换分类头为回归头,再训练回归头的参数,最终完成整个网络的训练。图像的输入作者采用的是直接在输入图上利用卷积核划窗。然后在指定的每个网络层上回归目标的尺度和空间位置。 参考博客: 论文题目:Scalable Object Detection using Deep Neural Networks 提出时间:2014年 论文地址: 针对问题: 既然CNN网络提取的特征可以直接用于检测任务(定位+分类),作者就尝试将目标框(可能包含目标的最小外包矩形框)提取任务放到CNN中进行。也就是直接通过网络完成输入图像上目标的定位工作。 创新点: 本文作者通过将物体检测问题定义为输出多个bounding box的回归问题. 同时每个bounding box会输出关于是否包含目标物体的置信度, 使得模型更加紧凑和高效。先通过聚类获得图像中可能有目标的位置聚类中心,(800个anchor box)然后学习预测不考虑目标类别的二分类网络,背景or前景。用到了多尺度下的检测。 参考博客: 论文题目:DeepBox: Learning Objectness with Convolutional Networks 提出时间:2015年ICCV 论文地址: 主要针对的问题: 本文完成的工作与第三篇类似,都是对目标框提取算法的优化方案,区别是本文首先采用自底而上的方案来提取图像上的疑似目标框,然后再利用CNN网络提取特征对目标框进行是否为前景区域的排序;而第三篇为直接利用CNN网络来回归图像上可能的目标位置。创新点: 本文作者想通过CNN学习输入图像的特征,从而实现对输入网络目标框是否为真实目标的情况进行计算,量化每个输入框的包含目标的可能性值。 参考博客: 论文题目:AttentionNet: AggregatingWeak Directions for Accurate Object Detection 提出时间:2015年ICCV 论文地址: 主要针对的问题: 对检测网络的实现方案进行思考,之前的执行策略是,先确定输入图像中可能包含目标位置的矩形框,再对每个矩形框进行分类和回归从而确定目标的准确位置,参考RCNN。那么能否直接利用回归的思路从图像的四个角点,逐渐得到目标的最小外接矩形框和类别呢? 创新点: 通过从图像的四个角点,逐步迭代的方式,每次计算一个缩小的方向,并缩小指定的距离来使得逐渐逼近目标。作者还提出了针对多目标情况的处理方式。 参考博客: 论文题目:Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition 提出时间:2014年 论文地址: 针对问题: 如RCNN会将输入的目标图像块处理到同一尺寸再输入进CNN网络,在处理过程中就造成了图像块信息的损失。在实际的场景中,输入网络的目标尺寸很难统一,而网络最后的全连接层又要求输入的特征信息为统一维度的向量。作者就尝试进行不同尺寸CNN网络提取到的特征维度进行统一。创新点: 作者提出的SPPnet中,通过使用特征金字塔池化来使得最后的卷积层输出结果可以统一到全连接层需要的尺寸,在训练的时候,池化的操作还是通过滑动窗口完成的,池化的核宽高及步长通过当前层的特征图的宽高计算得到。原论文中的特征金字塔池化操作图示如下。 参考博客 : 论文题目:Object detection via a multi-region & semantic segmentation-aware CNN model 提出时间:2015年 论文地址: 针对问题: 既然第三篇论文multibox算法提出了可以用CNN来实现输入图像中待检测目标的定位,本文作者就尝试增加一些训练时的方法技巧来提高CNN网络最终的定位精度。创新点: 作者通过对输入网络的region进行一定的处理(通过数据增强,使得网络利用目标周围的上下文信息得到更精准的目标框)来增加网络对目标回归框的精度。具体的处理方式包括:扩大输入目标的标签包围框、取输入目标的标签中包围框的一部分等并对不同区域分别回归位置,使得网络对目标的边界更加敏感。这种操作丰富了输入目标的多样性,从而提高了回归框的精度。 参考博客 : 论文题目:Fast-RCNN 提出时间:2015年 论文地址: 针对问题: RCNN中的CNN每输入一个图像块就要执行一次前向计算,这显然是非常耗时的,那么如何优化这部分呢? 创新点: 作者参考了SPPNet(第六篇论文),在网络中实现了ROIpooling来使得输入的图像块不用裁剪到统一尺寸,从而避免了输入的信息丢失。其次是将整张图输入网络得到特征图,再将原图上用Selective Search算法得到的目标框映射到特征图上,避免了特征的重复提取。 参考博客 : 论文题目:DeepProposal: Hunting Objects by Cascading Deep Convolutional Layers 提出时间:2015年 论文地址: 主要针对的问题: 本文的作者观察到CNN可以提取到很棒的对输入图像进行表征的论文,作者尝试通过实验来对CNN网络不同层所产生的特征的作用和情况进行讨论和解析。 创新点: 作者在不同的激活层上以滑动窗口的方式生成了假设,并表明最终的卷积层可以以较高的查全率找到感兴趣的对象,但是由于特征图的粗糙性,定位性很差。相反,网络的第一层可以更好地定位感兴趣的对象,但召回率降低。 论文题目:Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 提出时间:2015年NIPS 论文地址: 主要针对的问题: 由multibox(第三篇)和DeepBox(第四篇)等论文,我们知道,用CNN可以生成目标待检测框,并判定当前框为目标的概率,那能否将该模型整合到目标检测的模型中,从而实现真正输入端为图像,输出为最终检测结果的,全部依赖CNN完成的检测系统呢? 创新点: 将当前输入图目标框提取整合到了检测网络中,依赖一个小的目标框提取网络RPN来替代Selective Search算法,从而实现真正的端到端检测算法。 参考博客 :
原文: Scalable Object Detection using Deep Neural Networks——学术范 最近,深度卷积神经网络在许多图像识别基准上取得了最先进的性能,包括ImageNet大规模视觉识别挑战(ILSVRC-2012)。在定位子任务中获胜的模型是一个网络,它预测了图像中每个对象类别的单个边界框和置信度得分。这样的模型捕获了围绕对象的整幅图像上下文,但如果不天真地复制每个实例的输出数量,就无法处理图像中同一对象的多个实例。在这篇论文中提出了一个显著性启发的神经网络检测模型,它预测了一组与类无关的边界框,每个框有一个分数,对应于它包含任何感兴趣的对象的可能性。该模型自然地为每个类处理数量可变的实例,并允许在网络的最高级别上进行跨类泛化。 目标检测是计算机视觉的基本任务之一。一个解决这个问题的通用范例是训练在子图像上操作的对象检测器,并在所有的场所和尺度上以详尽的方式应用这些检测器。这一范例被成功地应用于经过区别训练的可变形零件模型(DPM)中,以实现检测任务的最新结果。对所有可能位置和尺度的穷举搜索带来了计算上的挑战。随着类数量的增加,这个挑战变得更加困难,因为大多数方法都训练每个类单独的检测器。为了解决这个问题,人们提出了多种方法,从检测器级联到使用分割提出少量的对象假设。 关于对象检测的文献非常多,在本节中,我们将重点讨论利用类不可知思想和解决可伸缩性的方法。 许多提出的检测方法都是基于基于部件的模型,最近由于有区别学习和精心设计的特征,已经取得了令人印象深刻的性能。然而,这些方法依赖于在多个尺度上详尽地应用零件模板,这是非常昂贵的。此外,它们在类的数量上是可伸缩的,这对像ImageNet这样的现代数据集来说是一个挑战。 为了解决前一个问题,Lampert等人使用分支绑定策略来避免计算所有可能的对象位置。为了解决后一个问题,Song et al.使用了一个低维部件基,在所有对象类中共享。基于哈希算法的零件检测也取得了良好的结果。 另一种不同的工作,与我们的工作更接近,是基于对象可以本地化的想法,而不必知道它们的类。其中一些方法建立在自底向上无阶级分割[9]的基础上。通过这种方式得到的片段可以使用自上而下的反馈进行评分。基于同样的动机,Alexe等人使用一种廉价的分类器对对象假设是否为对象进行评分,并以这种方式减少了后续检测步骤的位置数量。这些方法可以被认为是多层模型,分割作为第一层,分割分类作为后续层。尽管它们编码了已证明的感知原理,但我们将表明,有更深入的模型,充分学习可以导致更好的结果。 最后,我们利用了DeepLearning的最新进展,最引人注目的是Krizhevsky等人的工作。我们将他们的边界盒回归检测方法扩展到以可扩展的方式处理多个对象的情况。然而,基于dnn的回归已经被Szegedy等人应用到对象掩模中。最后一种方法实现了最先进的检测性能,但由于单个掩模回归的成本,不能扩展到多个类。 我们的目标是通过预测一组表示潜在对象的边界盒来实现一种与类无关的可扩展对象检测。更准确地说,我们使用了深度神经网络(DNN),它输出固定数量的包围盒。此外,它为每个盒子输出一个分数,表示这个盒子包含一个对象的网络信任度。 为了形式化上述思想,我们将i-thobject框及其相关的置信度编码为最后一网层的节点值: Bounding box: 我们将每个框的左上角和右下角坐标编码为四个节点值,可以写成vectorli∈R4。这些坐标是归一化的w. r. t.图像尺寸,以实现图像绝对尺寸的不变性。每个归一化坐标是由最后一层的线性变换产生的。 Confidence: 置信度:包含一个对象的盒子的置信度得分被编码为单个节点valueci∈[0,1]。这个值是通过最后一个隐藏层的线性变换产生的,后面跟着一个sigmoid。 我们可以组合边界盒位置sli,i∈{1,…K}为一个线性层。同样,我们可以将所有置信区间ci,i∈{1,…K}作为一个s型层的输出。这两个输出层都连接到最后一个隐藏层 在推理时,我们的算法生成kbound盒。在我们的实验中,我们使用ek = 100和K= 200。如果需要,我们可以使用置信分数和非最大抑制在推理时获得较少数量的高置信框。这些盒子应该代表对象。因此,它们可以通过后续的分类器进行分类,实现目标检测。由于盒子的数量非常少,我们可以提供强大的分类器。在我们的实验中,我们使用另一个dnn进行分类。 我们训练一个DNN来预测每个训练图像的边界框及其置信度得分,以便得分最高的框与图像的groundtruth对象框很好地匹配。假设对于一个特定的训练例子,对象被标记为boundingboxesgj,j∈{1,…,M}。在实践中,pre- dictionary的数量远远大于groundtruthboxm的数量。因此,我们试图只优化与地面真实最匹配的预测框子集。我们优化他们的位置,以提高他们的匹配度,最大化他们的信心。与此同时,我们将剩余预测的置信度最小化,这被认为不能很好地定位真实对象。为了达到上述目的,我们为每个训练实例制定一个分配问题。Wexij∈{0,1}表示赋值:xij= 1,如果第i个预测被赋值给第j个真对象。这项任务的目标可以表示为 其中,我们使用标准化边界框坐标之间的el2距离来量化边界框之间的不同。此外,我们希望根据分配x优化盒子的可信度。最大化指定预测的置信度可以表示为 最终的损失目标结合了匹配损失和信心损失 受式1的约束。α平衡了不同损失条款的贡献。 对于每个训练例子,我们通过解决一个最佳的赋值x*的预测到真实的盒子 约束执行赋值解决方案。这是二部匹配的一种变体,是一种多项式复杂度匹配。在我们的应用程序中,匹配是非常便宜的——每幅图像中标记的对象的数量少于一打,而且在大多数情况下只有很少的对象被标记。然后,通过反向传播优化网络参数。例如,反向传播算法的一阶导数计算w、r、t、l和c 尽管上述定义的损失在原则上是足够的,但三次修改使其有可能更快地达到更好的准确性。第一个修改是对地面真实位置进行聚类,并找到这样的聚类/质心,我们可以使用这些聚类/质心作为每个预测位置的先验。因此,鼓励学习算法为每个预测位置学习一个残差到一个先验。 第二个修改涉及到在匹配过程中使用这些先验:不是将N个groundtruth位置与K个预测进行匹配,而是在K个先验和groundtruth之间找到最佳匹配。一旦匹配完成,就会像之前一样计算目标的置信度。此外,位置预测损失也不变:对于任何一对匹配的(目标,预测)位置,其损失定义为groundtruth和对应于匹配先验的坐标之间的差值。我们把使用先验匹配称为先验匹配,并假设它促进了预测的多样化。 需要注意的是,尽管我们以一种与类无关的方式定义了我们的方法,但我们可以将它应用于预测特定类的对象盒。要做到这一点,我们只需要在类的边框上训练我们的模型。此外,我们可以预测每个类的kbox。不幸的是,这个模型的参数数量会随着类的数量线性增长。此外,在一个典型的设置中,给定类的对象数量相对较少,这些参数中的大多数会看到很少有相应梯度贡献的训练示例。因此,我们认为我们的两步过程——首先本地化,然后识别——是一个更好的选择,因为它允许使用少量参数利用同一图像中多个对象类型的数据 我们使用的本地化和分类模型的网络架构与[10]使用的网络架构相同。我们使用Adagrad来控制学习速率衰减,128的小批量,以及使用多个相同的网络副本进行并行分布式训练,从而实现更快的收敛。如前所述,我们在定位损失中使用先验——这些是使用训练集上的均值来计算的。我们还使用α = 来平衡局部化和置信度损失。定位器可以输出用于推断的种植区以外的坐标。坐标被映射和截断到最后的图像区域。另外,使用非最大抑制对盒进行修剪,Jaccard相似度阈值为。然后,我们的第二个模型将每个边界框分类为感兴趣的对象或“背景”。为了训练我们的定位器网络,我们从训练集中生成了大约3000万幅图像,并对训练集中的每幅图像应用以下步骤。最后,样品被打乱。为了训练我们的本地化网络,我们通过对训练集中的每一幅图像应用以下步骤,从训练集中生成了大约3000万幅图像。对于每幅图像,我们生成相同数量的平方样本,使样本总数大约为1000万。对于每幅图像,样本被桶状填充,这样,对于0 - 5%、5 - 15%、15 - 50%、50 - 100%范围内的每个比例,都有相同数量的样本,其中被包围框覆盖的比例在给定范围内。训练集和我们大多数超参数的选择是基于过去使用非公开数据集的经验。在下面的实验中,我们没有探索任何非标准数据生成或正则化选项。在所有的实验中,所有的超参数都是通过对训练集。 Pascal Visual Object Classes (VOC)挑战是最常用的对象检测算法基准。它主要由复杂的场景图像组成,其中包含了20种不同的对象类别的边界框。在我们的评估中,我们关注的是2007版VOC,为此发布了一个测试集。我们通过培训VOC 2012展示了结果,其中包含了大约。11000张图片。我们训练了一个100框的定位器和一个基于深度网络的分类器。 我们在一个由1000万作物组成的数据集上训练分类器,该数据集重叠的对象至少为 jaccard重叠相似度。这些作物被标记为20个VOC对象类中的一个。•2000万负作物与任何物体盒最多有个Jaccard相似度。这些作物被贴上特殊的“背景”类标签。体系结构和超参数的选择遵循。 在第一轮中,定位器模型应用于图像中最大-最小中心方形作物。作物的大小调整到网络输入大小is220×220。单次通过这个网络,我们就可以得到上百个候选日期框。在对重叠阈值为的非最大抑制后,保留评分最高的前10个检测项,并通过21路分类器模型分别通过网络进行分类。最终的检测分数是给定盒子的定位分数乘以分类器在作物周围的最大方形区域上评估的分数的乘积。这些分数通过评估,并用于计算精确查全曲线。 首先,我们分析了本地化器在隔离状态下的性能。我们给出了被检测对象的数量,正如Pascal检测标准所定义的那样,与生成的包围框的数量相对比。在图1中,我们展示了使用VOC2012进行训练所获得的结果。此外,我们通过使用图像的最大中心面积(max-center square crop)作为输入以及使用两个尺度(second scale)来给出结果:最大中心面积(max-center crop)的第二个尺度(select3×3windows的大小为图像大小的60%)正如我们所看到的,当使用10个边界框的预算时,我们可以用第一个模型本地化的对象,用第二个模型本地化48%的对象。这显示出比其他报告的结果更好的性能,例如对象度算法达到42%[1]。此外,这个图表显示了在不同分辨率下观察图像的重要性。虽然我们的算法通过使用最大中心作物获得了大量的对象,但当使用更高分辨率的图像作物时,我们获得了额外的提升。进一步,我们用21-way分类器对生成的包围盒进行分类,如上所述。表1列出了VOC 2007的平均精度(APs)。达到的平均AP是,与先进水平相当。注意,我们的运行时间复杂度非常低——我们只使用top10框。示例检测和全精度召回曲线分别如图2和图3所示。值得注意的是,可视化检测是通过仅使用最大中心方形图像裁剪,即使用全图像获得的。然而,我们设法获得了相对较小的对象,例如第二行和第二列的船,以及第三行和第三列的羊。 在本工作中,我们提出了一种新的方法来定位图像中的对象,该方法可以预测多个边界框的时间。该方法使用深度卷积神经网络作为基本特征提取和学习模型。它制定了一个能够利用可变数量的groundtruth位置的多箱定位成本。在“一个类一个箱”方法的情况下,对1000个盒子进行非max-suppression,使用与给定图像中感兴趣的DeepMulti-Box方法相同的准则,并学习在未见图像中预测这些位置。 我们在VOC2007和ILSVRC-2012这两个具有挑战性的基准上给出了结果,在这两个基准上,所提出的方法具有竞争力。此外,该方法能够很好地预测后续分类器将探测到的位置。我们的结果表明,deepmultibox的方法是可扩展的,甚至可以在两个数据集之间泛化,就能够预测感兴趣的定位,甚至对于它没有训练的类别。此外,它能够捕获同一类物体的多种情况,这是旨在更好地理解图像的算法的一个重要特征。 在未来,我们希望能够将定位和识别路径折叠到一个单一的网络中,这样我们就能够在一个通过网络的一次性前馈中提取位置和类标签信息。即使在其当前状态下,双通道过程(本地化网络之后是分类网络)也会产生5-10个网络评估,每个评估的速度大约为1个CPU-sec(现代机器)。重要的是,这个数字并不与要识别的类的数量成线性关系,这使得所提出的方法与类似dpm的方法非常有竞争力。
有一个月没更博客了,捂脸 o( ̄= ̄)d
端午回家休息了几天,6月要加油~
回到正文,HOG是很经典的一种图像特征提取方法,尤其是在行人识别领域被应用的很多。虽然文章是2005年发表在CVPR上的,但近十年来还没有被淹没的文章真的是很值得阅读的研究成果了。
key idea: 局部物体的形状和外观可以通过局部梯度或者边缘的密度分布所表示。
主要步骤:
上图为论文中提供的图,个人觉得我在参考资料中列出的那篇 博客 中给出的图可能更好理解一些。
具体细节: 关于每一个过程的详细解释还是在 这篇博客 中已经写得很清楚了,这里就不再搬运了。
文章中数据集的图像大小均为:64*128, block大小为16x16, block stride为8x8,cell size为8x8,bins=9(直方图等级数);
获取到每张图的特征维度后,再用线性SVM训练分类器即可。
下图为作者而给出的示例图:
这两篇博客写的都很好,推荐阅读一波。
在谷歌学术搜索中,存有高达4亿篇论文的数据库。论文被引用的数据可以作为证明文章影响力的依据。即使这个方法有局限性,但在更大程度上,反映了当今社会的进展和科学的进步。
1《亚当:一种随机优化方法 》 Adam: A Method for Stochastic Optimization。文章发布于2015年,引用数为47774。
截止2020年为止,这篇文章达到了,人类可知的引用最高数。一篇涉及人工智能的文章获得最高引用,证实了科学界对人工智能的注重。不仅是科学界对人工智能领域有巨大的兴趣,而且欧美国家也正在把人工智能作为未来的主要发展对象。美国把对人工智能的投资提高了一倍,欧盟也把投资提高了百分之70。《亚当:一种随机优化方法 》能够获得最高引用,正说明在未来人工智能上,将展开激烈竞争。无独有偶,跟着这篇文章后面,引用最多的文章多是涉及人工智能。
2《图像识别的深度残差学习》 Deep Residual Learning for Image Recognition 文章发布于2016年,引用数为25256。
深度残差学习的概念出自何凯明等4名中国学生。何凯明来自清华大学物理系,现是脸书人工智能的科学家。从文章的引用数量来看,足以显示,他提出的这个方法对该行业的影响。
3《让R-CNN更快: 朝着带有区域建议网络 的实时目标检测》 Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks发表于2015,引用数为19507。
4《深度学习》 Deep Learning, 文章发布于2015年,引用数为16750。
5 《带着缠绕走得更深》 Going deeper with Convolutions, 文章发布于2015年,引用数为14424。
这篇文章已经成为计算机图像处理必读论文之一。
6《通过深层强化学习的人类层面的控制》 Human-Level control through deep reinforcement learning 文章发布于2015年,引用数为10394。
7 《语义分割的完全常规网络》 Fully Conventinal Networks for Semantic segmentation 文章发布于2015年,引用数为10153。
9 《 脓毒症与脓毒症休克第三版国际共识 》 The Third International Consensus Definitions for Sepsis and Septic Shock (Sepsis-3) 文章发布于2016年,引用数为8576。
10《RNA测序和微阵列研究中 Limma 强化差异表达分析》 Limma porwers defferential expression analyses for RNA-sequencing and microarray studies 文章发布于2015年,引用数为8328。
第9和第10篇是前十名论文中,和计算机没有关系的两篇医学论文。这是否意味着,未来对人类社会影响最大的,除了人工智能就是医学了呢?
最后要提到的这篇文章,虽然没有进入第10,但值得一提。 《以深度神经网络和树搜索掌握围棋战略》 Mastering the game of Go with deep neural networks and tree search发布于2016年,引用数为8209。
这篇文章涉及的是伦敦大学学院的教授David Silver, 他领导的AlphaGo团队击败了围棋九段棋手柯洁。人工智能击败了最强大脑,没有什么能比这更能说明人工智能的前途,同时也可能是一个细思极恐的大事件。在机器击败人的时代,人怎么办?
一、中国文论与比较诗学学术定位与研究特色:力求古今贯通,中西并举,发现传统学术中具有根本意义的问题,精确介绍和研究西方现代批评理论。站在中国学者的立场对西方文学理论做出独特的阐释,企望在对话中形成自身的理论特征。学术带头人与学术骨干:张云鹏,男,教授,博导,复旦大学文艺学专业博士,致力于中西比较诗学研究。主要著作《盛唐气象——中国美学思想与艺术审美规律》、《隋唐美学思想史论》等,翻译出版《图像时代》,参编《现代性读本》(上下册)等。屠友祥,男,教授 ,复旦大学中国文学批评史专业博士,以语言问题和批评理论为研究重点。著有《言境释四章》、《修辞的展开和意识形态的实现》,译《索绪尔第三次普通语言学教程》、尼采《古修辞学描述》、罗兰·巴特《S/Z》、《文之悦》。孙先科,男,教授, 博导,华东师范大学文艺学专业博士。专注于叙述学的研究,提出象征化和符指化拓宽典型化叙事规范的问题。出版《颂祷与自诉》、《叙述的意味》等专著。萧开愚,男,教授,著名诗人、评论家。参与创办并主编诗刊《九十年代》、《反对》,参编《中国诗歌评论》,出版诗集《肖开愚的诗》。被视为最早提出“中年写作”概念的人。张先飞,男,副教授,北京师范大学文学博士。其专著《形而上的困惑与追问》勾勒了现代中国小说的文体谱系,揭发史料的思想意义,对人道主义浸润现代中国的过程做精细的“考古”工作。二、西方文论与美学学术定位与研究特色:以从古到今的西方美学和文论为研究对象,在哲学史、文化史、艺术史的大语境中,对重点人物、思潮、流派展开学术性翻译和研究,形成若干优势研究区域,如解释学、后现代性、新媒介理论;并通过个案解剖的形式,分析西方文论、美学发展的状况与社会发展之间的互动关系,探求四方文化精神在全球化语境下对中国文论、美学发展可能带来的影响,并结合中国文化传统,创造出属于我们自己的当代理论形态。学术带头人与学术骨干:金惠敏,男,教授,中国社会科学院研究生院哲学博士。主要著作有《意志与超越》(国内第一部叔本华美学思想研究专著),《后现代性与辩证解释学》、《媒介的后果》,译《解释学 美学 实践哲学——迦达默尔与杜特对谈录》;主持3项国家社科基金项目《文学理论基本问题与后结构主义批判》、《比较诗学》“阐释与接受”卷、《西方美学史》第4卷,均属学术界和理论界之重大课题。主编《西方思想家研究丛书》获第12届“中国图书奖”。贺淯滨,男,教授,英国爱丁堡大学比较文学博士。著有Towards a Typology of Love Dramas: Chinese Plays and Their Foreign Counterparts在方法论、戏剧形态学概念、对东方戏剧的语义和修辞批评等方面,均有独到之处。英文译著The Palace of Eternal Youth (《长生殿》)和Classical Chinese Poems through the Ages (《中国古典诗歌选译》)在不少方面有别于西方汉学家的翻译规范和程式,很好地传达了原作的美感和韵味,展示了中国古典诗歌和诗剧的非凡魅力,并以充满创见的注解传达了中国诗学观念,具有独立的学术价值。张清民,男,教授,北京大学文艺学博士。以西方现代美学思想研究为出发点,以中国现代文学理论学科史研究为归宿,力图以新的理论质素激活旧对象的生命因子,寻绎文学理论发展的普遍规律,对文学理论应有的学科品位、发展方向进行科学检测和预设。其专著《艺术解释的向度》、《话语与秩序》及其主持的“比较诗学与中国现代文论发展研究”(河南省高等学校人文重点学科开放研究中心重点项目)与“中国现代文学理论学科形成机制研究”(河南省青年骨干教师资助计划项目)、“社会语境与文学理论形态生成”(国家社科基金项目)均围绕上述目的而展开。刘 恪 ,男 ,教授,当代著名先锋作家、评论家。已发表小说与理论专著五百多万字,出版理论著作有《欲望玫瑰》(合著)、《现代小说技巧讲堂》、《先锋小说技巧讲堂》、《耳镜》;出版长篇小说《寡妇船》、《蓝色雨季》、《城与市》、《梦与诗》,中短篇小说《红帆船》、《梦中情人》、《墙上鱼耳朵》等。刘恪以自身多年丰富的先锋写作经验以及对小说理论的高度自觉,在我国小说诗学的道路上进行了具有拓荒意义的探索。三、文学批评与文化研究学术定位与研究特色:以文学文本和文学现象为研究对象,将艺术分析与社会学、主题学、文化学批评结合起来,探寻研究对象中富有现代意义的社会、人生、文化蕴涵。研究特点体现在,一是把话语形式与叙事方式的研究与社会心理问题相联系,分析艺术构成的社会学内涵;二是探讨作家创作心理及文学作品的文化蕴含,以及创作心理与文化精神之间的互动关系,总结文学的演进规律;三是把文学批评置于当前文化语境中,发掘文学中对人类具有支撑和提升意义的人文精神以及终极价值。学术带头人与学术骨干:耿占春,男,教授,耿占春教授在诗学和叙事学两个研究领域都有独到的研究。其诗歌理论研究专著《隐喻》出版后连续印刷5次,在国内学界反响良好。近年又从社会学、文化学诸角度研究叙事文学作品的构成机制及文体演变规律。出版《中魔的镜子》、《叙事美学》、《改变世界与改变语言》等多种著作。2000年以来,在《文学评论》、《当代作家评论》、《小说评论》、《读书》等核心期刊发表论文40多篇,有多篇被《新华文摘》、中国人民大学复印报刊资料《文艺理论》、《中国现当代文学》等刊物转载,有关观点被博士、硕士学位论文征引。相关学者如美国宾西法尼亚大学比博教授、北京评论家白烨、学者余虹、上海张闳博士等对耿占春教授的批评研究给予了高度评价。何向阳,女,教授,何向阳教授为河南省跨世纪学术与技术带头人,在文学批评领域做出了突出的贡献。出版专著《自巴颜喀拉》、《12个:1998年的孩子》、《思远道》、《梦与马》、《夏娃备案》等。2000年以来,荣获“中国当代文学研究奖”、“鲁迅文学奖·全国优秀理论评论奖”、“冯牧文学奖·青年批评家奖”、“冰心文学奖”、“河南省文学奖”、“河南省图书奖”等多项省部级奖励,2004年入选“百千万人才工程国家级人选”,有多篇论文被《新华文摘》、《读书》、中国人民大学报刊复印资料选载摘编,社会效果卓著,中央电视台“东方时空”对她作过专题报道。胡山林,男,教授,胡山林教授长期从事文艺心理学教学与研究,在接受美学和欣赏心理学方面尤为专长。近五年来,胡山林教授在《当代作家评论》、《写作》等国家核心期刊发表学术论文近20篇,出版《文艺效果论》、《文学欣赏导引》、《心灵感悟:文学与人生》、《文学艺术与终极关怀》、《寻找灵魂的归宿》、《文学与人生》等学术论著多种,主持河南省社科规划项目《文艺效果论》,其专著《文学欣赏心理学》荣获2002年教育部优秀论著奖。高有鹏,男,教授,高有鹏教授专研民俗学和中国现代民间文学理论,文献的理论探求和田野调查的实证精神兼具,有《中国民间文学史》等专著;获首届及第二届中国民间文艺山花奖·学术著作奖两项,独立承担国家社科基金项目“中国现代作家的民间文学观问题”。河南大学文艺学学科伴随着百年学府的历史嬗变,孜孜以求,薪火相传,建构了凝重深厚的学术平台,一代代学人辛勤耕耘,使文艺学学科的研究形成了根柢扎实深厚,学风朴实严谨的鲜明特色。“嵩岳苍苍,河水泱泱”,河南大学文艺学学科将秉承悠远淳厚的中原文化传统,承继先贤学风,开拓新的领域,凝聚学术实力,使人文传统弘扬恢张。
设计在不断发展,学科建设亦是如此,设计心理学的内容和体系必然会随着社会生活的发展、与艺术设计实践的不断结合而发展变化。下面是我给大家推荐的设计心理学论文2000字,希望大家喜欢!
《设计心理学在现代书籍设计中的应用》
【摘 要】读者是书籍设计作用的对象,书籍设计若想取得成功,务必要掌握消费者的心理规律。书籍设计师只有在满足读者心理需求的前提下,再运用各种技术手段提升读者的注意力,并有效增进读者的“记忆”和“联想”,这样的书籍设计才是优秀的书籍设计作品。本文从关注、感知、记忆、想象等心理因素角度对现代书籍设计进行分析,目的是使设计师在设计书籍时结合消费者的心理特点和活动规律,从而有效把握书籍设计的创意思维。
【关键词】现代书籍设计 设计心理学 心理因素
【Abstract】 Readers are objects the role of book design, book design to be successful, it is important to master the psychological laws of readers. Under the book designer only meet the psychological needs of readers in the premise, and then use various techniques to enhance the reader's attention, and effectively enhance the reader's "memory" and "Legend", this is the best book design book design works. From the attention and attraction, memory, perception and understanding, imagination and other psychological factors on the perspective of modern book design analyzes is intended to enable designers do combine psychological characteristics and activity patterns of consumers of books designed to effectively seize books design of creative thinking.
【Keywords】modern Chinese book design design psychology psychological factors
在当代这样一个注重阅读的时代,书籍设计是必不可少的,它已经成为我们生活中的一部分,丰富着我们的生活。一个成功的书籍设计作品,不仅能达到促销目的,吸引更多的读者关注,甚至能在一个时期内倡导某种生活方式,给读者带来深远的影响。书籍设计作为书籍的一部分,其目的是促销书籍,要实现这个目的,就必须从读者的心理出发,遵循读者的心理活动规律,使人易于接受所推销的书籍,从而达到较好的书籍设计效果。随着时代的进步,读者对书籍设计提出了更高的要求,要求其具有构思新颖、视觉强烈、形式美观等效果,能给读者留下深刻印象。任何优秀的书籍设计作品都是建立在成功把握读者心理基础之上的,因此本文从心理学与现代书籍设计的关系,以及现代书籍设计中心理学的应用两个方面进行分析。
1 心理学与现代书籍设计的关系
从设计学的角度来看,设计的核心是“人”,那么,书籍设计作为设计的一个分支,更要注重运用艺术的手法处理好“人”与“物”与“环境”之间的紧密关系,使“人”能够与其使用的“物”和所处的“环境”形成和谐促进的关系,所以我们参照设计学的思想,在书籍设计中就要研究“人”与“物”与“环境”之间的关系。设计心理学主要研究人对“物”和“环境”的认知方式,是精神层面的,属于心理关系。因此,在书籍设计中必须全面的认识人的认知方式,同时考虑读者的心理感受,这样才能降低读者的感知疲劳,增强审美感受。现代书籍设计的基本目的就是通过协调“人”与“物”与“环境”之间的关系,使人能够舒适并且愉快的使用“物”,切身感受到“环境”,达到书籍设计中“书如人,人如书”的境界。
2 现代书籍设计中的心理学应用
和平面设计作品一样,一个书籍设计作品若有了好的创意就等于成功了一半,而这创意的来源就得建立在充分把握读者心理的基础之上。一个伟大的创意总是出其不意地单纯,触动人心,优秀的创意应当使读者产生引起关注、提起兴趣、引发行动、加深印象、触动心灵的心理作用。怎样才能达到这种功效和目的呢?就要从以下几方面着手。
关注
关注是心理活动对一定对象的指向和集中。把人的注意力吸引到你的书籍设计上,就等于你的书籍推销出去一半。可见,注意是书籍设计效果的第一步,因此,在书籍设计中,可以采用突出显示刺激物的特点,增强书籍设计新颖性及艺术性,选择恰当的图形元素等来提高书籍设计自身的吸引力,引起消费者的注关注。在千万本书籍中有了注意,读者随手翻来,再加书籍内容等因素,就会吸引读者驻足观看。
感知
感知是客观事物直接作用于感官而在头脑中产生的对事物整体的认识。毛泽东《实践论》中指出“感觉到了的东西,我们不能立刻理解它,只有理解了的东西才更深刻地感觉它。同样,书籍设计首先需要读者通过感官来接收书籍设计信息再作判断,此即对书籍设计进行感知。感知具有整体性、恒常性、意义性、选择性等规律,在书籍设计中应好好把握和运用这些规律,以期让书籍设计达到特有的效果。书籍设计中的感知有色彩的、结构的等,现以色彩感知为例,色彩本身并没有感情内容,当色彩呈现在人们面前时,总是能诱发人的心理活动。色彩通过人的视觉,而作用于大脑,从而产生了温度感、距离感、重感、体感。色彩的心理功能是色彩对人具有的调节和引导作用,不同的色彩对观者具有不同的心理感受,由此产生丰畜的联想和判断。比如儿童读物在用色上要体现出儿童的天真、活泼、可爱、单纯等特点;人文历史书籍在色彩的运用上要体现深度、高雅和稳重的特点;女性书刊,用色上要体现并强调温柔妩媚、轻松时尚、高贵典雅的特点等等。
记忆
记忆是过去经历的事情在人们头脑中的反映,它是一个复杂的心理过程。人们想起一本书,首先想到的是书籍封面的颜色和样式,其次会回味书中所阐述的内容。就书籍设计记忆而言,它是把纷繁复杂的不同的书籍设计区别开,记在大脑中。浩如烟海的书籍中读者一定程度的遗忘是不可避免的。但是,可以根据读者的记忆规律和记忆特点,在书籍设计上采取一定策略,将遗忘降低到最低程度,增强读者的书籍设计回忆,正如想起一本书,就先想到它的封面,书籍设计正是书籍最好的名片。
想象
想象是人在头脑里对已储存的表象进行加工改造形成新形象的心理过程。它能突破时间和空间的束缚。它又可分为再造想象和创造想象。对于购买书籍的读者来说,依据书籍设计作品的描述或图示在脑中构思的形象就是再造想象;对于书籍设计师来说,所构思的新形象即是创造想象。因此,好的书籍设计应当能激发读者的再造想象。所以在书籍设计创作中,激发读者的再造想象是广大书籍设计师至死不变的追求。
综上所述,现代书籍设计师在传达信息时应该从三个方面考虑:一是运用色彩的对比,醒目的标题、新颖的构图等,以强有力视觉的冲击力吸引读者的注意力。二是书籍设计所传达的重要信息务必是易于记忆和便于理解的。三是书籍设计要激发读者的发散式的想象、跨越式的联想和深刻的情感体验。这样才能设计出优秀的书籍设计作品。
3 结语
学科与学科之间的融合能大大促进技术的进步,正如现代书籍设计需要设计心理学的扶助,设计心理学是书籍设计的基础及技能。在书籍设计中首先应该考虑到读者的心理需求,来确定设计风格;其次,设计师灵活应用新的理念、新的形式、新的材料方面去引导、改变读者心理需求。无论如何,都需牢记“上兵伐谋,攻心为上”的原则。读者是书籍设计作用的对象,书籍设计若想取得成功,务必要掌握读者的心理规律。书籍设计师只有在满足读者心理需求的前提下,再运用各种技术手段提升读者的注意力,并有效增进读者的“记忆”和“联想”,这样的书籍设计才是优秀的书籍设计作品。
总而言之,现代书籍设计师在设计作品时并不仅仅是展示个人才华,而是应该结合读者的心理特点和活动规律,有效把握书籍设计的创意思维,从而使书籍设计达到既是展示个人才华的平台又是打动读者的交流平台,更好的为商家和读者服务。
参考文献:
[1] 童庆炳,程正民 主编.《文艺心理学教程》.高等教育出版社.
[2] 王受之著.《世界平面设计史》.中国青年出版社.
[3] 胡经之著.《文艺美学》.
[4]李江,周志.从“世界最美的书”说开去――访书籍设计师赵健[J].装饰(艺术设计月刊),2007(5):102-105.
[5]王宁.雷圭元的图案学理论和教育思想研究[D].苏州:苏州大学,2009:32-33.
[6]吕敬人.书艺问道[M].北京:中国青年出版社,2007:99,102,170-173.
[7]陈鹏.黑格尔美学笔记[M].北京:文化艺术出版社,2007.
作者简介:折文菁(1983-),女,甘肃成县人,讲师,硕士研究生,主要研究方向:设计艺术学。
点击下页还有更多>>>设计心理学论文2000字
各省课程规定不同,没有统一的课程设定,需要到当地自考办了解详情。
1、3708 03708 中国近代史纲要 公共课 2 月开考 2 、3709 03709 马克思主义基本原理概论 公共课 4 马克思主义政治经济学原理 月开考 *** 思想概论 政治经济学 3 、0015 00015 英语(二) 公共课 14 英语 4 、0037 00037 美学 专业课 6 5 、0537 00537 中国现代文学史 专业课 6 中国现当代文学史 6 、0538 00538 中国古代文学史(一) 专业课 7 鲁迅研究 7、 0539 00539 中国古代文学史(二) 专业课 7 中国古代文学史 8 、0540 00540 外国文学史 专业课 6 自然科学概论 自然科学基础(二) 9 、0541 00541 语言学概论 专业课 6 10、 0321 00321 中国文化概论 专业课 5 中国通史 11 、0530 00530 中国现代文学作品选 加考课 6 中国现当代文学作品选 12、 0532 00532 中国古代文学作品选(一) 加考课 6 13、 0536 00536 古代汉语 加考课 8 14 、0812 00812 中国现当代作家作品专题研究 加考课 4 中国小说史 15 、0816 00816 文艺心理学 加考课 5 沙士比亚研究 16 、0818 00818 文献学 加考课 5 训古学 17、 0004 00004 *** 思想概论 公共课 2 停考 18、 0005 00005 马克思主义政治经济学原理 公共课 3 停考 撰写毕业论文并答辩。 报考类别及说明: 1、汉语言文学专业专科毕业生可直接报考; 2、非汉语言文学专业专科毕业生报考本专业本科段,须加考中国现代文学作品选、中国古代文学作品选(一)、古代汉语; 3、35岁以上考生可申请免考英语(二),须加考中国现当代作家作品专题研究、文艺心理学、文献学等3门课程; 4、凡已通过0004 *** 思想概论和0005马克思主义政治经济学原理两门课程的,不再参加思想政治课的考试。
河北省自考统汉语言文学专业(本科)考试计划 考试科目(科目程式码)
参考书籍
*** 思想概论(0004)
马克思主义政治经济学原理(0005)
英语(二)(0015)
日语(二)(0016)
俄语(二)(0017)
语言学概论(0541)
中国现代文学史(0537)
中国古代文学史(一)(0538)
中国古代文学史(二)(0539)
美学(0037)
外国文学史(0540)
马克思主义文艺论著选读(8002)
训诂学(0819)
报刊编辑学(8003)
汉语修辞学(8004)
新闻采访学(8005)
中国古代文论选读(0814)
中学语文教材教法(8006)
中国文化概论(0321)
毕业论文及答辩(6999)
2012年10月份的还没出来,5月16日报名时才公布 你要是急的话可以检视2011年10月的考试安排,科目安排近几年都没有变化过的
好像很简单,我好多同学都是一次就过了,我还没有考在,正在准备看书,应该多看看书,做做试卷就没有什么问题了吧。我目前还没有买资料在,估计会买燕园的或者是自考通、一考通之类的。重要的还是自己多看看,背背。
公共英语三级笔试证就OK
你好 自考专业课程设定可以网上直接搜寻查询,也可以到省教育考试院自考下查询专业设定、报名报考、考试流程。
美学 文艺心理学 中国近现代史纲要 民间文学 马克思主义基本原理概论 中国古代文学史(一) 马列文论 英语(二) 中国现代文学史 现代修辞学
*** 思想概论,马克思主义政治经济学原理,美学,中国现代文学史,中国古代文学史,国外文学史,语言学概论,(英语,日语,俄语)选一,(中国古代文论选读,马列文论选读,鲁迅研究,唐宋词研究,诗经研究)选一。 一般差不多就这些课程,希望你采纳。
050114汉语言文学专业(基础科段) 课程设定 主考学校:河南大学 开考形式:面向社会 序号 课程程式码 课程名称 学分 备注
1 3706 思想道德修养与法律基础 2
2 3707 *** 思想、 *** 理论和‘三个代表’重要思想概论 4
3 0506 写作(一) 7
4 0529 文学概论(一) 7
5 0530 中国现代文学作品选 6
6 0531 中国当代文学作品选 5
7 0532 中国古代文学作品选(一) 6
8 0533 中国古代文学作品选(二) 6
9 0534 外国文学作品选 6
10 0535 现代汉语 7
11 0536 古代汉语 8
12 0024 普通逻辑 4 三选一
13 0031 心理学 4
14 0429 教育学(一) 4
1、最先大家先进到知网网址的主页,点击查看中国知网查重入口,进来以后大家会见到不一样的检验类型。2、我们要先明确好自己的论文类型,挑选相对应的检验类型入口,开展论文查重。3、依照知网论文检测毕业论文,根据系统软件的提醒进行提交检验。4、递交检验取得成功后,等候检验进行,随后在免费下载结果就好了。在检验全过程中,大家一定要依照毕业论文状况挑选恰当的我国知网论文查重检测系统版本号,依照我国知网论文查重检验流程递交检验,千万别出现错漏哦。
1、选择一个可靠的论文检测系统;2、在选定的论文检测网站上注册或直接登录账户,然后点击查重入口查重;3、输入论文的相关信息,点击上传论文;4、论文检测时间一般为10-30分钟;5、拿到论文检测报告后,根据测试报告中的内容对论文进行有针对性的修改,修改完成后再次进行检测和修改,步骤与上述内容一样。
论文撰写步骤:
一、论文的标题部分
标题就是题目或题名,标题需要以最恰当、最简明的词语反映论文中重要的特定内容逻辑组合,论文题目非常重要,必须用心斟酌选定。
二、论文的摘要
论文一般应有摘要,它是论文内容不加注释和评论的简短陈述。摘要应该包含以下内容:
1、从事这一研究的目的和重要性
2、研究的主要内容
3、完成了哪些工作
4、获得的基本结论和研究成果,突出论文的新见解
5、结构或结果的意义
三、论文关键词
关键词属于主题词中的一类,主题词除关键词外,还包含有单元词、标题词和叙词。关键词是标识文献的主题内容,单未经规范处理的主题词。
四、引言
又称为前言,属于正片论文的引论部分。写作内容包括:
1、研究的理由
2、研究目的
3、背景
4、前人的工作和知识空白
5、作用和意义
五、正文部分
论文的主题,占据论文大部分篇幅。论文所体现的创造性成果或新的研究结果,都将在这一部分得到充分的反映,要求这部分内容一定要充实,论据充分可靠,论证有利,主题明确。
六、参考文献
参考文献是文章在研究过程和论文撰写是所参考过的有关文献的目录,参考文献的完整标注是对原作者的尊重。不只在格式上有具体要求,在数量、种类、年份等方面又有相关要求。
多数学校会先进行论文答辩按照正常的论文审核顺序是你的论文先提交给自己的导师,导师通过审核之后你就可以等着答辩了。论文答辩查重并不是同时进行的,而是先答辩后进行查重。只有通过了答辩之后,你的论文才能够进入到学校的论文查重系统中,如果答辩没有通过论文是无法查重的。这只是多数学校的安排,所以我们还是要提前了解一下自己的学校是如何安排的才行,一般答辩之前学校都是会有相应通知的。部分学校先查重后答辩当然每一个学校的顺序都是不一样的,论文答辩查重也有可能会调整,也有很多学校事先进行论文查重。当导师确定了你的论文没有问题之后,就会要求你按照学校的标准来提交一个word文档,然后导师对你的论文进行查重。论文查重没有问题你才能进入到答辩环节,不过少数学校会这样做,多数学校还是会先进行答辩,这样比较容易操作,审核也会简单一些。顺序不同论文格式也不同因为论文答辩查重的顺序不同,论文的格式也会有很大的差异性。可能很多人都没有注意到这一点,因为你的论文如果事先查重,就要为了查重而牺牲很多语句,甚至是一些数据。导师一般也会宽松一些,知道大家都为了能降重会修改一些格式,不会特别较真。但是如果你的论文需要答辩,还是需要打印一式四份的,其他老师也要看你的论文。只是按照论文检测系统降重的标准来提交的,论文肯定就无法通过审核了,建议他家还是应该将论文分别保存成不同的类别,这样使用的时候直接打印就可以。
感觉论文查重对大多数毕业生来说是一场噩梦,有些学生花了很多钱去检测论文,但是论文检测结果也不如人意,其实论文查重并没有那么恐怖,只要我们态度端正,认真查阅参考资料,认真撰写论文,不投机取巧,并学会几个小技巧,论文就可以顺利通过。那么下面来教大家几种降低重复率的方法!一、分析论文检测软件不同论文查重软件的算法和检测机制有很大的不同。因此,在论文检测前,有必要了解每个论文检测软件的优缺点,以便根据学校要求以及个人实际情况来进行具体的选择。二、掌握修改技巧此步骤对于论文检测查重来说是非常重要的。目前来说,常见的方法是同义词替换和局部句型交换。Papertime不仅具有机器人降重功能,还支持在线改重和实时查重功能。方便又好用,节约了同学们大量的时间,让修改论文变得轻松简单!修改方法:1、修改关键词我们在写论文的时候,总会有一些词语和参考文献中的词语相同,如果不修改,就会导致重复率增加。比如专有名词,在这种情况下,可以选择将专有名词的中文名称和英文名称都写上去。或者,还可以解释一下这个专有名词所代表的含义,当然,我们不能为了降重而降重,还是需要保证论文的专业性。 2、转换说法中华文化博大精深,一句话有多种表达方式,在文字标红部分可以使用自己的语言表述时,我们可以选择将句子的语序颠倒,可以参考“四”变。复杂变简单,正话反说,主动变被动,简单变复杂。值得注意的是:为了避免出现原则上的错误,我们不能改变句子的本来的含义。3、短句变长句飘红的短句是很难改的。因此,我们需要尽可能丰富句子,用自己的话来复述,将短句变为长句,这不仅增加了论文字数,而且也降低了重复率。修改论文的关键还是耐心。毕竟在提交论文终稿的时候,需要在学校的检测系统中检测重复率,如果不通过,麻烦就大了。因此,细致、耐心地修改论文的每一个地方,顺利完成自己毕业论文!
据学术堂了解论文降重还是有很多小窍门的:1 数据、步骤部分查重多的尽量做成三线表。亲测好用。2 查重句子可用谷歌翻译先翻译成英文(或日或韩或泰)再将译文翻译成中文,就会变动很多顺序以及近义词,亲测好用。3 替换同义词。如:一般发病突然,改成通常突然发作,定期清洗换成经常性清洗,致病机制改为发病机理,清洁改为干净,等等。4 变换顺序,把字句改被字句。如:存在于所有细菌中,改成,在所有细菌中广泛存在。含有六个部分改为由六个部分组成。试管变蓝则为阳性,改为,阳性反应为试管颜色变蓝。等等。5 适当增删。如果实在不知道怎么改且不重要的句子可以直接删掉,增就是扩充句子了,如今天晴空万里,改成,今天风和日丽,晴朗湛蓝的高空万里无云。重要的一点,就是你学校用哪个网站查重,你就要用那个网站,至少得查一次,不然出现差距较大的那种情况,就不好了。还有喔,虽然大家都为了查重把好好的句子别扭着说,但千万不要太白话了,要记住这还是你的毕业论文,是你的成果,不要改的太浅显了~
不能颠倒顺序的原因一般是: 1.并列关系:与上文的词语或句子一一对应。 2.递进关系:逐层深入,层层递进 3.逻辑关系:某一段是另一段的前提。 4.结构关系:总——分 1.与文中某句话或某个词语相照应;2.几个段落之间的内在联系: 时间顺序:从古到今 逻辑顺序:从小到大、先概括后具体、层层深入
你是说写议论文的顺序吧,这个这个从论题——论点——论据——论证——这个不能调换吧,不信问你的语文老师,调换了如何写,那不成为四不像了