神经网络应用论文题目

论文:论文地址：论文题目:《Session-based Recommendation with Graph Neural Networks》SR-GNN github: 基于会话的推荐一般是将序列会话建模，将整个session进行编码，变成一个隐向量，然后利用这个隐向量进行下一个点击预测。但是这种方法没有考虑到item直接复杂的转换(transitions)关系，也就是item之间在点击的session中除了时间顺序外还有复杂的有向图内的节点指向关系，所以之前的方法不足以很好的对点击序列进行建模。现有基于会话的推荐，方法主要集中于循环神经网络和马尔可夫链，论文提出了现有方法的两个缺点： 1）当一个session中用户的行为数量十分有限时，这些方法难以获取准确的用户行为表示。如当使用RNN模型时，用户行为的表示即最后一个单元的输出，论文认为只有这样并非十分准确。 2）根据先前的工作发现，物品之间的转移模式在会话推荐中是十分重要的特征，但RNN和马尔可夫过程只对相邻的两个物品的单向转移关系进行建模，而忽略了会话中其他的物品。为了克服上述缺陷，本文提出了用图神经网络对方法对用户对session进行建模：下面具体介绍怎么进行图序列推荐 V = {v1,v2...vm}为全部的item，S = { }为一个session里面按时间顺序的点击物品，论文的目标是预测用户下一个要点击的物品vs,n+1，模型的任务是输出所有item的预测概率，并选择top-k进行推荐。我们为每一个Session构建一个子图，并获得它对应的出度和入度矩阵。假设一个点击序列是v1->v2->v4->v3，那么它得到的子图如下图中红色部分所示：另一个例子，一个点击序列是v1->v2->v3->v2->v4，那么它得到的子图如下：同时，我们会为每一个子图构建一个出度和入度矩阵，并对出度和入度矩阵的每一行进行归一化，如我们序列v1->v2->v3->v2->v4对应的矩阵如下：这个矩阵里面的值是怎么计算的呢？下面讲一下：看左边的出度矩阵，第一行为 0 1 0 0 ，代表着v1->v2，因为v1，只有一个指向的item，所以为1；看第二行，0 0 1/2 1/2，因为v2有指向v3和v4的边，所以进行归一化后每一个值都变成了1/2。入度矩阵的计算方法也是一样的，就不再说了。本文采用的是GRU单元进行序列建模，将图信息嵌入到神经网络中，让GRU充分学习到item之间的关系，传统的GRU只能学到相邻的两个物品之间的关系，加入图信息后就能学到整个session子图的信息。计算公式如下：为了刚好的理解这个计算过程，我们还是使用之前那个例子：v1->v2->v3->v2->v4来一步步分析输入到输出的过程。（1）是t时刻，会话s中第i个点击对应的输入，是n✖️2n的矩阵，也就是会话子图的完整矩阵，而是其中一行，即物品vi所对应的那行，大小为1✖️2n，n代表序列中不同物品的数量。如果按照例子来看，如果i取2，那么为 [0 0 1/2 1/2 1/2 0 1/2 0] 进一步的，可以把 :拆解为[ , ] （2）可以理解为序列中第i个物品，在训练过程中对应的嵌入向量，这个向量随着模型的训练不断变化，可以理解为隐藏层的状态，是一个d维向量。 (3) H是d*2d的权重向量，也可以看作是一个分块的矩阵，可以理解为H=[Hin|Hout]，每一块都是d*d的向量。那么我们来看看计算过程： 1）[ ..., ] ，结果是d * n的矩阵，转置之后是n*d的矩阵，计作 2） : H相当于[ ]，即拆开之后相乘再拼接，因此结果是一个1 * 2d的向量。上面就是完整的第i个点击的输入的计算过程，可以看到，在进入GRU计算之前，通过跟As,i矩阵相乘，把图信息嵌入到了神经网络中取，加深了神经网络学习到的item之间的交互信息。此外，就是GRU的计算过程了，跟原始的GRU不一样的地方在于输入从xt变成了嵌入了图信息的as,i。通样也有更新门和重置门，计算方法跟原始GRU一模一样。这里的其实就是相当于原始gru中的，只不过在SR-GNN里面，进行一轮运算的时候i是没有变化，相当于每个物品单独进去GRU进行计算，得到自己的向量，也就是说在GRU的计算过程中，是不断变化的，看一下源码更易于理解： hidden就是公式里面的 ,在gru的每一个step计算中都会进行更新，这里我有个疑问，如果所有item的hidden都更新的话，那么应该是整个序列中所有的item并行进入GRU中进行计算，每一个step都得到自己的vector，当每个item的vector更新后，下一个step就重新根据新的计算，接着计算下一个step。计算过程大概就是下面这样：这里有四个GRU并行计算，没次更新自己的hidden状态，输入则考虑所有的hidden和图信息。从上面的图看来，每一个item都要进行T个step得到自己的item-vec，所以经过T个step后，我们就得到了序列中所有item的向量，即：图中用蓝色框框画出来的向量，有了这些向量后，我们怎么得到预测结果呢？这就引入了下一个问题。观察上面的模型结构，我们看到attention，没错，我们认为一个session中的这些item-vec并不都对预测结果产生影响，有些item对结果影响很大，有些影响很小，所以我们进行了加权求和。同时，论文认为session对最后一个item-vec，s1=vn是重要的，所以单独拿出来：公式(6)就是简单的attention操作，其实从公式上来看就是计算每个vi跟最后一个向量vn的权值，然后进行加权求和。在最后的输出层，使用sh和每个物品的embedding进行内积计算，这里vi应该是item的embedding层出来的向量，而不是后面一直更新的hidden：最后通过一个softmax得到最终每个物品的点击概率：损失函数为交叉熵损失函数：从数据上来看，SR-GNN超过了经典的GRU4REC，这也说明了图信息的嵌入能带来更好的推荐效果。本论文很巧妙的将图信息嵌入的神经网络中，更高地让GRU学习到每个item之间的关系，不再局限于相邻的物品之间进行学习。近年来，图神经网络的思想和方法屡屡被用在推荐系统中，学好图神经网络应该是推荐系统的下一个热潮。

深度神经网络（DNNs）是 AI 领域的重要成果，但它的 “存在感” 已经不仅仅限于该领域。一些前沿生物医学研究，也正被这一特别的概念所吸引。特别是计算神经科学家。在以前所未有的任务性能彻底改变计算机视觉之后，相应的 DNNs 网络很快就被用以试着解释大脑信息处理的能力，并日益被用作灵长类动物大脑神经计算的建模框架。经过任务优化的深度神经网络，已经成为预测灵长类动物视觉皮层多个区域活动的最佳模型类型之一。用神经网络模拟大脑或者试图让神经网络更像大脑正成为主流方向的当下，有研究小组却选择用神经生物学的方法重新审视计算机学界发明的DNNs。而他们发现，诸如改变初始权重等情况就能改变网络的最终训练结果。这对使用单个网络来窥得生物神经信息处理机制的普遍做法提出了新的要求：如果没有将具有相同功能的深度神经网络具有的差异性纳入考虑的话，借助这类网络进行生物大脑运行机制建模将有可能出现一些随机的影响。要想尽量避免这种现象，从事 DNNs 研究的计算神经科学家，可能需要将他们的推论建立在多个网络实例组的基础上，即尝试去研究多个相同功能的神经网络的质心，以此克服随机影响。而对于 AI 领域的研究者，团队也希望这种表征一致性的概念能帮助机器学习研究人员了解在不同任务性能水平下运行的深度神经网络之间的差异。人工神经网络由被称为 “感知器”、相互连接的单元所建立，感知器则是生物神经元的简化数字模型。人工神经网络至少有两层感知器，一层用于输入层，另一层用于输出层。在输入和输出之间夹上一个或多个 “隐藏” 层，就得到了一个 “深层” 神经网络，这些层越多，网络越深。深度神经网络可以通过训练来识别数据中的特征，就比如代表猫或狗图像的特征。训练包括使用一种算法来迭代地调整感知器之间的连接强度（权重系数），以便网络学会将给定的输入（图像的像素）与正确的标签（猫或狗）相关联。理想状况是，一旦经过训练，深度神经网络应该能够对它以前没有见过的同类型输入进行分类。但在总体结构和功能上，深度神经网络还不能说是严格地模仿人类大脑，其中对神经元之间连接强度的调整反映了学习过程中的关联。一些神经科学家常常指出深度神经网络与人脑相比存在的局限性：单个神经元处理信息的范围可能比 “失效” 的感知器更广，例如，深度神经网络经常依赖感知器之间被称为反向传播的通信方式，而这种通信方式似乎并不存在于人脑神经系统。然而，计算神经科学家会持不同想法。有的时候，深度神经网络似乎是建模大脑的最佳选择。例如，现有的计算机视觉系统已经受到我们所知的灵长类视觉系统的影响，尤其是在负责识别人、位置和事物的路径上，借鉴了一种被称为腹侧视觉流的机制。对人类来说，腹侧神经通路从眼睛开始，然后进入丘脑的外侧膝状体，这是一种感觉信息的中继站。外侧膝状体连接到初级视觉皮层中称为 V1 的区域，在 V1 和 V4 的下游是区域 V2 和 V4，它们最终通向下颞叶皮层。非人类灵长类动物的大脑也有类似的结构（与之相应的背部视觉流是一条很大程度上独立的通道，用于处理看到运动和物体位置的信息）。这里所体现的神经科学见解是，视觉信息处理的分层、分阶段推进的：早期阶段先处理视野中的低级特征（如边缘、轮廓、颜色和形状），而复杂的表征，如整个对象和面孔，将在之后由颞叶皮层接管。如同人的大脑，每个 DNN 都有独特的连通性和表征特征，既然人的大脑会因为内部构造上的差异而导致有的人可能记忆力或者数学能力更强，那训练前初始设定不同的神经网络是否也会在训练过程中展现出性能上的不同呢？换句话说，功能相同，但起始条件不同的神经网络间究竟有没有差异呢？这个问题之所以关键，是因为它决定着科学家们应该在研究中怎样使用深度神经网络。在之前 Nature 通讯发布的一篇论文中，由英国剑桥大学 MRC 认知及脑科学研究组、美国哥伦比亚大学 Zuckerman Institute 和荷兰拉德堡大学的 Donders 脑科学及认知与行为学研究中心的科学家组成的一支科研团队，正试图回答这个问题。论文题目为《Individual differences among deep neural network models》。根据这篇论文，初始条件不同的深度神经网络，确实会随着训练进行而在表征上表现出越来越大的个体差异。此前的研究主要是采用线性典范相关性分析（CCA，linear canonical correlation analysis）和 centered-kernel alignment（CKA）来比较神经网络间的内部网络表征差异。这一次，该团队的研究采用的也是领域内常见的分析手法 —— 表征相似性分析（RSA，representational similarity analysis）。该分析法源于神经科学的多变量分析方法，常被用于将计算模型生产的数据与真实的大脑数据进行比较，在原理上基于通过用 “双（或‘对’）” 反馈差异表示系统的内部刺激表征（Inner stimulus representation）的表征差异矩阵（RDMs，representational dissimilarity matrices），而所有双反馈组所组成的几何则能被用于表示高维刺激空间的几何排布。两个系统如果在刺激表征上的特点相同（即表征差异矩阵的相似度高达一定数值），就被认为是拥有相似的系统表征。表征差异矩阵的相似度计算在有不同维度和来源的源空间（source spaces）中进行，以避开定义 “系统间的映射网络”。本研究的在这方面上的一个特色就是，使用神经科学研究中常用的网络实例比较分析方法对网络间的表征相似度进行比较，这使得研究结果可被直接用于神经科学研究常用的模型。最终，对比的结果显示，仅在起始随机种子上存在不同的神经网络间存在明显个体差异。该结果在采用不同网络架构，不同训练集和距离测量的情况下都成立。团队分析认为，这种差异的程度与 “用不同输入训练神经网络” 所产生的差异相当。如上图所示，研究团队通过计算对应 RDM 之间的所有成对距离，比较 all-CNN-C 在所有网络实例和层、上的表示几何。再通过 MDS 将 a 中的数据点（每个点对应一个层和实例）投影到二维。各个网络实例的层通过灰色线连接。虽然早期的代表性几何图形高度相似，但随着网络深度的增加，个体差异逐渐显现。在证明了深度神经网络存在的显著个体差异之后，团队继续探索了这些差异存在的解释。随后，研究者再通过在训练和测试阶段使用 Bernoulli dropout 方法调查了网络正则化（network regularization）对结果能造成的影响，但发现正则化虽然能在一定程度上提升 “采用不同起始随机种子的网络之表征” 的一致性，但并不能修正这些网络间的个体差异。最后，通过分析网络的训练轨迹与个体差异出现的过程并将这一过程可视化，团队在论文中表示，神经网络的性能与表征一致性间存在强负相关性，即网络间的个体差异会在训练过程中被加剧。总而言之，这项研究主要调查了多个神经网络在最少的实验干预条件下是否存在个体差异，即在训练开始前为网络设置不同权重的随机种子，但保持其他条件一致，并以此拓展了此前与 “神经网络间相关性” 有关的研究。除了这篇这篇研究以外，“深度学习三巨头” 之一、著名 AI 学者 Hinton 也有过与之相关的研究，论文名为《Similarity of Neural Network Representations Revisited》，文章探讨了测量深度神经网络表示相似性的问题，感兴趣的读者可以一并进行阅读。 Refrence： [1] [2]

计算机网络技术专业毕业论文题目

你是不是在为选计算机网络技术专业毕业论文题目烦恼呢?以下是我为大家整理的关于计算机网络技术专业毕业论文题目，希望大家喜欢!

1. 基于移动互联网下服装品牌的推广及应用研究

2. 基于Spark平台的恶意流量监测分析系统

3. 基于MOOC翻转课堂教学模式的设计与应用研究

4. 一种数字货币系统P2P消息传输机制的设计与实现

5. 基于OpenStack开放云管理平台研究

6. 基于OpenFlow的软件定义网络路由技术研究

7. 未来互联网试验平台若干关键技术研究

8. 基于云计算的海量网络流量数据分析处理及关键算法研究

9. 基于网络化数据分析的社会计算关键问题研究

10. 基于Hadoop的网络流量分析系统的研究与应用

11. 基于支持向量机的移动互联网用户行为偏好研究

12. “网络技术应用”微课程设计与建设

13. 移动互联网环境下用户隐私关注的影响因素及隐私信息扩散规律研究

14. 未来互联网络资源负载均衡研究

15. 面向云数据中心的虚拟机调度机制研究

16. 基于OpenFlow的数据中心网络路由策略研究

17. 云计算环境下资源需求预测与优化配置方法研究

18. 基于多维属性的社会网络信息传播模型研究

19. 基于遗传算法的云计算任务调度算法研究

20. 基于OpenStack开源云平台的网络模型研究

21. SDN控制架构及应用开发的研究和设计

22. 云环境下的资源调度算法研究

23. 异构网络环境下多径并行传输若干关键技术研究

24. OpenFlow网络中QoS管理系统的研究与实现

25. 云协助文件共享与发布系统优化策略研究

26. 大规模数据中心可扩展交换与网络拓扑结构研究

27. 数据中心网络节能路由研究

28. Hadoop集群监控系统的设计与实现

29. 网络虚拟化映射算法研究

30. 软件定义网络分布式控制平台的研究与实现

31. 网络虚拟化资源管理及虚拟网络应用研究

32. 基于流聚类的网络业务识别关键技术研究

33. 基于自适应流抽样测量的网络异常检测技术研究

34. 未来网络虚拟化资源管理机制研究

35. 大规模社会网络中影响最大化问题高效处理技术研究

36. 数据中心网络的流量管理和优化问题研究

37. 云计算环境下基于虚拟网络的资源分配技术研究

38. 基于用户行为分析的精确营销系统设计与实现

39. P2P网络中基于博弈算法的优化技术研究

40. 基于灰色神经网络模型的网络流量预测算法研究

41. 基于KNN算法的Android应用异常检测技术研究

42. 基于macvlan的Docker容器网络系统的设计与实现

43. 基于容器云平台的网络资源管理与配置系统设计与实现

44. 基于OpenStack的SDN仿真网络的研究

45. 一个基于云平台的智慧校园数据中心的设计与实现

46. 基于SDN的数据中心网络流量调度与负载均衡研究

47. 软件定义网络(SDN)网络管理关键技术研究

48. 基于SDN的数据中心网络动态负载均衡研究

49. 基于移动智能终端的医疗服务系统设计与实现

50. 基于SDN的网络流量控制模型设计与研究

51. 《计算机网络》课程移动学习网站的设计与开发

52. 数据挖掘技术在网络教学中的应用研究

53. 移动互联网即时通讯产品的用户体验要素研究

54. 基于SDN的负载均衡节能技术研究

55. 基于SDN和OpenFlow的流量分析系统的研究与设计

56. 基于SDN的网络资源虚拟化的研究与设计

57. SDN中面向北向的`控制器关键技术的研究

58. 基于SDN的网络流量工程研究

59. 基于博弈论的云计算资源调度方法研究

60. 基于Hadoop的分布式网络爬虫系统的研究与实现

61. 一种基于SDN的IP骨干网流量调度方案的研究与实现

62. 基于软件定义网络的WLAN中DDoS攻击检测和防护

63. 基于SDN的集群控制器负载均衡的研究

64. 基于大数据的网络用户行为分析

65. 基于机器学习的P2P网络流分类研究

66. 移动互联网用户生成内容动机分析与质量评价研究

67. 基于大数据的网络恶意流量分析系统的设计与实现

68. 面向SDN的流量调度技术研究

69. 基于P2P的小额借贷融资平台的设计与实现

70. 基于移动互联网的智慧校园应用研究

71. 内容中心网络建模与内容放置问题研究

72. 分布式移动性管理架构下的资源优化机制研究

73. 基于模糊综合评价的P2P网络流量优化方法研究

74. 面向新型互联网架构的移动性管理关键技术研究

75. 虚拟网络映射策略与算法研究

76. 互联网流量特征智能提取关键技术研究

77. 云环境下基于随机优化的动态资源调度研究

78. OpenFlow网络中虚拟化机制的研究与实现

79. 基于时间相关的网络流量建模与预测研究

80. B2C电子商务物流网络优化技术的研究与实现

81. 基于SDN的信息网络的设计与实现

82. 基于网络编码的数据通信技术研究

83. 计算机网络可靠性分析与设计

84. 基于OpenFlow的分布式网络中负载均衡路由的研究

85. 城市电子商务物流网络优化设计与系统实现

86. 基于分形的网络流量分析及异常检测技术研究

87. 网络虚拟化环境下的网络资源分配与故障诊断技术

88. 基于中国互联网的P2P-VoIP系统网络域若干关键技术研究

89. 网络流量模型化与拥塞控制研究

90. 计算机网络脆弱性评估方法研究

91. Hadoop云平台下调度算法的研究

92. 网络虚拟化环境下资源管理关键技术研究

93. 高性能网络虚拟化技术研究

94. 互联网流量识别技术研究

95. 虚拟网络映射机制与算法研究

96. 基于业务体验的无线资源管理策略研究

97. 移动互联网络安全认证及安全应用中若干关键技术研究

98. 基于DHT的分布式网络中负载均衡机制及其安全性的研究

99. 高速复杂网络环境下异常流量检测技术研究

100. 基于移动互联网技术的移动图书馆系统研建

101. 基于连接度量的社区发现研究

102. 面向可信计算的分布式故障检测系统研究

103. 社会化媒体内容关注度分析与建模方法研究

104. P2P资源共享系统中的资源定位研究

105. 基于Flash的三维WebGIS可视化研究

106. P2P应用中的用户行为与系统性能研究

107. 基于MongoDB的云监控设计与应用

108. 基于流量监测的网络用户行为分析

109. 移动社交网络平台的研究与实现

110. 基于 Android 系统的 Camera 模块设计和实现

111. 基于Android定制的Lephone系统设计与实现

112. 云计算环境下资源负载均衡调度算法研究

113. 集群负载均衡关键技术研究

114. 云环境下作业调度算法研究与实现

115. 移动互联网终端界面设计研究

116. 云计算中的网络拓扑设计和Hadoop平台研究

117. pc集群作业调度算法研究

118. 内容中心网络网内缓存策略研究

119. 内容中心网络的路由转发机制研究

120. 学习分析技术在网络课程学习中的应用实践研究

深度神经网络研究应用论文

YouTube推荐系统的三大难点：

· 一是规模太大，简单的推荐算法在如此大规模数据量上可能是失效的；

· 二是实效性，即新数据不断产生，需要将其良好的呈现给用户，以平衡旧有的好内容以及新内容；

· 三是噪音问题，用户行为与视频描述均有噪音，并且只能获得充满噪音的用户隐含反馈，而不能直接获取用户满意度。

图基于深度学习推荐系统架构图

本文呈现的推荐系统解决方案分为两个部分:

· 一个是备选生成（Candidate Generation），其目标是初选结果，从海量数据中选择出符合其个人需求偏好的百级别数据;

· 一个则是排序（Ranking），通过更加丰富的用户，视频乃至场景信息，对结果进行精细化排序，得到呈现给用户的备选。

备选生成阶段，将推荐系统定义为一个多分类器，其职责是确定某个用户，在某个场景与时间下，将从系统的视频中选择消费哪一个视频。具体的方法是，将用户与视频全部转化为Embedding描述，即一个向量，最终用户消费某个视频的概率通过如下方式计算得到：

而构建用户与视频的Embedding，则是通过训练而来。将用户观看视频/搜索记录/其它信息如年龄性别等作为输入特征，部分稀疏特征首先进行Embedding化，中间为数层ReLU，最终一层用SoftMax进行分类。换句话讲，是将用户与场景信息作为输入，预估用户下一个要看的视频，也就是将用户分到具体某一个视频作为其类别。用户与视频的Eembedding，则是神经网络最后一层的对应矩阵。这种方法除了能利用用户行为信息外，其它信息例如设备，地理位置，性别等也可以作为输入，这是神经网络相对于普通MF类算法的优势之一。

图推荐备选生成阶段架构

备选生成的下一个阶段是排序。其网络结构跟备选生成阶段类似，将所有排序模型中的信息输入后，进入多层ReLU，最终进行优化的是一个加权逻辑回归损失函数，观看时间作为阳性样本权重。在这一层，也可以看到其推荐“代理问题”的转化：由点击行为预估转为了以观看时长为权重的点击行为预估，这样更佳贴近Youtube的产品优化方向。与备选生成阶段另一个不同在于，排序模块需要考量的特征要多得多:

· “场景”类特征，例如用户可能在某个地方某个时间愿意观看某一条视频，但是在别的地方别的时间则不会；

· 曝光信息：用户观看了某界面，但是并未在其上进行操作，那么随之应进行已呈现内容降级；

· 备选生成层输出：排序需要将各种备选结果联合起来；

· 更丰富的用户信息：例如用户最近的一次搜索词，用户最近观看的同一个主题下的视频数量，用户上一次观看同主题视频的时间，用户所使用的语言等；

图推荐排序阶段架构

除了整体设计与系统架构以外，本篇论文中陈述了很多“选择”，这些选择更多的是“艺术”而不完全属于技术范畴。这些选择往往是很多技术人员关注不多的点，但在笔者看来，这些都蕴含着YouTube技术与产品人员深入的思考与判断。

“Example Age” 特征

对于YouTube产品层来讲，鼓励内容产生毫无疑问是至关重要的，所以推荐系统也希望对用户上传的新内容的有所偏好。然而幸运的是，即使损失一部分相关性，视频的消费者也偏好新内容。也就是说，新内容的价值可以良好的通过其带来的吸引力呈现出来，并不需要平台刻意而为之。

由于系统使用一个时间窗口的训练样本进行训练，如果没有视频的上传时间信息，那么模型会认为这个时间窗口内用户对视频的偏好是稳定的，然而事实远非如此。将视频的上传时间加入到特征集合后，预估更加准确，尤其是视频刚上传阶段的强烈便好被成功捕捉到。

图4.无时间特征预估/有时间特征预估/真实情况三者对比

优化目标选择

图5.优化对象的选择

算法系统的设计首先要明确优化对象，这不仅仅涉及到损失函数的形式，同样也是评判系统成功与否的标准。YouTube是视频平台，更是富含“价值”的长视频平台，其观看行为比点击行为意义更大。（当然，笔者认为没有任何一个简单指标可以完全代表一个产品）

“正样本”定义

图6.何为正样本的设计选择

训练数据来源

图7.关于训练数据来源的设计抉择

训练数据应该只来源于推荐界面的曝光吗？YouTube认为不然。如果只考虑推荐界面曝光，则无法对用户便好进行探索，更加无法捕捉用户偏好的变化，因为用户偏好的变化往往首先会对应着搜索与浏览行为。所以YouTube将各个界面例如搜索，导航等用户行为全部纳入其中。

训练数据窗口

图8. 训练数据收集方式的设计选择

Youtube将所有用户等而视之，每个用户收集一定量的样本。而不是惯常可见的直接收集一个时间窗口内的所有用户行为，作为训练样本。这样的好处是避免系统收到少数行为过多用户的影响，使得系统更多的为大众设计。这样的设计理念与近期阿里Gai Kun的论文中评测方法(用户AUC)设计有异曲同工之妙。

用户行为序列处理

图9.用户行为序列信息处理的设计选择

在系统中，用户往往会顺着一个检索结果页或者用户发布者浏览页进行顺序观看，如果系统捕捉到了用户看了检索界面的前三个结果，那么预估用户将看第四个结果就会很容易。但是这样真的好吗？将检索结果页面或者用户发布视频界面直接作为推荐结果呈现给用户是并不友好的--抢了别的界面应该干的活嘛。所以此处YouTube对用户行为序列做了处理，在模型输入中选择放弃用户行为的序列信息，将其打散成词袋Embedding，即使这样的信息有利于模型的离线训练效果。

预估对象的选择

图10.关于预估对象的设计选择

用户的行为往往是有顺序的，用户在系统中“热身”后，在一个频道下面，往往先看大众喜欢的热门，然后逐步找到自己的兴趣点，聚焦看一块内容。那么，训练数据则应该收集用户前段时间行为，预估此后的行为。而不是收集时间前后段的行为，预估中间时间段的用户行为。这样模型更加接近用户习惯。

除此之外，Youtube根据系统设计了对应的实验，结果非常简单：深度网络层数越高，效果越好。

YouTube的推荐系统，已经为其贡献了70%的用户播放时长，搜索与导航在PC时代的主导地位在移动时代已经完全被颠覆掉。希望大家在其中学到一些东西。笔者水平所限，若有错误不当之处，敬请指正。

另外，个人用TensorFlow模拟Youtube的推荐系统，做了一个简单实现。其实就是一个多分类器外加一个单分类器，远谈不上成熟，可以供大家参考。

——END——

卷积神经网络论文题目

基于Python的SIFT和KCF的运动目标匹配与跟踪毕业论文+项目源码基于Python决策树算法的学生学习行为数据分析设计报告+代码及数据基于Sring+bootstrap+MySQL的住房公积金管理系统课程报告+项目源码及数据库文件基于C++的即时通信软件设计毕业论文+项目源码

你的论文准备往什么方向写，选题老师审核通过了没，有没有列个大纲让老师看一下写作方向？老师有没有和你说论文往哪个方向写比较好？写论文之前，一定要写个大纲，这样老师，好确定了框架，避免以后论文修改过程中出现大改的情况！！学校的格式要求、写作规范要注意，否则很可能发回来重新改，你要还有什么不明白或不懂可以问我，希望你能够顺利毕业，迈向新的人生。（一）选题毕业论文（设计）题目应符合本专业的培养目标和教学要求，具有综合性和创新性。本科生要根据自己的实际情况和专业特长，选择适当的论文题目，但所写论文要与本专业所学课程有关。（二）查阅资料、列出论文提纲题目选定后，要在指导教师指导下开展调研和进行实验，搜集、查阅有关资料，进行加工、提炼，然后列出详细的写作提纲。（三）完成初稿根据所列提纲，按指导教师的意见认真完成初稿。（四）定稿初稿须经指导教师审阅，并按其意见和要求进行修改，然后定稿。一般毕业论文题目的选择最好不要太泛，越具体越好，而且老师希望学生能结合自己学过的知识对问题进行分析和解决。不知道你是否确定了选题，确定选题了接下来你需要根据选题去查阅前辈们的相关论文，看看人家是怎么规划论文整体框架的；其次就是需要自己动手收集资料了，进而整理和分析资料得出自己的论文框架；最后就是按照框架去组织论文了。你如果需要什么参考资料和范文我可以提供给你。还有什么不了解的可以直接问我，希望可以帮到你，祝写作过程顺利毕业论文选题的方法: 一、尽快确定毕业论文的选题方向在毕业论文工作布置后,每个人都应遵循选题的基本原则,在较短的时间内把选题的方向确定下来。从毕业论文题目的性质来看,基本上可以分为两大类:一类是社会主义现代化建设实践中提出的理论和实际问题;另一类是专业学科本身发展中存在的基本范畴和基本理论问题。大学生应根据自己的志趣和爱好,尽快从上述两大类中确定一个方向。二、在初步调查研究的基础上选定毕业论文的具体题目在选题的方向确定以后,还要经过一定的调查和研究,来进一步确定选题的范围,以至最后选定具体题目。下面介绍两种常见的选题方法。浏览捕捉法 :这种方法就是通过对占有的文献资料快速地、大量地阅读,在比较中来确定论文题目地方法。浏览,一般是在资料占有达到一定数量时集中一段时间进行,这样便于对资料作集中的比较和鉴别。浏览的目的是在咀嚼消化已有资料的过程中,提出问题,寻找自己的研究课题。这就需要对收集到的材料作一全面的阅读研究,主要的、次要的、不同角度的、不同观点的都应了解,不能看了一些资料,有了一点看法,就到此为止,急于动笔。也不能“先入为主”,以自己头脑中原有的观点或看了第一篇资料后得到的看法去决定取舍。而应冷静地、客观地对所有资料作认真的分析思考。在浩如烟海,内容丰富的资料中吸取营养,反复思考琢磨许多时候之后,必然会有所发现,这是搞科学研究的人时常会碰到的情形。浏览捕捉法一般可按以下步骤进行: 第一步,广泛地浏览资料。在浏览中要注意勤作笔录,随时记下资料的纲目,记下资料中对自己影响最深刻的观点、论据、论证方法等,记下脑海中涌现的点滴体会。当然,手抄笔录并不等于有言必录,有文必录,而是要做细心的选择,有目的、有重点地摘录,当详则详,当略则略,一些相同的或类似的观点和材料则不必重复摘录,只需记下资料来源及页码就行,以避免浪费时间和精力。第二步,是将阅读所得到的方方面面的内容,进行分类、排列、组合,从中寻找问题、发现问题,材料可按纲目分类,如分成: 系统介绍有关问题研究发展概况的资料; 对某一个问题研究情况的资料; 对同一问题几种不同观点的资料; 对某一问题研究最新的资料和成果等等。第三步,将自己在研究中的体会与资料分别加以比较,找出哪些体会在资料中没有或部分没有;哪些体会虽然资料已有,但自己对此有不同看法;哪些体会和资料是基本一致的;哪些体会是在资料基础上的深化和发挥等等。经过几番深思熟虑的思考过程,就容易萌生自己的想法。把这种想法及时捕捉住,再作进一步的思考,选题的目标也就会渐渐明确起来。

计算机毕业设计基于Python的SIFT和KCF的运动目标匹配与跟踪毕业论文+项目源码基于Python决策树算法的学生学习行为数据分析设计报告+代码及数据基于Sring+bootstrap+MySQL的住房公积金管理系统课程报告+项目源码及数据库文件基于C++的即时通信软件设计毕业论文+项目源码基于JavaWeb+MySQL的图书管理系统课程报告+项目源码及数据库文件基于Android Studio+Android SDK的手机通讯录管理软件设计课程报告+项目源码基于JSP+MySQL的校园网上订餐系统毕业论文+项目源码及数据库文件基于AndroidStudio的花艺分享平台APP设计报告+源码及APK文件基于Python的酒店评论情感分析课程报告+答辩PPT+项目源码基于QT的教务选课管理系统设计与实现毕业论文+项目源码基于Android+Springboot+Mybatis+Mysql的个人生活APP设计说明书+项目源码基于的Web3D宇宙空间数据可视化系统设计报告+前后端源码及数据基于java+android+SQLite的保健型果饮在线销售APP设计毕业论文+源码数据库及APK文件基于的高校综合资源发布分享社交二手平台毕业论文+项目源码及数据库文件+演示视频基于Delphi+MySQL的大学生竞赛发布及组队系统设计报告+源码数据库及可执行文件+使用说明书基于Android的名片信息管理系统设计与实现毕业论文+任务书+外文翻译及原文+演示视频+项目源码基于Python的电影数据可视化分析系统设计报告+答辩PPT+项目源码基于JavaWeb的企业公司管理系统设计与实现毕业论文+答辩PPT+演示视频+项目源码高校成绩管理数据库系统的设计与实现毕业论文+项目源码基于JavaWeb的家庭食谱管理系统设计与实现毕业论文+项目源码及数据库文件基于Python+SQLSERVER的快递业务管理系统的设计与实现毕业论文+项目源码及数据库文件基于Python的语音词频提取云平台设计报告+设计源码在推荐系统中引入 Serendipity 的算法研究毕业论文+参考文献+项目源码基于Html+Python+Django+Sqlite的机票预订系统毕业论文+项目源码及数据库文件基于Python的卷积神经网络的猫狗图像识别系统课程报告+项目源码基于C++的云安全主动防御系统客户端服务端设计毕业论文+项目源码基于JavaSSM的学生成绩管理APP系统设计与实现毕业论文+答辩PPT+前后台源码及APK文件基于JavaSwing+MySQL的清朝古代名人数据管理系统设计毕业论文+任务书+项目源码及数据库文件基于Python_Django的社会实践活动管理系统设计与实现毕业论文基于Servlet WebSocket MySQL实现的网络在线考试系统毕业论文+项目源码基于JavaWEB+MySQL的学生成绩综合管理系统毕业论文+项目源码及数据库文件基于SpringBoot+Vue和MySQL+Redis的网络课程平台设计与实现毕业论文+任务书+开题报告+中期报告+初稿+前后台项目源码基于Java的毕业设计题目收集系统课程报告+项目源码基于Java+Python+html的生产者与消费者算法模拟毕业论文+任务书+项目源码基于JavaWeb+MySQL的学院党费缴费系统毕业论文+项目源码及数据库文件基于Java+MySQL的学生成绩管理系统毕业论文+任务书+答辩PPT+项目源码及数据库文件基于Java+MySQL的学生和客户信息管理系统课程报告+项目源码及数据库文件基于Java的长整数加减法算法设计毕业论文+项目源码基于vue+MySQL的毕业设计网上选题系统毕业论文+项目源码基于背景建模和FasterR-CNN的视频前景和目标检测毕业论文+答辩PPT+项目源码基于Python的智能视频分析之人数统计的多种实现毕业论文+答辩PPT+项目源码基于C#+SQL server的校园卡消费信息管理系统毕业论文+项目源码及数据库文件

原文： Scalable Object Detection using Deep Neural Networks——学术范最近，深度卷积神经网络在许多图像识别基准上取得了最先进的性能，包括ImageNet大规模视觉识别挑战(ILSVRC-2012)。在定位子任务中获胜的模型是一个网络，它预测了图像中每个对象类别的单个边界框和置信度得分。这样的模型捕获了围绕对象的整幅图像上下文，但如果不天真地复制每个实例的输出数量，就无法处理图像中同一对象的多个实例。在这篇论文中提出了一个显著性启发的神经网络检测模型，它预测了一组与类无关的边界框，每个框有一个分数，对应于它包含任何感兴趣的对象的可能性。该模型自然地为每个类处理数量可变的实例，并允许在网络的最高级别上进行跨类泛化。目标检测是计算机视觉的基本任务之一。一个解决这个问题的通用范例是训练在子图像上操作的对象检测器，并在所有的场所和尺度上以详尽的方式应用这些检测器。这一范例被成功地应用于经过区别训练的可变形零件模型(DPM)中，以实现检测任务的最新结果。对所有可能位置和尺度的穷举搜索带来了计算上的挑战。随着类数量的增加，这个挑战变得更加困难，因为大多数方法都训练每个类单独的检测器。为了解决这个问题，人们提出了多种方法，从检测器级联到使用分割提出少量的对象假设。关于对象检测的文献非常多，在本节中，我们将重点讨论利用类不可知思想和解决可伸缩性的方法。许多提出的检测方法都是基于基于部件的模型，最近由于有区别学习和精心设计的特征，已经取得了令人印象深刻的性能。然而,这些方法依赖于在多个尺度上详尽地应用零件模板，这是非常昂贵的。此外，它们在类的数量上是可伸缩的，这对像ImageNet这样的现代数据集来说是一个挑战。为了解决前一个问题，Lampert等人使用分支绑定策略来避免计算所有可能的对象位置。为了解决后一个问题，Song et al.使用了一个低维部件基，在所有对象类中共享。基于哈希算法的零件检测也取得了良好的结果。另一种不同的工作，与我们的工作更接近，是基于对象可以本地化的想法，而不必知道它们的类。其中一些方法建立在自底向上无阶级分割[9]的基础上。通过这种方式得到的片段可以使用自上而下的反馈进行评分。基于同样的动机，Alexe等人使用一种廉价的分类器对对象假设是否为对象进行评分，并以这种方式减少了后续检测步骤的位置数量。这些方法可以被认为是多层模型，分割作为第一层，分割分类作为后续层。尽管它们编码了已证明的感知原理，但我们将表明，有更深入的模型，充分学习可以导致更好的结果。最后，我们利用了DeepLearning的最新进展，最引人注目的是Krizhevsky等人的工作。我们将他们的边界盒回归检测方法扩展到以可扩展的方式处理多个对象的情况。然而，基于dnn的回归已经被Szegedy等人应用到对象掩模中。最后一种方法实现了最先进的检测性能，但由于单个掩模回归的成本，不能扩展到多个类。我们的目标是通过预测一组表示潜在对象的边界盒来实现一种与类无关的可扩展对象检测。更准确地说，我们使用了深度神经网络(DNN)，它输出固定数量的包围盒。此外，它为每个盒子输出一个分数，表示这个盒子包含一个对象的网络信任度。为了形式化上述思想，我们将i-thobject框及其相关的置信度编码为最后一网层的节点值: Bounding box: 我们将每个框的左上角和右下角坐标编码为四个节点值，可以写成vectorli∈R4。这些坐标是归一化的w. r. t.图像尺寸，以实现图像绝对尺寸的不变性。每个归一化坐标是由最后一层的线性变换产生的。 Confidence: 置信度:包含一个对象的盒子的置信度得分被编码为单个节点valueci∈[0,1]。这个值是通过最后一个隐藏层的线性变换产生的，后面跟着一个sigmoid。我们可以组合边界盒位置sli,i∈{1，…K}为一个线性层。同样，我们可以将所有置信区间ci,i∈{1，…K}作为一个s型层的输出。这两个输出层都连接到最后一个隐藏层在推理时，我们的算法生成kbound盒。在我们的实验中，我们使用ek = 100和K= 200。如果需要，我们可以使用置信分数和非最大抑制在推理时获得较少数量的高置信框。这些盒子应该代表对象。因此，它们可以通过后续的分类器进行分类，实现目标检测。由于盒子的数量非常少，我们可以提供强大的分类器。在我们的实验中，我们使用另一个dnn进行分类。我们训练一个DNN来预测每个训练图像的边界框及其置信度得分，以便得分最高的框与图像的groundtruth对象框很好地匹配。假设对于一个特定的训练例子，对象被标记为boundingboxesgj,j∈{1，…，M}。在实践中，pre- dictionary的数量远远大于groundtruthboxm的数量。因此，我们试图只优化与地面真实最匹配的预测框子集。我们优化他们的位置，以提高他们的匹配度，最大化他们的信心。与此同时，我们将剩余预测的置信度最小化，这被认为不能很好地定位真实对象。为了达到上述目的，我们为每个训练实例制定一个分配问题。Wexij∈{0,1}表示赋值:xij= 1，如果第i个预测被赋值给第j个真对象。这项任务的目标可以表示为其中，我们使用标准化边界框坐标之间的el2距离来量化边界框之间的不同。此外，我们希望根据分配x优化盒子的可信度。最大化指定预测的置信度可以表示为最终的损失目标结合了匹配损失和信心损失受式1的约束。α平衡了不同损失条款的贡献。对于每个训练例子，我们通过解决一个最佳的赋值x*的预测到真实的盒子约束执行赋值解决方案。这是二部匹配的一种变体，是一种多项式复杂度匹配。在我们的应用程序中，匹配是非常便宜的——每幅图像中标记的对象的数量少于一打，而且在大多数情况下只有很少的对象被标记。然后，通过反向传播优化网络参数。例如，反向传播算法的一阶导数计算w、r、t、l和c 尽管上述定义的损失在原则上是足够的，但三次修改使其有可能更快地达到更好的准确性。第一个修改是对地面真实位置进行聚类，并找到这样的聚类/质心，我们可以使用这些聚类/质心作为每个预测位置的先验。因此，鼓励学习算法为每个预测位置学习一个残差到一个先验。第二个修改涉及到在匹配过程中使用这些先验:不是将N个groundtruth位置与K个预测进行匹配，而是在K个先验和groundtruth之间找到最佳匹配。一旦匹配完成，就会像之前一样计算目标的置信度。此外，位置预测损失也不变:对于任何一对匹配的(目标，预测)位置，其损失定义为groundtruth和对应于匹配先验的坐标之间的差值。我们把使用先验匹配称为先验匹配，并假设它促进了预测的多样化。需要注意的是，尽管我们以一种与类无关的方式定义了我们的方法，但我们可以将它应用于预测特定类的对象盒。要做到这一点，我们只需要在类的边框上训练我们的模型。此外，我们可以预测每个类的kbox。不幸的是，这个模型的参数数量会随着类的数量线性增长。此外，在一个典型的设置中，给定类的对象数量相对较少，这些参数中的大多数会看到很少有相应梯度贡献的训练示例。因此，我们认为我们的两步过程——首先本地化，然后识别——是一个更好的选择，因为它允许使用少量参数利用同一图像中多个对象类型的数据我们使用的本地化和分类模型的网络架构与[10]使用的网络架构相同。我们使用Adagrad来控制学习速率衰减，128的小批量，以及使用多个相同的网络副本进行并行分布式训练，从而实现更快的收敛。如前所述，我们在定位损失中使用先验——这些是使用训练集上的均值来计算的。我们还使用α = 来平衡局部化和置信度损失。定位器可以输出用于推断的种植区以外的坐标。坐标被映射和截断到最后的图像区域。另外，使用非最大抑制对盒进行修剪，Jaccard相似度阈值为。然后，我们的第二个模型将每个边界框分类为感兴趣的对象或“背景”。为了训练我们的定位器网络，我们从训练集中生成了大约3000万幅图像，并对训练集中的每幅图像应用以下步骤。最后，样品被打乱。为了训练我们的本地化网络，我们通过对训练集中的每一幅图像应用以下步骤，从训练集中生成了大约3000万幅图像。对于每幅图像，我们生成相同数量的平方样本，使样本总数大约为1000万。对于每幅图像，样本被桶状填充，这样，对于0 - 5%、5 - 15%、15 - 50%、50 - 100%范围内的每个比例，都有相同数量的样本，其中被包围框覆盖的比例在给定范围内。训练集和我们大多数超参数的选择是基于过去使用非公开数据集的经验。在下面的实验中，我们没有探索任何非标准数据生成或正则化选项。在所有的实验中，所有的超参数都是通过对训练集。 Pascal Visual Object Classes (VOC)挑战是最常用的对象检测算法基准。它主要由复杂的场景图像组成，其中包含了20种不同的对象类别的边界框。在我们的评估中，我们关注的是2007版VOC，为此发布了一个测试集。我们通过培训VOC 2012展示了结果，其中包含了大约。11000张图片。我们训练了一个100框的定位器和一个基于深度网络的分类器。我们在一个由1000万作物组成的数据集上训练分类器，该数据集重叠的对象至少为 jaccard重叠相似度。这些作物被标记为20个VOC对象类中的一个。•2000万负作物与任何物体盒最多有个Jaccard相似度。这些作物被贴上特殊的“背景”类标签。体系结构和超参数的选择遵循。在第一轮中，定位器模型应用于图像中最大-最小中心方形作物。作物的大小调整到网络输入大小is220×220。单次通过这个网络，我们就可以得到上百个候选日期框。在对重叠阈值为的非最大抑制后，保留评分最高的前10个检测项，并通过21路分类器模型分别通过网络进行分类。最终的检测分数是给定盒子的定位分数乘以分类器在作物周围的最大方形区域上评估的分数的乘积。这些分数通过评估，并用于计算精确查全曲线。首先，我们分析了本地化器在隔离状态下的性能。我们给出了被检测对象的数量，正如Pascal检测标准所定义的那样，与生成的包围框的数量相对比。在图1中，我们展示了使用VOC2012进行训练所获得的结果。此外，我们通过使用图像的最大中心面积(max-center square crop)作为输入以及使用两个尺度(second scale)来给出结果:最大中心面积(max-center crop)的第二个尺度(select3×3windows的大小为图像大小的60%)正如我们所看到的，当使用10个边界框的预算时，我们可以用第一个模型本地化的对象，用第二个模型本地化48%的对象。这显示出比其他报告的结果更好的性能，例如对象度算法达到42%[1]。此外，这个图表显示了在不同分辨率下观察图像的重要性。虽然我们的算法通过使用最大中心作物获得了大量的对象，但当使用更高分辨率的图像作物时，我们获得了额外的提升。进一步，我们用21-way分类器对生成的包围盒进行分类，如上所述。表1列出了VOC 2007的平均精度(APs)。达到的平均AP是，与先进水平相当。注意，我们的运行时间复杂度非常低——我们只使用top10框。示例检测和全精度召回曲线分别如图2和图3所示。值得注意的是，可视化检测是通过仅使用最大中心方形图像裁剪，即使用全图像获得的。然而，我们设法获得了相对较小的对象，例如第二行和第二列的船，以及第三行和第三列的羊。在本工作中，我们提出了一种新的方法来定位图像中的对象，该方法可以预测多个边界框的时间。该方法使用深度卷积神经网络作为基本特征提取和学习模型。它制定了一个能够利用可变数量的groundtruth位置的多箱定位成本。在“一个类一个箱”方法的情况下，对1000个盒子进行非max-suppression，使用与给定图像中感兴趣的DeepMulti-Box方法相同的准则，并学习在未见图像中预测这些位置。我们在VOC2007和ILSVRC-2012这两个具有挑战性的基准上给出了结果，在这两个基准上，所提出的方法具有竞争力。此外，该方法能够很好地预测后续分类器将探测到的位置。我们的结果表明，deepmultibox的方法是可扩展的，甚至可以在两个数据集之间泛化，就能够预测感兴趣的定位，甚至对于它没有训练的类别。此外，它能够捕获同一类物体的多种情况，这是旨在更好地理解图像的算法的一个重要特征。在未来，我们希望能够将定位和识别路径折叠到一个单一的网络中，这样我们就能够在一个通过网络的一次性前馈中提取位置和类标签信息。即使在其当前状态下，双通道过程(本地化网络之后是分类网络)也会产生5-10个网络评估，每个评估的速度大约为1个CPU-sec(现代机器)。重要的是，这个数字并不与要识别的类的数量成线性关系，这使得所提出的方法与类似dpm的方法非常有竞争力。

自适应神经网络毕业论文

神经网络的是我的毕业论文的一部分4．人工神经网络人的思维有逻辑性和直观性两种不同的基本方式。逻辑性的思维是指根据逻辑规则进行推理的过程；它先将信息化成概念，并用符号表示，然后，根据符号运算按串行模式进行逻辑推理。这一过程可以写成串行的指令，让计算机执行。然而，直观性的思维是将分布式存储的信息综合起来，结果是忽然间产生想法或解决问题的办法。这种思维方式的根本之点在于以下两点:1.信息是通过神经元上的兴奋模式分布在网络上;2.信息处理是通过神经元之间同时相互作用的动态过程来完成的。人工神经网络就是模拟人思维的第二种方式。这是一个非线性动力学系统，其特色在于信息的分布式存储和并行协同处理。虽然单个神经元的结构极其简单，功能有限，但大量神经元构成的网络系统所能实现的行为却是极其丰富多彩的。人工神经网络学习的原理人工神经网络首先要以一定的学习准则进行学习，然后才能工作。现以人工神经网络对手写“A”、“B”两个字母的识别为例进行说明，规定当“A”输入网络时，应该输出“1”，而当输入为“B”时，输出为“0”。所以网络学习的准则应该是：如果网络做出错误的判决，则通过网络的学习，应使得网络减少下次犯同样错误的可能性。首先，给网络的各连接权值赋予(0，1)区间内的随机值，将“A”所对应的图像模式输入给网络，网络将输入模式加权求和、与门限比较、再进行非线性运算，得到网络的输出。在此情况下，网络输出为“1”和“0”的概率各为50%，也就是说是完全随机的。这时如果输出为“1”(结果正确)，则使连接权值增大，以便使网络再次遇到“A”模式输入时，仍然能做出正确的判断。如果输出为“0”(即结果错误)，则把网络连接权值朝着减小综合输入加权值的方向调整，其目的在于使网络下次再遇到“A”模式输入时，减小犯同样错误的可能性。如此操作调整，当给网络轮番输入若干个手写字母“A”、“B”后，经过网络按以上学习方法进行若干次学习后，网络判断的正确率将大大提高。这说明网络对这两个模式的学习已经获得了成功，它已将这两个模式分布地记忆在网络的各个连接权值上。当网络再次遇到其中任何一个模式时，能够做出迅速、准确的判断和识别。一般说来，网络中所含的神经元个数越多，则它能记忆、识别的模式也就越多。人工神经网络的优缺点人工神经网络由于模拟了大脑神经元的组织方式而具有了人脑功能的一些基本特征，为人工智能的研究开辟了新的途径，神经网络具有的优点在于:（1）并行分布性处理因为人工神经网络中的神经元排列并不是杂乱无章的，往往是分层或以一种有规律的序列排列，信号可以同时到达一批神经元的输入端，这种结构非常适合并行计算。同时如果将每一个神经元看作是一个小的处理单元，则整个系统可以是一个分布式计算系统，这样就避免了以往的“匹配冲突”，“组合爆炸”和“无穷递归”等题，推理速度快。（2）可学习性一个相对很小的人工神经网络可存储大量的专家知识，并且能根据学习算法，或者利用样本指导系统来模拟现实环境(称为有教师学习)，或者对输入进行自适应学习(称为无教师学习)，不断地自动学习，完善知识的存储。（3）鲁棒性和容错性由于采用大量的神经元及其相互连接，具有联想记忆与联想映射能力，可以增强专家系统的容错能力，人工神经网络中少量的神经元发生失效或错误，不会对系统整体功能带来严重的影响。而且克服了传统专家系统中存在的“知识窄台阶”问题。（4）泛化能力人工神经网络是一类大规模的非线形系统，这就提供了系统自组织和协同的潜力。它能充分逼近复杂的非线形关系。当输入发生较小变化，其输出能够与原输入产生的输出保持相当小的差距。（5）具有统一的内部知识表示形式，任何知识规则都可以通过对范例的学习存储于同一个神经网络的各连接权值中，便于知识库的组织管理，通用性强。虽然人工神经网络有很多优点，但基于其固有的内在机理，人工神经网络也不可避免的存在自己的弱点:（1）最严重的问题是没能力来解释自己的推理过程和推理依据。（2）神经网络不能向用户提出必要的询问，而且当数据不充分的时候，神经网络就无法进行工作。（3）神经网络把一切问题的特征都变为数字，把一切推理都变为数值计算，其结果势必是丢失信息。（4）神经网络的理论和学习算法还有待于进一步完善和提高。神经网络的发展趋势及在柴油机故障诊断中的可行性神经网络为现代复杂大系统的状态监测和故障诊断提供了全新的理论方法和技术实现手段。神经网络专家系统是一类新的知识表达体系，与传统专家系统的高层逻辑模型不同，它是一种低层数值模型，信息处理是通过大量的简单处理元件(结点) 之间的相互作用而进行的。由于它的分布式信息保持方式，为专家系统知识的获取与表达以及推理提供了全新的方式。它将逻辑推理与数值运算相结合，利用神经网络的学习功能、联想记忆功能、分布式并行信息处理功能，解决诊断系统中的不确定性知识表示、获取和并行推理等问题。通过对经验样本的学习，将专家知识以权值和阈值的形式存储在网络中，并且利用网络的信息保持性来完成不精确诊断推理，较好地模拟了专家凭经验、直觉而不是复杂的计算的推理过程。但是，该技术是一个多学科知识交叉应用的领域，是一个不十分成熟的学科。一方面，装备的故障相当复杂;另一方面，人工神经网络本身尚有诸多不足之处:（1）受限于脑科学的已有研究成果。由于生理实验的困难性，目前对于人脑思维与记忆机制的认识还很肤浅。（2）尚未建立起完整成熟的理论体系。目前已提出了众多的人工神经网络模型，归纳起来，这些模型一般都是一个由结点及其互连构成的有向拓扑网，结点间互连强度所构成的矩阵，可通过某种学习策略建立起来。但仅这一共性，不足以构成一个完整的体系。这些学习策略大多是各行其是而无法统一于一个完整的框架之中。（3）带有浓厚的策略色彩。这是在没有统一的基础理论支持下，为解决某些应用，而诱发出的自然结果。（4）与传统计算技术的接口不成熟。人工神经网络技术决不能全面替代传统计算技术，而只能在某些方面与之互补，从而需要进一步解决与传统计算技术的接口问题，才能获得自身的发展。虽然人工神经网络目前存在诸多不足，但是神经网络和传统专家系统相结合的智能故障诊断技术仍将是以后研究与应用的热点。它最大限度地发挥两者的优势。神经网络擅长数值计算，适合进行浅层次的经验推理;专家系统的特点是符号推理，适合进行深层次的逻辑推理。智能系统以并行工作方式运行，既扩大了状态监测和故障诊断的范围，又可满足状态监测和故障诊断的实时性要求。既强调符号推理，又注重数值计算，因此能适应当前故障诊断系统的基本特征和发展趋势。随着人工神经网络的不断发展与完善，它将在智能故障诊断中得到广泛的应用。根据神经网络上述的各类优缺点，目前有将神经网络与传统的专家系统结合起来的研究倾向，建造所谓的神经网络专家系统。理论分析与使用实践表明，神经网络专家系统较好地结合了两者的优点而得到更广泛的研究和应用。离心式制冷压缩机的构造和工作原理与离心式鼓风机极为相似。但它的工作原理与活塞式压缩机有根本的区别，它不是利用汽缸容积减小的方式来提高汽体的压力，而是依靠动能的变化来提高汽体压力。离心式压缩机具有带叶片的工作轮，当工作轮转动时，叶片就带动汽体运动或者使汽体得到动能，然后使部分动能转化为压力能从而提高汽体的压力。这种压缩机由于它工作时不断地将制冷剂蒸汽吸入，又不断地沿半径方向被甩出去，所以称这种型式的压缩机为离心式压缩机。其中根据压缩机中安装的工作轮数量的多少，分为单级式和多级式。如果只有一个工作轮，就称为单级离心式压缩机，如果是由几个工作轮串联而组成，就称为多级离心式压缩机。在空调中，由于压力增高较少，所以一般都是采用单级，其它方面所用的离心式制冷压缩机大都是多级的。单级离心式制冷压缩机的构造主要由工作轮、扩压器和蜗壳等所组成。压缩机工作时制冷剂蒸汽由吸汽口轴向进入吸汽室，并在吸汽室的导流作用引导由蒸发器(或中间冷却器)来的制冷剂蒸汽均匀地进入高速旋转的工作轮3(工作轮也称叶轮，它是离心式制冷压缩机的重要部件，因为只有通过工作轮才能将能量传给汽体)。汽体在叶片作用下，一边跟着工作轮作高速旋转，一边由于受离心力的作用，在叶片槽道中作扩压流动，从而使汽体的压力和速度都得到提高。由工作轮出来的汽体再进入截面积逐渐扩大的扩压器4(因为汽体从工作轮流出时具有较高的流速，扩压器便把动能部分地转化为压力能，从而提高汽体的压力)。汽体流过扩压器时速度减小，而压力则进一步提高。经扩压器后汽体汇集到蜗壳中，再经排气口引导至中间冷却器或冷凝器中。二、离心式制冷压缩机的特点与特性离心式制冷压缩机与活塞式制冷压缩机相比较，具有下列优点： (1)单机制冷量大，在制冷量相同时它的体积小，占地面积少，重量较活塞式轻5～8倍。 (2)由于它没有汽阀活塞环等易损部件，又没有曲柄连杆机构，因而工作可靠、运转平稳、噪音小、操作简单、维护费用低。 (3)工作轮和机壳之间没有摩擦，无需润滑。故制冷剂蒸汽与润滑油不接触，从而提高了蒸发器和冷凝器的传热性能。 (4)能经济方便的调节制冷量且调节的范围较大。 (5)对制冷剂的适应性差，一台结构一定的离心式制冷压缩机只能适应一种制冷剂。 (6)由于适宜采用分子量比较大的制冷剂，故只适用于大制冷量，一般都在25～30万大卡／时以上。如制冷量太少，则要求流量小，流道窄，从而使流动阻力大，效率低。但近年来经过不断改进，用于空调的离心式制冷压缩机，单机制冷量可以小到10万大卡／时左右。制冷与冷凝温度、蒸发温度的关系。由物理学可知，回转体的动量矩的变化等于外力矩，则 T=m(C2UR2-C1UR1) 两边都乘以角速度ω，得 Tω=m(C2UωR2-C1UωR1) 也就是说主轴上的外加功率N为： N=m(U2C2U-U1C1U) 上式两边同除以m则得叶轮给予单位质量制冷剂蒸汽的功即叶轮的理论能量头。 U2 C2 ω2 C2U R1 R2 ω1 C1 U1 C2r β 离心式制冷压缩机的特性是指理论能量头与流量之间变化关系，也可以表示成制冷 W=U2C2U-U1C1U≈U2C2U （因为进口C1U≈0）又C2U=U2-C2rctgβ C2r=Vυ1/(A2υ2) 故有 W= U22(1- Vυ1 ctgβ) A2υ2U2 式中：V—叶轮吸入蒸汽的容积流量（m3/s） υ1υ2 ——分别为叶轮入口和出口处的蒸汽比容（m3/kg） A2、U2—叶轮外缘出口面积(m2)与圆周速度(m/s) β—叶片安装角由上式可见，理论能量头W与压缩机结构、转速、冷凝温度、蒸发温度及叶轮吸入蒸汽容积流量有关。对于结构一定、转速一定的压缩机来说，U2、A2、β皆为常量，则理论能量头W仅与流量V、蒸发温度、冷凝温度有关。按照离心式制冷压缩机的特性，宜采用分子量比较大的制冷剂，目前离心式制冷机所用的制冷剂有F—11、F—12、F—22、F—113和F—114等。我国目前在空调用离心式压缩机中应用得最广泛的是F—11和F—12，且通常是在蒸发温度不太低和大制冷量的情况下，选用离心式制冷压缩机。此外，在石油化学工业中离心式的制冷压缩机则采用丙烯、乙烯作为制冷剂，只有制冷量特别大的离心式压缩机才用氨作为制冷剂。三、离心式制冷压缩机的调节离心式制冷压缩机和其它制冷设备共同构成一个能量供给与消耗的统一系统。制冷机组在运行时，只有当通过压缩机的制冷剂的流量与通过设备的流量相等时，以及压缩机所产生的能量头与制冷设备的阻力相适应时，制冷系统的工况才能保持稳定。但是制冷机的负荷总是随外界条件与用户对冷量的使用情况而变化的，因此为了适应用户对冷负荷变化的需要和安全经济运行，就需要根据外界的变化对制冷机组进行调节，离心式制冷机组制冷量的调节有：1°改变压缩机的转速；2°采用可转动的进口导叶；3°改变冷凝器的进水量；4°进汽节流等几种方式，其中最常用的是转动进口导叶调节和进汽节流两种调节方法。所谓转动进口导叶调节，就是转动压缩机进口处的导流叶片以使进入到叶轮去的汽体产生旋绕，从而使工作轮加给汽体的动能发生变化来调节制冷量。所谓进汽节流调节，就是在压缩机前的进汽管道上安装一个调节阀，如要改变压缩机的工况时，就调节阀门的大小，通过节流使压缩机进口的压力降低，从而实现调节制冷量。离心式压缩机制冷量的调节最经济有效的方法就是改变进口导叶角度，以改变蒸汽进入叶轮的速度方向(C1U)和流量V。但流量V必须控制在稳定工作范围内，以免效率下降。

计算机论文计算机网络在电子商务中的应用摘要：随着计算机网络技术的飞进发展，电子商务正得到越来越广泛的应用。由于电子商务中的交易行为大多数都是在网上完成的，因此电子商务的安全性是影响趸易双方成败的一个关键因素。本文从电子商务系统对计算机网络安全，商务交易安全性出发，介绍利用网络安全枝术解决安全问题的方法。关键词：计算机网络，电子商务安全技术一．引言近几年来．电子商务的发展十分迅速电子商务可以降低成本．增加贸易机会，简化贸易流通过程，提高生产力，改善物流和金流、商品流．信息流的环境与系统虽然电子商务发展势头很强，但其贸易额所占整个贸易额的比例仍然很低。影响其发展的首要因素是安全问题．网上的交易是一种非面对面交易，因此“交易安全“在电子商务的发展中十分重要。可以说．没有安全就没有电子商务。电子商务的安全从整体上可分为两大部分．计算机网络安全和商务交易安全。计算机网络安全包括计算机网络设备安全、计算机网络系统安全、数据库安全等。其特征是针对计算机网络本身可能存在的安全问题，实施网络安全增强方案．以保证计算机网络自身的安全性为目标。商务安全则紧紧围绕传统商务在Interne'(上应用时产生的各种安全问题．在计算机网络安全的基础上．如何保障电子商务过程的顺利进行。即实现电子商务的保密性．完整性．可鉴别性．不可伪造性和不可依赖性。二、电子商务网络的安全隐患1窃取信息：由于未采用加密措施．数据信息在网络上以明文形式传送．入侵者在数据包经过的网关或路由器上可以截获传送的信息。通过多次窃取和分析，可以找到信息的规律和格式，进而得到传输信息的内容．造成网上传输信息泄密2．篡改信息：当入侵者掌握了信息的格式和规律后．通过各种技术手段和方法．将网络上传送的信息数据在中途修改然后再发向目的地。这种方法并不新鲜．在路由器或者网关上都可以做此类工作。3假冒由于掌握了数据的格式，并可以篡改通过的信息，攻击者可以冒充合法用户发送假冒的信息或者主动获取信息，而远端用户通常很难分辨。4恶意破坏：由于攻击者可以接入网络．则可能对网络中的信息进行修改．掌握网上的机要信息．甚至可以潜入网络内部．其后果是非常严重的。三、电子商务交易中应用的网络安全技术为了提高电子商务的安全性．可以采用多种网络安全技术和协议．这些技术和协议各自有一定的使用范围，可以给电子商务交易活动提供不同程度的安全保障。1．防火墙技术。防火墙是目前主要的网络安全设备。防火墙通常使用的安全控制手段主要有包过滤、状态检测、代理服务由于它假设了网络的边界和服务，对内部的非法访问难以有效地控制。因此．最适合于相对独立的与外部网络互连途径有限、网络服务种类相对集中的单一网络(如常见的企业专用网) 防火墙的隔离技术决定了它在电子商务安全交易中的重要作用。目前．防火墙产品主要分为两大类基于代理服务方式的和基于状态检测方式的。例如Check Poim Fi rewalI-1 4 0是基于Unix、WinNT平台上的软件防火墙．属状态检测型 Cisco PIX是硬件防火墙．也属状态检测型。由于它采用了专用的操作系统．因此减少了黑客利用操作系统G)H攻击的可能性：Raptor完全是基于代理技术的软件防火墙由于互联网的开放性和复杂性．防火墙也有其固有的缺点(1)防火墙不能防范不经由防火墙的攻击。例如．如果允许从受保护网内部不受限制地向外拨号．一些用户可以形成与Interne'(的直接连接．从而绕过防火墙：造成一个潜在的后门攻击渠道，所以应该保证内部网与外部网之间通道的唯一性。(2)防火墙不能防止感染了病毒的软件或文件的传输．这只能在每台主机上装反病毒的实时监控软件。(3)防火墙不能防止数据驱动式攻击。当有些表面看来无害的数据被邮寄或复制到Interne'(主机上并被执行而发起攻击时．就会发生数据驱动攻击．所以对于来历不明的数据要先进行杀毒或者程序编码辨证，以防止带有后门程序。2．数据加密技术。防火墙技术是一种被动的防卫技术．它难以对电子商务活动中不安全的因素进行有效的防卫。因此．要保障电子商务的交易安全．就应当用当代密码技术来助阵。加密技术是电子商务中采取的主要安全措施，贸易方可根据需要在信息交换的阶段使用。目前．加密技术分为两类．即对称加密／对称密钥加密／专用密钥加密和非对称加密／公开密钥加密。现在许多机构运用PKI(punickey nfrastructur)的缩写．即公开密钥体系”)技术实施构建完整的加密／签名体系．更有效地解决上述难题．在充分利用互联网实现资源共享的前提下从真正意义上确保了网上交易与信息传递的安全。在PKI中．密钥被分解为一对(即一把公开密钥或加密密钥和一把专用密钥或解密密钥)。这对密钥中的任何一把都可作为公开密钥(加密密钥)通过非保密方式向他人公开．而另一把则作为专用密钥{解密密钥)加以保存。公开密钥用于对机密�6�11生息的加密．专用密钥则用于对加信息的解密。专用密钥只能由生成密钥对的贸易方掌握．公开密钥可广泛发布．但它只对应用于生成该密钥的贸易方。贸易方利用该方案实现机密信息交换的基本过程是贸易方甲生成一对密钥并将其中的一把作为公开密钥向其他贸易方公开：得到该公开密钥的贸易方乙使用该密钥对机密信息进行加密后再发送给贸易方甲贸易方甲再用自己保存的另一把专用密钥对加密后的信息进行解密。贸易方甲只能用其专用密钥解密由其公开密钥加密后的任何信息。3．身份认证技术。身份认证又称为鉴别或确认，它通过验证被认证对象的一个或多个参数的真实性与有效性来证实被认证对象是否符合或是否有效的一种过程，用来确保数据的真实性。防止攻击者假冒篡改等。一般来说。用人的生理特征参数f如指纹识别、虹膜识别)进行认证的安全性很高。但目前这种技术存在实现困难、成本很高的缺点。目前，计算机通信中采用的参数有口令、标识符密钥、随机数等。而且一般使用基于证书的公钥密码体制(PK I)身份认证技术。要实现基于公钥密码算法的身份认证需求。就必须建立一种信任及信任验证机制。即每个网络上的实体必须有一个可以被验证的数字标识这就是数字证书(Certifi2cate)”。数字证书是各实体在网上信息交流及商务交易活动中的身份证明。具有唯一性。证书基于公钥密码体制．它将用户的公开密钥同用户本身的属性(例如姓名，单位等)联系在一起。这就意味着应有一个网上各方都信任的机构专门负责对各个实体的身份进行审核，并签发和管理数字证书，这个机构就是证书中心(certificate authorities．简称CA}。CA用自己的私钥对所有的用户属性、证书属性和用户的公钥进行数字签名，产生用户的数字证书。在基于证书的安全通信中．证书是证明用户合法身份和提供用户合法公钥的凭证．是建立保密通信的基础。因此，作为网络可信机构的证书管理设施 CA主要职能就是管理和维护它所签发的证书提供各种证书服务，包括：证书的签发、更新回收、归档等。4．数字签名技术。数字签名也称电子签名在信息安全包括身份认证，数据完整性、不可否认性以及匿名性等方面有重要应用。数字签名是非对称加密和数字摘要技术的联合应用。其主要方式为：报文发送方从报文文本中生成一个1 28b it的散列值(或报文摘要)，并用自己的专用密钥对这个散列值进行加密形成发送方的数字签名：然后这个数字签名将作为报文的附件和报文一起发送给报文的接收方报文接收方首先从接收到的原始报文中计算出1 28bit位的散列值(或报文摘要)．接着再用发送方的公开密钥来对报文附加的数字签名进行解密如果两个散列值相同那么接收方就能确认该数字签名是发送方的．通过数字签名能够实现对原始报文的鉴别和不可抵赖性。四、结束语电子商务安全对计算机网络安全与商务安全提出了双重要求．其复杂程度比大多数计算机网络都高。在电子商务的建设过程中涉及到许多安全技术问题制定安全技术规则和实施安全技术手段不仅可以推动安全技术的发展，同时也促进安全的电子商务体系的形成。当然，任何一个安全技术都不会提供永远和绝对的安全，因为网络在变化．应用在变化，入侵和破坏的手段也在变化，只有技术的不断进步才是真正的安全保障。参考文献：[1]肖满梅罗兰娥：电子商务及其安全技术问题．湖南科技学院学报，2006，27[2]丰洪才管华陈珂：电子商务的关键技术及其安全性分析．武汉工业学院学报 2004，2[3]阎慧王伟：宁宇鹏等编著．防火墙原理与技术[M]北京：机械工业出版杜 2004

针对径向基函数(Radial basis function,RBF)神经网络的结构设计问题,提出一种结构动态优化设计方法.利用敏感度法(Sensitivity analysis,SA)分析隐含层神经元的输出加权值对神经网络输出的影响,以此判断增加或删除RBF神经网络隐含层中的神经元,解决了RBF神经网络结构过大或过小的问题,并给出了神经网络结构动态变化过程中收敛性证明;利用梯度下降的参数修正算法保证了最终RBF网络的精度,实现了神经网络的结构和参数自校正.通过对非线性函数的逼近与污水处理过程中关键参数的建模结果,证明了该动态RBF具有良好的自适应能力和逼近能力,尤其是在泛化能力、最终网络结构等方面较之最小资源神经网络(Minimal resource allocation networks,MRAN)与增长和修剪RBF神经网络(Generalized growing and pruning radial basis function,GGAP-RBF)有较大提高.[1] 朱文莉. 一类具有时滞的神经网络的稳定性分析[J]. 电子科技大学学报. 2000(05)[2] 廖晓昕,傅予力,高健,赵新泉. 具有反应扩散的Hopfield神经网络的稳定性[J]. 电子学报. 2000(01)[3] 张菊亮,章祥荪. 一个新的解线性规划的神经网络(英文)[J]. 运筹学学报. 2001(02)[4] 罗公亮. 从神经网络到支撑矢量机(上)[J]. 冶金自动化. 2001(05)[5] 蒋德云,张弓. 谷物识别中对神经网络的优化(英文)[J]. 农业工程学报. 2002(05)[6] 王芳荣,周德义,郑咏梅,王鼎,张铁强. 生物表面光谱特性识别的神经网络方法[J]. 吉林大学学报(信息科学版). 2002(03)[7] 宋光雄,何胜锋,曹辉,张峥,钟群鹏. 基于Hopfield神经网络的腐蚀失效模式识别[J]. 金属热处理学报. 2003(01)[8] 王学武,谭得健. 神经网络的应用与发展趋势[J]. 计算机工程与应用. 2003(03)[9] 刘斌,刘新芝,廖晓昕. 脉冲Hopfield神经网络的鲁棒H-稳定性及其脉冲控制器设计(英文)[J]. 控制理论与应用. 2003(02)[10] 刘国良,强文义,麻亮,陈兴林. 基于粗神经网络的仿人智能机器人的语音融合算法研究[J]. 控制与决策. 2003(03)

1绪论研究背景与研究目的意义中国互联网络信息中心（CNNIC，2018）发布了截至2018年12月的第43次中国互联网发展统计报告。根据该报告，截至2018年12月，中国互联网用户数量为亿，并且每年保持在5000多万增量。而且这种趋势将在未来几年继续保持。5G时代的来临将会加快促进互联网与其他产业融合，网络规模必然会进一步增大。传统的网络管理系统以分布式网络应用系统为基础，采用软件和硬件相结合的方式。SNMP协议是目前网络管理领域运用最为广泛的网络管理协议，它将从各类网络设备中获取数据方式进行了统一化，几乎所有的网络设备生产厂商都支持此协议。然而传统的基于SNMP的网络管理软件大多基于C/S架构，存在着扩展性和灵活性差，升级维护困难等缺点，对网为网络的管理带来了一定程度的不便。因此，基于三层的网管系统己经成为发展趋势，随着Web技术迅猛发展，诞生了以Web浏览器和服务器为核心，基于B/S ( Browser/Server)架构的“Web分布式网络管理系统”，它具有不依赖特定的客户端应用程序，跨平台，方便易用，支持分布式管理，并且可动态扩展和更新等优点。本文将重点研究基于BP故障诊断模型，实现了一种以接口故障为研究对象的智能网络管理系统模型，并以此为基础，设计与实现基于web的智能网络管理系统，不仅可以通过对网络数据实时监控，而且基于BP网络故障诊断模型可以诊断通信网中的接口故障，在一定程度上实现网络故障管理的自动化。该系统在保证网络设备提供稳定可靠的网络服务同时，也可以降低企业在维护网络设备上的成本。国内外研究现状网络设备管理是指对各种网络设备(如核心层、汇接层、接入层路由与交换设备、服务器和计算机)进行各种操作和相关配置，管理服务器（Manager）用来处理网络信息，配合管理服务器对网络信息处理并管理的实体被称为代理服务器（Agent），被管对象是指用于提供网络服务或使用网络服务等设备的全部资源信息，各种不同的被管对象构成了管理信息库。在实际的网络管理过程当中，管理服务器和代理服务器以及代理服务器和被管对象三种实体之间都是通过规范的网络管理协议来进行信息的交互（王鹤 2015）。相比国外的网络管理系统及产品，国内相应的网络管理系统和产品起步比较晚，但是随着互联网技术的发展网络管理软件发展势头迅猛，诞生了很多优秀的网络管理软件，这些软件已经广泛运用在我国网络管理领域。国外研究现状目前国外大型网络服务商都有与其产品相对应的网络管理系统。从最初步的C/S架构逐步过渡到现在的B/S架构。比较著名的:Cabletron系统公司的SPECTRUM,Cisco公司的CiscoWorks，HP公司的OpenView,Tivoli系统公司的TH NetView。这些网络管理产品均与自家产品相结合，实现了网络管理的全部功能，但是相对专业化的系统依旧采用C/S架构。NetView这款管理软件在网络管理领域最为流行。NetView可以通过分布式的方式实时监控网络运行数据，自动获取网络拓扑中的变化生成网络拓扑。另外，该系统具有强大的历史数据备份功能，方便管理员对历史数据统计管理。OpenView具有良好的兼容性，该软件集成了各个网络管理软件的优势，支持更多协议标准，异种网络管理能力十分强大。CiscoWorks是Cisco产品。该软件支持远程控制网络设备，管理员通过远程控制终端管理网络设备，提供了自动发现、网络数据可视化、远程配置设备和故障管理等功能。使用同一家产品可以更好的服务，因此CiscoWorks结合Cisco平台其他产品针对Cisco设备可以提供更加细致的服务。Cabletron的SPECTRUM是一个具有灵活性和扩展性的网络管理平台，它采用面向对象和人工智能的方法，可以管理多种对象实体，利用归纳模型检查不同的网络对象和事件，找到它们的共同点并归纳本质。同时，它也支持自动发现设备，并能分布式管理网络和设备数据。国内研究现状随着国内计算机发展迅猛，网络设备规模不断扩大，拓扑结构复杂性也随之日益增加，为应对这些问题，一大批优秀的网络管理软件应运而生。像南京联创OSS综合网络管理系统、迈普公司Masterplan等多个网络管理系统。华为公司的iManager U2000网络管理系统，北京智和通信自主研发的SugarNMS开源网络管理平台，均得到较为广泛应用。Masterplan主要特点是能够对网络应用实现良好的故障诊断和性能管理，适用于网络内服务器、网络设备以及设备上关键应用的监测管理。SugarNMS具有一键自动发现、可视化拓扑管理、网络资源管理、故障管理、日志管理、支付交付等功能，并提供C/S和B/S两种使用方式。iManager U2000定位于电信网络的网元管理层和网络管理层，采用开放、标准、统一的北向集成，很大程度上缩短OSS集成时间，系统运行以业务为中心，缩短故障处理时间，从而减少企业故障处理成本。近些年来，随着人工智能技术的崛起，越来越多的企业开始将人工智能技术应用在网络管理上面，替代传统的集中式网络管理方式。为了减小企业维护网络的成本，提高网管人员工作效率，智能化、自动化的网络管理系统成为许多学者研究的热点。神经网络在网络管理中的适用性分析网络管理的功能就是对网络资源进行管控、监测通信网络的运行状态以及排查网络故障。管控网络资源，本质上就是管理员为了满足业务需求下发相关设备配置命令改变网络设备状态，以保证稳定的服务；监测网络运行状态一般是指周期的或者实时的获取设备运行状态进行可视化，以方便管理员进行分析当前设备是否正常运行。排查网络故障是管理员通过分析网络设备运行数据与以往数据进行比较或者根据自身经验进行分析，确定故障源头、故障类别、产生原因、解决方法。故障排除是针对前一阶段发现的网络故障进行特征分析，按照诊断流程得出结果，执行特定的指令动作来恢复网络设备正常运行（洪国栋，2016）。神经网络具有并行性和分布式存储、自学习和自适应能力、非线性映射等基本特点。当下最为流行的神经网络模型就是BP(Back-Propagation)神经网络，是一种按照误差逆向传播算法训练多层前馈神经网络，属于监督式学习神经网络的一种。该模型分为输入层、隐含层以及输出层，网络模型在外界输入样本的刺激不断改变连接权值，将输出误差以某种形式通过隐含层向输入层逐层反转，使得网络输出不断逼近期望输出，其本质就是连接权值的动态调整。BP神经网络拥有突出的泛化能力，善于处理分类问题。BP网络是目前常用的误差处理方式，在众多领域得到了广泛的应用，它的处理单元具有数据量大、结构简单等特点，并且神经网络以对大脑的生理研究成果为基础，模拟大脑某些机制与机理组成十分繁杂的非线性动力学系统，其在处理网络设备运行中的数据时以及在比较模糊信号问题的时候，能够自主学习并得出需要的结果。能够将模型中输入输出矢量进行分类、连接、来适应复杂的传输存储处理。因此，本文会基于现有网络管理技术结合BP神经网络去解决网络故障问题。本文主要研究目标本文研究目标针对传统网络管理中故障方案的问题与不足，本文探究基于BP神经网络的方法来构建基于通信网接口故障诊断模型。通过构建的通信网接口故障诊断模型可以有效的诊断接口故障并判别出故障类型。推动现有网络管理系统更趋近于智能化。以此为基础，分析、设计、实现基于三层架构的智能网络管理系统技术路线智能网络研究首先要确定该系统的开发技术路线，课题研究的主要过程首先是在查阅相关科研资料的基础上，搭建实验环境。在保证网络正常通信的前提下采集各个端口的流入流出流量，记录设备的运行状态并对设备进信息进行管理。同时布置实验环境相应故障，包括：改变端口状态、更改端口ip地址、子网掩码，采集通讯网络接口故障发生时网络拓扑中产生的异常数据。查阅BP神经网络在故障在诊断方面的相关论文，基于网络通讯设备接口的常见故障以及相关故障文档构建BP神经网络故障模型，并判断故障模型的有效性。逐步地实现系统的全部功能。最后进行系统测试，得出结论，应用于实际。本文组织结构本文主要由六个章节构成，各章节主要内容如下：第一章绪论。本章首先简要介绍了网络管理系统当前的发展及应用现状从而进一步分析出建立智能网络管理系统的重要意义。阐述了网络管理系统国内外研究现状。最后论述了本文研究目的与组织结构。第二章相关概念及相关技术。本章对SNMP的相关技术进行详细介绍，SNMP组织模型、SNMP管理模型、SNMP信息模型、SNMP通讯模型。然后对前端框架Vue和绘图插件Echarts技术进行介绍，其次介绍了常见的故障分析技术，专家系统、神经网络等，最后对神经网络基本概念和分类进行简要描述。第三章基于BP神经网络故障推理模型。介绍了BP神经网络的基本概念、网络结构、设计步骤、训练过程，以接口故障为例详细介绍了BP神经网络故障模型的构建过程。第四章智能网络管理系统分析与系统设计。首先进行了需求分析，其次对体系结构设计、系统总体模块结构设计进行说明，对系统各个功能模块分析设计结合活动图进行详细说明，最后对数据库设计进行简要说明。第五章智能网络管理系统的实现。对整体开发流程进行了说明，对用户管理模块、配置管理模块、设备监控模块、故障诊断模块实现流程进行描述并展示实现结果。第六章系统测试与结论。并对系统的部分功能和性能进行了测试，并加以分析。第七章总结与展望。总结本文取得的研究成果和存在的问题，并提出下一步改进系统的设想与对未来的展望。2相关概念及相关技术网络管理概述网络管理就是通过合适手段和方法，确保通信网络可以根据设计目标稳定，高效运行。不仅需要准确定位网络故障，还需要通过分析数据来预先预测故障，并通过优化设置来降低故障的发生率。网络管理系统的五大基本功能，分别为:配置管理、性能管理、故障管理、计费管理和安全管理：1）配置管理：配置管理是最重要和最基础的部分。它可以设置网络通讯设备的相关参数，从而管理被管设备，依据需求周期的或实时的获取设备信息和运行状态，检查和维护设备状态列表，生成数据表格，为管理员提供参考和接口以更改设备配置。2）性能管理：性能管理是评估系统网络的运行状态和稳定性，主要工作内容包括从被管理对象获取与网络性能相关数据，对这些数据进行统计和分析，建立模型以预测变化趋势、评估故障风险，通过配置管理模块修改网络参数，以确保网络性能最优利用网络资源保证通信网络平稳运行。3）故障管理：故障管理的主要功能就是及时辨别出网络中出现的故障，找出故障原因，分析并处理故障。故障管理一般分为四个部分：（1）探测故障。通过被管设备主动向管理站发送故障信息或者管理站主动轮询被管设备两种方式发现故障源。（2）发出告警。管理站发现故障信息之后，会以短信、信号灯等方式提示管理员。（3）解决故障。对故障信息进行分析，明确其故障原因和类型，找到对应方法得以解决。（4）保存历史故障数据。对历史故障数据进行维护备份，为以后的故障提供一定依据，使得处理网络故障更为高效。4）计费管理：计费管理主要功能是为客户提供一个合理的收费依据，通过将客户的网络资源的使用情况进行统计，例如将客户消费流量计算成本从而向客户计费。5）安全管理：目的就是保证网络能够平稳安全的运行，可以避免或者抵御来自外界的恶意入侵，防止重要数据泄露，例如用户的个人隐私泄露问题等。根据网络管理系统的体系结构和ISO定义的基本功能，基于Web的网络管理系统基本模型如图基于Web的网络管理系统基本模型所示，整个模型包括六个组成部分:Web浏览器，Web服务器，管理服务集，管理信息库，网络管理协议，被管资源。 SNMP协议简单网络管理协议SNMP(Simple Network Management Protocol)，既可以作为一种协议，也可以作为一套标准。事实上SNMP己经成为网络管理领域的工业标准，从提出至今共有八个版本，在实践中得到广泛应用的有三个版本，分别是SNMPv1, SNMPv2c和SNMPv3（唐明兵2017）。最初的SNMPv1主要是为了满足基于TCP/IP的网络管理而设计的，但是随着网络管理行业的迅猛发展，第一版本的SNMP协议已经不适应网络行业的发展，身份验证、批量数据传输问题等暴露导致SNMPv1难以支持日益庞大的网络设备。第二版本就演变成了一个运行于多种网络协议之上的网络管理协议，较第一版本有了长足的进步，不仅提供了更多操作类型，支持更多的数据类型而且提供了更加丰富的错误代码，能够更加细致的区分错误，另外支持的分布式管理在一定程度上大大减轻了服务器的压力。但是SNMPv2c依旧是明文传输密钥，其安全性有待提高。直到1998年正式推出SNMPv3，SNMPv3的进步主要体现在安全性能上，他引入USM和VACM技术，USM添加了用户名和组的概念，可以设置认证和加密功能，对NMS和Agent之间传输的报文进行加密，提升其安全性防止窃听。VACM确定用户是否允许特定的访问MIB对象以及访问方式。 SNMP管理模型与信息模型SNMP系统包括网络管理系统NMS（Network Management System）、代理进程Agent、被管对象Management object和管理信息库MIB（Management Informoation Base）四部分组成.管理模型图如图所示：1）NMS称为网络管理系统，作为网络管理过程当中的核心，NMS通过SNMP协议向网络设备发送报文，并由Agent去接收NMS发来的管理报文从而对设备进行统一管控。NMS可以主动向被管对象发送管理请求，也可以被动接受被管对象主动发出的Trap报文。2）Agent相当于网络管理过程中的中间件，是一种软件，用于处理被管理设备的运行数据并响应来自NMS的请求，并把结果返回给NMS。Agent接收到NMS请求后，通过查询MIB库完成对应操作，并把数据结果返回给NMS。Agent也可以作为网络管理过程中的中间件不仅可以使得信息从NMS响应到具体硬件设备上，当设备发生故障时，通过配置Trap开启相应端口，被管设备也可以通过Agent主动将事件发送到NMS，使得NMS及时发现故障。3）Management object指被管理对象。一个设备可能处在多个被管理对象之中，设备中的某个硬件以及硬件、软件上配置的参数集合都可以作为被管理对象。4）MIB是一个概念性数据库，可以理解为Agent维护的管理对象数据库，里面存放了被管设备的相关变量信息。MIB库定义了被管理设备的一系列属性：对象的名称、对象的状态、对象的访问权限和对象的数据类型等。通过读取MIB变量的值， Agent可以查询到被管设备的当前运行状态以及硬件信息等，进而达到监控网络设备的目的。Agent可以利用修改对应设备MIB中的变量值，设置被管设备状态参数来完成设备配置。SNMP的管理信息库是树形结构，其结构类型与DNS相似，具有根节点且不具有名字。在MIB功能中，每个设备都是作为一个oid树的某分支末端被管理。每个OID（object identifier，对象标识符）对应于oid树中的一个管理对象且具有唯一性。有了树形结构的特性，可以高效迅速地读取其中MIB中存储的管理信息及遍历树中节点，读取顺序从上至下。目前运用最为广泛的管理信息库是MIB-Ⅱ，它在MIB-Ⅰ的基础上做了扩充和改进。MIB-Ⅱ结构示意图如图如所示：（1）system组：作为MIB中的基本组，可以通过它来获取设备基本信息和设备系统信息等。（2）interfac组：定了有关接口的信息，例如接口状态、错误数据包等，在故障管理和性能管理当中时常用到。（3）address translation组:用于地址映射。（4）ip组：包含了有关ip的信息，例如网络编号，ip数据包数量等信息。（5）icmp组：包含了和icmp协议有关信息，例如icmp消息总数、icmp差错报文输入和输出数量。（6）tcp组：包含于tcp协议相关信息，例如tcp报文数量、重传时间、拥塞设置等。应用于网络拥塞和流量控制。（7）udp组：与udp协议相关，可以查询到udp报文数量，同时也保存了udp用户ip地址。（8）egp组：包含EGP协议相关信息，例如EGP协议下邻居表信息、自治系统数。（9）cmot组：为CMOT协议保留（10）transmission组：为传输信息保留（11）snmp组：存储了SNMP运行与实现的信息，例如收发SNMP消息数据量。 SNMP通讯模型SNMP规定了5种协议基本数据单元PDU，用于管理进程与代理进程之间交换。（1）get-request操作：管理进程请求数据。（2）get-next-request操作：在当前操作MIB变量的基础上从代理进程处读取下一个参数的值。（3）set-request操作：用于对网络设备进行设置操作。（4）get-response操作：在上面三种操作成功返回后，对管理进程进行数据返回。这个操作是由代理进程返回给管理进程。（5）trap操作：SNMP代理以异步的方式主动向SNMP管理站发送Trap数据包。一般用于故障告警和特定事件发生。SNMP消息报文包含两个部分：SNMP报头和协议数据单元PDU。根据TCP/IP模型SNMP是基于UDP的应用层协议，而UDP又是基于IP协议的。因此可以得到完整的SNMP报文示意图如下：（1）版本号表示SNMP版本，其中版本字段的大小是版本号减1，如果SNMPv2则显示的字段值是1。（2）团体名（community）本质上是一个字符串，作为明文密钥在管理进程和代理进程之间用于加密传输的消息，一般默认设置成“public”。（3）请求标识符(request ID)用于消息识别。由管理进程发送消息时自带一个整数值，当代理进程返回消息时带上该标识符。管理进程可以通过该标识符识别出是哪一个代理进程返回的数据从而找到对应请求的报文。（4）差错状态(error status)表示出现错误时由代理进程返回时填入差错状态符0～5中的某一数字，数字对应相关错误信息。差错状态描述符如下表：（5）差错索引(error index)表示在通信过程当中出现上表的差错时，代理进程在应答请求时设置一个整数，整数大小对应差错变量在变量列表中偏移大小。（6）变量名-值对以key-value的方式存储变量名称和对应值。（7）trap报文是代理进程主动向管理进程发送的报文，不必等待管理进程下一次轮询。SNMPv2的trap报文格式较SNMPv1的trap报文格式更趋近于普通的SNMP响应报文，更加统一化。以SNMPv2为例的trap报文格式如下：trap类型已定义的特定trap共有7种，后面的则是由供养商自己定制。Trap类型如下表所示： SNMP组织模型SNMP代理组织分成分散式和集中式模型。在分散模型中，每一个服务器对应一个SNMP代理，可以理解为一一对应的关系，管理站分别与每个被管服务器上的代理进行通信。集中模型当中，在管理服务器上只创建一个SNMP代理。管理站只与管理管理服务器上的SNMP代理进行通信， SNMP代理接收来自某一固定区域的所有数据。如图所示： Vue为实现前后端分离开发的理念，Vue应运而生。作为构建用户界面框架的简单易上手使得前端开发人员不必再编写复杂的DOM操作通过this来回寻找相关节点，很大程度上提高了开发的效率。通过MVVM框架，可以自动完成视图同步数据更新，在对实例new Vue（data:data）进行声明后data中数据将与之相应的视图绑定，一旦data中的数据发生变更，视图中对应数据也会发生相应改变。基于MVVM框架实现了视图与数据一致性，MVVM框架可以分为三个部分：Model、ViewModel、View。MVVM框架模式：的理念是“一切皆为组件”，可以说组件是的最强大功能。组件可以扩展HTML元素，将HTML、CSS、JavaScript封装成可重用的代码组件，可以应用在不同的场景，大大提高效率。它与传统的JavaScript相比，采用虚拟DOM渲染页面。当有数据发生变更时，生成虚拟DOM结构与实际页面结构对比，重新渲染差离部分，进一步提供了页面性能。 EchartsEcharts（Enterprise Charts），它是由百度公司研发的纯JavaScript图表库，可以流畅的运行在PC和移动设备上。ECharts兼容当前主流浏览器，底层依赖轻量级Canvas库ZRender，Echarts提供直观、生动、交互性强、高度自定义化的可视化图标。ECharts包含了以下特性：1）丰富的可视化类型：既有柱状图、折线图、饼图等常规图，也有可用于地理数据可视化的热力图、线图等，还有多维数据可视化的平行坐标。2）支持多种数据格式共存：在版本中内置的dataset属性支持直接传入包括二维表中。3）多维数据的支持：可以传入多维度数据。4）移动端优化：特别针对移动端可视化进行了一定程度优化，可以使用手指在坐标系中进行缩放、平移。5）动态类型切换：支持不同类型图形随意切换，既可以用柱形图也可以用折线图展示统一数据，可以从不同角度展现数据。6）时间轴：对数据进行可视化的同时，可以分为周期或者定时进行展示，所有利用时间轴可以很好的动态观察数据的变化。目前常见的故障诊断方法基于专家系统的故障诊断方法专家系统是目前最常使用的诊断方法。通俗来讲，专家系统就是模拟人类专家去解决现实中某一特定领域的复杂问题。专家系统接收用户界面数据，将数据传递到推理引擎进行推理，做出决策并执行。专家系统作为人工智能的前身，从上世纪60年代开始到现在专家系统的应用已经产生了巨大的经济效益和社会效益，灵活可靠、极高的专业水平和良好的有效机制使得专家系统已经成为最受欢迎、最活跃的领域之一。基于模糊理论的故障诊断方法在实际的工业生产过程当中，设备的“故障”状态与“正常”状态之间并没有严格的界限，它们之间存在一定的模糊过渡状态，并且在特征获取、故障判定过程中都中存在一定的模糊性。因此，该方法不需要建立精确的数学分析模型，本质上是一个模式识别问题。根据建议的症状参数，得出系统状态。通常选择“择近原则”和“最大隶属原则”作为基本诊断原理（尤海鑫，2012）。基于免疫算法的故障诊断方法通过模拟自然生物免疫系统的功能，即快速识别外来生物和外来生物，最后通过自我排斥将异物排出体外。生物免疫系统还建立了一套算法来测试各种条件，主要是在线检测，通过不合格的自我和外部组织消除系统来实现故障识别的能力。免疫算法的故障诊断方法属于并行处理能力，可以进行很多复杂的操作和处理。同时可以与遗传算法等其他智能优化算法结合使用，以增强自适应能力和自学习能力。从公开的文献中，学者们并不热衷于这种原理的方法。一般来说，在故障诊断领域，目前人工免疫理论的研究尚处于萌芽阶段。基于神经网络的故障诊断方法神经网络是由大量简单的神经节点组成的复杂网络，以网络拓扑分布的方式存储信息，利用网络拓扑分布和权重实现对实际问题的非线性映射调整，并运用使用全局并行处理的方式，实现从输入空间到输出空间的非线性映射。该方法属于典型的模型诊断模式，不需要了解内部诊断过程，而是使用隐式方法完全表达知识。在获取知识时，它将自动生成由已知知识和连接节点的权重构成的网络的拓扑结构，并将这些问题完全连接到互连的网络中，有利于知识的自动发现和获取。并行关联推理和验证提供了便利的途径；神经网络通过神经元之间的交互来实现推理机制。

图神经网络论文

白行健（右）此前获COO金牌第一名

高中生开始研究图神经网络

白行健的论文为《基于自适应性图卷积神经网络的暴力用户检测》，目前已经成功入围总决赛。

文章提出了⼀种新的⾃适应图卷积神经⽹络模型（Adaptive Graph Convolutional Neural Networks，简称AdaGCN），在传统的GCN模型的基础上进⾏了改进和创新。为了解决参数增加带来的模型难以训练和过拟合情况，文章引入了标签平滑假设，对边权的训练施加了额外的监督，从⽽实现了和GCN模型的⾃然结合。

白行健的数据集包含了10万余名Twitter⽤户和200余万条社交关系，其中⼤约5千名⽤户被标记是否为暴⼒⽤户。实验结果表明，AdaGCN的AUC得分为，F1得分为，得分⾼于所有对⽐⽅法，包括传统的GCN模型，图注意⼒⽹络 (GAT)，标签传播算法（LPA），⽀持向量机（SVM）等等。此外， AdaGCN模型的结果具有最低的标准差，这表明AdaGCN模型具有很强的稳定性。在线社交平台可以利⽤本⽂提出的⽅法来更好地评估、检测暴⼒⽤户，防⽌暴⼒⽤户伤害他⼈并传播仇恨⾔论。同时，⾃适应图卷积神经⽹络模型也可以⽤来评估不同类型的暴⼒⾔论造成的社会影响。

开挂的学霸少年

此次入围丘成桐奖之前，白行健从2018年开始多次参加相关竞赛获得好成绩：

白行健（右）

在生活方面，白行健也有很多其他尝试，他目前就读北京师范⼤学附属实验中学国际部⾼三，对数学和计算机科学非常感兴趣，担任学校计算机社社长和⼈⽂社社长。

图 | 微博

而今年的丘成桐中学科学奖中，白行健选择用图神经网络为切入点，对网络暴力用户进行检测。很大一部分原因也是身边有好友经历过网络暴力：

“2018年2⽉10⽇，⼀个名叫Ted Senior的22岁男孩在林地上吊⾃杀，原因是⼀些⼈在社交媒体上恶意地分享和评判他与⼀名⼥孩的聊天内容。在我身边，我的同学好友在学校论坛发表观点，但是遭受匿名的辱骂和攻击，这种羞辱让他感到⾮常痛苦。我深深地被这些可恨的⾏为和可怕的后果所触动。计算机科学带来了信息时代，社交⽹络改变了我们的⽣活，我们期望技术会让世界更美好。但没有什么是尽善尽美的。⽹络暴⼒是信息技术⽆意中带来的⼀个问题，我渴望找到⼀种⽅法来发现和控制它们。”

而目前对于网络暴力，目前已经有不少基于深度学习的网络欺凌模型。比如Instagram去年推出「增强版的评论过滤器」，通过对照片、文字的检测分析，对其中的恶意行为采取过滤等措施。、

Facebook和Twitter也推出了类似的举措来限制其平台上的欺凌行为。Twitter在去年十月制定了一个时间表，以便从其平台中删除裸露和仇恨图像等内容。去年Facebook添加了一些工具，允许用户一次隐藏或删除多条评论，并允许用户代表朋友或家人报告欺凌或骚扰。

科技的发展真实的改变着我们的生活，我们享受其便利、承受其弊端。而像白行健这样的年轻人将越来越早的进入改变世界的行列，用技术影响着我们。

看来未来不仅仅是「同辈压力」了，「后辈压力」也追着我们跑来了。毕竟当你还在拼命打排位的时候，高中生已经论文已经发起来了......

在这篇文章中，我们将仔细研究一个名为GCN的著名图神经网络。首先，我们先直观的了解一下它的工作原理，然后再深入了解它背后的数学原理。

字幕组双语原文：【GCN】图卷积网络(GCN)入门详解英语原文： Graph Convolutional Networks (GCN) 翻译：听风1996 、大表哥

许多问题的本质上都是图。在我们的世界里，我们看到很多数据都是图，比如分子、社交网络、论文引用网络。

图的例子。(图片来自[1])

在图中，我们有节点特征（代表节点的数据）和图的结构（表示节点如何连接）。

对于节点来说，我们可以很容易地得到每个节点的数据。但是当涉及到图的结构时，要从中提取有用的信息就不是一件容易的事情了。例如，如果2个节点彼此距离很近，我们是否应该将它们与其他对节点区别对待呢？高低度节点又该如何处理呢？其实，对于每一项具体的工作，仅仅是特征工程，即把图结构转换为我们的特征，就会消耗大量的时间和精力。

图上的特征工程。(图片来自[1])

如果能以某种方式同时得到图的节点特征和结构信息作为输入，让机器自己去判断哪些信息是有用的，那就更好了。

这也是为什么我们需要图表示学习的原因。

我们希望图能够自己学习 "特征工程"。(图片来自[1])

论文：基于图神经网络的半监督分类（2017）[3]

GCN是一种卷积神经网络，它可以直接在图上工作，并利用图的结构信息。

它解决的是对图（如引文网络）中的节点（如文档）进行分类的问题，其中仅有一小部分节点有标签（半监督学习）。

在Graphs上进行半监督学习的例子。有些节点没有标签（未知节点）。

就像"卷积"这个名字所指代的那样，这个想法来自于图像，之后引进到图（Graphs）中。然而，当图像有固定的结构时，图（Graphs）就复杂得多。

从图像到图形的卷积思想。 (图片来自[1])

GCN的基本思路：对于每个节点，我们从它的所有邻居节点处获取其特征信息，当然也包括它自身的特征。假设我们使用average()函数。我们将对所有的节点进行同样的操作。最后，我们将这些计算得到的平均值输入到神经网络中。

在下图中，我们有一个引文网络的简单实例。其中每个节点代表一篇研究论文，同时边代表的是引文。我们在这里有一个预处理步骤。在这里我们不使用原始论文作为特征，而是将论文转换成向量（通过使用NLP嵌入，例如tf-idf）。NLP嵌入，例如TF-IDF)。

让我们考虑下绿色节点。首先，我们得到它的所有邻居的特征值，包括自身节点，接着取平均值。最后通过神经网络返回一个结果向量并将此作为最终结果。

GCN的主要思想。我们以绿色节点为例。首先，我们取其所有邻居节点的平均值，包括自身节点。然后，将平均值通过神经网络。请注意，在GCN中，我们仅仅使用一个全连接层。在这个例子中，我们得到2维向量作为输出（全连接层的2个节点）。

在实际操作中，我们可以使用比average函数更复杂的聚合函数。我们还可以将更多的层叠加在一起，以获得更深的GCN。其中每一层的输出会被视为下一层的输入。

2层GCN的例子：第一层的输出是第二层的输入。同样，注意GCN中的神经网络仅仅是一个全连接层（图片来自[2]）。

让我们认真从数学角度看看它到底是如何起作用的。

首先，我们需要一些注解

我们考虑图G，如下图所示。

从图G中，我们有一个邻接矩阵A和一个度矩阵D。同时我们也有特征矩阵X。

那么我们怎样才能从邻居节点处得到每一个节点的特征值呢？解决方法就在于A和X的相乘。

看看邻接矩阵的第一行，我们看到节点A与节点E之间有连接，得到的矩阵第一行就是与A相连接的E节点的特征向量（如下图）。同理，得到的矩阵的第二行是D和E的特征向量之和，通过这个方法，我们可以得到所有邻居节点的向量之和。

计算 "和向量矩阵 "AX的第一行。

在问题（1）中，我们可以通过在A中增加一个单位矩阵I来解决，得到一个新的邻接矩阵Ã。

取lambda=1（使得节点本身的特征和邻居一样重要），我们就有Ã=A+I，注意，我们可以把lambda当做一个可训练的参数，但现在只要把lambda赋值为1就可以了，即使在论文中，lambda也只是简单的赋值为1。

通过给每个节点增加一个自循环，我们得到新的邻接矩阵

对于问题(2): 对于矩阵缩放，我们通常将矩阵乘以对角线矩阵。在当前的情况下，我们要取聚合特征的平均值，或者从数学角度上说，要根据节点度数对聚合向量矩阵ÃX进行缩放。直觉告诉我们这里用来缩放的对角矩阵是和度矩阵D̃有关的东西（为什么是D̃，而不是D？因为我们考虑的是新邻接矩阵Ã 的度矩阵D̃，而不再是A了）。

现在的问题变成了我们要如何对和向量进行缩放/归一化？换句话说：

我们如何将邻居的信息传递给特定节点？我们从我们的老朋友average开始。在这种情况下，D̃的逆矩阵（即，D̃^{-1}）就会用起作用。基本上，D̃的逆矩阵中的每个元素都是对角矩阵D中相应项的倒数。

例如，节点A的度数为2，所以我们将节点A的聚合向量乘以1/2，而节点E的度数为5，我们应该将E的聚合向量乘以1/5，以此类推。

因此，通过D̃取反和X的乘法，我们可以取所有邻居节点的特征向量（包括自身节点）的平均值。

到目前为止一切都很好。但是你可能会问加权平均()怎么样？直觉上，如果我们对高低度的节点区别对待，应该会更好。

但我们只是按行缩放，但忽略了对应的列（虚线框）。

为列增加一个新的缩放器。

新的缩放方法给我们提供了 "加权 "的平均值。我们在这里做的是给低度的节点加更多的权重，以减少高度节点的影响。这个加权平均的想法是，我们假设低度节点会对邻居节点产生更大的影响，而高度节点则会产生较低的影响，因为它们的影响力分散在太多的邻居节点上。

在节点B处聚合邻接节点特征时，我们为节点B本身分配最大的权重（度数为3），为节点E分配最小的权重（度数为5）。

因为我们归一化了两次，所以将"-1 "改为"-1/2"

例如，我们有一个多分类问题，有10个类，F 被设置为10。在第2层有了10个维度的向量后，我们将这些向量通过一个softmax函数进行预测。

Loss函数的计算方法很简单，就是通过对所有有标签的例子的交叉熵误差来计算，其中Y_{l}是有标签的节点的集合。

层数是指节点特征能够传输的最远距离。例如，在1层的GCN中，每个节点只能从其邻居那里获得信息。每个节点收集信息的过程是独立进行的，对所有节点来说都是在同一时间进行的。

当在第一层的基础上再叠加一层时，我们重复收集信息的过程，但这一次，邻居节点已经有了自己的邻居的信息（来自上一步）。这使得层数成为每个节点可以走的最大跳步。所以，这取决于我们认为一个节点应该从网络中获取多远的信息，我们可以为#layers设置一个合适的数字。但同样，在图中，通常我们不希望走得太远。设置为6-7跳，我们就几乎可以得到整个图，但是这就使得聚合的意义不大。

例：收集目标节点 i 的两层信息的过程

在论文中，作者还分别对浅层和深层的GCN进行了一些实验。在下图中，我们可以看到，使用2层或3层的模型可以得到最好的结果。此外，对于深层的GCN（超过7层），反而往往得到不好的性能（虚线蓝色）。一种解决方案是借助隐藏层之间的残余连接（紫色线）。

不同层数#的性能。图片来自论文[3]

论文作者的说明

该框架目前仅限于无向图（加权或不加权）。但是，可以通过将原始有向图表示为一个无向的两端图，并增加代表原始图中边的节点，来处理有向边和边特征。

对于GCN，我们似乎可以同时利用节点特征和图的结构。然而，如果图中的边有不同的类型呢？我们是否应该对每种关系进行不同的处理？在这种情况下如何聚合邻居节点？最近有哪些先进的方法？

在图专题的下一篇文章中，我们将研究一些更复杂的方法。

如何处理边的不同关系（兄弟、朋友、......）？

[1] Excellent slides on Graph Representation Learning by Jure Leskovec (Stanford):

[2] Video Graph Convolutional Networks (GCNs) made simple:

[3] Paper Semi-supervised Classification with Graph Convolutional Networks (2017):

[4] GCN source code:

[5] Demo with StellarGraph library:

雷锋字幕组是一个由AI爱好者组成的翻译团队，汇聚五五多位志愿者的力量，分享最新的海外AI资讯，交流关于人工智能技术领域的行业转变与技术创新的见解。

团队成员有大数据专家，算法工程师，图像处理工程师，产品经理，产品运营，IT咨询人，在校师生；志愿者们来自IBM，AVL，Adobe，阿里，百度等知名企业，北大，清华，港大，中科院，南卡罗莱纳大学，早稻田大学等海内外高校研究所。

如果，你也是位热爱分享的AI爱好者。欢迎与雷锋字幕组一起，学习新知，分享成长。

大数据的核心是数据智能。数据智能的本质是在大量样本中发现、评估若干概念之间的关联性，归纳形成数学表达，再利用数学表达进行推理运算，从而完成对未知样本的判断决策。这就需要发现海量数据背后的规律，解决数据表征问题。数据智能先后经历了专家系统、传统机器学习和神经网络三个阶段，输入的知识从具体到抽象，从规则到特征再到模式，越来越宏观，智能化处理效率越来越高，对底层的感知和模型的可解释性越来越弱化。随着专家系统逐渐淡出，传统机器学习和神经网络成为数据智能的两大常见技术。实践证明，随着数据集样本的增多，传统机器学习的性能不及神经网络（见图一）。这主要归结于前者的表达能力不如后者。Goodfellow在2013年ICML（国际机器学习大会）上发表了论文《MaxoutNetworks》（最大输出网络）。在这篇论文中证明了MaxoutNetworks能够无限逼近任意连续函数。也即是说，神经网络能够拟合任意连续函数，与传统机器学习相比，神经网络具有突出的表达能力优势。（上图）：横轴代表数据量，纵轴代表算法精度我们看到几个趋势：行业数据量指数级增长、以GPU为代表的专业芯片算力增长、新型算法层出不穷、学术界的前沿研究、投资界的资金投入、工商业的多种场景，这些因素都促进了神经网络快速发展。神经网络的发展形态有两种方向：一是以DNN深度全连接和CNN卷积神经网络为代表的纵向发展，即层数增多的纵向迭代，典型应用是CV计算机视觉；二是以RNN循环神经网络为代表的横向发展，即神经元之间的横向迭代，典型应用是以NLP自然语言理解为代表的序列处理。神经网络技术同时呈现两种发展形态，并在多个领域有广泛应用，就说明这个技术已经进入成熟期了。下一步往哪个方向发展？很有可能是：将纵向发展和横向发展进行结合，渗透到更多的应用领域。这看似顺水推舟的事情。事实证明，这个判断是正确的，图神经网络就是二者的结合。纵观技术圈的发展历史，可以总结出这样的事实：一个理论技术能否在更多的领域推广，关键取决于它能否真实地刻画现实世界的实体特征和关系。如果它刻画得越真实，那么它的应用场景就越多。比如马尔科夫链这个理论，就真实地刻画了现实世界中的时序对象的特征和依赖关系，因此它广泛应用在语音理解、机器翻译、国民经济、事件预测等领域；再如概率图理论，用图来表示事件概率的依存关系，也是真实刻画了现实世界中的实体关系，因此它也广泛应用在反欺诈、图像理解、事件预测等领域。从方法论看，要刻画现实世界的实体，就必须在模型中置入代表这个实体的节点，并且设计出实体之间的依赖关系转化。但无论是马尔科夫链还是概率图等方法，都弱化了嵌入表示，从而丢失了一些隐语义信息，是有缺憾的。图神经网络（GraphNeural Networks，GNN）的问世，使事情出现了转机。在图神经网络中，存在两种网络。一种是拓扑结构网络，通常描述众多实体及其关系；另一种是特征变换神经网络，通常用于节点、边、图或子图的特征转化。前者完成信息横向传播，实现图信号的拓扑关系传递，理论依据是图论；后者完成信息纵向传播，实现原始特征向嵌入表示的转化，理论依据是深度学习。图神经网络是图论与深度学习的完美结合，它既考虑了实体关系，又考虑了实体特征。与传统图方法和传统深度学习相比，图神经网络具有明显的优势：建模来源数据更充分，更能反映现实世界中实体之间的真实关系，它既能从图结构代表的非欧式空间数据中学习到语义表示，又能让学习到的语义表示最大限度地符合图结构的实体关系。现实世界中80%以上的数据更适合用图结构来刻画，比如交通数据、社交数据、分子结构数据、行业经济数据等。图神经网络能适应这样的数据，在分布式学习架构下，图神经网络能处理的数据规模非常庞大，非常适合处理数亿节点的产业数据。因此图神经网络的应用场景更为广泛。近三年来，各种国际顶会关于图神经网络的论文频频发布，众多互联网科技公司（如阿里、百度、字节跳动）花重金在这一领域布局，并取得重大进展，广泛应用于关联搜索、实时推荐、风险防控、异常检测、行为预测、模式识别等。这些现象无疑说明了图神经网络是未来技术发展的重要领域方向。综上所述，在行业数据、算法理论、算力支持、市场需求、资本涌入等背景下，图神经网络的迅速崛起是大数据时代发展的必然。

首页

> 学术期刊知识库

神经网络应用论文题目