这个题目的确是有点超出本科生能力,因为数据聚类算法很多,都不是很容易实现,更不用说在效果,效率上的分析,而且绝大多数算法的优缺点早就总结过了,也很难创新,我专业是数据挖掘,我在研究生期间都不做这样的论文
传统时间序列聚类的缺点: 1)时间序列聚类的研究一般采用等长划分,会丢失重要特征点,对聚类结果有负面影响。 2)采用时间序列测量值不能准确度量相似度。 如下埃博拉出血热、卫生部在数值上很相似,但教育部和卫生部在形状更相似。若是以形状作为度量传统的欧氏距离可能就不太合适了。 不等长时间序列滑窗STS聚类算法: 1)通过标准分数z_score预处理,消除时间序列观测值数量级差异的影响。 2)更改了相似度计算的方式,采用基于滑窗的方法计算不等长序列的距离。 3)采用类k-means的聚类算法的中心曲线计算方法。 时间序列数据因其趋势信息的直观展现形式,广泛应用于社交网络、互联网搜索和新闻媒体数据分析中。例如:Google应用搜索流感的相关信息的时间序列预测流感爆发趋势。根据某话题热度时间序列数据趋势的规律性,通过聚类区分不同类型的时间序列数据。同一类簇的Twitter话题具有相同或相似的发展趋势,进而应用于话题的发展趋势的预测。 时间序列聚类算法可以分为两类。 1)基于原始数据的时间序列聚类算法。 2)基于特征的时间序列聚类算法。 基于特征的时间序列聚类算法指根据原始数据从时间序列中提取形态特征(极值点位置、分段斜率)、结构特征(平均值、方差等统计值特征)、模型特征(模型的预测值),从而根据这些特征值进行聚类。这类方法的优点解决了不等长时间序列聚类问题,缺点是减弱了原始数据值得影响,聚类的形状趋势信息往往比较粗糙。 3. HOW 一、距离度量公式 STS距离计算的是累加时间序列间每个时间间隔斜率差的平方,公式 如上图所示,g1、g2和g2、g3的欧式距离的数值更相近。g1、g2的STS距离大于g2、g3的数值。在形状距离上,STS距离计算方式表现更好,一定程度上可以解决欧式距离度量时间序列局部特征信息确实和受观测数值数量级差异影响大的问题,但是依旧无法度量不等长时间序列的距离。 基于滑窗的STS距离公式。 如上图所示,当计算不同长度的时间序列的s和r的距离时,先不断平移时间序列s,然后找到s和r距离最近的字段,就如同上图虚线之间的位置,此时s和r距离最近,这个最近距离作为s和r之间的距离。 二、预处理过程 z-score标准分数用数据观测值和观测值平均值的距离代替原观测值。z-score处理后的数据平均值为0,标准差为1。标准差的作用是统一量纲,去除数值的数量级差异影响。 总结 本论文提出了形状距离的不等长时间序列的聚类方法。我们可以学到的有 1)z-score统一量纲,消除数值数量级差异,聚类效果更好。 2)计算x和y时间序列的STS距离,可以平移其中一个时间序列,求最小值作为STS距离值,这就消除了同一时间序列不同起始点的影响。
[1]朱岑郁.国内户外音乐节运营问题研究[D].南京艺术学院2014
[2]左康秀.我国在线音乐产业的价值链[J].经营与管理.2014(06)
[3]孙武军,陆璐.交叉网络外部性与双边市场的倾斜式定价[J].中国经济问题.2013(06)
[4]余家辉.歌曲翻唱的版权问题研究[D].暨南大学2014
[5]李泉.双边市场价格理论及其产业应用研究[D].上海交通大学2008
[6]于霞.基于Hotelling模型的零售平台企业定价[J].统计与决策.2013(19)
[7]盛利.网络音乐有偿下载模式及其国内建设[J].音乐传播.2013(03)
[8]袁楠.天津大学“北洋合唱团”培养与训练的研究[D].曲阜师范大学2014
[9]徐天维.黄山市屯溪区民间音乐教育传承的可行性研究[D].南京艺术学院2014
[10]周加海.观第九届中国音乐金钟奖美声组比赛有感[D].河南大学2014
[11]武立强.山西交响乐演出市场调查与营销策略研究[D].河北师范大学2014
[12]尹隆.基于双边市场理论的媒体广告价格调整问题研究[J].北京工商大学学报(社会科学版).2013(05)
[13]王小芳,纪汉霖.双边市场的识别与界定:争论及最新进展[J].产业经济评论.2013(03)
[14]张鲁晶.大学生满意度模型构建与影响因素分析[D].首都经济贸易大学2010
[15]郑桂凤.移动互联网的用户行为分析系统的设计与实现[D].北京邮电大学2010
[16]张效辉.外商直接投资影响我国农业产业结构演变的机理研究[D].浙江财经学院2011
[17]刘文婷.以运营商为主导的移动互联网业务商业模式研究[D].北京邮电大学2009
[18]王娜仁图雅.浑善达克沙地草原畜牧业生产与气候关系初探[D].内蒙古师范大学2009
[19]侯琳琦,郑晓慧.三网融合带给中国数字音乐的机遇和挑战[J].人民音乐.2013(09)
[20]JeanJ.Gabszewicz,XavierY.Wauthy.Verticalproductdifferentiationandtwo-sidedmarkets[J].EconomicsLetters.2014(1)
[21]AtipAsvanund,KarenClay,RamayyaKrishnan,MichaelD.Smith.AnEmpiricalAnalysisofNetworkExternalitiesinPeer-to-PeerMusic-SharingNetworks[J].InformationSystemsResearch.2004(2)
[22]JAYPILCHOI.TYINGINTWO‐SIDEDMARKETSWITHMULTI‐HOMING[J].TheJournalofIndustrialEconomics.2010(3)
[1]房婷,蒋达.音乐可视化研究[J].电影评介.2013(05)
[2]付一超,张宏,林高雅,胡志强,赵瑞瑞.音乐播放中RGB-LED混光呈现匹配研究与实现[J].哈尔滨理工大学学报.2014(06)
[3]翟明超.浅谈色彩音乐的发展[J].大众文艺.2011(24)
[4]张宏,田春伟,林高雅,李小进,刘露.基于音频信号频谱分析的混合光效设计与实现[J].哈尔滨理工大学学报.2013(06)
[5]黄玉豪.STC89C58RD+单片机在MP3播放器设计中的应用[J].电子产品世界.2013(06)
[6]何谐.FAT32文件系统在Cortex-M3音乐播放器中的应用[J].单片机与嵌入式系统应用.2013(06)
[7]翁斌.嵌入式系统中USB总线的应用[J].电子质量.2013(01)
[8]Zoranovic,AleksandarL,Stojanovic,GoranM,Malbasa,VeljkoD.DevelopmentofanMP3playerusinganMP3hardwaredecoder[J].InternationalJournalofElectricalEngineeringEducation.2010(3)
[9]PeterG.Grossenbacher,ChristopherT.Lovelace.Mechanismsofsynesthesia:cognitiveandphysiologicalconstraints[J].TrendsinCognitiveSciences.2001(1)
[10]李书宇.WSN在农业温室监测系统中的应用[D].哈尔滨理工大学2013
[11]李欣欣.基于MPI的层次聚类算法的研究及实现[D].哈尔滨理工大学2012
[12]林钦.基于LotusDomino的办公自动化系统的设计与实现[D].福州大学2010
[13]张雪芳.浅谈音乐心理治疗[J].北方音乐.2011(11)
[14]张龙.基于S2SH+ExtJS的市级卫生防疫部门OA系统的设计与实现[D].福州大学2010
[15]胡远涛.基于中职学校“构、分、破、锁”的多边形建模和有关渲染技术的教学研究[D].西北师范大学2014
[16]符运河.基于AX2010解码芯片的嵌入式MP3播放系统的设计与实现[D].哈尔滨工业大学2012
[1]冯昕.智能手机美食应用信息设计研究[D].华东理工大学2015
[2]王兆,胡锦.从用户需求分析如何初步定义产品功能[J].艺术与设计(理论).2011(02)
[3]聂大安,李彦,麻广林,马涛.基于用户需求分类的同步多产品设计方法[J].计算机集成制造系统.2010(06)
[4]郁宁亚.LTE基站系统安全性算法及接口的FPGA设计与实现[D].武汉邮电科学研究院2015
[5]庄小芳.无线Mesh网络信道分配算法的研究[D].福州大学2011
[6]王昆鹏.基于文化因子的互联网产品满意度研究[D].浙江大学2011
[7]石曦.手持移动设备的界面设计模式和框架研究[D].北京服装学院2015
[8]熊子鉴.老年消费者高端养老消费意愿的影响因素研究[D].浙江工商大学2015
[9]陈颖.无线传感器网络自适应任务分配算法的研究[D].福州大学2011
[10]王钦.基于ZigBee无线传感器网络的研究与应用[D].福州大学2010
[11]周昱含.基于无线传感器网络的自适应压缩传感重构算法的研究[D].南开大学2013
[12]张沙沙.基于层次分析法的移动互联网产品可用性研究[D].北京邮电大学2010
[13]黄文涛.基于用户研究的互联网产品界面设计及评估[D].南京航空航天大学2013
[14]于晓燕.智能手机游戏界面设计研究[D].华东理工大学2015
[15]殷佳丽.基于情感化设计的儿童互联网产品界面视觉设计研究[D].苏州大学2014
[16]彭佳.基于用户体验的老年智能手机APP界面交互设计研究[D].华东理工大学2014
[17]赵文政.不同终端的互联网产品移植中的差异化设计研究[D].北京印刷学院2013
[18]程求江.基于NGID-DBSCAN算法与最小包围圆模型的基站位置分析[D].武汉邮电科学研究院2015
[19]聂波,王绪刚,王宏安,王纲.手持移动设备中多通道交互的通用开发框架[J].计算机应用研究.2007(09)
[20]CermakLS,WongBM.Theeffectsofdividedattentionduringencodingandretrievalonamnesicpatients'memoryperformance.Cortex;ajournaldevotedtothestudyofthenervoussystemandbehavior.1999
[21]GoodwinKim.Gettingfromresearchtopersonas:harnessingthepowerofdata..2002
模糊聚类分析和聚类分析只是数据处理的差别,就是模糊聚类是把输入的样本编程0~1之间的数,然后再进行运算,而聚类分析是把输入的样本变成0或者1,只是这两个数,然后计算。比较经典的就是zadeh的论文,你可以在google上搜索。然后中文的建议你看一下教材,看看离散数学和《模糊聚类分析及其应用》,西安电子科技大学出版的。要是需要文献,可以和我联系。
模糊聚类分析是聚类分析的一种。聚类分析按照不同的分类标准可以进行不同的分类。就好像人按照性别可以分成男人和女人,按照年龄可以分为老中青一样。聚类分析如果按照隶属度的取值范围可以分为两类,一类叫硬聚类算法,另一类就是模糊聚类算法。隶属度的概念是从模糊集理论里引申出来的。传统硬聚类算法隶属度只有两个值 0 和 1。 也就是说一个样本只能完全属于某一个类或者完全不属于某一个类。举个例子,把温度分为两类,大于10度为热,小于或者等于10度为冷,这就是典型的“硬隶属度”概念。 那么不论是5度 还是负100度都属于冷这个类,而不属于热这个类的。而模糊集里的隶属度是一个取值在[0 1]区间内的数。一个样本同时属于所有的类,但是通过隶属度的大小来区分其差异。比如5度,可能属于冷这类的隶属度值为0.7,而属于热这个类的值为0.3。这样做就比较合理,硬聚类也可以看做模糊聚类的一个特例。你说的动态模糊分析法我在文献里很少见到好像并不主流,似乎没有专门的这样一种典型聚类算法,可能是个别人根据自己需要设计并命名的一种针对模糊聚类的改进方法,这个不好说了就。我见过有把每个不同样本加权的,权值自己确定,这样就冠以“动态"二字,这都是作者自己起的。也有别的也叫”动态“的,可能也不一样,似乎都是个别人自己提出的。至于文献,你可以到中国知网搜索博士或者硕士毕业论文,有关模糊聚类为题目的,在第一章引言里面必然会有详细的介绍,或者联系我,我就是做这方面的。希望能对你有所帮助,给点分吧,打的挺累的。
With the continuous accumulation of electronic information, from how these massive effective in extracting information of interest to users of knowledge of data mining has now become an important research topic, and clustering as an important tool for data mining, data will be passed divided into several categories , Made similar types of data, as far as possible, and similar types of data Degree as possible, so as to tap in to that category, the implied knowledge model, and become a hotspot. This paper summarizes the data mining in the clustering algorithm, for clustering in the existing problems were summarized, and the future of the prospect.
这个题目的确是有点超出本科生能力,因为数据聚类算法很多,都不是很容易实现,更不用说在效果,效率上的分析,而且绝大多数算法的优缺点早就总结过了,也很难创新,我专业是数据挖掘,我在研究生期间都不做这样的论文
可以。聚类标准误是真实标准误的一致估计,因此毕业论文可以不加聚类标准误。毕业论文,也称作学位论文,是指作者为获得某种学位而撰写的研究报告或科学论文,是对自己在几年大学生活中所学到的知识的总结与运用。
童鞋你好!这个估计需要自己搜索了!网上基本很难找到免费给你服务的!我在这里给你点搜索国际上常用的外文数据库:----------------------------------------------------------❶ISI web of knowledge Engineering Village2❷Elsevier SDOL数据库 IEEE/IEE(IEL)❸EBSCOhost RSC英国皇家化学学会❹ACM美国计算机学会 ASCE美国土木工程师学会❺Springer电子期刊 WorldSciNet电子期刊全文库❻Nature周刊 NetLibrary电子图书❼ProQuest学位论文全文数据库❽国道外文专题数据库 CALIS西文期刊目次数据库❾推荐使用ISI web of knowledge Engineering Village2-----------------------------------------------------------中文翻译得自己做了,实在不成就谷歌翻译。弄完之后,自己阅读几遍弄顺了就成啦!学校以及老师都不会看这个东西的!外文翻译不是论文的主要内容!所以,很容易过去的!祝你好运!
聚类分析,亦称群分析或点分析,是研究多要素事物分类问题的数量方法。其基本原理是,根据样本自身的属性,用数学方法按照某些相似性或差异性指标,定量地确定样本之间的亲疏关系,并按亲疏关系的程度对样本进行聚类(徐建华,1994)。
聚类分析方法,应用在地下水中,是在各种指标和质量级别标准约束条件下,通过样品的各项指标监测值综合聚类,以判别地下水质量的级别。常见的聚类分析方法有系统聚类法、模糊聚类法和灰色聚类法等。
(一)系统聚类法
系统聚类法的主要步骤有:数据标准化、相似性统计量计算和聚类。
1.数据标准化
在聚类分析中,聚类要素的选择是十分重要的,它直接影响分类结果的准确性和可靠性。在地下水质量研究中,被聚类的对象常常是多个要素构成的。不同要素的数据差异可能很大,这会对分类结果产生影响。因此当分类要素的对象确定之后,在进行聚类分析之前,首先对聚类要素进行数据标准化处理。
假设把所考虑的水质分析点(G)作为聚类对象(有m个),用i表示(i=1,2,…,m);把影响水质的主要因素作为聚类指标(有n个),用j表示(j=1,2,…,n),它们所对应的要素数据可用表4-3给出。在聚类分析中,聚类要素的数据标准化的方法较多,一般采用标准差法和极差法。
表4-3 聚类对象与要素数据
对于第j个变量进行标准化,就是将xij变换为x′ij。
(1)总和标准化
区域地下水功能可持续性评价理论与方法研究
这种标准化方法所得的新数据x′ij满足
区域地下水功能可持续性评价理论与方法研究
(2)标准差标准化
区域地下水功能可持续性评价理论与方法研究
式中: ;
由这种标准化方法所得的新数据x′ij,各要素的平均值为0,标准差为1,即有
区域地下水功能可持续性评价理论与方法研究
(3)极差标准化
区域地下水功能可持续性评价理论与方法研究
经过这种标准化所得的新数据,各要素的极大值为1,极小值为0,其余的数值均在[0,1]闭区间内。
上述式中:xij为j变量实测值;xj为j变量的样本平均值;sj为样本标准差。
2.相似性统计量
系统聚类法要求给出一个能反映样品间相似程度的一个数字指标,需要找到能量度相似关系的统计量,这是系统聚类法的关键。
相似性统计量一般使用距离系数和相似系数进行计算。距离系数是把样品看成多维空间的点,用点间的距离来表示研究对象的紧密关系,距离越小,表明关系越密切。相似系数值表明样本和变量间的相似程度。
(1)距离系数
常采用欧几里得绝对距离,其中i样品与j样品距离dij为
区域地下水功能可持续性评价理论与方法研究
dij越小,表示i,j样品越相似。
(2)相似系数
常见的相似系数有夹角余弦和相关系数,计算公式为
1)夹角余弦
区域地下水功能可持续性评价理论与方法研究
在式(4-20)中:-1≤cosθij≤1。
2)相关系数
区域地下水功能可持续性评价理论与方法研究
式中:dij为i样品与j样品的欧几里得距离;cosθij为i样品与j样品的相似系数;rij为i样品与j样品的相关系数;xik为i样品第k个因子的实测值或标准化值;xjk为j样品第k个因子的实测值或标准化值; 为i样品第k个因子的均值, ; 为j样品第k个因子的均值, ;n为样品的数目;k为因子(变量)数。
3.聚类
在选定相似性统计量之后,根据计算结果构成距离或相似性系数矩阵(n×n),然后通过一定的方法把n个样品组合成不同等级的分类单位,对类进行并类,即将最相似的样品归为一组,然后,把次相似的样品归为分类级别较高的组。聚类主要有直接聚类法、距离聚类法(最短距离聚类法、最远距离聚类法)。
(1)直接聚类法
直接聚类法,是根据距离或相似系数矩阵的结构一次并类得到结果,是一种简便的聚类方法。它首先把各个分类对象单独视为一类,然后根据距离最小或相似系数最大的原则,依次选出一对分类对象,并成新类。如果一对分类对象正好属于已归的两类,则把这两类并为一类。每一次归并,都划去该对象所在的列与列序相同的行。经过n-1次把全部分类对象归为一类,最后根据归并的先后顺序作出聚类分析谱系图。
(2)距离聚类法
距离聚类法包括最短距离聚类法和最远距离聚类法。最短距离聚类法具有空间压缩性,而最远距离聚类法具有空间扩张性。这两种聚类方法关于类之间的距离计算可以用一个统一的公式表示:
区域地下水功能可持续性评价理论与方法研究
当γ=-0.5时,式(4-22)计算类之间的距离最短;当γ=0.5时,式(4-22)计算类之间的距离最远。
最短、最远距离法,是在原来的n×n距离矩阵的非对角元素中找出dpq=min(dij)或dpq=max(dij),把分类对象Gp和Gq归并为一新类Gr,然后按计算公式:
dpq=min(dpk,dqk)(k≠ p,q) (4-23)
dpq=max(dpk,dqk)(k≠ p,q) (4-24)
计算原来各类与新类之间的距离,这样就得到一个新的(n-1)阶的距离矩阵;再从新的距离矩阵中选出最小或最大的dij,把Gi和Gj归并成新类;再计算各类与新类的距离,直至各分类对象被归为一类为止。最后综合整个聚类过程,作出最短距离或最远距离聚类谱系图(图4-1)。
图4-1 地下水质量评价的聚类谱系图
(二)模糊聚类法
模糊聚类法是普通聚类方法的一种拓展,它是在聚类方法中引入模糊概念形成的。该方法评价地下水质量的主要步骤,包括数据标准化、标定和聚类3个方面(付雁鹏等,1987)。
1.数据标准化
在进行聚类过程中,由于所研究的各个变量绝对值不一样,所以直接使用原始数据进行计算就会突出绝对值大的变量,而降低绝对值小的变量作用,特别是在进行模糊聚类分析中,模糊运算要求必须将数据压缩在[0,1]之间。因此,模糊聚类计算的首要工作是解决数据标准化问题。数据标准化的方法见系统聚类分析法。
2.标定与聚类
所谓标定就是计算出被分类对象间的相似系数rij,从而确定论域集U上的模糊相似关系Rij。相似系数的求取,与系统聚类分析法相同。
聚类就是在已建立的模糊关系矩阵Rij上,给出不同的置信水平λ(λ∈[0,1])进行截取,进而得到不同的分类。
聚类方法较多,主要有基于模糊等价关系基础上的聚类与基于最大树的聚类。
(1)模糊等价关系方法
所谓模糊等价关系,是指具有自反性(rii=1)、对称性(rij=rji)与传递性(R·R⊆R)的模糊关系。
基于模糊等价关系的模糊聚类分析方法的基本思想是:由于模糊等价关系R是论域集U与自己的直积U×U上的一个模糊子集,因此可以对R进行分解,当用λ-水平对R作截集时,截得的U×U的普通子集Rλ就是U上的一个普通等价关系,也就是得到了关于U中被分类对象元素的一种。当λ由1下降到0时,所得的分类由细变粗,逐渐归并,从而形成一个动态聚类谱系图(徐建华,1994)。此类分析方法的具体步骤如下。
第一步:模糊相似关系的建立,即计算各分类对象之间相似性统计量。
第二步:将模糊相似关系R改造为模糊等价关系R′。模糊等价关系要求满足自反性、对称性与传递性。一般而言,模糊相似关系满足自反性和对称性,但不满足传递性。因此,需要采用传递闭合的性质将模糊相似关系改造为模糊等价关系。改造的方法是将相似关系R自乘,即
R2=R·R
R4=R2·R2
︙
这样计算下去,直到:R2k=Rk·Rk=Rk,则R′=Rk便是一个模糊等价关系。
第三步:在不同的截集水平下进行聚类。
(2)最大树聚类方法
基于最大树的模糊聚类分析方法的基本思路是:最大树是一个不包含回路的连通图(图4-2);选取λ水平对树枝进行截取,砍去权重低于λ 的枝,形成几个孤立的子树,每一棵子树就是一个类的集合。此类分析方法的具体步骤如下。
图4-2 最大聚类支撑树图
第一步:计算分类对象之间的模糊相似性统计量rij,构建最大树。
以所有被分类的对象为顶点,当两点间rij不等于0时,两点间可以用树干连接,这种连接是按rij从大到小的顺序依次进行的,从而构成最大树。
第二步:由最大树进行聚类分析。
选择某一λ值作截集,将树中小于λ值的树干砍断,使相连的结点构成一类,即子树,当λ由1到0时,所得到的分类由细变粗,各结点所代表的分类对象逐渐归并,从而形成一个动态聚类谱系图。
在聚类方法中,模糊聚类法比普通聚类法有较大的突破,简化了运算过程,使聚类法更易于掌握。
(三)灰色聚类法
灰色聚类是根据不同聚类指标所拥有的白化数,按几个灰类将聚类对象进行归纳,以判断该聚类对象属于哪一类。
灰色聚类应用于地下水水质评价中,是把所考虑的水质分析点作为聚类对象,用i表示(i=1,2,…,n);把影响水质的主要因素作为聚类指标,用j表示(j=1,2,…,m),把水质级别作为聚类灰数(灰类),用k表示(k=1,2,3)即一级、二级、三级3个灰类(罗定贵等,1995)。
灰色聚类的主要步骤:确定聚类白化数、确定各灰色白化函数fjk、求标定聚类权重ηjk、求聚类系数和按最大原则确定聚类对象分类。
1.确定聚类白化数
当各灰类白化数在数量上相差悬殊时,为保证各指标间的可比性与等效性,必须进行白化数的无量纲化处理。即给出第i个聚类对象中第j个聚类指标所拥有的白化数,i=1,2,…,n;j=1,2,…,m。
2.确定各灰色白化函数
建立满足各指标、级别区间为最大白化函数值(等于1),偏离此区间愈远,白化函数愈小(趋于0)的功效函数fij(x)。根据监测值Cki,可在图上(图4-3)解析出相应的白化函数值fjk(Cik),j=1,2,…,m;k=1,2,3。
3.求标定聚类权重
根据式(4-25),计算得出聚类权重ηjk的矩阵(n×m)。
区域地下水功能可持续性评价理论与方法研究
式中:ηjk为第j个指标对第k个灰类的权重;λjk为白化函数的阈值(根据标准浓度而定)。
图4-3 白化函数图
注:图4-3白化函数f(x)∈[0,1],具有下述特点:①平顶部分,表示该量的最佳程度。这部分的值为最佳值,即系数(权)为1,f(x)=max=1(峰值),x∈[x2,x3]。②白化函数是单调变化的,左边部分f(x)=L(x),单调增,x∈(x1,x2],称为白化的左支函数;右边部分f(x)=R(x),单调减,x∈[x3,x4),称为白化的右支函数。③白化函数左右支函数对称。④白化函数,为了简便,一般是直线。⑤白化函数的起点和终点,一般来说是人为凭经验确定。
4.求聚类系数
σik=∑fjk(dij)ηjk (4-26)
式中:σik为第i个聚类对象属于第k个灰类的系数,i=1,2,…,n;k=1,2,3。
5.按最大原则确定聚类对象分类
由σik构造聚类向量矩阵,行向量最大者,确定k样品属于j级对应的级别。
用灰色聚类方法进行地下水水质评价,能最大限度地避免因人为因素而造成的“失真、失效”现象。
聚类方法计算相对复杂,但是计算结果与地下水质量标准级别对应性明显,能够较全面反映地下水质量状况,也是较高层次定量研究地下水质量的重要方法。
1、聚类分析法是理想的多变量统计技术,主要有分层聚类法和迭代聚类法。 聚类分析也称群分析、点群分析,是研究分类的一种多元统计方法。 2、例如,我们可以根据各个银行网点的储蓄量、人力资源状况、营业面积、特色功能、网点级别、所处功能区域等因素情况,将网点分为几个等级,再比较各银行之间不同等级网点数量对比状况。
???????
需要计算机论文需要程序。计算机相关论文主要有算法类论文,系统类论文,网络类论文等几种。这些论文都集中在实现的具体功能和内容上,而计算机功能一般都是要编程实现,编程构成的就是程序,也就是说程序是计算机论文中的重要组成。
毕业论文是每位学生四年大学学习成绩的体现,同时也是检验教师教学效果和教学工作的重要一环, 因此,各位指导教师和学生要引起高度重视。 要彻底改变以前那种只有少数人参加答辩,其余的论文全部通过的局面。 此次我系所有的95年级学生都要参加答辩,对于答辩效果差的要重新答辩,以致于延迟毕业。 2、系里不定期将抽查学生毕业论文的进度和教师指导情况并通报全系。 3、每位学生要独立完成论文,对于两个或两个以上的学生共同完成一个论文题目的, 要求每个学生要完成一部分,否则不予通过。 4、论文最后上交日期为:6月18日。无特殊理由,延迟上交者,不予以答辩,一切责任自负。 5、上交毕业论文时,要上交存放有论文涉及到的软件、文档、图片等一切和论文有关文件的 磁盘和论文文档(格式见后),系里在论文答辩后,在公布最后成绩前要指派专人检查这些文档、 有关的程序等。有出入或信息不全的要在最后的成绩中适当扣除。 6、论文答辩日期:1999年6月21日-6月25日,具体时间和答辩顺序另定。 7、论文书写格式。 论文全部要采用word 7来书写,文件名统一为“report95´ ´ .doc”,其中´ ´ 代表自己的学号。 学位论文一般应包括下述几部分: 论文首页格式如图所示: 1. 其中学位论文题目用黑体二号字,其余用宋体四号字 2. 论文题目应能概括整个论文最重要的内容,简明、恰当,一般不超过25个字。 中文摘要及其关键词(宋体5号字b5排版): 3. 论文第二页为500字左右的中文内容摘要,应说明本论文的目的、研究方法、成果和结论。 学位论文摘要是学位论文的缩影,尽可能保留原论文的基本信息,突出论文的创造性成果和 4. 新见解。论文摘要应尽量深入浅出,通俗易懂,少用公式字母,语言力求精炼、准确。 在本页的最下方另起一行,注明本文的关键词3╠5个。 5. 英文摘要及其关键词(宋体5号字b5排版): 论文第三页为英文摘要,内容与中文摘要和关键词相同
又是一年一度毕业季,前阵子经常有一些师弟来问我,毕设选题应该怎么选,毕业论文应该怎么写,感觉大家都挺迷茫的,那我就跟大家稍微分享一下我自己的经验吧。首先声明,此文章针对小白,为那些没有写过论文并且不知道如何下手的同学,大神莫喷哈。关于计算机基础薄弱的同学如何快速的写一篇毕业论文,我个人的建议是:做工程性的毕业设计和论文,别选算法类型的论文,并不是因为算法文章不好水过去,其实算法的文章也非常好水过去,但是有风险,当你做的非常水的时候,例如直接从github摘抄一个算法然后把算法的公式哔哩吧啦讲了一遍,老师都是一眼就看明白的,他想放过你可以让你过,但是假设他心情不好或者跟你关系一般想要为难你,那就比较难搞了。而且选一个算法方向的毕业设计并且水过去的话,对你本身来说是没有任何帮助的。那选择工程性的毕业设计和论文有什么好处呢?1.真的可以学的到东西,对于大部分想找开发岗位的同学的就业来说也是有帮助了。2.文章比较好写,逻辑非常明确,不用担心凑不到字数。说了这么多,下面就来讲如何写一篇关于计算机的论文(工程性的设计)。首先是选题,一般老师都会提供若干个选题给你选,其中必然包括几个“XX系统的设计与开发”,这样的选题就是符合我们前面的假设和预想的。盘他!假设我现在选了一个题目是“基于SSM的XX网上商城的设计与开发”。选完题目就面临着一个问题:是先做开发还是先写文章,或者是一边写一边开发。我的建议是一边写一边开发。原因是:开发的过程是需要写一些文案的,比如需求分析、数据库的表结构的关系、整个系统的交互逻辑等等。而这些文案是可以出现在我们的论文当中的。那接下来就说一下如何开发和写文论,当然某些开发过程我只能粗略的说一下。1.摘要:这是所有论文的第一个小title,说他恶心有时候也恶心,说他简单也是蛮简单的。那么这一部分究竟是要写什么的?由于这一部分需要展现出做这个系统的必要性、开发这个系统的实现方式、系统的功能和系统的作用。所以可以这样写:随着中国经济的高速发展以及网络技术的普及,互联网的技术得到全面的发展,中国的各行各业都在互联网的影响下发生了变革。互联网的快速发展催生了许多产业,其中最具代表性的便是电子商务,电子商务使得企业和客户的营销关系由实体店销售准换为网络电子商务营销。马云曾说:“让天底下没有难做的生意”,越来越多的店家选择在网上开店,使得交易不再限制于天南地北,同时也大大降低了店家的经营成本,在提高收益的同时,也方便了客户,本课题正式在这种背景下应运而生。本课题介绍了“基于SSM的XX网上商城”的开发环境、需求分析、界面设计和数据库设计以及涉及到的框架。本系统采用了B/S架构,使用了Java、HTML、JS等语言,使用了主流的后台开发框架SSM(spring+springMVC+Mybatis),以及采用了开源的轻量级数据库Mysql进行开发,为网络商城提供了前端展示和后台管理的模块,实现了注册、登录以及购物等主要功能,为消费者提供了便捷快速的购物体验,以及为提高了店家的销售效率。关键字:网上商城,SSM,Java,HTML,JS,MySQL(关键字一般就是把摘要中提及到的关键性技术提取出来,让阅读者一目了然,知道哪些是重点)Abstract:......(英文摘要建议谷歌翻译,然后把明显错误的地方修改一下即可)2.第一章:引言这一部分也是比虚的,其实随便扯一扯就可以了,一般包含以下几部分1.背景2.研究内容。其中背景主要讲一些关于社会发展的趋势导致了一些什么问题,而这些问题又应该如何去解决,多说几句,写到两三百字即可。研究内容就是针对上述的背景我们如何进行改进。细心的同学可能会说,感觉跟摘要有些重复。是的!这两部分内容其实是挺重复的,但是没关系,不过不要使用完完全全一样的话去描述,因为最后论文查重的时候会对文章自引用进行查重的。这一部分也是三五百字即可。3.第二章:系统的开发技术介绍这一部分是需要我们在正式开发之前做好的技术调研,然后对这一部分的技术进行详细的介绍。这一部分我不可能细讲,因为内容太多了,而且对于不同的项目有不同的内容,在查阅资料的过程也是提升技术的一个重要的环节,你可以真真切切的了解到开发一个工程是需要哪方面的知识,因此我就对我所选的这个课题应该使用到的技术栈进行一下介绍,也算是抛砖引玉,各位同学可以根据自己的实际情况进行撰写。开发不同的系统虽然涉及到的业务逻辑不同,处理方式也千差万别,但是本质上都是一样的,都是前端界面通过服务器跟数据库进行数据交互的一个过程,涉及到的内容也无非就是前端、后台和服务器。但是有一个需要注意的点,就是不要把HTML、JAVA等使用的语言介绍也给堆在这里,老师没细看还好,细看还是会显得太水字数了,记住,写工程性的课题不怕没字数。那问题来了,语言介绍不给写那应该些什么呢?应该写涉及到的框架、使用的工具。这些就够了,随随便便就几千字了。下面举例简单说明一下。a. 前端强调一下,不要把HTML、CSS等一下前端的规范展开来写,可以轻描淡写,但篇幅不能过多。这里可以写前端框架的使用,比如使用npm管理包(可以介绍一下npm以及在工程中的使用)、vue的使用(同样可以介绍vue框架以及应用)、element(element以及使用他的好处)等等。也希望同学在做毕设的过程中要真的去了解这些技术并且去使用它,相信我,看完再去用你的技术会有质的飞跃。b. 后台这一部分是重点,对于本课题来说,标题就写了是基于SSM的。对于这个java框架并不熟悉的同学来说建议先去查一下资料,而且很多同学会有疑问,使用技术框架的目的就是为了让开发更加的便捷和快速,但是为什么我们自己在开发的过程中会感觉好像变得更加复杂?很负责任的告诉你,是正常的。因为框架不仅会帮我们封装好一些常用的方法,而且会考虑到更新迭代以及代码可读性等等的一系列的问题,某些规定和配置我们之所以没有感受到他的好处是因为这种校园内的开发并不涉及生产问题,也不会有很多的更新迭代,更加不会考虑到代码的可读性。例如spring的工厂,一开始使用的时候很多同学会觉得为什么我new一个类的时候还要去改配置文件,直接new不香吗?直接new是很香,但是你考虑到真正去工作的时候,假设你要改类的一些关系的时候,还要去改代码,当工程一大,代码去哪里找呢?一个一个文件看吗?显然是非常不可取的,效率非常低,这个时候配置文件的优势就发挥出来了,直接修改配置文件,不需要更改代码,耦合性也大大的降低。好像跑题了,说了这么多就告诉同学们,要沉住气,理解框架这样设计背后的原因,对大家自身技术的提高非常的有帮助!那这一部分我们就可以介绍spring(包括spring的IOC、spring的工厂、spring的AOP等等,并且可以在论文中强调如何应用到我们的系统当中)、springMVC(这一部分可以讲解srpingMVC作为一个连接前端和数据库的工具在实际工作过程中的具体流程,也可以讲述springMVC的分层的概念以及如何应用)、Mybatis(包括跟JDBC的关系、mybatis依赖的配置、使用到的接口、动态代理、一级缓存和二级缓存以及延迟加载等等的一些技术问题)c. 服务器和数据库这一部分可以介绍一下用来搭建服务器的工具和所使用的数据库。假设你是使用了云服务器来搭建了,可以详细介绍一下云服务器的搭建过程包括防火墙、端口等等内容。一般服务器使用tomcat进行搭建,可以把tomcat介绍一下并且介绍一下tomcat是如何监听和解析用户请求的具体流程。一般小型的项目采用MySQL作为数据库,可以详细说一下选择MySQL的原因,比如相对于Oracle的好处。可以介绍一下MySQL数据库的一些特点包括分页、是否支持事务等等。4.第三章:需求分析这一部分是针对具体的业务场景来分析需要开发哪些功能,这一部分可以让你感受一下产品经理的职责,只不过不需要跟程序员对接,因为你自己就是程序员哈哈。一般来说分成两部分就可以了,一部分是对于前端的业务流程,另一部分就是后台服务器的业务流程,可以使用一些软件来绘画流程图,想图个方便可以直接使用word自带的图形进行编写,也不至于难看,就比较简约。想做的好看点的话个人推荐使用xmind,非常简单,可以快速做出美观的流程图。如果没有什么思路,那前端就按照着使用者的逻辑去写,比如用户需要注册、登录、找回密码、购物、退货等操作,那后端就对应着这些前端逻辑需要有相应的业务处理。个人感觉这一部分比较好写,就不再赘述。5.第四章:系统的设计和实现这一部分可以挑选一些有代表性的功能出来细讲,有些同学可能会有疑问,论文可不可以贴代码呢?答案是可以的。但是我个人的建议是贴伪代码,不要把你写的长篇大论的代码全部放进去,不好看而且逻辑混乱,应该做的是把代码抽取为伪代码,贴代码的目的是为了让阅读者清晰地读懂你是如何实现这个功能的,他并不会在意你的语法你的命名。下面列举若干个可以写的内容,并不限于此。a. SSM框架的整合。如何使用Spring来整合并且管理SpringMVC和Mybatis.b. 客户登录状态保存的实现。这一部分可能会涉及到cookies,sessions以及http报文解析等等,都可以详解。c. 后台商品管理的功能。这一部分可以根据管理员的后台管理功能进行描写。d. 商品搜索功能。可以涉及到数据库的模糊搜索。e. 数据库表格的设计。可以体现数据库表格设计的时候如何遵守三范式。f. 可以写在开发过程中遇到的一些疑难杂症。g. 可以写开发过程中使用到的一些比较具有亮点的语言特性。比如java的多线程、lambda表达式。又比如实现注册功能的时候使用的正则表达式。……等等数不胜数。6.第五章:运行结果这一部分非常好写了。截取一些关于你的系统的界面并且介绍一下功能,尽量说详细点,就ok了。7.第六章:总结以及展望这一部分也是比较水的一部分,但是也希望同学们认真写一写。可以写一下你开发这个项目的过程中学习到了什么,可以是XX技术,也可以是艰苦奋斗的精神……。展望可以写有望发展成另外一个淘宝……开玩笑开玩笑,总之劈里啪啦凑个几百字即可。8.参考文献把你开发过程中参考过的文章、论文贴进去之后,往往会发现参考文献不够,太少了!那怎么办呢?那就贴一些关于使用的技术的文章或者参考手册咯,虽然大部分是没看过的,但是还是希望大家可以多少看一看(正义之气跃然纸上)。去知网查找参考文章然后添加到你的参考文献是非常方便的,只需要找到对应的文章并且选择“引用”功能,即可自动生成引用的文字,直接复制到你的论文中。9.致谢第一步,感谢你的导师,感谢你的院领导,感谢你的校领导。说的好听后可能答辩的时候不会太为难你……然后你要感谢你的家人你的舍友你的朋友或者是你家的狗(开玩笑),都可以的,这一部分又轻轻松松两百字。至此,一篇论文就写完了,是不是觉得挺简单的呢?呸!简单个鬼,明明就这么多字,还要看这么多资料,还要自己写代码。确实,要认真完成不是一件简单的事情。但是我前面强调过了,这是针对那些基础一般但是想学东西的同学。当你独自完成这个课题后,你会发现自己的东西简直太多太多了。而且春招即将来临,许多问题在你面试的过程中也会遇到,而且也不至于跟面试官说我什么项目都没做过……