孙远帅.基于大数据的推荐算法研究[D].厦门大学,2014.读的一篇论文的总结总览基于项目层次结构的推荐算法,并结合Hadoop技术实现矩阵分解算法。改进均衡相似度的余弦距离和皮尔逊相关系数的计算公式,避免计算目标用户与所有用户的像素度,从而避免了在整个用户空间中搜索最相近的k个用户...
最新博士论文—《面向大数据的聚类算法研究》摘要第1-6页abstract第6-12页第一章绪论第12-22页1.1研究背景及意义第12-13页
大数据挖掘中的并行算法研究及应用.谢欢.【摘要】:随着大数据时代的到来,信息已经出现式的增长,如何从海量数据中挖掘出有效的信息,是我们面临的难题。.传统的数据挖掘算法在面对大数据的时候,就显得无能为力。.利用集群并行计算的能力,在多台...
因此,研究大数据环境下的机器学习算法成为学术界和产业界共同关注的话题。文中主要分析和总结当前用于处理大数据的机器学习算法的研究现状。此外,并行是处理大数据的主流方法,因此介绍一些并行算法,并引出大数据环境下机器学习研究所面临的问题。最后
大数据下的在线机器学习算法研究与应用-随着信息技术的快速发展,大数据中蕴含的价值愈发受到关注,如何对大数据进行高效的分析成为了一个重要的课题。机器学习是进行数据分析的常用方法之一,传统的机器...
本文是一篇计算机论文,本文针对数据的大规模性、高维性、混合性、复杂性等特点,采用抽样、子空间聚类、聚类集成、图压缩等技术系统地开展了聚类分析模型与算法的研究.
最后,基于Hadoop大数据处理框架研究用户行为预处理以及推荐算法的并行化方法,完成搜索引擎下图书的个性化推荐系统的设计与实现。.通过引入Hadoop大数据处理平台,设计并行化的推荐算法,系统处理海量数据的能力有很大提升。.通过基于潜在语义分析...
大数据清洗算法研究与系统平台搭建.耿昭阳.【摘要】:数据清洗一直是数据分析和数据挖掘领域的一个重要问题,特别在信息快速增长的时代,每天会产生大量的数据,数据的海量性与数据质量的复杂性一直是数据分析与数据挖掘工程师所面临的挑战。.随着互联...
通过实验结果证明,使用MOOC隐式评分模型可以提高传统推荐算法在MOOC应用中的推荐准确率。.(3)设计基于大数据平台的MOOC推荐系统以便于应对当今互联网的大数据环境。.该系统根据大数据MOOC应用的业务特点分为六个模块,每个模块都采用微服务架构实现,方便...
基于数据流模型的频繁模式挖掘算法,利用“小图”数据本身具有的并发性,采用流水方式[29],不但有效地提高了处理的并发度,而且极大地提升了能够处理的图数据的规模.算法可以使用Spark[30]或者Flink[27]等通用的大数据处理,
孙远帅.基于大数据的推荐算法研究[D].厦门大学,2014.读的一篇论文的总结总览基于项目层次结构的推荐算法,并结合Hadoop技术实现矩阵分解算法。改进均衡相似度的余弦距离和皮尔逊相关系数的计算公式,避免计算目标用户与所有用户的像素度,从而避免了在整个用户空间中搜索最相近的k个用户...
最新博士论文—《面向大数据的聚类算法研究》摘要第1-6页abstract第6-12页第一章绪论第12-22页1.1研究背景及意义第12-13页
大数据挖掘中的并行算法研究及应用.谢欢.【摘要】:随着大数据时代的到来,信息已经出现式的增长,如何从海量数据中挖掘出有效的信息,是我们面临的难题。.传统的数据挖掘算法在面对大数据的时候,就显得无能为力。.利用集群并行计算的能力,在多台...
因此,研究大数据环境下的机器学习算法成为学术界和产业界共同关注的话题。文中主要分析和总结当前用于处理大数据的机器学习算法的研究现状。此外,并行是处理大数据的主流方法,因此介绍一些并行算法,并引出大数据环境下机器学习研究所面临的问题。最后
大数据下的在线机器学习算法研究与应用-随着信息技术的快速发展,大数据中蕴含的价值愈发受到关注,如何对大数据进行高效的分析成为了一个重要的课题。机器学习是进行数据分析的常用方法之一,传统的机器...
本文是一篇计算机论文,本文针对数据的大规模性、高维性、混合性、复杂性等特点,采用抽样、子空间聚类、聚类集成、图压缩等技术系统地开展了聚类分析模型与算法的研究.
最后,基于Hadoop大数据处理框架研究用户行为预处理以及推荐算法的并行化方法,完成搜索引擎下图书的个性化推荐系统的设计与实现。.通过引入Hadoop大数据处理平台,设计并行化的推荐算法,系统处理海量数据的能力有很大提升。.通过基于潜在语义分析...
大数据清洗算法研究与系统平台搭建.耿昭阳.【摘要】:数据清洗一直是数据分析和数据挖掘领域的一个重要问题,特别在信息快速增长的时代,每天会产生大量的数据,数据的海量性与数据质量的复杂性一直是数据分析与数据挖掘工程师所面临的挑战。.随着互联...
通过实验结果证明,使用MOOC隐式评分模型可以提高传统推荐算法在MOOC应用中的推荐准确率。.(3)设计基于大数据平台的MOOC推荐系统以便于应对当今互联网的大数据环境。.该系统根据大数据MOOC应用的业务特点分为六个模块,每个模块都采用微服务架构实现,方便...
基于数据流模型的频繁模式挖掘算法,利用“小图”数据本身具有的并发性,采用流水方式[29],不但有效地提高了处理的并发度,而且极大地提升了能够处理的图数据的规模.算法可以使用Spark[30]或者Flink[27]等通用的大数据处理,