hadoop就是基于Mapreduce框架的分布式平台,一般安装在Linex上面,也可以使用虚拟机在windows下使用。分布式程序可以在多台机器上生成多个节点,每个节点运行程序的一部分,然后合并起来,比单节点运行效率高很多。推荐本书《hadoop in action》(hadoop实战),还有论文可以看很多数据挖掘会议的论文,现在有很多人研究。我的毕业论文就是写这个
本科学位论文是侧重于动手能力的,所以称为毕业设计,大数据处理类的,如果真的去搭建云平台是稍微有些不太好做,毕竟咱们个人的计算机终端是不够的,所以我觉得侧重于大数据安全,有一些算法,简单仿真,或者基于hadoop对某个行业的数据进行下分析计算也是没问题,到实例部分其实你用数据挖掘的方法去做,结果差不多
大数据主要指的是软件开发,现在这个专业比较火,也就是说比较热门,因为现在是一个移动互联时代 ,找到客户的共同点,通过数据来分析,并且研究用户特点,可以起到事倍功半的作用。
大数据只是一个时代背景,具体内容可以班忙做
与大数据有关的当然可以做。
大数据(Big Data)又称为巨量资料,指需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。“大数据”概念最早由维克托·迈尔·舍恩伯格和肯尼斯·库克耶在编写《大数据时代》中提出,指不用随机分析法(抽样调查)的捷径,而是采用所有数据进行分析处理。大数据有4V特点,即Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)。
328 浏览 4 回答
144 浏览 2 回答
244 浏览 5 回答
302 浏览 4 回答
264 浏览 4 回答
265 浏览 3 回答
317 浏览 2 回答
165 浏览 6 回答
101 浏览 4 回答
107 浏览 6 回答
286 浏览 4 回答
350 浏览 2 回答
300 浏览 6 回答
158 浏览 6 回答
264 浏览 5 回答
127 浏览 5 回答
359 浏览 5 回答
190 浏览 3 回答
127 浏览 3 回答
220 浏览 5 回答
216 浏览 4 回答
337 浏览 4 回答
334 浏览 4 回答
158 浏览 8 回答