这个论文列表并不全,有些不是特别重要的论文就不列出来了。本文的内容以2012年的VLDBJournal论文为基础。Cosmos作为一个大数据解决方案,就像其他任何的大数据系统一样,有自己的存储,执行和语言系统。对应于Hadoop来说就是HDFS,HadoopMapReduce,Hive/Pig.
Spark,当前大数据领域最活跃的开源项目。好几个人想让我写写Spark了,说实话我觉得对Spark来说有点难写。Spark的论文我倒多半读过,但是Spark的系统就没怎么用过了。所以以一个没有实际使用经验的人去写这样一个当红的系统,我也不知道楼会歪到哪里
不可否认,大数据伊始,主要是因为Google这个公司。更加确切的说,不仅仅是因为Google的一系列的论文,更是因为Google以自己的一年又一年的财报告诉大家,免费的消费者们,结合大数据的技术,做成广告平台,就像开了印钞机一样。
大数据那些事(36):后记任何事物总有结束的时候。大数据这个系列到这里我就打算结束了。从最初开始写这个系列到现在也小半年了。时间之长远远超出了自己原来的预算。大约一个月之前的时候我…
最近一直没更新,不是因为懒,而是要学的东西太多了,时间全用来学大数据的技术栈了,见谅。言归正传,这篇科普文章就给大家讲讲大数据的技术栈和生态圈,让大数据不再神秘!何谓大数据?大数据的Wiki英文
在数据库领域里面,通常SIGMOD和VLDB算是公认第一档次,ICDE则是给牛人接纳那些被SIGMODVLDB抛弃的论文的收容所,勉强1.5吧,而且有日渐没落的趋势。至于其他的会议很多只能是二三流了,二三流在很多人,尤其是所谓的没有Tenure的AssistantProfessor的眼里,就和不入流没区别了。
自从“大数据”这个名词在几年前正式进入了人们的视野后,仿佛一夜间各行各业都充斥着它的身影,就连学生群体写毕业论文也出现了大量的“大数据”话题,那么,学生们都在研究一些大数据的什么内容呢?由于本科生的毕业论文基本都是直接交给学校,基本不存在对外发表的可能性,所以...
要谈大数据时代的利与弊,首先要认清楚大数据的本质,只有统一了对大数据的认知,才能区分那些事大数据,那些是打着大数据的幌子在做事。.在此基础上,以下是我个人对大数据的认知。.大数据可以分为两类,一类是硬储存数据,用现实社会类比,这一类...
大数据那些事(2):三驾马车之永垂不朽的GFS.但凡是要开始讲大数据的,都绕不开最初的Google三驾马车:GoogleFileSystem(GFS),MapReduce,BigTable。.如果我们拉长时间轴到20年为一个周期来看呢,这三驾马车到今天的影响力其实已然不同。.MapReduce作为一个有很多...
大数据那些事(33):SparkSQL.2018-04-07.2018-04-0719:59:22.阅读4370.SparkSQL是Spark新推出来的一个模块。.关于SparkSQL的八卦其实知道的不多,但是技术上倒能说几句。.早先我文章提到了Shark是个失败的作品。.这个观点从Shark出来不久我就这样觉得了。.SparkSQL的论文...
这个论文列表并不全,有些不是特别重要的论文就不列出来了。本文的内容以2012年的VLDBJournal论文为基础。Cosmos作为一个大数据解决方案,就像其他任何的大数据系统一样,有自己的存储,执行和语言系统。对应于Hadoop来说就是HDFS,HadoopMapReduce,Hive/Pig.
Spark,当前大数据领域最活跃的开源项目。好几个人想让我写写Spark了,说实话我觉得对Spark来说有点难写。Spark的论文我倒多半读过,但是Spark的系统就没怎么用过了。所以以一个没有实际使用经验的人去写这样一个当红的系统,我也不知道楼会歪到哪里
不可否认,大数据伊始,主要是因为Google这个公司。更加确切的说,不仅仅是因为Google的一系列的论文,更是因为Google以自己的一年又一年的财报告诉大家,免费的消费者们,结合大数据的技术,做成广告平台,就像开了印钞机一样。
大数据那些事(36):后记任何事物总有结束的时候。大数据这个系列到这里我就打算结束了。从最初开始写这个系列到现在也小半年了。时间之长远远超出了自己原来的预算。大约一个月之前的时候我…
最近一直没更新,不是因为懒,而是要学的东西太多了,时间全用来学大数据的技术栈了,见谅。言归正传,这篇科普文章就给大家讲讲大数据的技术栈和生态圈,让大数据不再神秘!何谓大数据?大数据的Wiki英文
在数据库领域里面,通常SIGMOD和VLDB算是公认第一档次,ICDE则是给牛人接纳那些被SIGMODVLDB抛弃的论文的收容所,勉强1.5吧,而且有日渐没落的趋势。至于其他的会议很多只能是二三流了,二三流在很多人,尤其是所谓的没有Tenure的AssistantProfessor的眼里,就和不入流没区别了。
自从“大数据”这个名词在几年前正式进入了人们的视野后,仿佛一夜间各行各业都充斥着它的身影,就连学生群体写毕业论文也出现了大量的“大数据”话题,那么,学生们都在研究一些大数据的什么内容呢?由于本科生的毕业论文基本都是直接交给学校,基本不存在对外发表的可能性,所以...
要谈大数据时代的利与弊,首先要认清楚大数据的本质,只有统一了对大数据的认知,才能区分那些事大数据,那些是打着大数据的幌子在做事。.在此基础上,以下是我个人对大数据的认知。.大数据可以分为两类,一类是硬储存数据,用现实社会类比,这一类...
大数据那些事(2):三驾马车之永垂不朽的GFS.但凡是要开始讲大数据的,都绕不开最初的Google三驾马车:GoogleFileSystem(GFS),MapReduce,BigTable。.如果我们拉长时间轴到20年为一个周期来看呢,这三驾马车到今天的影响力其实已然不同。.MapReduce作为一个有很多...
大数据那些事(33):SparkSQL.2018-04-07.2018-04-0719:59:22.阅读4370.SparkSQL是Spark新推出来的一个模块。.关于SparkSQL的八卦其实知道的不多,但是技术上倒能说几句。.早先我文章提到了Shark是个失败的作品。.这个观点从Shark出来不久我就这样觉得了。.SparkSQL的论文...