差距如下:知网和万方是两个完全不一样的数据库,所收录的期刊和论文也都不一样知网和万方分别是两个数据库,他们所收录的期刊都是不一样的,所以,相应的论文也有非常大的区别,相对来说,中国知网更加权威,收录的各种期刊都是正规期刊,当然,万方也有不少的数据库
1.专业期刊:复印资料,文学遗产,文学评论,文史知识,古典文学知识,国学研究,文艺理论研究,文艺评论,中国韵文学刊,中国文学研究,文史,文史哲。明清小说研究,红楼梦学刊,名作欣赏。2.社会科学:北京社会科学,甘肃社会科学,广东社会科学,广西社会科学,贵州社会科学,湖北社会科学,江苏社会科学,江西社会科学,内蒙古社会科学,新疆,云南社会科学,社会科学,宁夏,青海,北方论丛,东南学术,东岳论丛,福建论坛,湖湘论坛,晋阳学刊,兰州学刊,岭南学刊,鄱阳湖学刊,齐鲁学刊,社会科学论坛,唐都学刊,天府新论,天中学刊,殷都学刊,阴山学刊,云梦学刊,中州学刊3.大学学报安徽大学学报 ,安徽师大,安庆师院,北华,北大,北师大,渤海,长安,长春,长春师大,成都,成都师大,重庆大学,重庆师大,重庆第二师院,东北大学,东北师大,东南大学,广西师大,贵州,赣南师院,广东第二师院,福建师大,福州大学,复旦,贵州师大,杭州师大,海南,海南师大,合肥师院,河北,河北联合大学,河北师大,河南,华东师大,华南师大,河南教育,河南师大,衡阳师院,湖北,湖南师大,华中师大,淮阴,惠州,吉师大,吉首,集美,济南,暨南,佳木斯,江汉大学,江汉学术,江南,江苏第二师院,江苏,江苏师大,江西师大,喀什,开封,兰州,辽师大,聊城,鲁东,洛阳师院,牡丹江师院,南昌大学,南开,内蒙,内蒙师大,宁波,宁夏,南大,南师大文学,齐齐哈尔,青海师大,清华,三峡,山东师大,山西师大,陕西师范大学,汕头,商丘,上海大学,上海师大,深圳,沈阳师大,首师大,四川,四川师大,苏州,太原师范学院,天津师大,同济,温州,五邑,武陵,武大,厦门大学,西北大学,西北师大,西华,新疆师大,信阳师院,湘潭,烟台,燕山,扬州,云大,云师大,社科院,中南大学,中南民大,中山,人大,浙大,浙师大,郑州。
1.有没有关于学习古代文学的app 古代文学全国排前十的,尤其是985院校,难度不小。 我就是学中文的,红楼梦读过很多遍老实说用来应付古代文学考研是远远不够的,我们有同学在高中都能把红楼梦里的句子诗词信手拈来的,而且红楼梦实际上并不算文言了,是白话小说啦。 读古文障碍很多,这是个大问题,所以你得把基础打好再说,郭锡良版的《古代汉语》或是王力版可以好好学习一下的,都是经典教材,很多学校也把他们列为专业书的。 报考古代文学需要细分的,每个方向考试都不一样,看你的兴趣在哪儿,考的内容每个学校也都不一样。考研参考书也根据学校不同而不同。我觉得你现在最好先把《古代汉语》和高教版袁行霈的《中国文学史》(四本)学习了再说,看看自己能到一个什么程度,再确定学校,确定方向,买教材复习。你08级,时间要抓紧啊。另外补充一点,很多人说文学研究生很好考,其实没那么简单,相比数学那种理性的东西,文学要感性得多,思维方式的转变很重要。我也是08级的,学中文到现在觉得学文学有兴趣很重要,但光凭兴趣远远不够,勤奋需要,天赋也很重要。 报考中国古代文学的研究生,你首先要明确自己想上哪个具体专业,一般的院校分为先秦文学、秦汉文学、三国两晋南北朝文学、唐宋文学、元明清文学,个别院校会有些调整。 你说你比较喜欢《红楼梦》,你可以选择报考元明清专业。那你现在要尽可能多的阅读这一时期的古文名著,还有近现代学者研究这一时期的学术成果。这样你在专业面试的时候,会比较占优势。 此外,要报考中国古代文学专业的研究生,你必须对整个中国古代文学史有较清楚的了解,像《诗经》、《楚辞》、《论语》、《春秋左传》等等以及辞赋、唐诗宋词元曲、散文你都要出口成诵,这是基本功,这有助于你培养较好的古文基础。这些只是积累,你还要学会研究,多看大家的研究成果,对你有助。 好一点的学校是北大、北师大、复旦、南京大学、四川大学、山东大学,你加油应该是有机会的。 关于必读的书目,每个学校是不一样的,但是一般考研肯定会考文学理论、中国古代史,所以建议你找北大出版社、高等教育出版社等的课程辅导资料。如果你决定要考那所学校,可以查一查它的具体要求,有很多学校是会标明辅导书目的。不过关键还是在于你的积累,所以你必须花大力气积累文学知识了。 祝你好运! 2.文学常识怎么背最有效果 一、穿针引线法 零散的文学常识就像是没有穿好的一大把针,只要有一根线将它们贯串起来,这些文学常识就显得非常系统了,这根线可以是时间、空间、风格、内容等等。例如记忆中国古代文学史,可以以内容为线索,用这条线串起各个朝代文学现象这些针。 韵文类:诗经——楚辞——乐府民歌——唐诗——宋词——元曲 散文类:尚书——先秦散文——六朝陶渊明散文——唐宋八大家——明初诗文三大家(宋濂、刘基、高启)——明中叶唐宋派(归有光)——明末公安派(三袁)——清代桐城派(姚鼐、方苞、刘大櫆) 什么时候想记忆文学常识了,就先拉一条长线,一根针-根针地穿过去,哪根针(朝代作家作品)穿不过去了,就停下来,细细地查究竟什么原因,该补的补上了,就可以继续穿,这样既快又能随时检查自己的记忆情况。 二、联想法 联想,就是由一事物想到另一事物的心理过程。比如记忆屈原时,由屈原想到他的作品《离骚》,又因《离骚》是中国浪漫主义文学的源头想到西方浪漫主义三大家:雪莱、雨果、拜伦。这样举一而反三触一而发十,能较系统地记住许多知识。经常这样记忆,也有利于联想能力的提高。 三、积少成多法 文学常识内容多,涉及面广,短时间内是没有办法全部记下来的。心理学认为,记忆由四个环节组成:识记、保持、回忆和再认。任何一个环节出问题都会影响到记忆的质量,我们记不住是因为保持不够,如何才能很好地保持呢?心理学上有一条著名的遗忘曲线,它告诉我们,识记后最初一段时间遗忘较快,以后遗忘逐渐减慢,稳定在一个水平上,所以要保持识记的内容就应该在识记后及时复习。 积少成多法实际上是一种小循环复习法。因为要不断地复习,所以记忆新的内容的量不会多,我们可以将所有的需要记忆的文学常识化整为零,分配在各个时间段里,比如用一两个月记忆中国文学史(可以按朝代顺序每天记一两个作家或几部作品),用一个月记忆外国文学史,再用一个月进行第二轮的复习,而在每一天的复习之中,先回忆前一天的内容,再记忆新的内容,这样大循环套小循环,一直到高考前,不怕记不住需要记忆的文学常识。 四、口诀法 我们平时背诵诗文时有这样的体会:文章背起来较慢,诗词因其节奏分明、音律和谐,读起来琅琅上口,就容易背诵得多。我们可以把要识记的文学常识编成“口诀”,这些口诀要讲究押韵,也应该是浓缩的文学常识,记上两句,就应该记忆了许多知识。另外,在口诀中把容易弄混的作家作品编成“固定搭配”。看下面的例子: 文学常识,并不难记,中有妙诀,帮你记清。先说国内,作家作品。 先秦诸子,孔孟荀卿。《论语》《孟子》,四书列名。老庄无为,《道德》《逍遥》。屈子楚辞,《九》《九》《离》《天》。 汉代文赋,首推贾谊。刘向司马,《战》《楚》《史记》。班固《汉书》,断代开启。 魏晋建安,三曹领先。父有乐府,《神龟》《蒿》《观》。曹丕《燕歌》,《典论》批评;子建七步,五言奠基。 《鲁迅全集》,著作颇丰。小说有三,《彷徨》《呐喊》,旧事新说,《故事新编》。 中学课本,除了《祝福》,皆入《呐喊》。散文一部,《朝花夕拾》,另加《野草》,略带诗体。杂文十六,《热风》与《坟》,《华盖》二集,《而已》《三闲》,再多《二心》,《南腔北调》、《伪自由书》,《准风月谈》,三《且》二《集》,文学花边。 这些口诀读起来琅琅上口,记忆起来就容易得多了。 3.让孩子背文学常识有什么快捷方法 语文要记住的文学常识有很多,想要全部要花费很多时间,所以,我们需要一些好的、可以事半功倍的办法来记忆语文文学常识。 联想法 联想,就是由一事物想到另一事物的心理过程。比如记忆屈原时,由屈原想到他的作品《离骚》,又因《离骚》是中国浪漫主义文学的源头想到西方浪漫主义三大家:雪莱、雨果、拜伦。 这样举一而反三触一而发十,能较系统地记住许多知识。经常这样记忆,也有利于联想能力的提高。 穿针引线法 零散的文学常识就像是没有穿好的一大把针,只要有一根线将它们贯串起来,这些文学常识就显得非常系统了,这根线可以是时间、空间、风格、内容等等。例如记忆中国古代文学史,可以以内容为线索,用这条线串起各个朝代文学现象这些针,请看下图。 韵文类:诗经——楚辞——乐府民歌——唐诗——宋词——元曲 散文类:尚书——先秦散文——六朝陶渊明散文——唐宋八大家——明初诗文三大家(宋濂、刘基、高启)——明中叶唐宋派(归有光)——明末公安派(三袁)——清代桐城派(姚鼐、方苞、刘大櫆) 什么时候想记忆文学常识了,就先拉一条长线,一根针-根针地穿过去,哪根针(朝代作家作品)穿不过去了,就停下来,细细地查究竟什么原因,该补的补上了,就可以继续穿,这样既快又能随时检查自己的记忆情况。 积少成多法 文学常识内容多,涉及面广,短时间内是没有办法全部记下来的。 心理学认为,记忆由四个环节组成:识记、保持、回忆和再认。任何一个环节出问题都会影响到记忆的质量,我们记不住是因为保持不够,如何才能很好地保持呢?心理学上有一条著名的遗忘曲线,它告诉我们,识记后最初一段时间遗忘较快,以后遗忘逐渐减慢,稳定在一个水平上,所以要保持识记的内容就应该在识记后及时复习。 积少成多法实际上是一种小循环复习法。因为要不断地复习,所以记忆新的内容的量不会多,我们可以将所有的需要记忆的文学常识化整为零,分配在各个时间段里,比如用一两个月记忆中国文学史(可以按朝代顺序每天记一两个作家或几部作品),用一个月记忆外国文学史,再用一个月进行第二轮的复习,而在每一天的复习之中,先回忆前一天的内容,再记忆新的内容,这样大循环套小循环,一直到高考前,不怕记不住需要记忆的文学常识。 口诀法 我们平时背诵诗文时有这样的体会:文章背起来较慢,诗词因其节奏分明、音律和谐,读起来琅琅上口,就容易背诵得多。我们可以把要识记的文学常识编成“口诀”,这些口诀要讲究押韵,也应该是浓缩的文学常识,记上两句,就应该记忆了许多知识。 另外,在口诀中把容易弄混的作家作品编成“固定搭配”。看下面的例子:文学常识,并不难记,中有妙诀,帮你记清。 先说国内,作家作品。 先秦诸子,孔孟荀卿。 《论语》《孟子》,四书列名。老庄无为,《道德》《逍遥》。 屈子楚辞,《九》《九》《离》《天》。 汉代文赋,首推贾谊。 刘向司马,《战》《楚》《史记》。班固《汉书》,断代开启。 魏晋建安,三曹领先。父有乐府,《神龟》《蒿》《观》。 曹丕《燕歌》,《典论》批评;子建七步,五言奠基。 《鲁迅全集》,著作颇丰。 小说有三,《彷徨》《呐喊》,旧事新说,《故事新编》。 中学课本,除了《祝福》,皆入《呐喊》。 散文一部,《朝花夕拾》,另加《野草》,略带诗体。杂文十六,《热风》与《坟》,《华盖》二集,《而已》《三闲》,再多《二心》,《南腔北调》、《 伪自由书》,《准风月谈》,三《且》二《集》,文学花边。 中国古代文学常识歌谣 1、先秦文学 先秦文学有两源,现实主义和浪漫。 《诗经》分为风雅颂,反映现实300篇① 手法牢记赋比兴,名篇《硕鼠》与《伐檀》。 浪漫主义是《楚辞》,《离骚》作者为屈原。先秦散文有两派,“ 诸子”、史书要记全。 儒墨道法属诸子,各有著作传世间;儒家《论语》和《孟子》, 墨家《墨子》见一斑;道家《老子》和《庄子》,法家韩非著名篇。历史散文有两体,分为“国别”和“编年” 前者《国语》《战国策》, 后者《春秋》与《左传》。 2、两汉魏晋南北朝文学 两汉魏晋南北朝,诗歌成就比较高;“乐府双璧” ②人称赞,建安文学推“三曹”③;田园鼻祖是陶潜,“采菊”遗风见节操。《史记》首开纪传体,号称“无韵之离骚”;班固承续司马意④,《汉书》断代创新招;贾谊雄文《过秦论》,气势酣畅冲云霄;“出师”二表名后世,《桃花源记》乐逍遥。 辞赋盛行多空洞,张衡《二京》似惊涛。文学批评也兴起,《文心雕龙》真高超。 骈文追求形式美,小说初起尚粗糙。 3、唐代文学 唐代鼎盛累如山,“初唐四杰”不平凡;王杨卢骆创格律,律诗、绝句要记全。 浪漫诗人推李白,一路高歌《蜀道难》。现实主义有杜甫,“三吏”、“三别”不一般。 乐天倡导新乐府,“琵琶”、“长恨”留名篇。田园诗派有王孟,高、岑诗歌唱边塞。 中唐李贺多奇丽,贾岛“推敲”传世间。晚唐崛起“小李杜”⑤;此后衰败如尘烟。 韩柳古文创新体,《阿房宫赋》唱千年。唐代传奇已成熟,代表作推《柳毅传》。 4、宋代文学 宋代文学词泱泱,分成婉约与豪放。柳永秦。 4.请问哪本书是介绍古代文学常识的 《不可不知的文化常识》 作者:韦明辉(主编) 本书是一本浓缩世界文化知识精粹的必读手册。旨在为读者提高文化修养,事富人生内涵、添加知识储备、准备写作素材、增加聚会谈资…… 它涵盖了天文历法、地理名胜、人物称谓、礼仪习俗、节日庆典、历史、宗教、文学、思想、医药卫生、农业生物、交通建筑、政治军事、经济贸易、体育娱乐、科技、教育、历史、影视曲艺、音乐舞蹈、成语、典故等各个层面。 很实用的一本书,全部通俗易懂,你看看就知道了。 望采纳
试卷有很多,多看看就行了
以下提供网址里均有仿古写作... 我平时爱极诗词及小说。。。现在我专本同修。。。专修英文。。。本修中文。。。所以由于同属文科。。。所以对国外及中国古典文学常多加留意。。。有时由于找很多文学材料。。。我会经常浏览于各大网站。。。这是我平时经常搜索文学网站所留下的经典。。。也有很多诸如我们从小到大学过的从简单到复杂的文学。。。 下面为你介绍经典三个文学网址: 1、中华经典文学网(囊括诸子百家、诗经、楚词等多种古典文学体裁。。。并有名家赏析。。。) 2、中国新世纪读书网--古典文学(本网站囊括大量各种体裁古典小说、明清小说、古典散文、古典戏曲、诸子百家及其他文学形式诸如随园食曲、文心雕龙等等。。。还有儒家、道家等各家章句经典。。。并有大型讨论区。。。) 3、秋雁南回(*****注:该网站是我最喜欢的文学网站,自1999年秋,致力于中国古典文学发展的网站《秋雁南回》开通,至今已经包括古典文学、网络文学、古文作品、名句欣赏、成语典故、古代文人、古文学苑、休闲时尚、聊天室、论坛等栏目。其中古典文学作品为主要栏目,古文作品已经收录了几十万篇,也是目前收录古典文学作品最全的文学网站。作品按年代分别收录在先秦,秦汉,魏晋,南北朝,隋唐,宋朝,元朝,明清的栏目中。) 因为不知道你喜欢这类网站是做何用。。。是做课件还是专门学习还是个人爱好。。。不过。。。我想无论你如何使用。。。都希望你能够喜欢。。。 最后祝你成功!!!国学网 最好 这里面有很多书你去看哈 也许有你要的 作 者 书籍名称 本月点击 最后更新 吴楚材 吴调侯 古文观止 15 2005-2-18 18:33:13 孔子 礼记 31 2005-2-27 22:12:05 司马迁 史记 138 2006-3-23 16:44:52 佚名 列女传 1 2005-3-24 1:16:25 吕不韦 吕氏春秋 3 2005-3-29 1:04:53 老子 道德经 1 2005-4-13 0:30:20 孙武 孙子兵法 2 2005-4-23 0:07:17 佚名 乐府诗集 2 2005-5-5 11:38:29 佚名 诗经 2 2005-5-12 23:21:13 王实甫 西厢记 1 2005-6-7 18:21:41 庄子 庄子 1 2005-6-10 6:15:56 关汉卿 窦娥冤 1 2005-6-15 6:04:25 李白 李白诗全集 16 2005-7-10 5:06:49 郑光祖 倩女离魂 2 2005-7-21 20:39:56 孔子 论语 10 2005-7-22 16:38:01 吴兢 贞观政要 1 2005-7-23 12:36:05 袁了凡 了凡四训 2 2005-7-24 8:34:10 鬼谷子 鬼谷子 2 2005-7-25 4:32:15 李贺 李贺诗全集 3 2005-8-10 19:53:51 佚名 古诗十九首 8 2005-8-14 23:44:15
好写,古代文学是研究古代的事情,属于既定事实,没有啥变数,还是比较好写的!
古代文学论文应该是比较好写的,因为你只要对古代文学比较了解。那么也不用用古文写,只要用现代文写出来,只要是论文,阐述古代文学的就可以了。论点一定要突出,论据一定要充分。
1、中国作家网
中国作家网由中国作家协会主办、《文艺报》社管理运营,作为一家公益性文学网站,已成为“汇聚作家信息、发出作家声音、展示文学魅力”的平台,是广大作家和读者了解中国作协工作、观察当代文学艺术发展趋势、跟踪当代文学创作动态、获知国外文艺新状况的重要渠道。
正式上线的新版中国作家网,在页面风格、栏目设置、功能拓展等方面呈现出新气象,网站设立“服务”、“评奖”、“新闻”、“报刊”、“评论”、“阅读”、“文史”等27个频道。
2、中国青年文学网
中国青年文学网,原名红草莓文学论坛,2010年6月,于2011年5月4日青年节正式改版为中国青年文学网,同时报请国家工业和信息化部域名备案。
为网站涵盖原创诗歌、散文、小说、连载、随笔、对联、美图、摄影、影音、灌水、娱乐等版块,同时集成个人空间、微博、签到、游戏等多种娱乐功能于一身,致力于打造最前沿的青年文学交流平台。
3、中国报告文学网
中国纪实文学研究会是经中华人民共和国民政部、中共中央宣传部、中国作家协会批准登记的全国性纪实文学一级学术团体,是海内外纪实文学工作者的联系中心。
其宗旨是坚持党的文艺方针政策,繁荣纪实文学事业,以高度的责任感反映现实生活,讴歌新时期风貌,为社会主义精神文明和物质文明建设服务。通过开展纪实文学理论研讨活动,交流纪实文学创作、编辑、出版工作经验。
4、中国散文网
散文是中国语言文化的一大精粹,是值得品味的文学宝藏。中国散文网隶属于北方联合传媒有限公司,北联传媒前身为北方联合电台报道中心。
是集合了互联网信息服务、高端奢侈品代理销售、藏獒宠物养殖、汽饰汽配零售批发、房地产开发、建材生产开发、多媒体广告合作、影视制作及图书出版、演艺经纪、文化信息交流等多项商业及文化服务,具有雄厚实力的一家综合型股份制企业。
5、晋江原创网
晋江原创网创立于2003年8月1日,是全球最大女性文学基地。具备投稿系统、个人文集系统、媒体联络发表系统及高创作水平的原创书库。2010年2月,晋江原创网正式更名晋江文学城。
晋江是福建省所属的一个县级市,晋江文学城的前身是晋江电信所创办的一个小BBS,后有了晋江文学城和晋江原创网。
参考资料:百度百科-中国作家网
参考资料:百度百科-中国青年文学网
参考资料:百度百科-中国报告文学网
参考资料:百度百科-中国散文网
参考资料:百度百科-晋江原创网
第一名:榕树。榕树作为网络中的最早文学网络,其影响是不言而喻的。综合影响力,榕树可以排在第一,在万千文学青年心里,它就是一座文学圣殿,几乎所有的网络写手都在那里发过作品,他留给网民的记忆是其他任何网站都无法取代的。时至今日,榕树已经成为网络文学的代名词了。第二名:起点。论人气,论知名度,起点都应当排在前三甲。大陆玄幻作品,尽出于起点。在玄幻写手中,起点与幻剑一样,都是他们心目中的圣殿。许多流传于网络的玄幻作品,都是最先发在起点。因此,要想看到最新的玄幻作品,最好还是去起点。第三名:猫扑。说到猫扑,很多网友都不会陌生。网络上有许多流传甚广的幽默的网文,大多是出自猫扑。在猫扑,你会流连忘返,因为那么搞笑的帖子层出不穷,千奇百怪的帖子都有。许多帖子可以让你捧腹大笑不已。在国内网络上,论幽默论搞笑,没有网站可以比得上猫扑。因此,猫扑排在第三,也是合情合理的事了。特别是在出了一个“比我聪明的没我漂亮,比我漂亮的没我聪明”的小天女后,猫扑更是名震网络,几有不知猫扑不称网友之势。第四名:天涯。天涯也是网络上最有知名度的网站,几乎每一个网民都听过天涯的名字。有很多网民感叹说:天涯的水太深入,一不小心就被淹死。的确,天涯藏着许多的高人,有很多其他网站的精英和名人都曾在天涯驻足过,并且留下了文字,只是我们有很多人没注意到罢了。可以说,天涯是一个小型社会,君子与小人共处一室,绅士与流氓兼有。换句话来说,天涯就是一个江湖,在这个江湖里,很多人留连忘返,这又吸引了更多的网友前来。第五名:清韵。说人气,清韵的人气并不是很旺,为什么清韵也能排在前五名呢?原因就是清韵的定位非常鲜明,坚持文学本色,做一个纯粹的文学网站。在清韵,聚集了一大批网络写手。在那里,你可以看到各路高人。而且清韵的气氛也很好。在那里,完全只有心平气和的交流,看到的只有高手论剑,偶尔也能看到高手坐而论道。这对于新网民来说,无疑是一个极高的学习提高机会。因此凡是新网友,一律都要去清韵看看,那的确是一个好地方。无可讳言,清韵的水平相当高,差不多和榕树相当。特别是它的武侠,几乎代表了大陆武侠的最高水平。清韵能做到这一步,的确很不容易,值得赞一个。更加难得可贵的是,在清韵基本上看不到什么广告,看到的只有文学作品,而且其页面设计也非常简洁大方,看起来很舒服。在这里,不得不为清韵的苦心赞一个,网络中如果多一些这样的网站,那将是网络文学的幸事。第六名:红初添香。红袖"这个名字,带着婉约的气息,让人立刻想起古代书生夜读,夜阑人寂,有佳人白衣胜雪研磨添香,这是古代士子心中最最不沾烟火气的美。红袖创立于1999年,原本是一个个人网站,元老除了今天的站长孙鹏,还有他当时的四个网友。原本只是个人浓厚的兴趣,想不到却慢慢地做出了点名气,叫"红袖添香"是五个人谁的主意,今天已不可考证,只记得当初是为了办出鲜明的女性特色来,后来,这种概念渐渐地模糊起来,红袖成了纯粹的原创文学网站。人世几番变化,今天,当年的五个人只剩下孙鹏和disha还在坚持。网站的80多位志愿编辑,则都是网站的网友,分散在各地,无偿地为红袖服务,就是为了不让这一片净土沦陷。从1999年7月到今年5月,红袖在没有任何资金援助的情况下,苦苦支撑了近5年。5月,红袖终于找到了同盟,双方以成立公司的形式合作,由对方出资30万,双方各占50%的股份。对于红袖,我也要赞一个,因为红袖和清韵的情况差不多,也是纯粹以文学为立身根本,似乎和清韵一样,红袖也不想走上商业化道路。第七名,晋江。晋江是晋江电信局所发展起来的,当时只有五个管理者在努力操持。后来几经变更,现在的管理层已经是第三度换血了。晋江的发展和清韵有相似之处,又有着不同之处。相似之处是晋江和清韵一样,走得也是综合文学的路子,但是清韵是以武侠见长,代表了大陆武侠文学的最高成就。而晋江则是以言情见长,代表着大陆言情文学的最高成就。在晋江走出了不少的写手,像明晓溪、藤、飞天红猪等都是先在晋江发表作品,然后再出版作品的。这里不得不提及,晋江的出版机会也很发达,居出各大网站之冠。如果网友们在晋江发过帖的话,一定还记得出版有ABCD四个级别吧?可以这样说,如果是得到读者认可的作品,只要发在晋江,一般都有出版的机会。就这一点而论,晋江要比清韵做得好,因为在晋江,写手有了出版的保证,作品质量自然更有保障了。晋江作品的文风大多是华丽的,连回帖都是华丽的。在晋江呆的时候,常看见这样的回帖“大人好华丽的文字阿”“一篇华丽的文字又要出来了”,实在有趣。第八名:汉网。说起来,汉网是一个奇怪的网站,因为它宣扬大汉族极端主义,我也时常去那里玩,有时候也不免被其中的文字激发起血性。在汉网中,“犯强汉者,虽远必诛”成为说得最多的一句话,几乎每一个帖子都要来这么一句话。对此,也不能有太多的非议,毕竟他们也是出于一片爱国之心。在汉网中,提到的最多就是卫青、陈汤、李世民、冉闵、岳飞、袁崇焕等这些中华民族英雄,讨论最多的朝代就是汉朝和唐朝,最痛恨的朝代就是清朝了。如果我没记错的话,汉服也是汉网最先提出来的,记得汉网有过不少的帖子传遍网络,像“遥想我伟大汉人当年”“千古第一英雄冉闵”等文章都是很有爱国激情的文章,不可不读。作为中华民族子孙,还是有必要去一下汉网,了解一下我们民族伟大的过去。只有了解了我们民族辉煌的过去,才能充分建立起我们的自信心。如果有网友是一位爱国愤青的话,建议不妨去汉网看一下。另外不可不提的是,与汉网对立的满网则经常有贬低汉人的帖子出现,汉满之争也成为网络上的焦点。第九名:西祠。西祠和榕树一样,也是将自己定位在文学综合网站上了。但是西祠一直是榕树的追赶者。曾经与朋友谈论,文学论道也就榕树、红袖、西祠、清韵可道,其他的不足为人道也。其实西祠与榕树、红袖的写手资源是共享的,有很多文章基本上是贴遍三家的。换句话来说,西祠与榕树、红袖形成了一个网络文学圈子,他们三家与清韵共同代表了网络文学。他们的发展历史就是整个网络文学的发展历史。他们的发展趋势就是网络文学未来的发展趋势。但是西祠的发展比起榕树和红袖来,具有较大的风险,因为西祠没有吸引到足够多的写手,榕树是以综合文学见长,红袖是以女性文学见长,清韵是以武侠见长,晋江是以言情见长,西祠又是以什么见长呢?不过凭着人气,西祠还能排进十大,以后能不能排进十大,谁也不知道。第十名就难以排出了,现在心中的候选名单就有铁血、幻剑、龙空、碧海银沙、西陆、水木清华、中青在线、强国论坛、凯迪等,均是难分伯仲啊~~~
首先,我非常不赞成买ipad看论文。诚然,ipad确实能给我们带来工作、娱乐上的便利,但高校里面大多数同学还是以娱乐为主,看电影、刷美剧、玩游戏等是其主要作用。ipad毕竟偏娱乐,你若真想好好学习,可以入手一台好的超薄笔记本,轻量便携,于学习有更大的作用。看论文,你得先问自己,你喜欢看论文吗?有些同学喜欢通过阅读大量文献来找想法、思路,徜徉在论文的海洋里,也很享受,这种类型的同学比较善于写;而有些同学不喜欢看论文,一看论文就头疼,而这种类型的同学比较善于动手实施。同时,我相信大学里有很多同学都有这样类似的想法,比如我要好好练字,想入手一支很好的钢笔;我要学编程,打算买一台苹果笔记本等等。这种想法和出发点是好的,但真正想做一件事,不在于外在的工具,而在于你对知识的渴望和自我的严格要求。
看个人喜好吧,不一定非要买,用电脑笔记本还是一样的。看哪个比较方便。由于自己喜欢在图书馆学习,正好笔记本也用了好多年,就换了个ipad。买之前问了一部分人,查了一部分资料。看了下性价比感觉还是不错的。反正主要就要用来看论文做笔记。都说买前生产力,买后爱奇艺。我感觉只要你有心去做一件事,所有的困难都会给你让路的。做什么都是一个道理。顺便给大家推荐几个看论文做笔记的不错的app:1.首推pdf+Xmind(是一款论文做笔记的神器,主要是下载论文格式是pdf还好说,如果是caj格式的话还需要在caj app里面转成pdf格式。然后用到分屏,可以一边做笔记,一边做思维导图,非常方便)。2.goodnotes和notebility,这两款都是平常做笔记的好帮手,非常好上手。3.平时看论文累的话,就用ipad开启绘画模式放松一下,常用的就是procreate。做点小涂鸦,非常随意的去表达自己的思想,感觉长时间看论文带来的疲惫感觉一扫而空。言归正传,适合自己的才是最好的。希望大家能够找到适合自己的最好的学习方式,也提前预祝自己开题顺利。
我们可以这样记笔记。按照参考书上的章节目录为顺序,每一节都分为三个模块。第一个模块总结知识点,在这个模块中可以补充一些其他版本的教材中的不错的观点,这些后面在背的时候会用到,非常有用的,也是后半年最应该倚重的复习资料。第二个模块记自己的读后感,把自己对于这一节的一些体会写出来,也许会比较私人化,会比较非主流,但是毕竟是自己的,都是自己消化后的成果,虽然拿不出手,但是毕竟都是走心的。后面再看到时,能马上回到第一次复习时的情境,多看几次,知识点自然也就非常容易地记住了。第三个模块专门用来提示自己,我这里掌握得不好,需要再找其他资料或者跟同学们交流下才能吃透。我这里背了很多次还是背不会,需要多花点时间背。
首先,我非常不赞成买ipad看论文。诚然,ipad确实能给我们带来工作、娱乐上的便利,但高校里面大多数同学还是以娱乐为主,看电影、刷美剧、玩游戏等是其主要作用。ipad毕竟偏娱乐,你若真想好好学习,可以入手一台好的超薄笔记本,轻量便携,于学习有更大的作用。看论文,你得先问自己,你喜欢看论文吗?有些同学喜欢通过阅读大量文献来找想法、思路,徜徉在论文的海洋里,也很享受,这种类型的同学比较善于写;而有些同学不喜欢看论文,一看论文就头疼,而这种类型的同学比较善于动手实施。同时,我相信大学里有很多同学都有这样类似的想法,比如我要好好练字,想入手一支很好的钢笔;我要学编程,打算买一台苹果笔记本等等。这种想法和出发点是好的,但真正想做一件事,不在于外在的工具,而在于你对知识的渴望和自我的严格要求。
看个人喜好吧,不一定非要买,用电脑笔记本还是一样的。看哪个比较方便。由于自己喜欢在图书馆学习,正好笔记本也用了好多年,就换了个ipad。买之前问了一部分人,查了一部分资料。看了下性价比感觉还是不错的。反正主要就要用来看论文做笔记。都说买前生产力,买后爱奇艺。我感觉只要你有心去做一件事,所有的困难都会给你让路的。做什么都是一个道理。顺便给大家推荐几个看论文做笔记的不错的app:1.首推pdf+Xmind(是一款论文做笔记的神器,主要是下载论文格式是pdf还好说,如果是caj格式的话还需要在caj app里面转成pdf格式。然后用到分屏,可以一边做笔记,一边做思维导图,非常方便)。2.goodnotes和notebility,这两款都是平常做笔记的好帮手,非常好上手。3.平时看论文累的话,就用ipad开启绘画模式放松一下,常用的就是procreate。做点小涂鸦,非常随意的去表达自己的思想,感觉长时间看论文带来的疲惫感觉一扫而空。言归正传,适合自己的才是最好的。希望大家能够找到适合自己的最好的学习方式,也提前预祝自己开题顺利。
GFS的诞生来源于google日益增长的数据量的处理需求,它是一个可扩展的分布式文件系统,用于大型分布式数据密集型应用,在廉价的通用硬件上运行时提供容错机制,并且可以为大量客户端提供较高的聚合性能。 它的设计由当前和预期的应用负载(当时的)和技术环境驱动,与以前的文件系统的假设有着明显不同,因此gfs在设计上有几个不同的points:
当前已部署多个集群用于不同目的,最大的拥有1000多个存储节点,超过300TB的存储服务,并且有数百个客户端连续不断地高负载请求。
前面提到一些对应用负载和技术环境的观察,现在更详细地进行阐述:
虽然GFS不能提供像POSIX标准的API,但它提供一个相似的文件系统接口。文件在目录中按层次结构组织,并以路径名作为标识。支持create、delete、open、close、read and write files。
gfs支持快照和record append操作。快照以低代价创建文件副本或者目录树,record append支持多个客户端并发地写文件,保证每个独立客户端append的原子性。
一个gfs集群包含一个master和多个chunkservers,chunkserver被多个客户端访问,如图1所示。每一个都是普通linux机器上运行的用户态服务进程。资源允许的情况下,客户端可以和chunkserver部署在同一台机器上。
文件被划分为固定大小的块。每个chunk由一个独一无二的64位大小的chunk handle所标识,chunk handle在chunk被创建时由master分配。每个chunk的副本分布在多个机器上,系统默认为三副本模式,用户也可以为不同namespace的文件指定不同级别的副本。
master包含文件系统的所有元信息。包含namespace、访问控制权限信息、文件到chunks的映射、当前chunks的位置信息。也控制着全局的活动,像chunk租约管理、gc、chunk迁移等。master通过心跳的方式与每个chunkserver交流来发送它的指令和收集状态。
客户端与master的交互涉及元信息操作,所有数据操作直接与chunkserver交互。gfs不提供POSIX标准API,因此不需要挂接到linux的vnode层。
客户端和chunkserver都不缓存文件数据。大多数应用传输大文件,客户端缓存收益很低。chunks作为本地的文件存储,linux系统有自己的buffer cache,chunkserver不需要再增加缓存。
单master简化了系统的设计,但是会有单点的瓶颈问题,这是必须要解决的。客户端不会从master读写数据文件,客户端请求master它需要的交互的chunkserver信息,并且将其缓存一段时间,后续的操作直接与chunkservers交互。
客户端会发送请求给离它最近的一个副本。实际上,客户端通常会向master请求多个chunk的信息,以减少未来与maser交互的代价。
chunk size定为64MB,相比普通的文件系统的block size更大。每个chunk副本以linux文件的形式存在chunkserver上,仅根据需要来扩展。使用lazy space allocation的方式避免空间浪费。
large chunk size有以下几个优点:
但是large chunk size with lazy space allocation也有其缺点:单个文件可能包含很少数量的chunks,或许只有一个,当许多客户端访问相同文件时这些chunks成为热点。但由于目标应用大多是顺序的读多个large chunk文件,热点并不是主要的问题。 然而GFS第一次用于批处理队列系统时确实出现了热点问题,数百个客户端同时访问一个单chunk文件,存储这个文件的几个chunkserver超负荷运转,当时通过错开应用的启动时间避免了这个问题,一个潜在、长期的解决方法是允许客户端从其它客户端读取数据。
master保存三种类型的元数据:
所有元数据都保存在内存中 。对于元数据的内存操作是很快的,后台任务周期巡检整个状态也是比较简单高效的。周期巡检用于实现chunk gc、在chunkserver故障时重新构造副本、chunk迁移以平衡多个chunkserver的负载和disk usage。 虽然系统的容量受master内存大小的限制,但这并不是一个严重的问题,64MB的chunk只需要不到64byte大小的元信息,如果一定需要更大的文件系统,那么增加内存的代价相比为可靠性、性能和灵活性等付出的代价是较小的。
前两种类型的元数据通过写日志来保证持久化,并且会复制日志到远程机器上。master不需要将chunks的位置信息持久化,而是在master启动和新的chunkserver加入集群时向每个chunkserver询问它的位置信息,之后通过心跳信息监控chunk位置变更信息。chunkserver作为最后一关是确切知道自己本地有没有哪些chunk的,因此维护一个一致性的视图是没有必要的。
operation log 包含元数据的变更记录, 它是GFS的核心 ,它不仅仅是唯一的元数据持久化记录,也表明了并发操作的逻辑时间线。文件、chunks和它们的版本都是由逻辑时间线唯一标识。元数据变更记录在持久化之前对客户端是不可见的,而且日志被复制到多个远程的机器,只有相应的记录在本地和远程都持久化到硬盘了才可以回复客户端。master使用批处理log的方式提高系统的吞吐。
master通过回放日志来恢复文件系统的状态,为提高恢复速度需要保持log量足够小。当log增长超过特定大小时,master会checkpoint它的状态,以加速恢复提高可用性。构建checkpoint可能需要花费一段时间,因此master以一种不delay后续变化的方式来组织内部状态,先switch到一个新的日志文件,使用独立的线程创建checkpoint,新的checkpoint包含了所有switch之前的变化。几百万个文件的集群在一分钟内可以完成,完成后将同时被写入本地和远程。恢复只需要最新的checkpoint和之后的日志文件,旧的checkpoints和日志文件可以完全删除。
GFS使用一个宽松的一致性模型,这种模型可以很好地支持分布式应用程序,而且实现起来简单有效。 file namesapce变化(例如文件创建)是原子的,使用namespace锁。 master的operation log定义了这些操作的全局顺序。
数据变化后文件region的状态取决于变化的类型,是否成功、失败或者是并发的。Table1做了总结。如果所有客户端都能看到相同的数据,无论它们读的是哪个副本,则这个file region是一致的。
数据变化有两种:writes或者record appends。write是指从应用指定offset处开始写数据,record append指即使存在并发冲突,数据也要被原子地append到文件至少一次,但offset是由GFS选定。
GFS保证在一系列成功的mutations后,file region是defined,通过下面两点来保证:
过期的副本将不会再涉及到任何mutation,master也不会将其位置信息回应给客户端,不久后将会被gc。但客户端缓存的信息可能包含过期的副本,缓存失效存在一个时间窗口,文件再次打开也会清除该文件的所有chunk信息。由于大多数文件是append-only,过期的副本通常返回的是过早的结尾???而不是过期的数据。
介绍客户端、master和chunkserver之间如何交互来实现数据变化、原子追加写和快照的。
使用租约的方式维护多个副本间一致的mutation order。master授权租约给副本中的一个,称之为primary。primary为chunk的mutaions选择一个顺序,所有副本都按照这个顺序apply。 租约机制最小化了master的管理overhead。租约初始的超时时间是60s,如果chunk一直在变化过程中,primary可以申请续租。这些授权和续租请求由master和chunkserver之间的心跳信息携带。master也可以尝试撤销租约,即使它与primary失去了联系,也可以等租约过期后安全地授权给另外一个副本。
在Figure2中,跟随着写入控制流展示了处理过程:
如果一个写请求比较大或者超出了chunk边界,GFS客户端将它拆为多个写操作,但是多个操作可能与其它客户端并发交叉写入,因此共享的fie region最终可能包含多个不同客户端的碎片,这会造成 一致性模型 中所描述的file region处于consistent but undefined状态。
数据以pipline的机制在chunkserver链上线性传输,而控制流是从客户端到primary再到所有的其它副本。分离数据流和控制流可以更高效地使用网络。可以带来以下好处:
GFS提供原子的append operaton叫作 record append 。传统的write中,客户端指定offset,并发写相同region时不是serializable,最终region可能包含多个客户端的碎片数据。而对于record append,客户端仅指定数据,GFS保证至少一次成功的原子append,offset由GFS选定,与Unix的O_APPEND模式相似。
多个客户端并发操作相同文件是比较重的。如果处理传统的write,客户端需要额外复杂和昂贵的同步逻辑,像分布式锁。而record append仅需要primary增加一点额外的逻辑:primary检查是否并发append数据的chunk会超出max size,如果会超出则将chunk填充到max size,并且告诉所有二级副本同样操作,然后回应客户端指出这个操作应该选择另一个chunk重试;大多数情况下记录是在max size内的,primary将数据append到自己的副本,并告诉所有二级副本按照确切的offset写数据,最后回应给客户端。
如果中间出现错误,客户端重试,相同chunk的副本可能包含不同的数据,可能包含相同的记录或者一部分相同,GFS不保证bytewise identical,仅仅保证数据至少有一次被成功地原子写入。从report success逻辑可以容易得出,数据必须是在某个chunk的所有副本上以相同的offset写入。在此之后,所有副本都与记录end一样长,即使后面不同的副本成为primary,任何将来的记录也将分配到更高的offset或者不同的chunk。根据上述的一致性保证,成功的record append的region是defined和一致的,而中间的region是不一致的(undefined)。GFS的应用可以处理这种不一致的region(2.7.2)。
snapshot 操作拷贝一份文件或者目录树,几乎是实时的,同时最大程度减少对正在进行中的mutation的干扰。 像AFS一样,使用标准的COW技术实现snapshot。当master接收到一个snapshot请求,首先将所有涉及到chunks的租约撤销,这保证了这些chunks后续的write将会先请求master查找租约持有者,master会创建一个新的副本来回应。
租约被撤销或者过期后,master将这个操作记录日志到disk。新创建的snapshot引用元数据相同的chunks。 当snapshot操作完成后,客户端第一次要写chunk C,发送请求给master查询持有租约者,master察觉到chunk C的引用大于1,则让每个含有当前chunk副本的chunkserver创建一个新的chunk叫作C',所有创建都使用本地的副本,相比100Mb的网络本地速度大约是三倍速度。master授权租约给新的chunk C'中的一个并且回复给客户端,之后正常地写chunk。整个过程对客户端是透明的。
master执行所有的namespace操作。另外,它管理整个系统的chunk副本:
接下来,详细探讨这些细节。
许多master操作可能花费较长一段时间,比如snapshot操作需要撤销相关的所有chunks的租约。因此为了不delay其它master操作,在namesapce的regions上使用locks来确保串行化。 GFS没有按目录列出该目录中所有文件的结构,也不支持文件和目录的别名(unix中的硬链和软链)。GFS将完整的路径名到元数据的映射表作为它的逻辑namespace。使用前缀压缩,这个表可以有效保存在内存中。namespace tree中的每个节点都有一个关联的读写锁。 每个master操作在运行前都会获取一组锁。如果涉及到/d1/d2/../dn/leaf,它将获取目录名称/d1、/d1/d2、...、/d1/d2/.../dn上的读锁,完整路径/d1/d2/../dn/leaf的读锁或者写锁。leaf可以是文件或者目录。
创建文件不需要对父级目录加锁,因为没有"目录"的概念不会修改它,而加读锁是防止它被删除、重命名或者snapshot。这种锁机制的好处是允许相同目录下并发的mutations。
一个GFS集群通常具有分布在多个机架上的数百个chunkserver,这些chunkserver也会被相同或者不同机架的数百个客户端访问。不同机架上的两台计算机之间的通信可能会跨越一个或者多个网络交换机。另外进出机架的带宽可能小于机架内所有计算机的总带宽。多级分布式对如何分发数据以实现可伸缩性、可靠性和可用性提出了独特的挑战。 副本放置策略有两个目的:最大化数据可靠性和可用性,最大化网络带宽利用率。不仅要在多台机器上放置,还要在多个racks上,即使整个racks损坏也可以确保部分副本保持可用。也可以利用多个racks的总带宽。
chunk副本创建有三个原因:
当master创建新的chunk时,根据几个因素考虑如何放置新的副本:
当chunk可用副本的数量低于用户指定时,master会重新复制。可能发生在几种情况:
需要重新复制的chunk根据以下几个因素确定优先级:
master限制集群和每一个chunkserver内的活跃的clone数量,另外chunkserver通过限制其对源chunkserver的读请求来限制在每个clone操作上花费的带宽。
master会定期重新平衡副本:检查当前副本的分布,迁移副本以获得更好的磁盘空间利用率和负载平衡。同样通过此过程,master逐渐填充一个新的chunkserver。另外,master通常更倾向于移除具有低磁盘利用率chunkservers上的副本,以平衡空间使用。
当文件被删除时,master记录日志,但不会立即回收资源,而是将文件重命名为包含删除时间戳标记的隐藏名称。如果这些文件存在时间超过三天(时间可配置),master巡检时会将其删除。在此之前,仍然可以用特殊名称来读取文件,并且可以重命名为正常名称来取消删除。当从namesapce中删除隐藏文件时,其内存元数据将被删除,这有效切断了所有chunk的连接,在对chunk namespace的扫描中,master识别出孤立的chunk并清除元数据。在心跳信息中,每个chunkserver报告其拥有的chunks子集,而master将回应不在存在于master元数据中的所有的chunk的标识。chunkserver可以自由删除此类chunk的副本。
这种gc机制相比立即删除有以下几个优点:
这种机制主要的缺点是当存储空间紧张时,延迟有时会影响用户的使用,重复创建和删除临时文件的应用可能无法立即重用存储。如果删除的文件再次被明确删除,GFS将通过加快存储回收来解决这些问题。还允许用户将不同的复制和回收策略应用于不同的namespace的不同部分中。
如果一个chunkserver故障或者chunk丢失了mutations,这个chunk副本可能是过期的。对于每个chunk,master都维护了一个chunk版本号。
当master授权租约给一个chunk时,这个chunk的版本号增加1,如果一个副本当前不可用了,则其版本号将不会领先。当chunkserver重新启动并报告其chunks集合和相关联的版本号时,master将检测到该chunkserver上具有过期的副本。如果master看到的版本号大于它记录的版本号,则认为在授权租约时失败了,因此将较高的版本号更新。
master在常规gc中删除旧的副本。另一个保护措施,在master回应客户端哪个chunk持有租约或者clone操作中chunkserver从另一个chunkserver读取chunk时会包含chunk的最新版本号。客户端或者chunkserver在执行操作时会验证版本号。
这个系统最大的挑战之一是处理经常故障的组件。组件的质量和数量造成的问题会超出预期,组件故障可能造成系统不可能,甚至数据错误。接下来讨论GFS如何应对这些挑战,还有系统如何诊断不可避免问题。
使用两个简单有效的方式保证系统的高可用:快速恢复和复制。 master和chunkserver的恢复都是秒级别的。 master维护每个chunk的副本数量,当chunkserver下线或者checksum检测出错误副本时,master会通过已有副本来复制。尽管复制提供了很好的解决方式,但仍在探索其它形式的跨服务器冗余方案,例如奇偶校验或者纠删码,以适应不断增长的只读存储需求。在非常松耦合的系统中实现这些更复杂的冗余方案更具有挑战性。
master的操作日志和checkpoint会被复制到多台机器上,状态的变化只有在本地和所有副本上都持久化以后才可以commit。master进程负责所有的mutations以及后台任务,当它宕机时可以很快重启,如果机器或者磁盘故障,GFS的外部监控将使用日志在其它节点重启新的master进程。在master宕机时,master的备节点只提供只读服务,它们不与master保持强一致,可能会落后于master,通常在1/4秒内。它们保证了那些不介意读到过期数据的应用的高可用读。类似于chunk的primary机制,master的备按照相同的序列应用日志。与master一样,在启动时从每个chunkserver拉取chunks的位置信息,与它们频繁交换握手消息来监控其状态。
每个chunkserver使用checksum来检测存储数据的损坏。数据损坏的chunk可以通过其它的副本来恢复,但是通过副本间比较来检验数据是不切实际的。正常的副本也不是完全一样的,如前文所讲,原子的append并不能保证完全一样的副本。因此每个chunkserver会维护自己的checksum。 每个chunk分为多个64kb的blocks,每个block包含一个32位的checksum,与其它元数据一样,checksum保存在内存中,依靠log持久化,与用户数据分离。
对于读,chunkserver在返回数据给请求者前先检测checksum,确保不会将出错的数据传输给其它chunkservers或者客户端。如果数据是坏的,chunkserver将错误返回给请求者并报告给master,请求者将会去读其它副本, master将会根据其它副本重新克隆一份。当新的副本创建以后,master指示chunkserver将错误的副本删除。checksum的计算不涉及I/O,对读的影响比较小,客户端通常尝试使用对齐block边界读来减少overhead。
为append写是做了checksum计算上的优化的,因为append写是主要的负载(相比于overwrite)。GFS只增量地更新最后部分block的checksum,为新的block的计算新的checksum。这样即使block已经损坏,新的checksum将与存储的数据不会匹配,下次读时将会与正常一样被检测出来。 如果一个写请求要写一个chunk中已存在的region,必要要先检验region的第一个和最后一个block的checksum,然后再重写,最后计算新的checksums。因为第一个和最后一个block可能含有不被重写的内容,如果这部分数据是损坏的,则新的checksum将包含错误的数据。
在idle时,checkserver可以扫描并检查不活跃的chunks,可以检测到冷chunks的错误,一旦错误被检测到,master可以创建一个新的副本。
GFS在设计上与传统文件系统有很多不同,这些点是基于对当时应用负载和技术环境的观察所重新设计,将组件故障看作平常的事件而非异常,为大文件的读取和追加写做优化,扩展和放宽了标准的文件系统接口以改善整个系统。通过监控、复制以及快速恢复能力提供容错能力,使用checksum机制来校验数据的正确性。通过将控制流和数据流分离,数据直接在chunkservers、客户端之间传输,为许多并发的各种任务的读取和写入提供了高吞吐量。大chunk size和租约机制使得master的操作足够轻量化,使得这样一个简单中心化的master不会成为瓶颈。
GFS成功地满足了google的存储需求,作为研究、开发和数据处理的存储平台广泛地应用于google内部。