首页

> 学术期刊知识库

首页 学术期刊知识库 问题

旅游客体文化的挖掘与研究论文

发布时间:

旅游客体文化的挖掘与研究论文

旅游文化方向的毕业学生论文

随着我国国民经济的快速发展,旅游业在近年来也得到突飞猛进的发展,通过将旅游与文化进行有效结合,不仅能够让人们感受到大自然的魅力,接下来是我为您整理的旅游文化方向的毕业学生论文,希望对您有所帮助。

摘要:当前随着我国社会经济的稳定发展,人们的生活水平也在不断的提升,而人们的生活质量也逐渐从物质要求向精神层面所发展。现今旅游也成为人们接触自然的一种有效的形式,并且也随之成为一种文化形式,更是人们追求精神需求的重要部分。“旅游文化”和“文化旅游”的概念是不同的,但是其两者很容易被混淆,并且两者也应该引起一定的重视。文章就通过对旅游文化与文化旅游两方面进行分析与研究,从而真正明确两者概念,从而真正有效的促进旅游业的发展。

关键词:旅游文化;文化旅游;理论与实践;问题;探究

随着我国国民经济的快速发展,旅游业在近年来也得到突飞猛进的发展,通过将旅游与文化进行有效结合,不仅能够让人们感受到大自然的魅力,并且也能感受到人类发展的伟大,是促进我国社会文明建设以及不断发展的关键。通过有效的将旅游与文化向结合的形式,从而真正的发挥“旅游文化”与“文化旅游”的优势以及其不同的意义,从而明确“旅游文化”与“文化旅游”的理论,为其良好的实践提供坚实基础。

一、“旅游文化”与“文化旅游”的概念及领域出现困惑和混淆的现象

对于我国的旅游界来说,在对旅游文化与文化旅游概念进行研究时,很容易将两者混淆,甚至出现疑惑的现象,这一直是旅游界所重视的部分。对于“旅游文化”,其是人们一听就非常熟悉的内容,但也还是需要进行进一步研究和探索的概念;而“文化旅游”是近年来才运用开来的名词,可是其内涵与外延还并没有得到有效的界定。现今最重要的问题就是,其两者从字面意思上看是非常相似的,但从其内在进行分析,还是有很大的不同,可是却有很大人并不能分清楚两者的区别。所以对于这两个概念无论是在理论界还是实业界,都是时常被混淆的概念。只有将两者概念和理论以及实践形式进行明确,才能更好的将其优势与作用发挥出来,并真正能够促进旅游文化产业的稳定发展。

二、关于旅游文化和文化旅游的'概念的界定

旅游文化与文化旅游这两个词语在实际的语境运用当中很容易会弄混乱,导致语境意义完全改变。通过从语言的构词法角度进行分析,对于旅游文化其中的核心词是文化,那么可以看出旅游文化主要表达的就是涉及到旅游方面中的文化内容,其属于文化研究的领域范畴。而对于文化旅游来说,其核心词在旅游,其主要的含义就是通过旅游的形式,有效的感受和了解人类文化,从而深刻感受人类在大自然当中所留下的文化遗迹等。通过对旅游文化与文化旅游的理论角度进行分析,是相对比较简单辨别的。可是从实际角度出发,在实际运用当中,还是很难将两者区分开来,而影响到两个词组的运用。并且一些学者认为,文化产业当中包含旅游产业,由于文化中所涉及的范围是比较广泛的,旅游产业属于文化产业中的内容。可是实际并不是这样的,并且对其进行深度分析发现,文化产业与旅游产业两者是相互并列的内容。首先,对旅游文化进行有效分析。其属于文化领域范畴内的概念,但是对于旅游来说属于文化中的限定词,其展现的是文化行为的表现。在旅游文化概念形成当中是要有几个元素组成的,其包括旅游主体、旅游媒介以及旅游客体三个环节。在其中所提到的旅游主体属于旅游文化的研究核心环节,也就是旅游者。由此就可以看出旅游文化从实际角度就是研究旅游者的一种文化体系。其次,对文化旅游进行全面分析。其被归结为旅游研究范畴内人,主要就是旅游者通过自身的旅游活动形式,以此来满足自身对文化需求。对于文化旅游来说其展现的是一种经历,旅游者在享受旅游的过程当中,会打从精神上获得愉悦心理。由此就可以看出文化旅游注重的是一个过程,其表现在旅游者在进行旅游过程中,根据自身主观意愿对旅游文化进行有效感知。最后,对于两者的密切关系分析。对于旅游文化是文化研究范畴,而文化旅游属于旅游过程中所感受的文化,可是其两者概念中的内涵以及外延,却并不是两个词语在不同形式下的简单分析或是研究。也可以说旅游文化与文化旅游两者间有着密切联系的内容。对于旅游概念自身进行分析,属于人们的一种生活形式,更是展现文化的一种表现。无论是什么样的旅游,都会从中感受到不同的文化。由此可以看出,旅游文化多以人的精神境界进行表达;文化旅游则表现的是旅游参与者,在良好的旅游过程当中,来对其文化进行理解。

三、对于旅游文化与文化旅游概念的区别以及关联分析

1.区别首先,其两者的侧重点有一定的不同,由于旅游文化以旅游为限定词,而文化是核心词,那么可以看出其侧重点为文化,属于文化范畴,对于旅游文化的广义,其中包含了文化在旅游业当中的不同展现,并且也能表出旅游与文化间关系。而从其狭义角度进行分析,旅游文化所表达的就是旅游者在活动当中所引出的文化现象。对于文化旅游来说,穷核心词为旅游,而“文化”是限定词,由此可以看出旅游是其侧重点,属于旅游活动与旅游产品当中重要内容。其次,两者研究的重点有所不同,对于旅游文化的研究来说,其广义角度,不仅注重旅游活动基础理论的研究,其中就包括旅游活动属性、特征以及影响等问题内容,而从穷狭义角度分析,其重视的是旅游业与旅游活动当中的文化内容;而对于文化旅游的重点研究的内容,是旅游活动对象,也就是旅游产品的开发以及其经营管理的问题研究等,更加重视其文化旅游活动特点、管理体制以及文化旅游市场需求特征的研究等内容。最后,两者的学科归属不同,通过对我国现今的学科划分体系进行分析,旅游文化的主体是旅游社会学、心理学以及伦理学范畴内的,也有部分内容是管理学范畴内的部分;而对于文化旅游来说,其主体是旅游管理学以及旅游开发规划学当中的范畴研究内容。而从西方学术界角度进行分析发现,旅游文化属于基础性的学科,文化旅游则是应用性的学科。

2.关联首先,通过以概念的范畴进行分析,旅游文化与文化旅游都是对当前旅游以及文化的结合点进行全面的研究与分析,其两者有着一定的交集,就包括文化旅游资源以及趋向文化景观旅游活动的开展。其次,对于旅游文化研究来说,其包含旅游社会学、旅游心理学以及旅游人类学等非常多的理论与结论参与到研究当中,这对文化旅游的实践以及理论研究都有着极大的作用。并且文化旅游的发展和理论研究,也能够科学有效的丰富旅游文化的内涵,促进两者更好发展。

四、对旅游文化与文化旅游实践情况进行明确

对于旅游文化和文化旅游,其两者间是有着很大的联系的,其两者的交集点是对旅游以及文化间的良好结合点,以此来进行有效的研究与分析,主要就是对旅游资源以及文化景观进行分析,从而明确其特点。这样使得旅游文化更加重视理论的研究,因此可以保障其对文化旅游起到理论和借鉴的作用与优势,并且也能够突显文化旅游重视实践以及丰富旅游文化意义的优势。对于我国来说是拥有着上下五千年文明历史的文化古国,由此能够看出中国的文化历史是非常悠久和深厚的。这就给我国当前旅游业的开发通过了越来越多的文化资源和文化优势,并且我国旅游业的发展方向也要靠着文化优势来稳定发展。对于我国旅游业开发状况进行分析,发现中国旅游业的发展还处在起步时期,我国属于新兴旅游大国。由于具有丰富的自然资源以及深厚的文化底蕴,给我国旅游业的发展提供了坚实有利的基础,虽然我国有很多旅游项目还并没有被开发出来,但是却已经受到世界各地的关注,而真因为这些现象从中出现很多问题。如果将与旅游相关的不同资源良好的挖掘出来,并将其与社会实践紧紧地连接在一起,这是一项需要深思的话题。其中就包括不同的旅游产品能够在真正意义上促进旅游业的稳定发展;在旅游业中出现很多旅行团服务,这为旅游者带来非常多的便利,但是随之而来的就是各种名目收费以及游客消费产生矛盾等问题的出现,会对旅游业发展带来严重影响,这也是一个需要重视和深度研究的内容。对于旅游地来说,其中不仅包括自然遗产,并且也有当地的文化遗产,而在进行旅游资源的开发时,如果只是想单纯地迎合旅游业发展,而对自然和文化的发展带来影响,这样会失去旅游业发展的价值。所以在旅游业发展中也要重视当地自然以及文化的保护,只有这样才能促进我国旅游业的长远发展。

五、结束语

通过对旅游文化与文化旅游两者的概念进行有效分析,发现其两者很容易混淆,因此在实际当中必须要对两者进行明确,并对两个概念进行清楚的界定,只要这样才能将两者优势和作用展现出来,从而科学有效的促进我国旅游业的稳定发展。

参考文献

[1]卢俊莉.旅游文化与文化旅游:理论与实践的若干问题[J].河南科技,2013,(14):237.

[2]徐菊凤.旅游文化与文化旅游:理论与实践的若干问题[J].旅游学刊,2005,(4):67-72.

旅游 文化 是广泛存在于旅游活动中的,由专业人员挖掘或设计出来,满足旅游者特定需要的物质文化与精神文化产品。下面是我为大家整理的有关旅游文化 毕业 论文,供大家参考。

摘要:随着OBOR战略的实施,培养高素质的旅游人才便成为当务之急,这既是社会发展的需要,也是 教育 改革的契机,是实现文化的展示与传承的途径与 方法 。

关键词:旅游文化;特征

现代经济的发展促进了旅游文化的繁荣,“一带一路”(以下简称为“OBOR”)是21世纪初中国为了实现“加强不同文明的交流互鉴、促进世界和平发展、推进沿线各国经济繁荣与区域合作”而提出的战略构想。随着2015年3月国家发改委、商务部、外交部联合发布的《推动共建丝绸之路经济带和21世纪海上丝绸之路的愿景与行动》文件,OBOR战略开始付诸行动。OBOR分为陆路与海路。陆路从西安向西,横穿西亚抵达欧洲荷兰的鹿特丹。海路从长三角、珠三角沿东南亚向西,经非洲过黑海最后抵达欧洲的鹿特丹。因此,新世纪下的OBOR一端为日益崛起的中华经济圈,另一端连接着世界上最重要的经济共同体———欧州联盟,中间是经济潜力巨大的西亚、东南亚和非洲。在OBOR战略构想下,经济的发展与文明的对话,必将促进国内外旅游业的发展,研究OBOR战略下的旅游文化特征,对促进旅游、经济、文化、教育、外交等各方面均有重要的现实意义。

1OBOR背景下旅游文化特征研究

《推动共建丝绸之路经济带和21世纪海上丝绸之路的愿景与行动》在合作重点中明确指出“加强旅游合作,扩大旅游规模,互办旅游推广周、宣传月等活动,联合打造具有丝绸之路特色的国际精品旅游线路和旅游产品,提高沿线各国游客签证便利化水平。推动21世纪海上丝绸之路邮轮旅游合作。积极开展体育交流活动,支持沿线国家申办重大国际体育赛事。”因此,OBOR战略沿线必将呈现出人类古代文明繁荣的鲜活再现、为欣赏旖旎风光的丝绸之路特色的国际精品线路游、沿线OBOR友好城市互办旅游推广活动游、体育活动交流观光、参与、体验游和“新海上丝绸之路游轮游”等5大特征,相应的文化也呈现出这五大特征。

人类古文明的鲜活再现

丝绸之路是跨越文明、贯穿古今的古代经济发展之路,对丝绸之路的重游是对人类古文明的探索与考察,具有旅游和文化挖掘发现的双重意义。2014年,由哈萨克斯坦、吉尔吉斯斯坦、中国三国联合递交的《丝绸之路:长安———天山廊道路网》成功入选《世界遗产名录》,将丝绸之路沿线的人类古文明推向新的历史舞台。透过OBOR,不仅可以探索考察中国自秦、汉至清的灿烂文明与文化,而且还可以探索考察西亚、中亚、欧洲诸国的文明发展史,对比中外历史发展中的文化差异。

博大丰富的汉前文明

OBOR的陆路起点西安,是中华文明的摇篮和发祥地,其历史变迁是华夏文明发展的缩影。以西安为中心辐射出的旅游圈,能充分体现中华古文明。西安早在汉朝以前就具有博大精深的文化,曾是周、秦的都城,同时也是世界历史上的第一座城市。西安高陵杨官寨遗址将人们带回到6000年前的新石器时代,秦始皇兵马俑则展现出了大秦帝国的强盛国力。对OBOR起点城市的考察,人们可以领略汉前中华文字的形成变化、陶器制作工艺、古建筑的特征、古代天文体系、别树一帜的中国数学及丝绸文化等等。

影响深远的汉文化

汉代是中华历史上科技与文化发展的一个辉煌时期,从汉代建立到灭亡的四百多年间,汉代王朝与古罗马成为世界上最为强大的两大帝国,汉王朝雄踞东方,开拓了OBOR的丝绸之路,开辟了东西经济文化技术交流的走廊。而且在汉代,西南丝绸之路也在这个时期开辟,从天府之国的四川成都,到缅甸、印度,将汉朝先进的文化技术传播到东南亚。因此,汉代是OBOR战略的起始朝代,考察旅游OBOR的内涵与文化功能在于探索和考证对后世影响深远的汉代文化。其中著名的建筑文化,有著名诗歌“秦时明月汉时关”为证,可见汉代的建筑科技已经发展到了相当高的水平;还有史学瑰宝的《史记》和《汉书》;蔡伦发明的造纸术,如今在成都、西安、安徽宏村、浙江等地还保留着这种比较原始的造纸术,对人们了解汉代科技文化,起着重要的作用;汉代的《九章算术》、《伤寒杂病论》以及地震仪等都对后世影响深远。深入了解和考察探索汉代文化,对OBOR旅游品质的提升、内涵建设、转型升级都有着重要的意义。

辉煌的隋唐文化

隋唐时期是当时世界上最安定最文明的国家,以强大国力为依托,以蓬勃发展的世俗文化为主体,表现出了内容丰富、思想兼容、形式多样的特点,而这种特点大量汲取少数民族文化的同时,更多的表现出对外文化的输入输出,加强了东西方文化的交流,这其中丝绸之路OBOR起到了非常重要的桥梁和平台作用。辉煌的隋唐文化繁荣发展的原因之一便是东西文化交流的畅通和频繁。考察OBOR线路,不少历史遗迹和名胜景点都是对唐朝文化的重新认知。就科技而言,隋唐发明了火药,将印刷术发展到雕版印刷,代表作有《金刚经》,建造了辉煌的长安城和赵州桥。唐朝是中国诗歌发展的黄金时代,这个历史时期诗人辈出,影响深远,如初唐的陈子昂、盛唐时期成就最高的李白、杜甫,田园山水诗人王维、孟浩然,边塞诗人高适,晚唐诗人杜牧和李商隐等。OBOR线路考察诗人的出生地、作品等,对认识和发扬古代文化,都有着重要的意义,并提升了OBOR区域旅游的品质与内涵。位于OBOR线路上的文化旅游景点众多,其中有著名的敦煌莫高窟,集绘画、书法、乐舞于一体,有很高的旅游、考察、研究价值。辉煌的隋唐文化促进了亚洲文明乃至世界文明的进步,而隋唐文明遗留至今,保留完好的大多分布在OBOR,因此对OBOR旅游线路的开发,是中国旅游改革发展、转型升级的新领域。

鼎盛的宋朝文化

宋朝文化是中华文化的鼎盛时期,是品质旅游和文化旅游的重要内容。宋朝时期,文学、科学、理学、史学等都取得了空前的成就。宋代有大文豪苏轼,还有著名女词人李清照, 散文 家范仲淹等。宋代的四大书法家,对中华后世影响深远。宋代还有无数的著名画家,最能代表中 国画 最高艺术水平的就是宋代 山水画 的博大意境,如今被制作成3D技术重现的《 清明 上河图》等。此外,以朱熹为代表的理学,司马光编写的《资治通鉴》为代表的史学,陶瓷窑为代表的手工业,都达到了很高的水平。对南北宋时期文化的OBOR综合规划,是旅游文化的重要组成部分与提升途径。

文学艺术空前的元、明文化

元、明是中国疆域广阔、国力强盛的时代。元朝进行了大一统,促进了少数民族的融合和文化交流,促进了中外文化交流和中外交通发展,各民族取长补短,互通有无,特别是产生了一个新的民族———回族。研究考察元代文化,对当今国家发展战略乃至世界和平共处都有一定的借鉴意义,因此,重回元朝时代的OBOR线路,在文化、意识形态方面都有重要的历史价值。明继承元代文化,文学艺术空前繁荣,呈现出平民化与世俗化。在文学方面,中国四大名著中的三部《三国演义》、《水浒传》、《西游记》均在明朝完成。在明朝,宗教方面,天主教传入中国,出现了西学东渐的萌芽。资本主义开始萌芽,在OBOR的南线,明朝文化深远的影响着东南亚和南亚。随着丝绸文化的不断影响,中国的庭院建筑随之传入西方。

历史巨变中的清代文化

中华民族领先世界文明几千年,而到了清代,由于清王朝的闭关锁国和自大,直接导致了世界第一次工业革命未能影响中国,从而使中国沦为后来的长达半个多世纪的半殖民半封建社会。为了防止明朝复辟,清关闭了南方的泉州、宁波等重要港口,在北方驻扎重兵,严重影响了丝绸之路东西方文明与科技的交流。清代前期国力强盛,国内安定,因此这一时期的小说、戏剧和绘画都达到了历史最高水平。清代后期逐步落后于世界资本主义强国,反封建思想成为这一时期的主题和特征。神秘的中西亚文化中西亚位于亚非欧三洲的交界地带,素有“五海三洲”之名,是OBOR的重要枢纽和中间连接点,承担着连接亚洲中华经济圈和欧盟两大经济体的作用。中西亚气候干旱、水资源缺乏,但富有石油资源。中西亚还是人类古代文明发源地之一,有辉煌灿烂的古巴比伦,是伊斯兰教、__和犹太教的发源地。研究考察OBOR线路,不仅可以考察探索文明古国中国,还能接触神秘的中西亚文化,最后抵达体验欧洲的近代文明,因此,OBOR是一条古今文明的文化之旅。

精品线路文化兴起

OBOR大战略下,国内旅游将此作为旅游转型升级发展的契机和平台,各地纷纷以OBOR为依托,出台《XXX旅游总体规划纲要》,形成精品线路游,并以精品线路为平台,提升精品线路文化。精品线路将极大的促进旅游文化的发展、丰富旅游文化的内涵,促进文化的交流。随着三部委联合推出的《推动共建丝绸之路经济带和21世纪海上丝绸之路的愿景与行动》的颁布,建设精品线路的步伐在加快。OBOR是世界最精华的旅游资源带,汇集了世界4/5的文明,古代文明古国中国、印度、巴比伦和古罗马均被OBOR有机的整合在一起,向世人展示人类古文明的历史及进程。据新华网报道,国家旅游局将2015年确定为“OBOR旅游年”,推动了国际旅游的发展。北方线路上,甘肃出台《甘肃丝绸之路经济带建设大景区总体规划纲要》,计划至2020年建成20个游客容量为300万人次的大景区,形成华夏寻根线、黄河风情线、民族风情线、中医药养生线、红色旅游线等主题精品品牌线路。新疆维吾尔自治区依靠OBOR战略体系,着眼于优越的旅游资源和天然的区位优势,面向中亚、南亚、西亚及欧洲和非洲开放的最前沿,把丝绸之路做成品牌,形成丝绸之路经济带大旅游概念。此外,湖北、湖南、四川、重庆、陕西、浙江、海南、福建等地均以OBOR发展战略为契机,加快把OBOR线路建成国内一流、国际知名的旅游目的地,开拓旅游文化发展新境界。

沿线城市文化交流频繁

OBOR战略体系下,国内城市之间,国际城市之间,OBOR线路带城市之间的文化交流更加宽广深入。OBOR战略前提下,形成全新的四大城市文化交流线路体系:

西北方向的新亚欧陆桥城市文化交流

从西安经兰州,通过乌鲁木齐 出国 境线,连接哈萨克及其中亚、西亚、中东欧等国家。乌鲁木齐将利用独特的区位优势和向西开放重要窗口作用,成为丝绸之路城市文化交流的核心城市。西北方向城市间的文化交流内容广泛,涵盖教育、城市交通、宗教信仰、城市文化等,有利于促进城市、区域的共同繁荣。

南方的海上丝绸之路城市文化交流

以福建大中城市为核心区,通过长三角、珠三角、环渤海、海峡西岸等地区的港口、滨海地带和岛屿共同连接太平洋、印度洋等沿岸国家或地区。南方的海上丝绸之路包括了中国最有活力的长三角和珠三角经济区,连接了日本、韩国等许多大中城市,对东亚的稳定和促进东亚国家之间、城市之间的了解和合作有着重要作用。

西南方向的中国-南亚-西亚城市文化交流

从成都、重庆经云南、广西连接巴基斯坦、印度、缅甸、泰国、老挝、柬埔寨、马来西亚、越南、新加坡等国家的城市,促进南亚国家之间的文化交流。

东北方向的中蒙俄城市文化交流

从东三省向东连接绥芬河、海参崴出海口,向西连接俄罗斯赤塔,通过老亚欧大陆桥抵达欧洲。目前,东北方向已开通“津满欧”、“苏满欧”、“粤满欧”、“沈满欧”等“中俄欧”铁路国际货运班列,并基本实现常态化运营。随着OBOR线路高铁的建设运营,东北方向的经济带将呈现出强劲的发展势头,城市间的文化交流、文化推广将出现繁荣鼎盛的新局面。

体育活动文化交流

体育活动文化交流对促进国家之间、城市之间、民族之间的了解和文化交流有着重要作用。20世纪七十年代的中国就曾经以“小球撬动了大球”,通过兵乓球的比赛展开了对美国的外交。如今的国际化体育赛事如NBA、F1、奥运会、洲际运动会、 足球 等,都是国家和民族展示各自文化的平台。OBOR战略体系下,体育活动文化交流是文化交流的先行者,通过开展体育活动文化交流,加深了国家与国家之间、民族与民族之间的了解,对实现区域和平稳定共同发展,有着重要意义。

新海上丝绸之路文化

“海上丝绸之路”是古代中国与外国进行贸易和文化交流的通道,起始于秦代,繁荣于隋唐,鼎盛于明代,以广州为起点,连接日本及东南亚诸国,其中最为著名的郑和下西洋。2013年,国家主席提出了建设“新海上丝绸之路”的构想,从而拉开了建设新的贸易与文化交流通道的序幕。新海上丝绸之路文化交流既包括古代文明的交流,也包括现代文明的交流。新海上丝绸之路文化的交流与合作,对区域经济的交流与合作、区域一体化、区域繁荣稳定有着重要意义,并与亚投行遥相呼应,成为中国走向世界的两大战略举措。

2OBOR旅游文化新内涵及其发展趋势

OBOR战略体系下,随着高铁的建设发展、亚投行的建设运行,OBOR旅游承载着传播古代文明,发扬人类文明,建设现代文明的重任。在体验博大精深的中华文明的同时,也体验世界不同国家和地区的文明文化。OBOR集中了世界4/5的文明,新OBOR旅游呈现出旅游文化互补、国内外旅游文化输入输出平衡发展、中国古文明与现代文化共同发展、文化发展推动社会发展等新内涵与发展趋势。

国内国际旅游文化互补

文化是一个国家、民族的精华。目前,旅游文化已经趋于大众化,对旅游文化的研究也进入瓶颈阶段[1]。究其根本原因在于旅游文化的单一和旅游文化的互补性不强。实际上,旅游文化是一个国家,一个民族文化的体现,是广泛存在于旅游活动中的[2]。旅游文化主要体现在两个方面:(一)旅游目的地对旅游兴趣产品、服务的开发、再生产及营销;(二)不同类型的旅游者特征、体验模式及行为。就这两点而言,只有旅游文化互补,旅游文化才能发展。OBOR线路涉及众多的城市和全世界主要的人类文明和现代文化,因此,出现极强的旅游文化互补,能更好地促进旅游文化的发展。

国内外旅游文化输入输出平衡发展

改革开放以来,中国旅游蓬勃发展。随着国内外旅游的发展,对外文化输出趋势明显,而对内文化输入、吸收、演变的趋势缓慢,这就呈现出国内外旅游文化输入输出不平衡发展的现象。国内很多景区接待的游客多为境内游客,境外游客较少的现象普遍存在。在出境游方面,出境游甚至超过了经济发展增速[3],远远高于入境游,不仅产生了国际旅游的不平衡发展,也导致了国际旅游文化失衡现象。OBOR战略下,境内境外旅游有机结合,成为系统旅游下的两个有机部分,这两部分各有特色,但又高度统一在OBOR下,因此国内外旅游文化输入输出成为OBOR旅游文化的不可分割的两部分,将出现均衡发展的态势。

中国古文明与现代文化共同发展

OBOR是贯穿古今文明的线路,将中国古文明与现代文化有机结合起来,促进中国古代文明与现代文化共同发展。中国古代文明博大精深、辉煌灿烂,有着悠久的历史。中国5000年的文明中,天文、算术、教育、哲学、科技、学制等,都有着历史意义,与现代文明一起,推动“中国梦”的实现。

文化发展推动社会发展

OBOR战略体系的目的在于促进沿线沿路城市和区域的共同发展,用文化的发展来推动社会的发展。新的文化带来新的旅游消费观念,人们在日益国际化的旅游文化中,逐步提高公民意识,发扬中华文化的优良传统,通过在旅游活动中帮助他人、自觉排队、低碳出行等行为,影响和推动交际文化的发展。为适应OBOR战略体系的发展,教育、外交、建筑、交通等也融合了国际文化内容,这些新的内涵特征一起推动社会的发展,为共同富裕和区域发展创造条件。

3启示

对OBOR旅游文化特征及新特征的研究,可以得到以下的一些启示:

加强国际间的文化交流与合作,实现文化的交流互鉴

OBOR是实现区域发展和共同富裕的战略举措,必须加强国际间的战略合作,相应的,在文化上也要加强国家间、区域间的交流与合作。在依托亚洲,促进亚非欧经济发展的同时,也促进世界文化的交流和发展。目前,中国已同俄罗斯、塔吉克斯坦、哈萨克斯坦、卡塔尔、科威特等多个国家签署了同OBOR建设相关的合作协议,有60多个沿线国家和国际组织对参与OBOR建设表达了积极态度。随着OBOR建设中的互通互联,泛亚洲高铁网的建设,国际间的战略合作将进步一步加强,有利于世界的和平稳定,共同发展主题。

充分利用亚投行的战略平台,加强中华文明的国际影响

亚投行是亚洲基础设施投资银行的简称,缩写为AIIB,总部设在北京,是一个政府间性质的亚洲区域多边开发机构,重点支持基础设施建设,是OBOR支撑的经济战略平台,能为“丝绸之路”基金提供强有力的保证,应充分利用亚投行的战略平台,加强中华文明的国际影响,加快中华文明文化的输出。截止2015年4月,英国、德国、意大利、法国、韩国、俄罗斯、澳大利亚、埃及、瑞典等国先后已同意加入亚洲基础设施投资银行,亚投行的成员国已达57个,大多数是OBOR战略体系下国家,这不仅为OBOR产业合作提供强有力的经济基础,还有利于OBOR战略体系下旅游文化的健康发展。应充分利用亚投行的经济战略平台,为旅游提供一体化支付等提供经济便利,在此基础上,尽快完善一体化下的文化交流与融合。

加快落实国家旅游局的全局战略规划行动

2015年,国家旅游局从全局出发,制定了《丝绸之路经济带和21世纪海上丝绸之路旅游合作发展战略规划》,该规划在组织专家进行3轮讨论后,形成定稿,包括实施重点行动等内容。OBOR核心城市和区域早在OBOR战略提出后,已经做出OBOR的发展布局,以“丝绸之路”为主题的旅游节庆、旅游营销大幅增多。因此,各地加快落实国家旅游局的全局战略规划,有利于国内旅游的健康发展和旅游升级,促进出境入境旅游的平衡发展。

培养高素质的旅游人才,实现文化的展示与传承

随着OBOR战略的实施,培养高素质的旅游人才便成为当务之急,这既是社会发展的需要,也是教育改革的契机,是实现文化的展示与传承的途径与方法。培养能面对不同文化,不同习俗的旅游者的专门人才,不仅要求具有很好的处理旅游行业的专业综合知识,包括接机、酒店入住、报关、旅游景点导游等素质,而且要求具有很好的一门或者几门外语能力。在此基础上,培养能冷静面对各种问题,灵活机智的解决风俗文化问题,友好周到有耐心的处理导游过程问题等多方面能力素质,是培养高素质的旅游人才的基本要求和内在诉求。

参考文献

1、旅游文化与文化旅游:理论与实践的若干问题徐菊凤旅游学刊2005-07-18

2、神仙世界与泰山文化旅游城的形象策划(CI)陈传康,王新军旅游学刊1996-01-18

摘要:

在旅游产业飞速发展的过程中,相关部门要处理好旅游文化与旅游经济的关系,促进旅游业与世界接轨,逐步走向现代化的发展历程,使我国的旅游文化与旅游经济朝着又好又快的趋势发展。

关键词:旅游文化;现代旅游经济

近年来,中国旅游业的发展速度越来越快,也面临着巨大的挑战与冲击。中国的旅游业要想与世界旅游发展的潮流相适应,就要创设一条现代旅游经济的道路,将旅游文化与旅游经济的内在关系处理好,促进旅游业朝着更好更快的方向发展。

一、文化与旅游

1、旅游与文化的本质联系。

旅游与文化二者之间存在着必然的联系。所谓的旅游,就是人类文明活动的本质特征。而文化在广义上是指人们创造物质财富与精神财富的总和,这也是人与动物的本质区别。人只有在物质条件得到了一定的满足后,才能在心理、情感等各个方面得到更深一步的发展,从而创造出丰富的精神文化。文化在狭义上主要是指精神性的文化,这也是文化的内在本质。人类旅游就是通过拓展生存空间这种形式,设法促进自身的精神发展,用文化精神来武装自己。旅游的外在表现,主要是指人的移动,通常是指旅游文化的交流与沟通,这是推动人类社会发展的重要形式。真正意义上的旅游,就是一种求知与审美,逐步开阔人类的视野,积极改善自身的生存条件,从而逐步提高自己的精神追求。旅游文化就其本质而言,就是人类对美的追求与感悟。这种活动从广义上来讲,即是一种旅游文化的消费过程,也是一种文化的创造过程。人类在欣赏大自然景观的过程中,将会逐步提升自己的文化素养、审美情趣以及审美能力,这就需要人类具有丰富的文化内涵,才能发现大自然神秘的生命气息与运动规律。旅游文化是人类对美学的发现与概括,以及对艺术哲学的思考。因此,旅游文化具有陶冶情操的作用,从这种人文角度而言,旅游文化实质上就是一种精神性的文化活动。

2、文化是旅游业的内在灵魂。

旅游业现已逐步成为世界上最大的新兴第三产业,这主要是因为旅游业的产生与发展,从古至今都与文化有密切的联系。旅游业始终都是以文化为载体的,是在文化基础上建立起来的经济产业。旅游资源可以分为自然景观与人文景观,人文景观就是指文化创造出来的产物,其核心内容就是文化特色。旅游业主要是以某个国家、地区独特的文化吸引游客,以此取得较大的经济效益。旅游经济是一种将文化与经济结合最为密切的活动,是通过一定的文化观念与精神需求,满足游客的观赏愿望,尤其是满足游客精神、文化上的需求。

二、旅游经济文化与旅游文化经济

当代旅游业在发展的过程中,经济与文化是相互整合的。旅游资源的开发与利用,经营与管理,都是以文化作为基础的。只要有旅游活动在进行,就肯定会有文化因素渗透其中。旅游作为一种文化型的产业,经济与文化保持高度的一体化,这是一种必然的社会趋势。

1、旅游文化是一种独立出来的形态。

旅游文化自身就具备鲜明的文化特征,主要有以下两个特征:第一,综合性与多样性。旅游文化是指与旅游相关的各种文化概况,是旅游产品六大因素的统一,并从整体上构成旅游文化的产业链,同时又能够在旅游产品中显示其自身的文化内涵。但旅游文化必须要适应不同的消费群体,充分体现出产品消费的多样性、广泛性。第二,服务性与经济性。旅游产品所体现出的核心要素就是服务性,优质的旅游服务,可以给游客带来精神上的满足,让游客获得美好的心理体验。同时,旅游文化也展示出自身较强的功利性,通过各种文化功能,以期获得最大的经济效益,实现最大化的经济价值。这两种旅游文化特征,都间接表明旅游文化的形态,展示出自身丰富的精神文化内涵。

2、旅游文化是一个系统的文化工程。

旅游文化更应该注重内在精神的建设,任何文化都涵盖了物质文化、精神文化与环境文化。旅游文化也是如此,这就表明精神建设在旅游文化中起着决定性的作用。旅游活动中的精神因素是构成旅游文化的精神文化,对旅游业起着引导与深化作用,也是旅游文化追求的最高目的。旅游本身也是一种经济文化现象,内涵非常丰富,涉及到的范围也非常广,这是旅游文化由自然经济文化向现代经济文化逐步过渡的趋向。因此,旅游业必须要充分结合市场经济的发展,结合国情,研究旅游文化产品的市场。同时,始终坚持旅游文化的原则,把它作为一种系统的文化工程,带动相关的经济发展,并把旅游文化建设落实到实处,增加人力、物力的支出,逐步完善旅游文化产业的内容,丰富旅游文化的精神内涵,促进旅游文化产业的迅速发展。

结语

在旅游产业飞速发展的过程中,相关部门要处理好旅游文化与旅游经济的关系,促进旅游业与世界接轨,逐步走向现代化的发展历程,使我国的旅游文化与旅游经济朝着又好又快的趋势发展。

参考文献

1、旅游对目的地社会文化影响研究结构框架刘赵平桂林旅游高等专科学校学报1999-02-01

2、旅游产业与文化产业融合发展研究张海燕;王忠云;资源开发与市场2010-04-20186 有关旅游文化毕业论文相关 文章 :

1. 大学生旅游专业毕业论文

2. 旅游管理本科毕业论文范文

3. 本科毕业论文旅游管理

4. 旅游管理毕业论文

5. 2016旅游管理论文参考

6. 旅游管理本科毕业论文

文化型旅游景区游客体验研究论文

这些方面的毕竟好写徽州文化信息资源的保护管理与开发利用研究随州市新农村文化建设的研究视听产品进出口贸易法律规制问题研究国家出版基金专题研究乡村综合治理中的新农村文化建设研究两型社会建设背景下农村文化建设研究北妇社图书编校项目质量控制研究文化型旅游景区游客体验研究烟台市普通高校网球运动开展现状及发展对策研究南阳文化旅游发展研究

范围广,选题很多的

旅游业做为新兴的产业在国民经济中具有越来越重要的地位。特别是近几年来,已经成为了一些国家和地区重要的经济支柱。然后,这种新兴的“绿色产业”正在是益陷入极其尴尬的境地。由于一些地方过于追求眼前的经济效益,过度,盲目开发旅游资源,造成了对生态环境的严重破坏。使得一些地方的旅游业在迅猛发展的同时,也面临着严重的衰退危机。因为,实现旅游业的可持续发展,已经是一个旅游界面临的极其迫切的课题了。

而充分发掘“文化旅游资源”可是说是解决这一课题的有效途径之一。

1文化旅游实现旅游资源多元化

文化旅游是对自然景观的人文观照,游客可以对自然物的观赏,从中探寻人类的发展历程。比如,游客在登上泰山之巅时,回首望望那苍茫的齐鲁大地,想想当年,多少帝王泰山封禅,召告天下,那种君临天下的威武,那种一览众山小的气概。体现了中国几千年来的君主专制制度的气势与威严。也会感到,这样一个大国所受的专制的桎梏。从中,加深了对中国历史的体味与感悟。再比如游客去西安秦始皇陵兵马甬,在观看那气势宏伟的石人石马时,那种沙场点兵的古战场仿佛就在眼前。我们在感受气势宏大之时,怎能不慷慨大秦帝国经济的发达与国力的强盛,还有工匠数量之多,技艺之精湛?文化旅游是对旧时生活方式,不同的民族,不同地域文化,风土人情的人文观照。比如,在民族众多的云南省,你会处处感受到不同民族,民俗的风情,不论是婚俗,还是节俗,都会让各地的游客感到新鲜,现在,这种民俗游已经日益成为了旅游业的重要组成部分了。而中国又是一个统一的多民族回家,在五千年文明发展历程中,各民族形成了各自风格的民族特色文化,从而共同构成了中华文明的博大精深。这些,已经是中国旅游得天独厚的优势,也是现代都市人感到好奇和新鲜的旅游点,如果加以合理开发,必然会带来巨大的旅游效益。

2文化资源具有传承性和可持续性旅游资源

按其特点分为自然资源和人文旅游资源。自然资源包括可供旅游者游览的植物、动物、矿产、山川地貌及美丽风景等。它最显著的特征是其脆弱性和不可再生性。而人文旅游资源则具有鲜明的历史性、民族性及文化性。与自然资源相比,他的最大的优势就是其传承性和可持续性。特别对于中国这样一个史学极其发达的国度,文化的传承从来就没有中断过。无论是文化遗址,还是民风民俗,或是古代建筑,亦或是民间艺术。这些人类宝贵的文化遗产在中国都得到充分完好的保留。这就为中国的旅游资源注入了新的内容与拓宽开发的空间。

文化旅游资源作为人类文明的载体,它以为丰富的内涵和广阔的外延,给游客带来了无限的文化感染和艺术熏陶。而且,这种文化旅游资源,不会因为游客数量的增加而受到破坏,相反,却会因为游客的`日益增加而丰富他的内涵,同时,通过游客之间的口耳相传,会扩大其辐射范围。如果能对其合理的进行开发与挖掘,这种文化资源会越来越厚重。比如,帝王陵可能会因年久失修而残破甚至倒掉,但其中的故事却会因年代的久远而历久弥新,更具吸引力。因此,这种文化资源的传承性与可持续性应在旅游资源的开发中给以足够的重视。

文化旅游资源的可持续性还表现为文化旅游资源的再创造。历史文化是可以再加工,再创造的,随着时间的推移和旅客的文化需求,每一名旅游人都可以在合理的范围内对原来的历史文化,历史典故进行再加工,进行合理的演义,付以其新的时代内涵。让历史文化真正的鲜活起来,比如可以借鉴《百家讲坛》那样的方式和内容,对原有的历史文化资源进行新的阐述和理解。从而,提升旅游文化资源的深度与厚度。

3人文旅游资源的差异性

可以提高景点的竞争力和吸引力旅游的本质从某种层面上来讲,就是在一定区域生活的人到另一个区域去感受不同的自然景观与文化差异。因此,旅游的核心就是地域和文化的差异性。这就意味着,只有不同的特色文化才是吸引游客四处奔波浏览的关键。各个景点也只有尽量打造自己的特色文化才能在激烈的旅游市场竞争中争取主动以致胜利。据有关资料统计显示,欧洲各国的入境旅游者,进行文化旅游的占65%;在美国人中,27%的人每年在文化旅游的消费总额达数十亿美元。日本人来华旅游的目的也各不相同:了解中国历史文化、古迹的占49%,体察民俗风情的占22%,观赏文艺美术的占7%,品尝风味佳肴的占,其他占。可见,吸引国际游客的主要是中国独特的文化魅力。从这种意义来讲,如何打造本地特色的文化品牌,是每一个旅游区工作人员好好研究的课题之一。

反观当下的旅游市场在这方面却不尽如人意,不同的旅游景点,文化的趋同越来越明显,有的甚至出现了抄袭的现象。比如,到处都可以见到的有些牵强的“一线天”景点,让旅客越来越觉得旅游文化资源的单一与匮乏。还有那只在有山有水就有的商业味十足的“放生池”已经让游客产生了严重的审美疲劳,如果旅游景点再不能拿出自己的特色,也许真的有一天这些土方就是“门前冷落车马稀”了。

总之,文化旅游,现在已经是实现旅游业可持续发展的强大动力之一。巴蜀文化,荆楚文化,齐鲁文化,这些极具地方特色的文化品牌,已经日益显示出了文化旅游的极大魅力,吸引着越来越多的人奔向他们的怀抱。还有,近几年正在兴起的红色文化之旅,也都是因为,这种文化资源的独特性,使旅游资源出现了新的增长点。可见,要想让旅游这种“无烟的绿色产业”真正在永葆青春,可持续发展,好好发掘各地的特色文化资源,已经是一种有效的途径了。

4、经济波动与建筑材料价格相关性分析

表1预警指数与建筑材料价格的相关系数计算结果变量相关系数变量相关系数变量相关系数圆钢镀锌管汽油螺纹钢镀锌板电线材普通硅酸盐水泥水中厚板矿渣硅酸盐水泥沪铝薄板柴油沪铜相关性分析(1)根据以上计算结果,不难发现,经济波动与大宗原材料价格的涨跌是有相互关系的。

(2)将不同的建筑材料与预警指数的相关系数值用柱形图表示,见图1。

图1建筑材料价格与预警指数相关系数值对照图我们发现不同的材料与经济波动的相关关系的强弱不同。总体而言,金属类及原油的衍生物与经济波动的相关关系表现的比较强,而水泥与经济波动的相关关系相对比较弱,水、电做为国家宏观经济所控制的材料,伴随着经济的长期趋势发展,也表现出了相当强的相关性,但由于其市场经济程度化不高,故不做详细分析。

(3)在价格波动的过程中,由于生产材料的工厂兴建的时间长短不同,不同材料的上涨幅度与回落方式不一样。在水利工程中钢材及水泥所占的建筑材料总成本最大,故着重分析钢材及水泥的价格走势。就钢材市场而言,当供需矛盾发生,产生供不应求的情况下,由于兴建一个炼钢厂需要1~2 a的时间,所以价格会持续上升,且上升空间大,利润会促使更多炼钢厂的兴建,直至出现市场供过于求的状况,此时钢材价格便会回落,但由于受成本的支撑,钢材价格回落缓慢,表现出了较弱的供给弹性及相当强的需求弹性。而水泥厂的兴建周期很短,180 d即可。当市场上出现供不应求的状况时,水泥价格会急剧上涨,但同样利润会促使更多工厂的兴建,在很短的时间内就会导致水泥市场供过于求,价格上升幅度不大而且能迅速回落。

(4)经济的复苏会拉动原材料价格的上升,而原材料价格的下跌则超前于经济的滑落。以钢材为例,我国新一轮的经济增长从2002年8月份复苏,突破前期高点,而钢材价格则到2003年2月份才突破前期高点。2004年4月份钢材价格大幅度下跌,2004年8月经济回落。

[参考文献]

[1]李洁明,祁新娥.经济统计学简明教程[M].上海:复旦大学出版社,2003.

[2]于俊年.计量经济学[M].北京:对外经济贸易大学出版社,2000.

[3]厉以宁.中国经济增长与波动[M].北京:中国计划出版社,1993.

[4]丁世昭.建设工程项目管理[M].北京:中国建筑工业出版社,2004.

[5]吴翊,李永乐,胡庆军.应用数理统计[M].北京:国防科技大学出版社,2005.

[6]王立九,李振荣.建筑材料学[M].北京:中国水利水电出版社,1997.

[7]李世蓉,邓铁军.工程建设项目管理[M].武汉:武汉理工大学出版社,2002.

数据挖掘算法与研究的论文

数据挖掘在软件工程技术中的应用毕业论文

【 摘要 】计算机技术在发展,软件也发展的越来越复杂,而系统开发工作也显得更加重要。信息技术的广泛应用会产生大量数据,通过对数据进行挖掘,分析其存在的规律,对实现数据资源的有效利用意义重大。本文就数据挖掘技术在软件工程中的应用作简要阐述。

【 关键词 】数据挖掘技术;软件工程中;应用软件技术

随着信息技术发展而快速发展,但是其可控性并不是特别强。软件在应用过程中会产生大量数据,数据作为一种宝贵的资源,有效的利用可以带来价值增值。作为软件开发行业,数据挖掘技术应用则实现了数据资源的有效利用,通过对其中规律进行研究,为软件工程提供相应指导,并且对于系统故障能够有效处理,成本评估的有效性也能够提升。

1数据挖掘技术应用存在的问题

信息数据自身存在的复杂性

软件工程所包含的数据可以分为两个类别,结构化与非结构化。在非结构化数据中软件代码发挥着重要作用。而对结构化数据产生影响的则是软件版本信息。结构与非结构化数据二者之间联系非常密切。实现数据有效利用就需要通过一定技术找出其中的规律。数据挖掘技术则刚好满足需求。利用该技术对结构与非结构化数据进行整合,提升其使用的有效性。

在评价标准方面缺乏一致性

数据挖掘技术在生活中的应用比较广泛,通过该技术应用能够更好的对实际情况进行评价,从而对结果进行优化。但是由于没有统一标准,导致了软件信息复杂。而在表述方式方面自身又存有差异性。信息获取者无法有效的对信息进行应用及对比。而信息缺乏统一标准的原因就在于评价方式不一致。

2数据挖掘技术在软件工程中的应用

数据挖掘执行记录

执行记录挖掘主要是对主程序的路径进行分析,从而发现程序代码存有的相关关系。其实质是通过对相关执行路径进行分析,并进行逆向建模,最终达到目的。作用在于验证,维护,了解程序。记录挖掘的过程通常是对被分析的系统进行初步插装,之后是记录过程,该过程在执行上一步程序后,对应用编程接口,系统,模块的状态变量记录,最后是对所得到的信息进行约简,过滤,聚类。最终得到的模型能够表达系统的特征。

漏洞检测

系统或是软件自身都会存在漏洞,漏洞自身具一定的隐蔽性,由于人的思维存在某些盲区,无法发现漏洞的存在,就需要借助于某些软件。检测漏洞的目的就在于找出软件中存在的漏洞及错误,并对其进行修复,从而保证软件质量与安全。将数据挖掘技术应用于软件检测,首先要确定测试项目,结合到用户需要,对测试内容进行规划,从而确定测试方法,并制定出具体方案。测试工作环节主要是对数据进行清理与转换,其基础在于漏洞数据收集,通过对收集与采集的信息进行清理,将与软件数据有关联同时存在缺陷的数据筛选出来,而将剩余无数据清理,对丢失项目采取相应措施补充,将其属性转换为数值表示。之后是选择适当的'模型进行训练与验证,该环节要结合到项目实际的需要选择挖掘方式,通过对不同数据结果进行分析与比较找到最适合的方式。之后则是重复应用上述方法,对软件存在的漏洞进行定位与检测。并将与之对应的数据收集于软件库,在对漏洞进行描述的基础上分类,最后将通过挖掘得到的知识应用到测试的项目中.

开源软件

对于开源软件的管理由于其自身的开放,动态与全局性,需要与传统管理软件进行区别对待,一般情况下,成熟的开源软件对于软件应用记录较为完整,参与的内容包括了错误报告,开发者活动。参与开发的工作人员会处在动态变化之中,存在动态变化的原因就在于软件的开放性。同时对于软件中动态性特征的挖掘,可达到对开源软件进行优质管理的目标。

版本控制信息

为了保证参与项目人员所共同编辑内容的统一性,就需要对系统应用进行控制。软件开发工程应用中,开发工作管理与保护都会通过版本控制系统来实施。并且其应用方式主要是对变更数据挖掘,找出不同模块及系统存在关系,并对程序中可能会存在的漏洞进行检测。此类技术的应用,使得系统后期维护成本被有效的降低,而对后期变更产生的漏洞也有一定的规避作用。

3数据挖掘在软件工程中的应用

关联法

该方法作用在于寻找数据中存在的相关联系与有趣关联。而体现的关联规则有两个明显的特征。①支持度;②信度。前者表示在某个事物集中,两个子集出现的概率是相同的。而后者则表明了某事物在事物集中出现的概率,而另一事物也会出现。

分类方法

该方法主要是应用于分类标号与离散值的操作。该方法的操作步骤是,首先要建立相应的模型,对数据进行描述,并利用模型对其进行分类。在分类方法选择方面,常用的有判定树法,贝叶斯法,支持项量机法等。判定树法应用的基础是贪心算法。

聚类方法

该方法常用的有划分方法,基于密度,模型,网格的方法与层次方法。聚类分析输入的是一组有序对,有序对中的数据分别表示了样本,相似度。其基本的应用理论是依据不同的对象数据予以应用。

4数据挖掘在软件工程中的应用

对克隆代码的数据挖掘

在软件工程中最为原始的是对克隆代码的检查测试。就其方式而言有文本对比为基础,标识符对比为基础。前者是利用系统中程序代码包含的语句进行判断。该方法在后期改进过程中主要是对字符串匹配效率进行提升。实际应用过程中是通过相关函数匹配对效率进行优化。

软件数据检索挖掘

该方法同样是软件工程中原始的挖掘需求之一。该方法在应用时主要有以下三个步骤。

①数据录入。其实质是对需要检索的信息录入,并结合到使用者需要在数据中查找使用者需要的数据。

②信息查找过程。确认了用户需要查找的信息后,系统将依据信息内容在数据库中进行查找,并分类罗列。

③信息数据导出与查看。用户可以依据自身需要将数据导出或者是在线查看。数据在导出时会形成相应的记录,客户再次进行查找时就会更加的方便与快捷。而将数据导出则需要利用到相关的软件。

应用于设计的三个阶段

软件工程有许多关于软件的资料,资料通常是存放于代码库中。数据运用可以提升工作效率。软件工程每一次循环都会产生大量的数据。基于软件工程生命周期可以将其分为分析设计,迭代的开发,维护应用三个阶段。

面向项目管理数据集的挖掘

软件开发工作到目前已经是将多学科集中于一体。如经济学,组织行为学,管理学等。对于软件开发者而言,关注的重点除过技术方面革新外,同时也需要科学规范的管理。除过对于版本控制信息挖掘外,还有人员组织关系挖掘。对于大规模的软件开发工作而言,对人力资源的有效分配与协调也是软件工作领域需要面对的问题。例如在大型系统开发过程中,往往会有许多人参与其中,人员之间需要进行沟通交流。交流方式包括了面对面沟通,文档传递,电子信息等。通过对人员之间的关系进行挖掘,有利于管理工作开展。员工群体存在的网络是社会网络。通过人员合理组织与分配,将会影响到项目进度,成本,成功的可能性。而对该方面实施研究通常采用的是模拟建模。

5结束语

软件工程技术在生活中许多领域都有广泛的应用,数据挖掘作为其中的一项技术,其重要性及作用随着技术发展而表现的越加明显。为了保证挖掘技术的可靠性与高效,与其它工程技术有一定融合性。数据挖掘在实际应用工作中体现出了巨大的经济效益,因此应该大力推进其应用的范围,并拓展其应用的深度与层次。

参考文献

[1]李红兰.试论数据挖掘技术在软件工程中的应用综述[J].电脑知识与技术,2016(34).

[2]雷蕾.关于数据挖掘技术在软件工程中的应用综述究[J].电子测试,2014(02).

[3]孙云鹏.数据挖掘技术在软件工程中的应用综述[J].中国新通信,2015(15).

数据挖掘的算法及技术的应用的研究论文

摘要: 数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中发现隐含的、规律性的、人们事先未知的, 但又是潜在有用的并且最终可被理解的信息和知识的非平凡过程。任何有数据管理和知识发现需求的地方都可以借助数据挖掘技术来解决问题。本文对数据挖掘的算法以及数据挖掘技术的应用展开研究, 论文对数据挖掘技术的应用做了有益的研究。

关键词: 数据挖掘; 技术; 应用;

引言: 数据挖掘技术是人们长期对数据库技术进行研究和开发的结果。起初各种商业数据是存储在计算机的数据库中的, 然后发展到可对数据库进行查询和访问, 进而发展到对数据库的即时遍历。数据挖掘使数据库技术进入了一个更高级的阶段, 它不仅能对过去的数据进行查询和遍历, 并且能够找出过去数据之间的潜在联系, 从而促进信息的传递。

一、数据挖掘概述

数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中发现隐含的、规律性的、人们事先未知的, 但又是潜在有用的并且最终可被理解的信息和知识的非平凡过程。

二、数据挖掘的基本过程

(1) 数据选择:选择与目标相关的数据进行数据挖掘。根据不同的数据挖掘目标, 对数据进行处理, 不仅可以排除不必要的数据干扰, 还可以极大地提高数据挖掘的效率。 (2) 数据预处理:主要进行数据清理、数据集成和变换、数据归约、离散化和概念分层生成。 (3) 模式发现:从数据中发现用户感兴趣的模式的过程.是知识发现的主要的处理过程。 (4) 模式评估:通过某种度量得出真正代表知识的模式。一般来说企业进行数据挖掘主要遵循以下流程——准备数据, 即收集数据并进行积累, 此时企业就需要知道其所需要的是什么样的数据, 并通过分类、编辑、清洗、预处理得到客观明确的目标数据。数据挖掘这是最为关键的步骤, 主要是针对预处理后的数据进行进一步的挖掘, 取得更加客观准确的数据, 方能引入决策之中, 不同的企业可能采取的数据挖掘技术不同, 但在当前来看暂时脱离不了上述的挖掘方法。当然随着技术的进步, 大数据必定会进一步成为企业的立身之本, 在当前已经在很多领域得以应用。如市场营销, 这是数据挖掘应用最早的领域, 旨在挖掘用户消费习惯, 分析用户消费特征进而进行精准营销。就以令人深恶痛绝的弹窗广告来说, 当消费者有网购习惯并在网络上搜索喜爱的产品, 当再一次进行搜索时, 就会弹出很多针对消费者消费习惯的商品。

三、数据挖掘方法

1、聚集发现。

聚集是把整个数据库分成不同的群组。它的目的是要群与群之间差别很明显.而同一个群之间的数据尽量相似.聚集在电子商务上的典型应用是帮助市场分析人员从客户基本库中发现不同的客户群, 并且用购买模式来刻画不同客户群的特征。此外聚类分析可以作为其它算法 (如特征和分类等) 的预处理步骤, 这些算法再在生成的簇上进行处理。与分类不同, 在开始聚集之前你不知道要把数据分成几组, 也不知道怎么分 (依照哪几个变量) .因此在聚集之后要有一个对业务很熟悉的人来解释这样分群的意义。很多情况下一次聚集你得到的分群对你的业务来说可能并不好, 这时你需要删除或增加变量以影响分群的方式, 经过几次反复之后才能最终得到一个理想的结果.聚类方法主要有两类, 包括统计方法和神经网络方法.自组织神经网络方法和K-均值是比较常用的`聚集算法。

2、决策树。

这在解决归类与预测上能力极强, 通过一系列的问题组成法则并表达出来, 然后经过不断询问问题导出所需的结果。典型的决策树顶端是一个树根, 底部拥有许多树叶, 记录分解成不同的子集, 每个子集可能包含一个简单法则。

四、数据挖掘的应用领域

市场营销

市场销售数据采掘在销售业上的应用可分为两类:数据库销售和篮子数据分析。前者的任务是通过交互式查询、数据分割和模型预测等方法来选择潜在的顾客以便向它们推销产品, 而不是像以前那样盲目地选择顾客推销;后者的任务是分析市场销售数据以识别顾客的购买行为模式, 从而帮助确定商店货架的布局排放以促销某些商品。

金融投资

典型的金融分析领域有投资评估和股票交易市场预测, 分析方法一般采用模型预测法。这方面的系统有Fidelity Stock Selector, LBS Capital Management。前者的任务是使用神经网络模型选择投资, 后者则使用了专家系统、神经网络和基因算法技术辅助管理多达6亿美元的有价证券。

结论:数据挖掘是一种新兴的智能信息处理技术。随着相关信息技术的迅猛发展, 数据挖掘的应用领域不断地拓宽和深入, 特别是在电信、军事、生物工程和商业智能等方面的应用将成为新的研究热点。同时, 数据挖掘应用也面临着许多技术上的挑战, 如何对复杂类型的数据进行挖掘, 数据挖掘与数据库、数据仓库和Web技术等技术的集成问题, 以及数据挖掘的可视化和数据质量等问题都有待于进一步研究和探索。

参考文献

[1]孟强, 李海晨.Web数据挖掘技术及应用研究[J].电脑与信息技术, 2017, 25 (1) :59-62.

[2]高海峰.智能交通系统中数据挖掘技术的应用研究[J].数字技术与应用, 2016 (5) :108-108.

数据挖掘算法与生活中的应用案例

如何分辨出垃圾邮件”、“如何判断一笔交易是否属于欺诈”、“如何判断红酒的品质和档次”、“扫描王是如何做到文字识别的”、“如何判断佚名的著作是否出自某位名家之手”、“如何判断一个细胞是否属于肿瘤细胞”等等,这些问题似乎都很专业,都不太好回答。但是,如果了解一点点数据挖掘的知识,你,或许会有柳暗花明的感觉。本文,主要想简单介绍下数据挖掘中的算法,以及它包含的类型。然后,通过现实中触手可及的、活生生的案例,去诠释它的真实存在。              一般来说,数据挖掘的算法包含四种类型,即分类、预测、聚类、关联。前两种属于有监督学习,后两种属于无监督学习,属于描述性的模式识别和发现。 有监督学习有监督的学习,即存在目标变量,需要探索特征变量和目标变量之间的关系,在目标变量的监督下学习和优化算法。例如,信用评分模型就是典型的有监督学习,目标变量为“是否违约”。算法的目的在于研究特征变量(人口统计、资产属性等)和目标变量之间的关系。 分类算法分类算法和预测算法的最大区别在于,前者的目标变量是分类离散型(例如,是否逾期、是否肿瘤细胞、是否垃圾邮件等),后者的目标变量是连续型。一般而言,具体的分类算法包括,逻辑回归、决策树、KNN、贝叶斯判别、SVM、随机森林、神经网络等。 预测算法预测类算法,其目标变量一般是连续型变量。常见的算法,包括线性回归、回归树、神经网络、SVM等。 无监督学习无监督学习,即不存在目标变量,基于数据本身,去识别变量之间内在的模式和特征。例如关联分析,通过数据发现项目A和项目B之间的关联性。例如聚类分析,通过距离,将所有样本划分为几个稳定可区分的群体。这些都是在没有目标变量监督下的模式识别和分析。 聚类分析聚类的目的就是实现对样本的细分,使得同组内的样本特征较为相似,不同组的样本特征差异较大。常见的聚类算法包括kmeans、系谱聚类、密度聚类等。 关联分析关联分析的目的在于,找出项目(item)之间内在的联系。常常是指购物篮分析,即消费者常常会同时购买哪些产品(例如游泳裤、防晒霜),从而有助于商家的捆绑销售。 基于数据挖掘的案例和应用上文所提到的四种算法类型(分类、预测、聚类、关联),是比较传统和常见的。还有其他一些比较有趣的算法分类和应用场景,例如协同过滤、异常值分析、社会网络、文本分析等。下面,想针对不同的算法类型,具体的介绍下数据挖掘在日常生活中真实的存在。下面是能想到的、几个比较有趣的、和生活紧密关联的例子。 基于分类模型的案例这里面主要想介绍两个案例,一个是垃圾邮件的分类和判断,另外一个是在生物医药领域的应用,即肿瘤细胞的判断和分辨。 垃圾邮件的判别邮箱系统如何分辨一封Email是否属于垃圾邮件?这应该属于文本挖掘的范畴,通常会采用朴素贝叶斯的方法进行判别。它的主要原理是,根据邮件正文中的单词,是否经常出现在垃圾邮件中,进行判断。例如,如果一份邮件的正文中包含“报销”、“发票”、“促销”等词汇时,该邮件被判定为垃圾邮件的概率将会比较大。 一般来说,判断邮件是否属于垃圾邮件,应该包含以下几个步骤。 第一,把邮件正文拆解成单词组合,假设某篇邮件包含100个单词。 第二,根据贝叶斯条件概率,计算一封已经出现了这100个单词的邮件,属于垃圾邮件的概率和正常邮件的概率。如果结果表明,属于垃圾邮件的概率大于正常邮件的概率。那么该邮件就会被划为垃圾邮件。 医学上的肿瘤判断如何判断细胞是否属于肿瘤细胞呢?肿瘤细胞和普通细胞,有差别。但是,需要非常有经验的医生,通过病理切片才能判断。如果通过机器学习的方式,使得系统自动识别出肿瘤细胞。此时的效率,将会得到飞速的提升。并且,通过主观(医生)+客观(模型)的方式识别肿瘤细胞,结果交叉验证,结论可能更加靠谱。 如何操作?通过分类模型识别。简言之,包含两个步骤。首先,通过一系列指标刻画细胞特征,例如细胞的半径、质地、周长、面积、光滑度、对称性、凹凸性等等,构成细胞特征的数据。其次,在细胞特征宽表的基础上,通过搭建分类模型进行肿瘤细胞的判断。 基于预测模型的案例这里面主要想介绍两个案例。即通过化学特性判断和预测红酒的品质。另外一个是,通过搜索引擎来预测和判断股价的波动和趋势。 红酒品质的判断如何评鉴红酒?有经验的人会说,红酒最重要的是口感。而口感的好坏,受很多因素的影响,例如年份、产地、气候、酿造的工艺等等。但是,统计学家并没有时间去品尝各种各样的红酒,他们觉得通过一些化学属性特征就能够很好地判断红酒的品质了。并且,现在很多酿酒企业其实也都这么干了,通过监测红酒中化学成分的含量,从而控制红酒的品质和口感。 那么,如何判断鉴红酒的品质呢? 第一步,收集很多红酒样本,整理检测他们的化学特性,例如酸性、含糖量、氯化物含量、硫含量、酒精度、PH值、密度等等。 第二步,通过分类回归树模型进行预测和判断红酒的品质和等级。 搜索引擎的搜索量和股价波动一只南美洲热带雨林中的蝴蝶,偶尔扇动了几下翅膀,可以在两周以后,引起美国德克萨斯州的一场龙卷风。你在互联网上的搜索是否会影响公司股价的波动? 很早之前,就已经有文献证明,互联网关键词的搜索量(例如流感)会比疾控中心提前1到2周预测出某地区流感的爆发。 同样,现在也有些学者发现了这样一种现象,即公司在互联网中搜索量的变化,会显著影响公司股价的波动和趋势,即所谓的投资者注意力理论。该理论认为,公司在搜索引擎中的搜索量,代表了该股票被投资者关注的程度。因此,当一只股票的搜索频数增加时,说明投资者对该股票的关注度提升,从而使得该股票更容易被个人投资者购买,进一步地导致股票价格上升,带来正向的股票收益。这是已经得到无数论文验证了的。 基于关联分析的案例:沃尔玛的啤酒尿布啤酒尿布是一个非常非常古老陈旧的故事。故事是这样的,沃尔玛发现一个非常有趣的现象,即把尿布与啤酒这两种风马牛不相及的商品摆在一起,能够大幅增加两者的销量。原因在于,美国的妇女通常在家照顾孩子,所以,她们常常会嘱咐丈夫在下班回家的路上为孩子买尿布,而丈夫在买尿布的同时又会顺手购买自己爱喝的啤酒。沃尔玛从数据中发现了这种关联性,因此,将这两种商品并置,从而大大提高了关联销售。 啤酒尿布主要讲的是产品之间的关联性,如果大量的数据表明,消费者购买A商品的同时,也会顺带着购买B产品。那么A和B之间存在关联性。在超市中,常常会看到两个商品的捆绑销售,很有可能就是关联分析的结果。 基于聚类分析的案例:零售客户细分对客户的细分,还是比较常见的。细分的功能,在于能够有效的划分出客户群体,使得群体内部成员具有相似性,但是群体之间存在差异性。其目的在于识别不同的客户群体,然后针对不同的客户群体,精准地进行产品设计和推送,从而节约营销成本,提高营销效率。 例如,针对商业银行中的零售客户进行细分,基于零售客户的特征变量(人口特征、资产特征、负债特征、结算特征),计算客户之间的距离。然后,按照距离的远近,把相似的客户聚集为一类,从而有效的细分客户。将全体客户划分为诸如,理财偏好者、基金偏好者、活期偏好者、国债偏好者、风险均衡者、渠道偏好者等。 基于异常值分析的案例:支付中的交易欺诈侦测采用支付宝支付时,或者刷信用卡支付时,系统会实时判断这笔刷卡行为是否属于盗刷。通过判断刷卡的时间、地点、商户名称、金额、频率等要素进行判断。这里面基本的原理就是寻找异常值。如果您的刷卡被判定为异常,这笔交易可能会被终止。 异常值的判断,应该是基于一个欺诈规则库的。可能包含两类规则,即事件类规则和模型类规则。第一,事件类规则,例如刷卡的时间是否异常(凌晨刷卡)、刷卡的地点是否异常(非经常所在地刷卡)、刷卡的商户是否异常(被列入黑名单的套现商户)、刷卡金额是否异常(是否偏离正常均值的三倍标准差)、刷卡频次是否异常(高频密集刷卡)。第二,模型类规则,则是通过算法判定交易是否属于欺诈。一般通过支付数据、卖家数据、结算数据,构建模型进行分类问题的判断。 基于协同过滤的案例:电商猜你喜欢和推荐引擎电商中的猜你喜欢,应该是大家最为熟悉的。在京东商城或者亚马逊购物,总会有“猜你喜欢”、“根据您的浏览历史记录精心为您推荐”、“购买此商品的顾客同时也购买了商品”、“浏览了该商品的顾客最终购买了商品”,这些都是推荐引擎运算的结果。 这里面,确实很喜欢亚马逊的推荐,通过“购买该商品的人同时购买了**商品”,常常会发现一些质量比较高、较为受认可的书。一般来说,电商的“猜你喜欢”(即推荐引擎)都是在协同过滤算法(Collaborative Filter)的基础上,搭建一套符合自身特点的规则库。即该算法会同时考虑其他顾客的选择和行为,在此基础上搭建产品相似性矩阵和用户相似性矩阵。基于此,找出最相似的顾客或最关联的产品,从而完成产品的推荐。 基于社会网络分析的案例:电信中的种子客户种子客户和社会网络,最早出现在电信领域的研究。即,通过人们的通话记录,就可以勾勒出人们的关系网络。电信领域的网络,一般会分析客户的影响力和客户流失、产品扩散的关系。 基于通话记录,可以构建客户影响力指标体系。采用的指标,大概包括如下,一度人脉、二度人脉、三度人脉、平均通话频次、平均通话量等。基于社会影响力,分析的结果表明,高影响力客户的流失会导致关联客户的流失。其次,在产品的扩散上,选择高影响力客户作为传播的起点,很容易推动新套餐的扩散和渗透。 此外,社会网络在银行(担保网络)、保险(团伙欺诈)、互联网(社交互动)中也都有很多的应用和案例。 基于文本分析的案例这里面主要想介绍两个案例。一个是类似“扫描王”的APP,直接把纸质文档扫描成电子文档。相信很多人都用过,这里准备简单介绍下原理。另外一个是,江湖上总是传言红楼梦的前八十回和后四十回,好像并非都是出自曹雪芹之手,这里面准备从统计的角度聊聊。 字符识别:扫描王APP手机拍照时会自动识别人脸,还有一些APP,例如扫描王,可以扫描书本,然后把扫描的内容自动转化为word。这些属于图像识别和字符识别(Optical Character Recognition)。图像识别比较复杂,字符识别理解起来比较容易些。 查找了一些资料,字符识别的大概原理如下,以字符S为例。 第一,把字符图像缩小到标准像素尺寸,例如12*16。注意,图像是由像素构成,字符图像主要包括黑、白两种像素。 第二,提取字符的特征向量。如何提取字符的特征,采用二维直方图投影。就是把字符(12*16的像素图)往水平方向和垂直方向上投影。水平方向有12个维度,垂直方向有16个维度。这样分别计算水平方向上各个像素行中黑色像素的累计数量、垂直方向各个像素列上的黑色像素的累计数量。从而得到水平方向12个维度的特征向量取值,垂直方向上16个维度的特征向量取值。这样就构成了包含28个维度的字符特征向量。 第三,基于前面的字符特征向量,通过神经网络学习,从而识别字符和有效分类。 文学著作与统计:红楼梦归属这是非常著名的一个争论,悬而未决。对于红楼梦的作者,通常认为前80回合是曹雪芹所著,后四十回合为高鹗所写。其实主要问题,就是想确定,前80回合和后40回合是否在遣词造句方面存在显著差异。 这事让一群统计学家比较兴奋了。有些学者通过统计名词、动词、形容词、副词、虚词出现的频次,以及不同词性之间的相关系做判断。有些学者通过虚词(例如之、其、或、亦、了、的、不、把、别、好),判断前后文风的差异。有些学者通过场景(花卉、树木、饮食、医药与诗词)频次的差异,来做统计判断。总而言之,主要通过一些指标量化,然后比较指标之间是否存在显著差异,藉此进行写作风格的判断。

以上是小编为大家分享的关于数据挖掘算法与生活中的应用案例的相关内容,更多信息可以关注环球青藤分享更多干货

文化与旅游研究论文

旅游文化的历史本真性(一) 旅游文化蕴含真实的历史文化。历(厯)在甲骨文和金文中的字形,就是一只脚,表示人穿过树林。汉代徐慎所著的《说文解字》里便说:“历,过也,传也。”“文化是一个复杂的总体,包括知识、艺术、宗教、神话、法律、风俗以及其它社会现象。”(英国.IB.泰勒)旅游文化作为一种历史和文化,应该“真实”,这种真实,是客观存在的事实。不是靠拉几个“洋专家”,“土权威”捏造、篡改的历史。在这场“丝路起点”争论中。河南省文物鉴定委员会委员,河南大学易学考古研究所所长蔡运章在古籍《穆天子传》找到了佐证:西周时期穆天子从洛阳出发,西游到昆仑山会见西王母。这种带有传奇色彩的“佐证”,只能是传说而已,笔者认为并不能构成历史文化的真实场景。获取历史本真的方法很多,特别是“丝绸之路”作为涉及气象、宗教、贸易、艺术等方面的特质“旅游产品(旅游资源)”,更应运用现代的考古方法进行科学断定,通过多方面寻找史料,多方论证,才能还原其本真性。(二) 旅游文化的真实性也是相对的。要绝对复原“丝绸之路”是不可能的。在研究时,我们应尽可能的在现阶段考虑周全。在张骞出使西域前,也有零碎的丝绸资料可走。蔡运章先生认为,早在张骞出使西域前,丝绸之路已经开通。商代时期,中原到西域就有一条“玉石之路”,安阳殷墟富豪墓以及洛阳一些富豪墓里出土的玉器有不少是来自新疆的和田玉。事实上,商州时期,直至张骞出使,长安以西是蛮荒之地,汉朝对此冷淡,甚至有放弃掉“凉州”的打算。我们研究问题,要用哲学的观点,应该分清主次和主要矛盾与次要矛盾,矛盾的主要方面与次要方面的关系。研究“丝绸之路”要首先确定其历史概念上的内涵和外延。唯有张骞是代表大汉政府主权国家出使西域的,这是其一;学术界认可研究丝绸之路的起止时间和起止路线已有定论,就应在这个范畴内深入研究,这是其二。丝绸之路陆路有三条,在历史中有过演变,但应有一个公认的界定。当然,我们不应反对历史的置疑和推敲,但任何一种颠覆是要有根据的。所以,旅游文化的本真性是相对的,应考虑旅游、历史、文化三者的最佳结合。这样才有研究价值和意义。一些考古的东西仅限于历史的范畴,对旅游文化的作用应有所选择。经过慎重考虑,中国专家目前侧重于主张以张骞出使西域时间为起点,清中期为时间终点,这一主张在“新疆会议”上基本被中亚沿线国家接受。(三) 旅游文化的历史本真性还表现在它的“真实性”不受政府及其媒体的歪曲。政府出于政治目的,经济意识或者为了迎合某种观点、理论,主导宣传、媒体轰炸,造成旅游文化的历史本真性在体验、传播中褪色或者变味。西安、洛阳媒体报道时各有偏颇,缺乏“中立”立场,这也许是为了制造新闻“卖点”。但有点“祸国殃民,贻误子孙”。洛阳媒体在对“新疆会议”上的《初步行动计划》表述有意篡改,这种“黑色幽默”有悖于职业良知。旅游文化主体从心理上需要真实的历史文化,旅游文化作为一种学术探讨,不应将民间调查上升到学术依据。旅游客体应反映客观的历史文化,旅游文化媒介需要掌握、了解真实、准确、最新的历史文化。我们应尊重旅游文化的历史本真性,探首溯源,赋于客观真实历史意义上的旅游文化,才能发展本地、本区域、本民族的旅游文化。旅游文化的市场商品性(一) 旅游文化作为一种旅游主体、客体、媒介各种关系的总和,在初期表现为旅游资源,更多地表现为一种旅游产品。一旦形成旅游产品,其市场商品性随之而来。“丝绸之路起点”之争,说白了是一种旅游资源、旅游产品与旅游文化之争,西安、洛阳两城市都想站在文化的“高地”,用“丝绸之路起点”这种旅游文化世界知名品牌支撑自己的城市文化,塑造城市良好的品牌形象,让城市在整体竞争中获胜。(二) 旅游文化应该在市场上商品化,但不能违背旅游文化的真实历史。西安、洛阳之争,不仅仅看到联合国对丝绸之路沿线城市的经济援助,还在于旅游产品的进一步开发,城市文化内涵的提升。在今天,各个旅游城市利用文化品牌进行城市经营,加快国际化旅游城市进程中,应尊重旅游文化的真实历史,走市场化道路,不要大肆铺张,大建一些虚无的城市广场、城市标志等,违背商品的市场价值规律。(三) 旅游已成为城市的“名片”,旅游文化更是“名片”的“芯片”。西安、洛阳两城市渴望自己的城市明确定位,希望早日打造城市的旅游文化品牌,应该按照旅游、历史、文化的规律办事,并要分析、研究旅游文化的特殊性,保护城市的历史文化风貌,不要一方面大搞古城拆迁,一方面大搞新城建设。笔者看到西安、洛阳两个城市及两个城市在旅游文化经营方面旧城已经破坏十分严重,新城的快速建设让旅游文化消失殆尽。所以说,旅游文化不是一种简单的文化,应统筹考虑,从城市的色彩定位、形象等各个方面来最终确定自己的特色。例如,北京的胡同文化,广东的汉奸别墅,湖南的清代妓院遗址,长安古乐等等旅游文化内容(类别)应有选择性的接收或者传承。七、结尾西安、洛阳两城市争夺“丝绸之路起点”这一事件,从另一方面也反映出两个城市对旅游文化的重视,旅游文化已成为旅游城市的核心竞争力,“走向共赢”是最好的选择,但这种选择,不是打着中华民族“和为贵”的旗帜,漠视旅游文化历史本真性的选择。也不是为了保住洛阳加入申遗名单,在“不影响西安”的前提下,将始点由西安东移至洛阳。丝绸之路在世界的商贸、文化、交流上是有重要作用,当前,商贸交易有“回潮”趋势,备受沿线各国关注。其申遗工作是一项复杂的、巨大的工程,任何一国无法单独申报,申遗工作应具有前瞻性和可操作性。据悉,这个政府关于丝绸之路申遗的准备工作正紧锣密鼓地进行:西安作为起点城市,在重新设立的中国世界文化遗产预备名单中,汉长安城、唐大明宫、西安碑林等将作为丝绸之路的捆绑项目出现;丝绸之路在甘肃省全长1600公里,联合国教科文组织考察组对天水麦积山、武威文庙、天梯山石窟、张掖大佛寺,以及嘉峪关和魏晋墓等文物点进行了重点考察,包括10处石窟、6处古建、7处古遗址、4处古墓葬在内的物质遗存,被列入了申遗保护方案;作为丝绸之路的必由之路,新疆已经启动了近两年的对沿线遗址的调查、研究、保护工作除了陕西,甘肃和新疆三省,将河南(洛阳)也纳入了丝绸之路申遗项目单位,但并不是以“丝绸之路起点”的名义纳入的,主要还是考虑了其丝绸之路的遗迹。笔者考虑,可能是为了全面展示丝绸之路的演变过程。我们可以看到,甘肃在打“丝绸之路”品牌上也下了很多功夫,如成立甘肃省丝绸之路协会,办《丝绸之路》杂志,新疆,陕西也不例外。丝绸之路已成为一种驰名世界的旅游品牌,例如举办“丝绸之路国际模特大赛”等等,影响甚广。关于旅游文化及其历史所谓本真性和市场的商品性问题,笔者只是泛泛而谈,希望能起到一个抛砖引玉的作用,也希望更多的师长们加入到研究旅游文化学科建设、基础理论、发展探究等等问题的队伍中来,不断创新,为发展中国特色的旅游文化尽自己一点心意。

旅游文化方向的毕业学生论文

随着我国国民经济的快速发展,旅游业在近年来也得到突飞猛进的发展,通过将旅游与文化进行有效结合,不仅能够让人们感受到大自然的魅力,接下来是我为您整理的旅游文化方向的毕业学生论文,希望对您有所帮助。

摘要:当前随着我国社会经济的稳定发展,人们的生活水平也在不断的提升,而人们的生活质量也逐渐从物质要求向精神层面所发展。现今旅游也成为人们接触自然的一种有效的形式,并且也随之成为一种文化形式,更是人们追求精神需求的重要部分。“旅游文化”和“文化旅游”的概念是不同的,但是其两者很容易被混淆,并且两者也应该引起一定的重视。文章就通过对旅游文化与文化旅游两方面进行分析与研究,从而真正明确两者概念,从而真正有效的促进旅游业的发展。

关键词:旅游文化;文化旅游;理论与实践;问题;探究

随着我国国民经济的快速发展,旅游业在近年来也得到突飞猛进的发展,通过将旅游与文化进行有效结合,不仅能够让人们感受到大自然的魅力,并且也能感受到人类发展的伟大,是促进我国社会文明建设以及不断发展的关键。通过有效的将旅游与文化向结合的形式,从而真正的发挥“旅游文化”与“文化旅游”的优势以及其不同的意义,从而明确“旅游文化”与“文化旅游”的理论,为其良好的实践提供坚实基础。

一、“旅游文化”与“文化旅游”的概念及领域出现困惑和混淆的现象

对于我国的旅游界来说,在对旅游文化与文化旅游概念进行研究时,很容易将两者混淆,甚至出现疑惑的现象,这一直是旅游界所重视的部分。对于“旅游文化”,其是人们一听就非常熟悉的内容,但也还是需要进行进一步研究和探索的概念;而“文化旅游”是近年来才运用开来的名词,可是其内涵与外延还并没有得到有效的界定。现今最重要的问题就是,其两者从字面意思上看是非常相似的,但从其内在进行分析,还是有很大的不同,可是却有很大人并不能分清楚两者的区别。所以对于这两个概念无论是在理论界还是实业界,都是时常被混淆的概念。只有将两者概念和理论以及实践形式进行明确,才能更好的将其优势与作用发挥出来,并真正能够促进旅游文化产业的稳定发展。

二、关于旅游文化和文化旅游的'概念的界定

旅游文化与文化旅游这两个词语在实际的语境运用当中很容易会弄混乱,导致语境意义完全改变。通过从语言的构词法角度进行分析,对于旅游文化其中的核心词是文化,那么可以看出旅游文化主要表达的就是涉及到旅游方面中的文化内容,其属于文化研究的领域范畴。而对于文化旅游来说,其核心词在旅游,其主要的含义就是通过旅游的形式,有效的感受和了解人类文化,从而深刻感受人类在大自然当中所留下的文化遗迹等。通过对旅游文化与文化旅游的理论角度进行分析,是相对比较简单辨别的。可是从实际角度出发,在实际运用当中,还是很难将两者区分开来,而影响到两个词组的运用。并且一些学者认为,文化产业当中包含旅游产业,由于文化中所涉及的范围是比较广泛的,旅游产业属于文化产业中的内容。可是实际并不是这样的,并且对其进行深度分析发现,文化产业与旅游产业两者是相互并列的内容。首先,对旅游文化进行有效分析。其属于文化领域范畴内的概念,但是对于旅游来说属于文化中的限定词,其展现的是文化行为的表现。在旅游文化概念形成当中是要有几个元素组成的,其包括旅游主体、旅游媒介以及旅游客体三个环节。在其中所提到的旅游主体属于旅游文化的研究核心环节,也就是旅游者。由此就可以看出旅游文化从实际角度就是研究旅游者的一种文化体系。其次,对文化旅游进行全面分析。其被归结为旅游研究范畴内人,主要就是旅游者通过自身的旅游活动形式,以此来满足自身对文化需求。对于文化旅游来说其展现的是一种经历,旅游者在享受旅游的过程当中,会打从精神上获得愉悦心理。由此就可以看出文化旅游注重的是一个过程,其表现在旅游者在进行旅游过程中,根据自身主观意愿对旅游文化进行有效感知。最后,对于两者的密切关系分析。对于旅游文化是文化研究范畴,而文化旅游属于旅游过程中所感受的文化,可是其两者概念中的内涵以及外延,却并不是两个词语在不同形式下的简单分析或是研究。也可以说旅游文化与文化旅游两者间有着密切联系的内容。对于旅游概念自身进行分析,属于人们的一种生活形式,更是展现文化的一种表现。无论是什么样的旅游,都会从中感受到不同的文化。由此可以看出,旅游文化多以人的精神境界进行表达;文化旅游则表现的是旅游参与者,在良好的旅游过程当中,来对其文化进行理解。

三、对于旅游文化与文化旅游概念的区别以及关联分析

1.区别首先,其两者的侧重点有一定的不同,由于旅游文化以旅游为限定词,而文化是核心词,那么可以看出其侧重点为文化,属于文化范畴,对于旅游文化的广义,其中包含了文化在旅游业当中的不同展现,并且也能表出旅游与文化间关系。而从其狭义角度进行分析,旅游文化所表达的就是旅游者在活动当中所引出的文化现象。对于文化旅游来说,穷核心词为旅游,而“文化”是限定词,由此可以看出旅游是其侧重点,属于旅游活动与旅游产品当中重要内容。其次,两者研究的重点有所不同,对于旅游文化的研究来说,其广义角度,不仅注重旅游活动基础理论的研究,其中就包括旅游活动属性、特征以及影响等问题内容,而从穷狭义角度分析,其重视的是旅游业与旅游活动当中的文化内容;而对于文化旅游的重点研究的内容,是旅游活动对象,也就是旅游产品的开发以及其经营管理的问题研究等,更加重视其文化旅游活动特点、管理体制以及文化旅游市场需求特征的研究等内容。最后,两者的学科归属不同,通过对我国现今的学科划分体系进行分析,旅游文化的主体是旅游社会学、心理学以及伦理学范畴内的,也有部分内容是管理学范畴内的部分;而对于文化旅游来说,其主体是旅游管理学以及旅游开发规划学当中的范畴研究内容。而从西方学术界角度进行分析发现,旅游文化属于基础性的学科,文化旅游则是应用性的学科。

2.关联首先,通过以概念的范畴进行分析,旅游文化与文化旅游都是对当前旅游以及文化的结合点进行全面的研究与分析,其两者有着一定的交集,就包括文化旅游资源以及趋向文化景观旅游活动的开展。其次,对于旅游文化研究来说,其包含旅游社会学、旅游心理学以及旅游人类学等非常多的理论与结论参与到研究当中,这对文化旅游的实践以及理论研究都有着极大的作用。并且文化旅游的发展和理论研究,也能够科学有效的丰富旅游文化的内涵,促进两者更好发展。

四、对旅游文化与文化旅游实践情况进行明确

对于旅游文化和文化旅游,其两者间是有着很大的联系的,其两者的交集点是对旅游以及文化间的良好结合点,以此来进行有效的研究与分析,主要就是对旅游资源以及文化景观进行分析,从而明确其特点。这样使得旅游文化更加重视理论的研究,因此可以保障其对文化旅游起到理论和借鉴的作用与优势,并且也能够突显文化旅游重视实践以及丰富旅游文化意义的优势。对于我国来说是拥有着上下五千年文明历史的文化古国,由此能够看出中国的文化历史是非常悠久和深厚的。这就给我国当前旅游业的开发通过了越来越多的文化资源和文化优势,并且我国旅游业的发展方向也要靠着文化优势来稳定发展。对于我国旅游业开发状况进行分析,发现中国旅游业的发展还处在起步时期,我国属于新兴旅游大国。由于具有丰富的自然资源以及深厚的文化底蕴,给我国旅游业的发展提供了坚实有利的基础,虽然我国有很多旅游项目还并没有被开发出来,但是却已经受到世界各地的关注,而真因为这些现象从中出现很多问题。如果将与旅游相关的不同资源良好的挖掘出来,并将其与社会实践紧紧地连接在一起,这是一项需要深思的话题。其中就包括不同的旅游产品能够在真正意义上促进旅游业的稳定发展;在旅游业中出现很多旅行团服务,这为旅游者带来非常多的便利,但是随之而来的就是各种名目收费以及游客消费产生矛盾等问题的出现,会对旅游业发展带来严重影响,这也是一个需要重视和深度研究的内容。对于旅游地来说,其中不仅包括自然遗产,并且也有当地的文化遗产,而在进行旅游资源的开发时,如果只是想单纯地迎合旅游业发展,而对自然和文化的发展带来影响,这样会失去旅游业发展的价值。所以在旅游业发展中也要重视当地自然以及文化的保护,只有这样才能促进我国旅游业的长远发展。

五、结束语

通过对旅游文化与文化旅游两者的概念进行有效分析,发现其两者很容易混淆,因此在实际当中必须要对两者进行明确,并对两个概念进行清楚的界定,只要这样才能将两者优势和作用展现出来,从而科学有效的促进我国旅游业的稳定发展。

参考文献

[1]卢俊莉.旅游文化与文化旅游:理论与实践的若干问题[J].河南科技,2013,(14):237.

[2]徐菊凤.旅游文化与文化旅游:理论与实践的若干问题[J].旅游学刊,2005,(4):67-72.

文本挖掘的算法研究论文

数据挖掘的算法及技术的应用的研究论文

摘要: 数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中发现隐含的、规律性的、人们事先未知的, 但又是潜在有用的并且最终可被理解的信息和知识的非平凡过程。任何有数据管理和知识发现需求的地方都可以借助数据挖掘技术来解决问题。本文对数据挖掘的算法以及数据挖掘技术的应用展开研究, 论文对数据挖掘技术的应用做了有益的研究。

关键词: 数据挖掘; 技术; 应用;

引言: 数据挖掘技术是人们长期对数据库技术进行研究和开发的结果。起初各种商业数据是存储在计算机的数据库中的, 然后发展到可对数据库进行查询和访问, 进而发展到对数据库的即时遍历。数据挖掘使数据库技术进入了一个更高级的阶段, 它不仅能对过去的数据进行查询和遍历, 并且能够找出过去数据之间的潜在联系, 从而促进信息的传递。

一、数据挖掘概述

数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中发现隐含的、规律性的、人们事先未知的, 但又是潜在有用的并且最终可被理解的信息和知识的非平凡过程。

二、数据挖掘的基本过程

(1) 数据选择:选择与目标相关的数据进行数据挖掘。根据不同的数据挖掘目标, 对数据进行处理, 不仅可以排除不必要的数据干扰, 还可以极大地提高数据挖掘的效率。 (2) 数据预处理:主要进行数据清理、数据集成和变换、数据归约、离散化和概念分层生成。 (3) 模式发现:从数据中发现用户感兴趣的模式的过程.是知识发现的主要的处理过程。 (4) 模式评估:通过某种度量得出真正代表知识的模式。一般来说企业进行数据挖掘主要遵循以下流程——准备数据, 即收集数据并进行积累, 此时企业就需要知道其所需要的是什么样的数据, 并通过分类、编辑、清洗、预处理得到客观明确的目标数据。数据挖掘这是最为关键的步骤, 主要是针对预处理后的数据进行进一步的挖掘, 取得更加客观准确的数据, 方能引入决策之中, 不同的企业可能采取的数据挖掘技术不同, 但在当前来看暂时脱离不了上述的挖掘方法。当然随着技术的进步, 大数据必定会进一步成为企业的立身之本, 在当前已经在很多领域得以应用。如市场营销, 这是数据挖掘应用最早的领域, 旨在挖掘用户消费习惯, 分析用户消费特征进而进行精准营销。就以令人深恶痛绝的弹窗广告来说, 当消费者有网购习惯并在网络上搜索喜爱的产品, 当再一次进行搜索时, 就会弹出很多针对消费者消费习惯的商品。

三、数据挖掘方法

1、聚集发现。

聚集是把整个数据库分成不同的群组。它的目的是要群与群之间差别很明显.而同一个群之间的数据尽量相似.聚集在电子商务上的典型应用是帮助市场分析人员从客户基本库中发现不同的客户群, 并且用购买模式来刻画不同客户群的特征。此外聚类分析可以作为其它算法 (如特征和分类等) 的预处理步骤, 这些算法再在生成的簇上进行处理。与分类不同, 在开始聚集之前你不知道要把数据分成几组, 也不知道怎么分 (依照哪几个变量) .因此在聚集之后要有一个对业务很熟悉的人来解释这样分群的意义。很多情况下一次聚集你得到的分群对你的业务来说可能并不好, 这时你需要删除或增加变量以影响分群的方式, 经过几次反复之后才能最终得到一个理想的结果.聚类方法主要有两类, 包括统计方法和神经网络方法.自组织神经网络方法和K-均值是比较常用的`聚集算法。

2、决策树。

这在解决归类与预测上能力极强, 通过一系列的问题组成法则并表达出来, 然后经过不断询问问题导出所需的结果。典型的决策树顶端是一个树根, 底部拥有许多树叶, 记录分解成不同的子集, 每个子集可能包含一个简单法则。

四、数据挖掘的应用领域

市场营销

市场销售数据采掘在销售业上的应用可分为两类:数据库销售和篮子数据分析。前者的任务是通过交互式查询、数据分割和模型预测等方法来选择潜在的顾客以便向它们推销产品, 而不是像以前那样盲目地选择顾客推销;后者的任务是分析市场销售数据以识别顾客的购买行为模式, 从而帮助确定商店货架的布局排放以促销某些商品。

金融投资

典型的金融分析领域有投资评估和股票交易市场预测, 分析方法一般采用模型预测法。这方面的系统有Fidelity Stock Selector, LBS Capital Management。前者的任务是使用神经网络模型选择投资, 后者则使用了专家系统、神经网络和基因算法技术辅助管理多达6亿美元的有价证券。

结论:数据挖掘是一种新兴的智能信息处理技术。随着相关信息技术的迅猛发展, 数据挖掘的应用领域不断地拓宽和深入, 特别是在电信、军事、生物工程和商业智能等方面的应用将成为新的研究热点。同时, 数据挖掘应用也面临着许多技术上的挑战, 如何对复杂类型的数据进行挖掘, 数据挖掘与数据库、数据仓库和Web技术等技术的集成问题, 以及数据挖掘的可视化和数据质量等问题都有待于进一步研究和探索。

参考文献

[1]孟强, 李海晨.Web数据挖掘技术及应用研究[J].电脑与信息技术, 2017, 25 (1) :59-62.

[2]高海峰.智能交通系统中数据挖掘技术的应用研究[J].数字技术与应用, 2016 (5) :108-108.

我给你找了一篇,摘要如下:随着Internet在全世界范围内迅猛发展,网上庞大的数字化信息和人们获取信息之间的矛盾日益突出。因此,对网络信息的检索技术及其发展趋势进行探讨和研究,是一个既迫切而又实用的课题。本文通过对网络信息检索的基本原理、网络信息检索的技术及工具、网络信息检索的现状等方面进行分析研究,并对网络信息检索的发展趋势进行了预测,旨在寻找提高网络信息检索的手段和方法的有效途径,并最终提高网络信息的检索效果,使得网络信息资源得到充分有效地利用。 全文主要包括六个部分,第一部分为网络信息检索述评,主要是阐述了网络信息检索所涉及到的有关概念,如信息检索技术、网络信息检索的特点及网络信息检索效果评价。第二部分重点讨论了网络信息检索的基本技术。如信息推拉技术、数据挖掘技术、信息过滤技术、自然语言处理技术等等,旨在弄清网络信息检索的技术支撑,为预测网络信息检索的发展趋势作下铺垫。第三部分对网络信息检索的重要工具——搜索引擎进行了阐述,主要从其检索机制入手,分析了不同种类的搜索引擎的检索特点及功能。其独到之处在于对搜索引擎的基本功能进行了比较全面的概括,并对目前流行的搜索引擎进行科学的分类...第四部分分析讨论了检索技术的另一分支—基于内容的检索技术第五部分则分析了网络信息搜索工具的局限,主要从文本信息检索和多媒体信息检索两方面进行阐述。好不容易给转成 .txt文本,贴在下面:网络信息资源网络信息资源是指“通过国际Intemet可以利用的各种信息资源”的总称。随着Intemet的迅速发展,网上信息资源也以指数形式增加,网络信息资源作为一种新型的信息资源,发挥着越来越重要的作用,其内容几乎无所不包,涉及政治、经济、文化、科学、娱乐等各个方面;其媒体形式多种多样,包括文本、图形、图像、声音、视频等;其范围覆盖社会科学、自然科学、人文科学和工程技术等各个领域。信息检索技术信息检索技术是现代信息社会中非常关键的技术之一。信息检索是指将信息按一定的方式组织和存储起来,并根据信息用户的信息需求查找所需信息的过程和技术,所以信息检索的全称又叫“信息存储与检索”。狭义的信息检索仅指从信息集合中找出所需信息的过程,也就是利用信息系统检索工具查找所需信息的过程。人们获取信息源的方式主要有:①遵循传统的检索方法在浩如烟海的图书馆资料中,通过人工查找索引找到对应的文献索引号再获取文献原文;②联机信息检索。这其中也存在一个发展过程,由检索结果来看,从提供目录、文摘等相关的二次信息检索到可以直接获得电子版的全文;由检索方法来看,从对特定关键词或者如作者、机构等辅助信息作为检索入口的常规检索到以原始文献中任意词检索的全文检索等等。其中,全文检索由于其包含信息的原始性、信息检索的彻底性、所用检索语言的自然性等特点在近年来发展比较迅速,成为深受人们关注的一种非常有效的信息检索技术,它是从大容量文档库中精确定位所需信息的最有效手段l3]。.信息检索其检索方式有:浏览器方式和搜索引擎方式。(l)浏览器方式(Br,singsystelns)。只要能够进入hitemct就能够通过浏览器,利用HTTP协议提供的WV乃万服务,浏览认触b页面和通过W匕b页面提供的检索方式访问数据库。(2)搜索引擎方式(SearehEngines)。搜索引擎是intemet提供公共信息检索服务的W七b站点,它是以一定的技术和策略在intemet中搜集和发现网络信息,并对网络信息进行理解、提取和处理,建立数据库,同时以认倪b形式提供一个检索界面,供用户输入检索关键词、词组或短语等检索项,代替用户在数据库中查找出与提问相匹配的记录,同时返回结果且按相关度排序输出,从而起到快速查找信息的目的。搜索引擎所处理的信息资源主要包括万维网服务器上的信息,另外还包括电子邮件和新闻组信息。搜索引擎服务的宗旨是为满足用户的信息需要,所以它是面向用户的,采用的方式是交互式的。网络信息检索工具采用主动提交或自动搜索两种方法搜索数据。网络信息检索效果评价目前,得到普遍认同的检索效果的评价标准主要有以下几个:查全率、查准率、收录范围、输出格式,其中以查全率和查准率最为重要。现代信息科学技术的发展,为人们提供了多种多样的信息获取和传送方法及技术,从“信源”与“用户”的关系来看,可分为两种模式:“信息推送”模式(InformationPush),由“信源”主动将信息推送给“用户”,如电台广播;“信息拉取”模式(InformationPull),由“用户”主动从“信源”中拉取信息,如查询数据库。信息推送技术“推”模式网络信息服务,是基于网络环境下的一种新的服务形式,即信息服务者在网上利用“Push”技术为特定用户开展信息服务的方式。Push技术之所以成为Intemet上一项新兴的技术,是因为借助该技术使网络信息服务具有主动性,不仅可以直接把用户感兴趣的信息推送给用户,而且可有效地利用网络资源,提高网络吞吐率;再者,Push技术还允许用户与提供信息的服务器之间透明地进行通信,极大地方便了用户。所谓Push技术,又称“推送”技术、Web广播(Webeasting)技术,实质上是一种软件,这种软件可以根据用户定义的准则,自动搜集用户最可能发生兴趣的信息,然后在适当的时候,将其传递至用户指定的“地点”。因而从技术上看,“推”模式网络信息服务就是具有一定智能性的、可以自动提供信息服务的一组计算机软件,该软件不仅能够了解、发现用户的兴趣(可能关心的某些主题的信息),还能够主动从网上搜寻信息,并经过筛选、分类、排序,然后按照每个用户的特定要求,主动推送给用户141。(l)信息推送方式。信息推送方式分两类,即网播方式和智能方式。网播方式有:频道式推送。频道式网播技术是目前普遍采用的一种模式,它将某些页面定义为浏览器中的频道,用户可像选择电视频道那样接受有兴趣的网播信息;邮件式推送,用电子邮件方式主动将所推送信息发布给各用户,如国际会议的通知、产品的广告等:网页式推送。在一个特定网页内将所推送信息发布给各用户,如某企业、某组织、某个人的网页;专用式推送。采用专门的信息发送和接收软件,信源将信息推送给专门用户,如机密的点对点通信。智能推送方式有:操作式推送(客户推送式),由客户数据操作启动信息推送。当某客户对数据进行操作时,把修改后的新数据存入数据库后,即启动信息推送过程,将新数据推送给其他客户;触发式推送(服务器推送式),由ll硕士学位论文MASTER,5THESIS⑧数据库中的触发器启动信息推送过程,将新数据推送给其他客户,当数据发生变化,如出现增加(Insert)、删除(Delete)、修改(update)操作时,触发器启动信息推送过程。(2)信息推送的特征。信息推送的特征有:主动性、针对性、智能性、高效性·灵活性和综合性I5]。主动性。Push技术的核心就是服务方不需要客户方的及时请求而主动地将数据传送到客户方。因而,主动性是“推”模式网络信息服务最基本特征之一。这也是它与基于浏览器的“拉”(Pull)模式的被动服务的鲜明对比。针对性(个性化)。针对性是说,Push技术可以针对用户的特定信息需求进行检索、加工和推送,并根据用户的特定信息需求为其提供个人定制的检索界面。智能性。Push服务器能够根据用户的要求自动搜集用户感兴趣的信息并定期推送给用户。甚至,Push技术中的“客户代理(ClientAgent)”可以定期自动对预定站点进行搜索,收集更新信息送回用户。同时个人信息服务代理和主题搜索代理还可为了提高“推送”的准确性,控制搜索的深度,过滤掉不必要的信息,将认飞b站点的资源列表及其更新状态配以客户代理完成。因而,网络环境下的“推”模式信息服务具有较高的智能性。这也是传统的定题服务(SDI)不能比的。高效性。高效性是网络环境下“推”模式信息服务的又一个重要特征。Push技术的应用可在网络空闲时启动,有效地利用网络带宽,比较适合传送大数据量的多媒体信息。灵活性。灵活性是指用户可以完全根据自己的方便和需要,灵活地设置连接时间,通过E一mail、对话框、音频、视频等方式获取网上特定信息资源。综合性。“推”模式网络信息服务的实现,不仅需要信息技术设备,而且还依赖于搜寻软件、分类标引软件等多种技术的综合[6]。但在当前信息技术的发展阶段,“推”技术还存在很大的缺陷,比如:不能确保信息发送,没有状态跟踪,缺乏群组管理功能等等。因此,国内外的研究者们又提出超级推(BeyondPush)技术的理论。所谓超级推技术是在保留、继承、完善了Push的优点(主动传递和个性化定制),摒弃了Push的诸多缺点之!2硕士学位论文MASTER,5THESIS管后而发展起来的一种新型的Push技术。它的最大特点是在于保证传送。即所有的信息都是在特定的时间送给特定的信息用户,同时保持连续性的用户资料,随时可以知道谁收到了信息,信息是否为该用户定制,用户环境是否适当等等[刀。信息拉取技术常用的、典型的信息拉取技术,如数据库查询,是由用户主动查询数据库,从数据库中拉取所需信息。其主要优点是:针对性好,用户可针对自己的需求有目的地去查询、搜索所需的信息。Intemet上的信息拉取技术可以说是数据库查询技术的扩展和延伸。在网络上,用户面对的不止是一个数据库,而是拥有海量信息的hitemet环境,因此,各种网络信息拉取(查询)的辅助工具—搜索引擎应运而生了。信息推送与信息拉取两种模式各有其特点,在实际中常常是将两者的结合起来,常用的结合方式为:(1)“先推后拉”式。先及时地推送最新信息(更新的动态信息),再有针对性地拉取所需的信息。这样,便于用户注意信息变化的新情况和趋势,从而动态地选取需要深入了解的信息。(2)“先拉后推”式。用户先拉取所需信息,然后根据用户的兴趣,再有针对性地推送相关的其它信息。(3)“推中有拉”式。在信息推送过程中,允许用户随时中断、定格在所感兴趣的网页上,作进一步的搜索,主动拉取更丰富的信息。(4)“拉中有推”式。在用户拉取信息的搜索过程中,根据用户输入的关键词,信源主动推送相关信息和最新信息。这样既可以及时地、有针对性时为用户服务,又可以减轻网络的负担,并便于扩大用户范围[8]。因此,信息推送与信息拉取相结合是当前Intemet、数据库系统及其它信息系统为用户提供主动信息服务的一个发展方向。挖掘技术随着功temet的发展,W己b已经成为人类社会的公共信息源。在hitemet给人类带来前所未有的信息机遇的同时,又使得人类的信息环境更加复杂,人硕士学位论文MASTER,5THESIS⑧类如何利用信息的问题非但没有如预想的通过信息技术的发展得到圆满的解决,相反,随着信息技术的发展,信息量的激增,造成了个人实际所需信息量与研触b上的海量信息之间的矛盾,因而也就造成了个人利用信息的困难。在这种情况下,虽然出现了叭范b环境下的专门检索工具,但是由于搜索引擎是由传统检索技术发展而来,在当前用户要求不断提高的情况下,传统的搜索技术己经不能够满足人们的需要。为了更加有效地利用网络信息资源,W七b挖掘作为新的知识挖掘的手段,为Web信息的利用提出了新的解决方案叨。,1姗eb挖掘的内容数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。Web挖掘则是从WWW及其相关的资源和行为中抽取有用的模式和隐含信息。其中WWW及其相关资源是指存在于WWW之上的Web文档及Web服务器上的日志文件以及用户资料,从Web挖掘的概念中应当看出Web挖掘在本质上是一种知识发现的手段,它主要从下面3个方面进行仁’时。(1)Web内容挖掘。W七b内容挖掘是从W匕b数据中抽取知识,以实现Web资源的自动检索,提高web数据的利用效率。随着Intemet的进一步延伸,Web数据越来越庞大,种类越来越繁多,数据的形式既有文本数据信息,也有图像、声音、视频等多媒体数据信息,既有来自于数据库的结构化数据,也有用HTML标记的半结构化数据及非结构化的自由文本数据信息。因而,对W己b内容信息挖掘主要从下面两个角度进行〔”]。一是从信息检索的角度,主要研究如何处理文本格式和超级链接文档,这些数据是非结构化或半结构化的。处理非结构化数据时,一般采用词集方法,用一组组词条来表示非结构化的文本,先用信息评价技术对文本进行预处理,然后采取相应的模型进行表示。另外,还可以用最大字序列长度、划分段落、概念分类、机器学习和自然语言统计等方法来表示文本。处理半结构化数据时,可以利用一些相关算法给超级链接分类,寻求认七b页面关系,抽取规则。同处理非结构化数据相比,由于半结构化数据增加了HTM毛标记信息及Web文档内部超链结构,使得表示半结构化数据的方法更加丰富。二是从数据库的角度,主要处理结构化的W匕b数据库,也就是超级链接14⑧蕊誉蕊文档,数据多采用带权图或者对象嵌入模型(OME),或者关系数据库表示,应用一定的算法,寻找出网站页面之间的内在联系,其主要目的是推导出Web站点结构或者把W匕b变成一个数据库,以便进行更好的信息管理和查询。数据库管理一般分成三个方面:一是模型化,研究认触b上的高级查询语言,使其不局限于关键字查询;二是信息的集成与抽取,把每个W七b站点及其包装程序看成是一个认范b数据源,通过W七b数据仓库(data~house)或虚拟W七b数据库实现多种数据来源的集成;三是叭几b站点的创建与重构,通过研究web上的查询语言来实现建立并维护web站点的途径[’“]。(2)札b结构挖掘。W匕b结构挖掘,主要指的是通过对W七b文档的分析,从文档之间的组织结构获取有用的模式。W匕b内容挖掘研究的是文档内的关系,W七b结构挖掘关注的则是网站中的超级链接结构之间的关系,找到隐藏在一个个页面之后的链接结构模型,可以用这个模型对W七b页面重新分类,也可以用于寻找相似的网站。W七b结构挖掘处理的数据类型为W七b结构化的数据。结构化数据是描述网页内容组织方式的数据,页内结构可以用超文本标记语言等表示成树型结构,此外页间结构还可以用连接不同网页的超链结构表示。文档间的链接反映了文档信息间的某种联系,如隶属平行关系、引用与被引用关系等。对W七b页面的超级链接进行分类,可以判断与识别页面信息间的属性关系。由于Web页面内部存在或多或少的结构信息,通过研究W亡b页面内部结构,可寻找出与用户选定的页面集合信息相关的其它页面信息模式,以检测W己b站点所展示的信息完整程度。③Web行为挖掘。所谓W己b用户行为挖掘主要是通过对认尼b服务器的日志文件以及用户信息的分析,从而获得有关用户的有用模式。W七b行为挖掘的数据信息主要指网络日志中包括的用户行为模式,它包括检索时间、检索词、检索路径、检索结果以及对哪些检索结果进行了浏览。由于W七b自身的异质、分布、动态、无统一结构等特点,使得在认七b网上进行内容挖掘比较困难,它需要在人工智能和自然语言理解等方面有所突破。所幸的是基于W七b服务器的109日志存在着完整的结构,当信息用户访问web站点时,与访问相关的页面、时间、用户ro等信息,日志中都作了相应的记录,因而对其进行信息l5硕士学位论文MASTER,5THESIS⑥挖掘是可行的,也是有意义的。在技术实践过程中,一般先把日志中的数据映射成诸种关系信息,并对其进行预处理,包括清除与挖掘不相关的信息等。为了提高性能,目前对109日志数据信息挖掘采用的方法有路径分析、关联规则、模式发现、聚类分析等。为了提高精确度,行为挖掘也应用到站点结构信息和页面内容信息等方面。挖掘技术在网络信息检索中的应用(l)Web内容挖掘在检索中的应用。W匕b内容挖掘是指从文档内容及其描述中获取知识的过程,由于用传统的信息检索技术对W己b文档的处理不够深入,因此,可以利用叭触b内容挖掘技术来对网络信息检索中的W己b文档处理部分进行进一步的完善,具体而言表现在以下几个方面。①文本总结技术。文本总结技术是指从文档中抽取出关键信息,然后以简洁的形式对W匕b文档的信息进行摘要或表示。这样用户通过浏览这些关键信息,就可以对W七b网页的信息有大致的了解,决定其相关性并对其进行取舍。②文本分类技术。W匕b内容挖掘中的文本分类指的是按照预先定义的主题类别,利用计算机自动为文档集合中的每一个文档进行分类。分类在网络信息检索中的价值在于可以缩小检索范围,大大提高查准率。目前,己经出现了很多文本分类技术,如TFIFF算法等,由于文本挖掘与搜索引擎所处理的文本几乎完全一样,所以可以直接将文本分类技术应用于搜索引擎的自动分类之中,通过对大量页面自动、快速、有效的分类,来提高文档检索的查准率。③文本聚类技术。文本聚类与文本分类的过程J险洽相反,文本聚类指的是将文档集合中的文档分为更小的簇,要求同一簇内的文档之间的相似性尽可能大,而簇与簇之间的关系尽可能小,这些簇相当于分类表中的类目。文本聚类技术不需要预先定义好的主题类别,从而使得搜索引擎的类目能够与所收集的信息相适应。文本聚类技术与人工分类相比,它的分类更加迅速、客观。同时,文本聚类可与文本分类技术相结合,使得信息处理更加方便。可以对检索结果进行分类,并将相似的结果集中在一起。(2)Web结构挖掘在网络信息检索中的应用。W匕b的信息组织方式采用了一种非平面结构,一般来说W己b的信息组织方式是根据内容来进行组织的。但是由于W匕b的这些结构信息比较难以处理,所以搜索引擎一般不处理这些信16硕士学位论文MASTER,S竹正515⑧息,而是将叭触b页面作为平面机构的文本进行处理。但是,在从触b结构挖掘中,通过对研触b文档组织结构的挖掘,搜索引擎可以进一步扩展搜索引擎的检索能力,改善检索效果〔’3]。(3)脆b行为挖掘在网络信息检索中的应用。认触b行为挖掘是一种通过挖掘总结出用户的检索行为的模式。用户的检索行为一直是信息检索中重要的研究内容,通过研触b行为挖掘,不仅可以发现多数用户潜在共同的行为模式,而且还可以发现单个用户的个性化行为,对这些模式进行研究,可以更好地对搜索引擎的检索效果进行反馈,以便进一步改进搜索策略,提高检索效果。挖掘技术的局限及方向(1)孔b内容挖掘。W七b上的数据不管是用HTML还是XML标记语言表示,都不能完全解决W七b数据的非结构性问题,特别是汉语句子格式繁多,虚词、实词没有绝对的界限,切分词难度大,这些是造成无法对数据进行完全自动标引的根本性问题,因此,从七b内容挖掘技术有必要结合数据仓库等信息技术进行信息存储,并最终实现智能化、自动化的数据表示和标引,以供搜索之用。通常数据的表示和数据的利用形式是相互关联的,因此,设计相应的具有高查全率和查准率的挖掘算法也和数据表示一样是未来的方向之一。另外多媒体数据如何进行识别分类标引,这也是未来的研几b内容挖掘研究的难点和方向。(2)梅b结构数据挖掘。随着Intemet的迅猛发展,网站的内容也越来越丰富,结构也越来越庞杂,用有向图表示巨型网站链接结构将不能满足数据处理的需要,需要设计新的数据结构来表示网站结构。由于用来作对比分析发现问题所在的用户使用信息只有日志流,那么,对用户使用日志流中每一链接关系如何识别、采用什么结构表示、如何抽取有用的模式等等,不仅是认飞b行为挖掘的重要研究内容也是网站结构挖掘的重要研究方向之一。(3),eb用户行为挖掘。由于Iniemet传输协议HTTP的无状态性,客户端、代理服务器端缓存的存在,使用户访问日志分别存在于服务器、代理服务器和客户端,因此,从W七b用户访问日志中研究用户访问规律最大的难点在于如何把分布于不同位置的访问日志经过预处理,形成一个个用户一次的访问期间。通常来讲,对于静态W七b网站,服务器端的日志容易取得,客户端和代l7理服务器用户访问日志不容易取得;其次,由于一个完整的W匕b是由一个个图片和框架页面组成的,而用户访问服务器也有并发性,在确定用户访问内容时,必须从服务器日志中甄选出某个用户实际请求的页面和页面的主要内容。另外,由于目前已经有的数据挖掘算法主要是在大量交易数据基础上发展起来的,在处理海量Web用户访问日志中也需要重新设计算法结构〔’41。信息过滤技术hitemet开放式的环境,为人们检索和利用信息提供了极大的方便,但同时,网络环境也为人们及时准确地检索到所需信息带来了麻烦。这是因为,第一,网络环境中信息的来源复杂多样,随意性大,任何人、任何单位不管其背景和动机如何都可以在网络上发布信息,信息的产生和传播没有经过筛选和审定,因此信息的可靠性、质量和价值成为用户普遍担心的一大问题;第二,目前大多数据搜索工具的检索范围是综合性的,它们的Robots尽可能地把各种网页抓回来,经过简单加工后存放在数据库中备检;第三,搜索引擎直接提供给用户的检索途径大都是基于关键词的布尔逻辑匹配,返回给用户的就是所有包括关键词的文献,这样的检索结果在数量上远远超出了用户的吸收和使用能力,让人感到束手无策。这就是人们经常谈论的“信息过载”、“信息超载”现象。信息过滤技术就是在这样的背景下开始受到人们的重视,它的目的就是让搜索引擎具有更多的“智力”,让搜索引擎能够更加深入、更加细致地参与到用户的整个检索过程中,从关键词的选择、检索范围的确定到检索结果的精炼,帮助用户在浩如烟海的信息中找到和需求真正相关的资料。信息过滤模型信息过滤其实质仍是一种信息检索技术,因此它仍依托于某一信息检索模型,不同的检索模型有不同的过滤方法。51。(1)利用布尔逻辑模型进行过滤。布尔模型是一种简单的检索模型。在检索中,它以文献中是否包含关键词来作为取舍标准,因此,它不需要对网页数据进行深度的加工。最简单的关键词表可以设计成只有三个字段:关键词、包括关键词的文献号、关键词在相应文献中出现的次数。检索时,用户提交关键词……………………………………太长 发不全 希望对你有用 实在不行联系我(给我留言)我发给你邮箱。

我给你找了一篇,摘要如下:随着Internet在全世界范围内迅猛发展,网上庞大的数字化信息和人们获取信息之间的矛盾日益突出。因此,对网络信息的检索技术及其发展趋势进行探讨和研究,是一个既迫切而又实用的课题。本文通过对网络信息检索的基本原理、网络信息检索的技术及工具、网络信息检索的现状等方面进行分析研究,并对网络信息检索的发展趋势进行了预测,旨在寻找提高网络信息检索的手段和方法的有效途径,并最终提高网络信息的检索效果,使得网络信息资源得到充分有效地利用。 全文主要包括六个部分,第一部分为网络信息检索述评,主要是阐述了网络信息检索所涉及到的有关概念,如信息检索技术、网络信息检索的特点及网络信息检索效果评价。第二部分重点讨论了网络信息检索的基本技术。如信息推拉技术、数据挖掘技术、信息过滤技术、自然语言处理技术等等,旨在弄清网络信息检索的技术支撑,为预测网络信息检索的发展趋势作下铺垫。第三部分对网络信息检索的重要工具——搜索引擎进行了阐述,主要从其检索机制入手,分析了不同种类的搜索引擎的检索特点及功能。其独到之处在于对搜索引擎的基本功能进行了比较全面的概括,并对目前流行的搜索引擎进行科学的分类...第四部分分析讨论了检索技术的另一分支—基于内容的检索技术第五部分则分析了网络信息搜索工具的局限,主要从文本信息检索和多媒体信息检索两方面进行阐述。好不容易给转成 .txt文本,贴在下面:网络信息资源网络信息资源是指“通过国际Intemet可以利用的各种信息资源”的总称。随着Intemet的迅速发展,网上信息资源也以指数形式增加,网络信息资源作为一种新型的信息资源,发挥着越来越重要的作用,其内容几乎无所不包,涉及政治、经济、文化、科学、娱乐等各个方面;其媒体形式多种多样,包括文本、图形、图像、声音、视频等;其范围覆盖社会科学、自然科学、人文科学和工程技术等各个领域。信息检索技术信息检索技术是现代信息社会中非常关键的技术之一。信息检索是指将信息按一定的方式组织和存储起来,并根据信息用户的信息需求查找所需信息的过程和技术,所以信息检索的全称又叫“信息存储与检索”。狭义的信息检索仅指从信息集合中找出所需信息的过程,也就是利用信息系统检索工具查找所需信息的过程。人们获取信息源的方式主要有:①遵循传统的检索方法在浩如烟海的图书馆资料中,通过人工查找索引找到对应的文献索引号再获取文献原文;②联机信息检索。这其中也存在一个发展过程,由检索结果来看,从提供目录、文摘等相关的二次信息检索到可以直接获得电子版的全文;由检索方法来看,从对特定关键词或者如作者、机构等辅助信息作为检索入口的常规检索到以原始文献中任意词检索的全文检索等等。其中,全文检索由于其包含信息的原始性、信息检索的彻底性、所用检索语言的自然性等特点在近年来发展比较迅速,成为深受人们关注的一种非常有效的信息检索技术,它是从大容量文档库中精确定位所需信息的最有效手段l3]。.信息检索其检索方式有:浏览器方式和搜索引擎方式。(l)浏览器方式(Br,singsystelns)。只要能够进入hitemct就能够通过浏览器,利用HTTP协议提供的WV乃万服务,浏览认触b页面和通过W匕b页面提供的检索方式访问数据库。(2)搜索引擎方式(SearehEngines)。搜索引擎是intemet提供公共信息检索服务的W七b站点,它是以一定的技术和策略在intemet中搜集和发现网络信息,并对网络信息进行理解、提取和处理,建立数据库,同时以认倪b形式提供一个检索界面,供用户输入检索关键词、词组或短语等检索项,代替用户在数据库中查找出与提问相匹配的记录,同时返回结果且按相关度排序输出,从而起到快速查找信息的目的。搜索引擎所处理的信息资源主要包括万维网服务器上的信息,另外还包括电子邮件和新闻组信息。搜索引擎服务的宗旨是为满足用户的信息需要,所以它是面向用户的,采用的方式是交互式的。网络信息检索工具采用主动提交或自动搜索两种方法搜索数据。网络信息检索效果评价目前,得到普遍认同的检索效果的评价标准主要有以下几个:查全率、查准率、收录范围、输出格式,其中以查全率和查准率最为重要。现代信息科学技术的发展,为人们提供了多种多样的信息获取和传送方法及技术,从“信源”与“用户”的关系来看,可分为两种模式:“信息推送”模式(InformationPush),由“信源”主动将信息推送给“用户”,如电台广播;“信息拉取”模式(InformationPull),由“用户”主动从“信源”中拉取信息,如查询数据库。信息推送技术“推”模式网络信息服务,是基于网络环境下的一种新的服务形式,即信息服务者在网上利用“Push”技术为特定用户开展信息服务的方式。Push技术之所以成为Intemet上一项新兴的技术,是因为借助该技术使网络信息服务具有主动性,不仅可以直接把用户感兴趣的信息推送给用户,而且可有效地利用网络资源,提高网络吞吐率;再者,Push技术还允许用户与提供信息的服务器之间透明地进行通信,极大地方便了用户。所谓Push技术,又称“推送”技术、Web广播(Webeasting)技术,实质上是一种软件,这种软件可以根据用户定义的准则,自动搜集用户最可能发生兴趣的信息,然后在适当的时候,将其传递至用户指定的“地点”。因而从技术上看,“推”模式网络信息服务就是具有一定智能性的、可以自动提供信息服务的一组计算机软件,该软件不仅能够了解、发现用户的兴趣(可能关心的某些主题的信息),还能够主动从网上搜寻信息,并经过筛选、分类、排序,然后按照每个用户的特定要求,主动推送给用户141。(l)信息推送方式。信息推送方式分两类,即网播方式和智能方式。网播方式有:频道式推送。频道式网播技术是目前普遍采用的一种模式,它将某些页面定义为浏览器中的频道,用户可像选择电视频道那样接受有兴趣的网播信息;邮件式推送,用电子邮件方式主动将所推送信息发布给各用户,如国际会议的通知、产品的广告等:网页式推送。在一个特定网页内将所推送信息发布给各用户,如某企业、某组织、某个人的网页;专用式推送。采用专门的信息发送和接收软件,信源将信息推送给专门用户,如机密的点对点通信。智能推送方式有:操作式推送(客户推送式),由客户数据操作启动信息推送。当某客户对数据进行操作时,把修改后的新数据存入数据库后,即启动信息推送过程,将新数据推送给其他客户;触发式推送(服务器推送式),由ll硕士学位论文MASTER,5THESIS⑧数据库中的触发器启动信息推送过程,将新数据推送给其他客户,当数据发生变化,如出现增加(Insert)、删除(Delete)、修改(update)操作时,触发器启动信息推送过程。(2)信息推送的特征。信息推送的特征有:主动性、针对性、智能性、高效性·灵活性和综合性I5]。主动性。Push技术的核心就是服务方不需要客户方的及时请求而主动地将数据传送到客户方。因而,主动性是“推”模式网络信息服务最基本特征之一。这也是它与基于浏览器的“拉”(Pull)模式的被动服务的鲜明对比。针对性(个性化)。针对性是说,Push技术可以针对用户的特定信息需求进行检索、加工和推送,并根据用户的特定信息需求为其提供个人定制的检索界面。智能性。Push服务器能够根据用户的要求自动搜集用户感兴趣的信息并定期推送给用户。甚至,Push技术中的“客户代理(ClientAgent)”可以定期自动对预定站点进行搜索,收集更新信息送回用户。同时个人信息服务代理和主题搜索代理还可为了提高“推送”的准确性,控制搜索的深度,过滤掉不必要的信息,将认飞b站点的资源列表及其更新状态配以客户代理完成。因而,网络环境下的“推”模式信息服务具有较高的智能性。这也是传统的定题服务(SDI)不能比的。高效性。高效性是网络环境下“推”模式信息服务的又一个重要特征。Push技术的应用可在网络空闲时启动,有效地利用网络带宽,比较适合传送大数据量的多媒体信息。灵活性。灵活性是指用户可以完全根据自己的方便和需要,灵活地设置连接时间,通过E一mail、对话框、音频、视频等方式获取网上特定信息资源。综合性。“推”模式网络信息服务的实现,不仅需要信息技术设备,而且还依赖于搜寻软件、分类标引软件等多种技术的综合[6]。但在当前信息技术的发展阶段,“推”技术还存在很大的缺陷,比如:不能确保信息发送,没有状态跟踪,缺乏群组管理功能等等。因此,国内外的研究者们又提出超级推(BeyondPush)技术的理论。所谓超级推技术是在保留、继承、完善了Push的优点(主动传递和个性化定制),摒弃了Push的诸多缺点之,2硕士学位论文MASTER,5THESIS管后而发展起来的一种新型的Push技术。它的最大特点是在于保证传送。即所有的信息都是在特定的时间送给特定的信息用户,同时保持连续性的用户资料,随时可以知道谁收到了信息,信息是否为该用户定制,用户环境是否适当等等[刀。信息拉取技术常用的、典型的信息拉取技术,如数据库查询,是由用户主动查询数据库,从数据库中拉取所需信息。其主要优点是:针对性好,用户可针对自己的需求有目的地去查询、搜索所需的信息。Intemet上的信息拉取技术可以说是数据库查询技术的扩展和延伸。在网络上,用户面对的不止是一个数据库,而是拥有海量信息的hitemet环境,因此,各种网络信息拉取(查询)的辅助工具—搜索引擎应运而生了。信息推送与信息拉取两种模式各有其特点,在实际中常常是将两者的结合起来,常用的结合方式为:(1)“先推后拉”式。先及时地推送最新信息(更新的动态信息),再有针对性地拉取所需的信息。这样,便于用户注意信息变化的新情况和趋势,从而动态地选取需要深入了解的信息。(2)“先拉后推”式。用户先拉取所需信息,然后根据用户的兴趣,再有针对性地推送相关的其它信息。(3)“推中有拉”式。在信息推送过程中,允许用户随时中断、定格在所感兴趣的网页上,作进一步的搜索,主动拉取更丰富的信息。(4)“拉中有推”式。在用户拉取信息的搜索过程中,根据用户输入的关键词,信源主动推送相关信息和最新信息。这样既可以及时地、有针对性时为用户服务,又可以减轻网络的负担,并便于扩大用户范围[8]。因此,信息推送与信息拉取相结合是当前Intemet、数据库系统及其它信息系统为用户提供主动信息服务的一个发展方向。挖掘技术随着功temet的发展,W己b已经成为人类社会的公共信息源。在hitemet给人类带来前所未有的信息机遇的同时,又使得人类的信息环境更加复杂,人硕士学位论文MASTER,5THESIS⑧类如何利用信息的问题非但没有如预想的通过信息技术的发展得到圆满的解决,相反,随着信息技术的发展,信息量的激增,造成了个人实际所需信息量与研触b上的海量信息之间的矛盾,因而也就造成了个人利用信息的困难。在这种情况下,虽然出现了叭范b环境下的专门检索工具,但是由于搜索引擎是由传统检索技术发展而来,在当前用户要求不断提高的情况下,传统的搜索技术己经不能够满足人们的需要。为了更加有效地利用网络信息资源,W七b挖掘作为新的知识挖掘的手段,为Web信息的利用提出了新的解决方案叨。,1姗eb挖掘的内容数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。Web挖掘则是从WWW及其相关的资源和行为中抽取有用的模式和隐含信息。其中WWW及其相关资源是指存在于WWW之上的Web文档及Web服务器上的日志文件以及用户资料,从Web挖掘的概念中应当看出Web挖掘在本质上是一种知识发现的手段,它主要从下面3个方面进行仁时。(1)Web内容挖掘。W七b内容挖掘是从W匕b数据中抽取知识,以实现Web资源的自动检索,提高web数据的利用效率。随着Intemet的进一步延伸,Web数据越来越庞大,种类越来越繁多,数据的形式既有文本数据信息,也有图像、声音、视频等多媒体数据信息,既有来自于数据库的结构化数据,也有用HTML标记的半结构化数据及非结构化的自由文本数据信息。因而,对W己b内容信息挖掘主要从下面两个角度进行〔”]。一是从信息检索的角度,主要研究如何处理文本格式和超级链接文档,这些数据是非结构化或半结构化的。处理非结构化数据时,一般采用词集方法,用一组组词条来表示非结构化的文本,先用信息评价技术对文本进行预处理,然后采取相应的模型进行表示。另外,还可以用最大字序列长度、划分段落、概念分类、机器学习和自然语言统计等方法来表示文本。处理半结构化数据时,可以利用一些相关算法给超级链接分类,寻求认七b页面关系,抽取规则。同处理非结构化数据相比,由于半结构化数据增加了HTM毛标记信息及Web文档内部超链结构,使得表示半结构化数据的方法更加丰富。二是从数据库的角度,主要处理结构化的W匕b数据库,也就是超级链接14⑧蕊誉蕊文档,数据多采用带权图或者对象嵌入模型(OME),或者关系数据库表示,应用一定的算法,寻找出网站页面之间的内在联系,其主要目的是推导出Web站点结构或者把W匕b变成一个数据库,以便进行更好的信息管理和查询。数据库管理一般分成三个方面:一是模型化,研究认触b上的高级查询语言,使其不局限于关键字查询;二是信息的集成与抽取,把每个W七b站点及其包装程序看成是一个认范b数据源,通过W七b数据仓库(data~house)或虚拟W七b数据库实现多种数据来源的集成;三是叭几b站点的创建与重构,通过研究web上的查询语言来实现建立并维护web站点的途径[“]。(2)札b结构挖掘。W匕b结构挖掘,主要指的是通过对W七b文档的分析,从文档之间的组织结构获取有用的模式。W匕b内容挖掘研究的是文档内的关系,W七b结构挖掘关注的则是网站中的超级链接结构之间的关系,找到隐藏在一个个页面之后的链接结构模型,可以用这个模型对W七b页面重新分类,也可以用于寻找相似的网站。W七b结构挖掘处理的数据类型为W七b结构化的数据。结构化数据是描述网页内容组织方式的数据,页内结构可以用超文本标记语言等表示成树型结构,此外页间结构还可以用连接不同网页的超链结构表示。文档间的链接反映了文档信息间的某种联系,如隶属平行关系、引用与被引用关系等。对W七b页面的超级链接进行分类,可以判断与识别页面信息间的属性关系。由于Web页面内部存在或多或少的结构信息,通过研究W亡b页面内部结构,可寻找出与用户选定的页面集合信息相关的其它页面信息模式,以检测W己b站点所展示的信息完整程度。③Web行为挖掘。所谓W己b用户行为挖掘主要是通过对认尼b服务器的日志文件以及用户信息的分析,从而获得有关用户的有用模式。W七b行为挖掘的数据信息主要指网络日志中包括的用户行为模式,它包括检索时间、检索词、检索路径、检索结果以及对哪些检索结果进行了浏览。由于W七b自身的异质、分布、动态、无统一结构等特点,使得在认七b网上进行内容挖掘比较困难,它需要在人工智能和自然语言理解等方面有所突破。所幸的是基于W七b服务器的109日志存在着完整的结构,当信息用户访问web站点时,与访问相关的页面、时间、用户ro等信息,日志中都作了相应的记录,因而对其进行信息l5硕士学位论文MASTER,5THESIS⑥挖掘是可行的,也是有意义的。在技术实践过程中,一般先把日志中的数据映射成诸种关系信息,并对其进行预处理,包括清除与挖掘不相关的信息等。为了提高性能,目前对109日志数据信息挖掘采用的方法有路径分析、关联规则、模式发现、聚类分析等。为了提高精确度,行为挖掘也应用到站点结构信息和页面内容信息等方面。挖掘技术在网络信息检索中的应用(l)Web内容挖掘在检索中的应用。W匕b内容挖掘是指从文档内容及其描述中获取知识的过程,由于用传统的信息检索技术对W己b文档的处理不够深入,因此,可以利用叭触b内容挖掘技术来对网络信息检索中的W己b文档处理部分进行进一步的完善,具体而言表现在以下几个方面。①文本总结技术。文本总结技术是指从文档中抽取出关键信息,然后以简洁的形式对W匕b文档的信息进行摘要或表示。这样用户通过浏览这些关键信息,就可以对W七b网页的信息有大致的了解,决定其相关性并对其进行取舍。②文本分类技术。W匕b内容挖掘中的文本分类指的是按照预先定义的主题类别,利用计算机自动为文档集合中的每一个文档进行分类。分类在网络信息检索中的价值在于可以缩小检索范围,大大提高查准率。目前,己经出现了很多文本分类技术,如TFIFF算法等,由于文本挖掘与搜索引擎所处理的文本几乎完全一样,所以可以直接将文本分类技术应用于搜索引擎的自动分类之中,通过对大量页面自动、快速、有效的分类,来提高文档检索的查准率。③文本聚类技术。文本聚类与文本分类的过程J险洽相反,文本聚类指的是将文档集合中的文档分为更小的簇,要求同一簇内的文档之间的相似性尽可能大,而簇与簇之间的关系尽可能小,这些簇相当于分类表中的类目。文本聚类技术不需要预先定义好的主题类别,从而使得搜索引擎的类目能够与所收集的信息相适应。文本聚类技术与人工分类相比,它的分类更加迅速、客观。同时,文本聚类可与文本分类技术相结合,使得信息处理更加方便。可以对检索结果进行分类,并将相似的结果集中在一起。(2)Web结构挖掘在网络信息检索中的应用。W匕b的信息组织方式采用了一种非平面结构,一般来说W己b的信息组织方式是根据内容来进行组织的。但是由于W匕b的这些结构信息比较难以处理,所以搜索引擎一般不处理这些信16硕士学位论文MASTER,S竹正515⑧息,而是将叭触b页面作为平面机构的文本进行处理。但是,在从触b结构挖掘中,通过对研触b文档组织结构的挖掘,搜索引擎可以进一步扩展搜索引擎的检索能力,改善检索效果〔3]。(3)脆b行为挖掘在网络信息检索中的应用。认触b行为挖掘是一种通过挖掘总结出用户的检索行为的模式。用户的检索行为一直是信息检索中重要的研究内容,通过研触b行为挖掘,不仅可以发现多数用户潜在共同的行为模式,而且还可以发现单个用户的个性化行为,对这些模式进行研究,可以更好地对搜索引擎的检索效果进行反馈,以便进一步改进搜索策略,提高检索效果。挖掘技术的局限及方向(1)孔b内容挖掘。W七b上的数据不管是用HTML还是XML标记语言表示,都不能完全解决W七b数据的非结构性问题,特别是汉语句子格式繁多,虚词、实词没有绝对的界限,切分词难度大,这些是造成无法对数据进行完全自动标引的根本性问题,因此,从七b内容挖掘技术有必要结合数据仓库等信息技术进行信息存储,并最终实现智能化、自动化的数据表示和标引,以供搜索之用。通常数据的表示和数据的利用形式是相互关联的,因此,设计相应的具有高查全率和查准率的挖掘算法也和数据表示一样是未来的方向之一。另外多媒体数据如何进行识别分类标引,这也是未来的研几b内容挖掘研究的难点和方向。(2)梅b结构数据挖掘。随着Intemet的迅猛发展,网站的内容也越来越丰富,结构也越来越庞杂,用有向图表示巨型网站链接结构将不能满足数据处理的需要,需要设计新的数据结构来表示网站结构。由于用来作对比分析发现问题所在的用户使用信息只有日志流,那么,对用户使用日志流中每一链接关系如何识别、采用什么结构表示、如何抽取有用的模式等等,不仅是认飞b行为挖掘的重要研究内容也是网站结构挖掘的重要研究方向之一。(3),eb用户行为挖掘。由于Iniemet传输协议HTTP的无状态性,客户端、代理服务器端缓存的存在,使用户访问日志分别存在于服务器、代理服务器和客户端,因此,从W七b用户访问日志中研究用户访问规律最大的难点在于如何把分布于不同位置的访问日志经过预处理,形成一个个用户一次的访问期间。通常来讲,对于静态W七b网站,服务器端的日志容易取得,客户端和代l7理服务器用户访问日志不容易取得;其次,由于一个完整的W匕b是由一个个图片和框架页面组成的,而用户访问服务器也有并发性,在确定用户访问内容时,必须从服务器日志中甄选出某个用户实际请求的页面和页面的主要内容。另外,由于目前已经有的数据挖掘算法主要是在大量交易数据基础上发展起来的,在处理海量Web用户访问日志中也需要重新设计算法结构〔41。信息过滤技术hitemet开放式的环境,为人们检索和利用信息提供了极大的方便,但同时,网络环境也为人们及时准确地检索到所需信息带来了麻烦。这是因为,第一,网络环境中信息的来源复杂多样,随意性大,任何人、任何单位不管其背景和动机如何都可以在网络上发布信息,信息的产生和传播没有经过筛选和审定,因此信息的可靠性、质量和价值成为用户普遍担心的一大问题;第二,目前大多数据搜索工具的检索范围是综合性的,它们的Robots尽可能地把各种网页抓回来,经过简单加工后存放在数据库中备检;第三,搜索引擎直接提供给用户的检索途径大都是基于关键词的布尔逻辑匹配,返回给用户的就是所有包括关键词的文献,这样的检索结果在数量上远远超出了用户的吸收和使用能力,让人感到束手无策。这就是人们经常谈论的“信息过载”、“信息超载”现象。信息过滤技术就是在这样的背景下开始受到人们的重视,它的目的就是让搜索引擎具有更多的“智力”,让搜索引擎能够更加深入、更加细致地参与到用户的整个检索过程中,从关键词的选择、检索范围的确定到检索结果的精炼,帮助用户在浩如烟海的信息中找到和需求真正相关的资料。信息过滤模型信息过滤其实质仍是一种信息检索技术,因此它仍依托于某一信息检索模型,不同的检索模型有不同的过滤方法。51。(1)利用布尔逻辑模型进行过滤。布尔模型是一种简单的检索模型。在检索中,它以文献中是否包含关键词来作为取舍标准,因此,它不需要对网页数据进行深度的加工。最简单的关键词表可以设计成只有三个字段:关键词、包括关键词的文献号、关键词在相应文献中出现的次数。检索时,用户提交关键词。

相关百科

热门百科

首页
发表服务