电子竞技运动有两个基本元素:电子、竞技。在电子竞技运动的概念中,“电子”是其方式和手段,指这项运动是借助信息技术为核心的各种软硬件以及由其营造的环境来进行,这类似于传统体育运动项目中相应的器材和场地。我们知道,任何一项体育运动,都需要相应的器材和场地,比如篮球运动有篮球和篮球场,田径有标枪、跳高架和跑道、沙坑等等。在电子竞技运动中,这一切都是依赖信息技术来实现。这是电子竞技运动有别于传统体育的根本不同。“竞技”则指的是其体育的本质特性,即对抗、比赛。作为一个体育项目,对抗、比赛是最基本的特征,这也是电子竞技运动有别于其他电子游戏特别是网络游戏的主要不同。电子竞技运动有多种分类和项目,但共同的核心一定是对抗、比赛。需要说明的是,体育的比赛特征,具有可定量、可重复、精确比较的特点,作为一项运动项目,具有高度的技巧性、国家有关电子竞技的文件规律性,选手的技战术水平,必须通过严格的训练和实践来提高。电子竞技运动作为一个体育项目,还有一个必不可少的基本特征,那就是统一的竞赛规则,以及在这样的规则保障下进行公平、公开、公正的比赛。从这样的理解我们来尝试阐述电子竞技运动的概念:电子竞技运动是以信息技术为核心的软硬件设备为器械、在信息技术营造的虚拟环境中、在统一的竞赛规则下进行的对抗性益智电子游戏运动。电子竞技运动作为一项体育项目,可以锻炼和提高参与者的思维能力、反应能力、协调能力、团队精神和毅力,以及对现代信息社会的适应能力,从而促进其全面发展。正是因为电子竞技运动这样的内涵和功能,国家体育总局才根据形势发展的需要,将之列为中国正式开展的第99个体育项目。(注:现已重新定义为第78项体育运动.)[编辑本段]二.电子竞技与网络游戏的区别电子竞技运动和网络游戏都属于广义的电子游戏的范畴。电子竞技运动与网络游戏是两个不同的概念,他们从性质、方式、项目等等各个方面,都有较大的不同。首先从性质上看,电子竞技运动是体育项目,网络游戏是娱乐游戏,这是两者本质的不同。网络游戏的目的和方式是建立一个虚拟的世界,在这个世界里的所有玩家都像是生活一个全新的社会里,这个社会有它自己的各种“法律”,生活在这个社会里的玩家必须要遵守这些法律。网络游戏完整继承了RPG的最关键的升级系统和俗称布娃娃的武器装备系统,玩家通过这些系统来体会自己角色的成长快乐,自娱自乐。所以从本质上说,网络游戏是以追求感受为目的的模拟和角色扮演,相对而言并不十分重视或者需要游戏的技巧。而电子竞技则接近于那些传统的体育项目,对抗性和竞技性是它的特点。它有着可定量、可重复、精确比较的体育比赛特征,游戏的方式是对抗和比赛,有统一的规则和相同的技术手段,这与体育比赛中的技、战术完全一样。选手通过日常刻苦的、近乎于枯燥的训练,提高自己与电子设备等这些比赛器械相关的速度、反应和配合等等综合能力和素质,依靠技巧和技战术水平的发挥,争取在对抗中获得胜利和好成绩。其实简单地说,电子竞技运动是一项体育项目,只不过其器械、比赛环境等等是通过信息技术来实现的而已。这是其与网络游戏最本质的区别。从技术层面上看,两者所依托的网络环境或者说载体不同,网络游戏是完全建立在国际互联网上的,它离开了互联网,根本就无法存在。而电子竞技运动所依赖的是局域网环境,甚至可以是两台电脑的直接联接,互联网只是电子竞技运动用来训练或娱乐的一种手段而已。另外,两者对软件的依赖、赢利手段和运营方式等等也不同。网络游戏很大程度受软件商的约束,通过近三年来的市场实践,已经摸索出了一套完整的赢利模式。游戏开发商负责开发游戏,而运营商负责运营,玩家按照游戏时间付费,产生赢利后由开发商和运营商按一定比例分成。而电子竞技基本上不受游戏软件的制约,游戏开发商负责开发游戏,并委托发行公司发行,玩家通过购买游戏一次性付费,便可进行电子竞技的娱乐和比赛。这样电子竞技比赛的组织者能否获得利润与游戏的开发商与发行公司并没有直接关系,这也造成两者在平台构建和与平台的关系上也有较大不同。把电子竞技运动列为正式体育项目,纳入体育比赛和体育产业的轨道,必然更加突出其体育的特性,加剧电子竞技运动和网络游戏分别朝不同的发展方向发展。但是,电子竞技运动与网络游戏虽然不同,但两者本身及其产业,都是信息技术的产物,不同之中有着许多相同之处。如何处理这两者之间的关系,是电子竞技运动发展所必须面对的一个重要问题。从目前中国的现状来看,网络游戏由于起步较早,玩家群体较大,已经形成了一个非常大的市场,商业模式和产业链都已经比较成熟和清晰。中国电子竞技运动尚处在起步阶段,比赛模式、赛事品牌、商业模式和产业链等等,都在摸索之中。不管对项目还是对产业,电子竞技运动与网络游戏都应该朝着各得其所、相得益彰而努力,事实上,庞大的网络游戏基础对电子竞技运动的开展不无裨益,而电子竞技运动的健康发展,对网络游戏的发展同样有着促进和推动作用。当然,现在所说的电子竞技运动和网络游戏的不同,是一个历史的观点,用发展的眼光看,电子竞技运动与网络游戏并不是决然分开、一成不变。从理论和实践上说,网络游戏经过发展,在补充和强化了体育的特性后,其中一些类型可能转化发展成为新的电子竞技运动项目。
热爱电子竞技 我热爱电子竞技,最喜欢玩英雄联盟这个游戏。 英雄联盟,是一款既需要操作技术又需要大脑思考以及团队配合的游戏,而且里面会有很多数学上和物理上的东西。所以,玩这个游戏,可以发展和开拓我们的大脑思维能力。当然,玩游戏是要在学习任务和工作完成的情况下进行娱乐。首先,我们进入界面需要选择英雄,你将会有系统匹配到的四个队友与你并肩作战,最标准的配置是:打野,上单(指上路一个人),AP输出(法系),AD(物理)输出以及辅助,你需要根据你的队友来确认你选择什么位置,通过讨论我们可以知道彼此擅长玩什么。进入到游戏画面时,我们需要用初始的475元金币买装备(可以用天赋点加成改为初始金币提高40元),这时,你可以根据你选的英雄来购买出门装,以便你那一路的发展,若你是AP,则需要打中路,若打野的队友选择的英雄是无蓝职业,则帮他拉一下(指打一下,让打野有更多的时间和效率gank)红Buff,若是耗蓝职业,则拉一下蓝Buff。开局是十分重要的,这需要看对手的意识,若对手来抓,你们人不够,则不能进行团战,毕竟开局让对面拿到人头对线的那一方友军将会十分吃力。我们先来看下路(常规打法是ADC和辅助),我们看到下路紫色军团是牛头和VN,蓝色军团是EZ和奶妈,双方的辅助装备都是仙女护符,三眼,一蓝一红,并且彼此互相插了一个眼在对方的草丛里,以及河道的草丛附近,以防打野的来gank,牛头和奶妈蹲草丛,VN和EZ进行补兵,补兵是一个很简单的事,也是个玩ADC或APC必须练就好的事情,前期若拿不到人头,几十个小兵也可以补回来这份经济,后期也有很多ADC靠补兵崛起,这种事数不胜数。VN率先发起进攻,一个Q的翻滚打到了EZ,耗了EZ半格血,可是对面是奶妈,并且一级点的是E,给EZ加了血,奶妈一级应该点W,W相比E之下,在一级更有用,W是给友军加蓝和沉默敌军,并且无消耗,而E消耗很多蓝并且在1级的情况下加不了多少血,所以建议一级还是点W。此时,EZ也按捺不住了,到了3级的时候,EWQ了过来,加上奶妈的Q,VN掉了2格血,可是牛头反应很快,将E过来技能抛完的EZ撞到墙上并垂起二练眩晕,加上VN的E,EZ眩晕了很久,并且被VN的三下真实伤害一个Q打成残血,这时,蓝色军团打野的武器来了,牛头注意到了河道,但眼在那时快要消失了,牛头提醒VN快速回家出装自己先扛着,可VN说,不行,你这样一定会被他们三个强杀的,我不能抛下你一个人,我们还是呼叫我们这打野的瞎子(盲僧)来吧。果然,盲僧在偷对面的三狼,留了一个小的,就火速赶了过来,蹲在河道里,惊喜的发现武器回家了,对面的眼时间也到了,就在这时,瞎子神Q,Q到了对面残血的EZ正准备回家,VN顿时一个Q翻滚Q了一下EZ,EZ还有一格血,奶妈帮EZ加血加蓝,VN给EZ上了引燃,瞎子也再一次Q到了EZ并Q了过去一套连招,First!是VN的,没错,就在这么短的片刻,一瞬间,引燃还在!EZ太浪了,以至于送了一血。这时双方ADC的补兵是差不多的。只相差10几个左右。现在转到中路,中路紫色军团的光辉看到本方拿到一血,气势大增,就在瞎子来gank顿草丛的时候,一下子就禁锢到了对面,对面并没有意识到打野的过来,压了兵线,结果,卡特被光辉一套QER和瞎子的帮助直接带走。是上路表演的时候了,可是上路紫色军团表现不是很好,蓝色军团的上单是斧头,紫色是瑞文,瑞文的意识不是很好,被对面打野的武器给抓了,并且被武器杀死,这样瑞文上单会有一定压力,不过可以理解,斧头的确是个前后期都比较均衡强劲的英雄。这时,瞎子在偷对面的红Buff,眼看武器和斧头就要去了,瞎子插了眼,留了一手,打了红用惩戒收了Buff,直接用眼逃跑,表演瞬移大法。三路相比之下,紫军还是有优势的,因为对面下塔并没有多少血了。一旦拆掉,一个人150不是小数目。到了中期,双方的装备逐渐开始成形,这时团战比的就是意识,技术和信任了。辅助要记得多插眼,在大小龙的位置,以防对方偷龙,小龙为每人190元,大龙是每人300元加上龙buff(增加AD,AP和回复的增益),可以大大提高友军的团体输出以及经济。当小地图上的人消失了,或是对面出了吸血攻速等装备的ADC消失,则需要去看一看小龙,这是没眼的情况下,最好在高地上向里面插眼观察。大龙更需要注意。当然,偷塔是后期一种常见的事,偷野在前中期,偷塔的专业人士有:剑圣,武器,剑姬,提莫等英雄。通常他们偷塔会插眼或提莫种蘑菇保证视野,这时候,队友和你去抓偷塔的敌方,敌方会察觉,并逃跑,一次次这样消耗,既消耗友军的经济发展,又给对面除了偷塔以外的人发展空间,若剑圣在偷上路,下路则可能会出现对面的ADC去偷塔之类的。所以,对于偷塔的,不要给他们兵线,或是也留一个偷塔的,对面的到哪友军的跟到哪,一起推线,并防范被抓。被抓了的话,队友再赶过来4V5不怎么好打,若失败,中后期不是掉一个塔就是掉两个塔,甚至可能在后期直接推掉水晶,所以眼是非常重要的。到了近40分钟的时候,就是中期转后期了,双方的装备,就算前期送了很多,后期此时也会有各种突破,此时比的就是意识与阵容。后期比较强势的ADC有:VN,EZ,好运姐,飞机(后三个为APC,暂且融入ADC同论)。凯特琳后期可能机动性比较弱,若跟这些ADC一样的装备,一样的技术操作,想必凯特琳优势不大,VN的三下真实伤害我十分看好,打肉打输出都很赞,不过就是太脆了,如果操作的人有很强的意识,并且团队也有意识保护输出,那么,VN四杀五杀是没有任何问题的,EZ,好运姐,飞机之类的也是如此,当然,凯特琳也是有用的,前期压线很强,射程远,有夹子,有反弹,还有大招,但大招被挡掉是经常的事,另外,腿太短,跑的慢,就算反弹了,还是不确定跑不跑得掉。ADC就谈到这,你懂我喜欢哪个ADC的。现在谈谈AP吧!AP是前期gank收人头或是给队友人头,后期切脆皮或是群体伤害的职业。当然,AP也可以靠补兵起,AP最忌讳的是裸帽子,不过有一种情况你可以这样,那就是把对面打趴了,人头都是20几比0或者几个的那种,你裸帽子百分百秒人的情况下,裸帽子是可以的,可如果并不是这样的福利局,那么,追求法强高而不搞穿透或是一点防御,那么,对面出了魔抗,一帮人冲到你身上直接没碰到脆皮你就跪了。不要说自己站位好,都是肉先上你才上,对面意识好就不会打肉,这点你要想清楚,无脑的人们都是丢各种技能把对面肉搞死还得意肉死了他们没人抗了,请问输出都是看戏的么,某些心理不正常的输出除外。卡特,AKL,皎月这种近身的AP(卡特,AKL均为AP AD输出都有,暂且同上归为AP),特别是卡特,大招需要找准机会跳进去放,当然,不要让你们队人死的差不多了你还不动手或是进去了,那样,后果可想而知。(经常看到新手这样玩,所以还是提醒下~)轮到肉了,后期不存在什么打野的,除了那种野区30年不出山的智力不正常除外。肉里面有团控类型,也有输出类型(技能AD或AP),团控有木木,石头,输出有盖伦之类的。团控是很重要的,一个团控,可以给你队友足够的时间将对面打残。当然,这也得看控的好不好,控到多少人。输出型的肉比如盖伦,就算一身肉装,那技能打人还是很疼,不知多少英雄豪杰死于他的剑下,现在貌似很流行AD盖伦,不出肉的那种,一把大剑,一个Q加转啊转,脆皮就挂了,真的很伤不起,当然,这样他也很脆了,但是,一个Q移除减速很坑爹啊。谈到这,谈的也差不多了。咱们最后来说说那些队友之间的合作吧。该卖的时候就该卖,因为那个为你牺牲的人一定不希望你也死,你死了,你的队友死的就没意义了,所以,该卖的时候就该卖,这并不是无情,这是为了下一次替他报仇做的铺垫。中路对线的人消失,中路立刻标记上下路小心,此时,下路辅助需要在河道插眼或是提醒ADC后撤,上路更是应退过河道猥琐一点,不退的话,不是3V2就是2V1,人头就是这样出现的,然后对面有钱出装备了,又杀人了,这是循环的。其实,有很多很多的感动从游戏转变到生活,仔细想想,游戏让我们体会到合作的快感,友谊的幸福,胜利的喜悦和失败的蜕变。玩游戏,图的就是个开心,不要嫌弃队友技术差,有时候就是这样打击了对方,只要想想自己难道没有发挥失常过么,也不要觉得队友坑,你不是大神,你是大神就不会觉得队友坑,你有能力带领全队胜利,再说那些无用的话吧。或许,游戏只是游戏,但,体会到的,不仅仅是快意恩仇,更多的是,游戏将这一切体现在了生活中,让我们明智,让我们敏锐,助我们成长。 可能太多了
电子竞技走向体育化随着电竞行业正式归入体育项目,电子竞技产业发展进入新阶段,2016年以来,电子竞技行业政策利好不断,包括:中国文化娱乐行业协会成立电子游戏竞技分会;国家发改委、文化部等发文鼓励发展电子竞技赛事;教育部将电子竞技设为高职正式专业等。电子竞技纳入体育范畴后,电子竞技产业市场空间的不断扩大,对社会释放出更多的正面影响力。围绕“体育化”目标,电子竞技行业在“UP大会”上宣布了“体系化升级”“城市化布局”及“规范化运营”三大策略及具体措施。基于电子竞技体育化发展计划,行业将与所有合作伙伴一起,以赛事为核心、以联盟为依托、以教育为根本、以产业园为载体,打造一个绿色、可持续发展的电子竞技产业。电子竞技走向规范化腾讯公司是我国电子竞技产业发展的领头羊,在《腾讯2018电子竞技运动标准》基础上,腾讯继续完善电竞行业规则,着重搭建赛事规范、硬件规范和技术规范体系,与各地政府部门及官方体育组织一起建立完善的电子竞技运动标准体系,行业监管力度持续提升。未来将针对促进行业规范以及维护市场秩序,出台多项重磅政策。电竞正一步步成为一项被社会认可、具有巨大发展潜力的体育运动。目前,全国已有十多个城市布局电竞场馆。除了通过主办赛事以及赛事直播和门票收入获取收益外,电竞场馆还能通过赛事吸引人流,再通过餐饮、桌游、上网服务的途径实现盈利,同时可以举办音乐会、见面会、发布会等活动获取收益。更重要的是,电竞场馆还有助于提升一个城市的产业层次,也正是如此,不少地方政府以PPP的形式参与到电竞场馆的建造中来。电子竞技走向市场化电子竞技产业市场化发展,带动了一批俱乐部和职业联赛的兴起,很大程度上改变了电子竞技产业在中国的发展轨道。随着资本进入,直播和电竞赛事日益受到关注。其中,电竞赛事更具市场潜力。英雄联盟全球总决赛的收看观众超过1亿,与此同时,活跃的电竞市场也提高了竞争强度。直接拉动消费是电竞作为经济新动能的一个重要表现。一方面,电竞的消费习惯往往表现为游戏内消费,表现为购买游戏皮肤和品牌外设。另一方面,众多电竞用户到现场观赛,购物中心可以选择通过与电竞企业合作举办赛事的方式,将人流导入线下购物场所,开启“集市+电竞”的跨界融合。与此同时,还可以通过线下电竞赛事、直播等形式将线下粉丝客流导流至电商平台。或与电竞明星合作,采用游戏互动、社交互动等方式与电商产品相结合,通过电竞粉丝经济拉动产品销售,实现“电竞+新零售”的无缝衔接。此外,电竞已经成为增加就业的一个新型渠道。一方面,电竞的出现已经完全颠覆游戏是“不务正业”的主流价值观,上升为一个技能化、职业化与专业化的体育运动;另一方面,电竞已经不再是“富二代”的专门游戏,广大草根青年都可以参与进来,使得电竞具有更广泛的参与度。特别是随着电竞俱乐部的市场化运作,不少游戏玩家因此可以由业余转向职业,获得稳定的收入,而且赛手退役后还可以顺利进入电竞培训、游戏开发等行业。但随着用户的不断增多以及产业链的形成与扩张,电竞从业人员获得的报酬必然会越来越高。电子竞技走向全民化近年来,电子竞技的边界范围正在不断扩大,真正触及更多非核心粉丝的大众人群。与此同时,电竞行业的“壁垒”被进一步打破,更多的行业、品牌、资本都纷纷进军电竞,参与行业共建。众多知名企业家组建战队,加快了中国电竞的崛起速度。随着网络直播平台的兴起,电子竞技赛事观看移动化,使得电子竞技被越来越多的人所熟知。国内电竞行业的用户群将不断扩大,迎来全民参与时代。英雄联盟、王者荣耀作为时下最火热的两款游戏,其中国赛区内的两大职业联赛赛事LPL与KPL对于电竞破壁,有着不可推卸的“责任”,它们是破壁的先锋军。它们从传统体育联赛“取经”,率先进行了联盟化、地域化等诸多改革。尤其是地域化的改革,通过把LPL和KPL主场落户于重庆、杭州、西安等城市,为这些城市培育了电竞土壤,让电竞战队犹如洒落在土壤里的种子,从小到大、从无到有,催生出了粉丝、场馆、个性化周边等电竞生态体系,举办更多全民性、大众化的落地竞技比赛。这是一条完整的电竞赛事生态链不可或缺的部分,也是中国电竞走向体育的必经之路。电子竞技走向国际化随着全球电子竞技产业的快速发展,电子竞技运动也开始受到越来越多的关注,包括耐克在内的众多国际著名体育品牌与电子竞技正碰撞出新的火花。与耐克的合作,能够更加提升电竞运动的市场价值;与耐克合作,能够为电竞运动员带来更加专业化和科学化的服务,也让电竞运动以更多元更深入的方式融入大众生活。腾竞体育正和耐克共同努力,融合彼此的专业性与创造力,为我们的电竞运动员以及电竞爱好者创造更加多元化的内容和服务,以此塑造一种全新的生活方式,并传递更加积极向上的体育精神。作为全球年轻人的共同爱好,电子竞技正成为全世界文化交流的桥梁。近年来,在世界电竞发展过程中,中国扮演了不可或缺的角色,很多外国人正是通过电竞更好地认识中国的年轻人,更深入地了解中国。得益于各级政府的大力扶持,以及如火如荼的国内外赛事,一批优秀的电竞选手、职业战队纷纷涌现,电竞内容制作的产业链得到完善,电子竞技产业正向着国际化方向发展。
作者在 Kaggle 中上传了模型的每个部分,以便大家更好地理解数据的处理过程与模型结构:
第一部分:第二部分:第三部分:
目前这个项目还在进行当中,我们希望展示复杂的机器学习方法可以在游戏中做什么。该游戏的分数不只是简单的「计分板」统计结果,如下图所示:
动机和目标
英雄联盟是一款团队竞技电子游戏,每局游戏有两个团队(每队五人),为补兵与杀人展开竞争。获得优势会使玩家变得比对手更强大(获得更好的装备,升级更快),一方优势不断增加的话,获胜的几率也会变大。因此,后续的打法和游戏走向依赖于之前的打法和战况,最后一方将摧毁另一方的基地,从而赢得比赛。
像这种根据前情建模的情况并不新鲜;多年来,研究人员一直在考虑如何将这种方法应用于篮球等运动中(),在这些运动中,传球、运球、犯规等一系列动作会导致一方得分或失分。此类研究旨在提供比简单的得分统计(篮球中运动员得分或游戏里玩家获取人头)更加详细的情况,并考虑建模为时间上连续的一系列事件时,团队应该如何操作。
以这种方式建模对英雄联盟这类游戏来说更为重要,因为在该类游戏中,玩家补兵和杀人后可以获得装备并升级。例如,一个玩家拿到首杀就可以获取额外金币购买更强的装备。而有了这些装备之后,该玩家变得更加强大进而获取更多人头,如此循环,直到带领其队伍获取最后的胜利。这种领先优势被称为「滚雪球」,因为该玩家会不断积累优势,不过很多时候,该玩家在游戏中所在的队伍并不一定是优势方,野怪和团队合作更为重要。
然而,一场游戏中影响玩家决策的因素有很多,没那么容易预测。不论收集多少数据,玩家获得的信息量始终多于任何一台计算机(至少目前如此!)。例如,在一场游戏中,玩家可能超水平发挥或发挥失常,或者偏好某种打法(通常根据他们选择的英雄来界定)。有些玩家自然而然地会变得更加好斗,喜欢杀戮,有些玩家则比较被动一直补兵发育。因此,我们进一步开发模型,允许玩家根据其偏好调整建议的打法。
让模型「人工智能化」
在第一部分中,我们进行了一些介绍性的统计分析。例如,假设队伍在比赛中补到第一个和第二个兵,我们能够计算出获胜的概率,如下图所示。
有两个组成部分,使我们的项目超越简单的统计的人工智能:
首先,在未预先设想游戏概念时,模型会学习哪些行动是最好的。第二,它试图了解玩家对影响模型输出的决策的偏好。
我们定义马尔可夫决策过程及收集玩家喜好的方式会决定模型学习和输出的内容。
根据匹配统计信息对马尔科夫决策过程进行预处理和创建
AI 模型 II:引入打钱效率
我从第一个模型的结果中意识到,我们没有考虑到负面和正面事件对未来都可能产生累积的影响。换句话说,无论在当时时间点之前还是之后,当前的MDP(马尔科夫决策过程)概率都有可能发生。在游戏中,这是不正确的。一旦落后,杀人、拿塔、补兵都会变得更难,我们需要考虑到这一点。所以,我们引入队伍间的打钱效率来重新定义状态。当前目标是建立一个定义状态的 MDP,这个状态可能是事件发生顺序,或者队伍是否落后或领先。我们将金币差值分为以下几类:
相等:0–999 金币差值(平均每个队员 0-200)略落后/领先:1,000–2,499(平均每个队员 200–500)落后/领先:2,500–4,999(平均每个队员 500–1,000)远远落后/遥遥领先:5,000(平均每个队员 1,000+)
我们也需要考虑没有任何事件发生的情况,并把其归为『无』事件中,以保证每分钟都有事件发生。这个『无』事件表示一个队伍决定拖延游戏,以将那些在早期游戏中更善于获得金币的队伍区分出来,而不需要杀死(或通过小兵杀死)他们。然而,这样做也会大大增加数据量。因为我们为匹配可用匹配项已经添加了 7 个类别,但如果我们能访问更常规的匹配项,那数据量就已足够了。如前所述,我们可以通过以下步骤来概述:
预处理
1. 输入杀人数、塔数、野怪和金币差值的数据。
2. 将『地址』转为 ID 特性。
3. 移除所有旧版本的游戏。
4. 从金币差值开始,按照事件的时间、匹配 ID 和与以前一致的团队进行合计。
5. 追加(助攻的)人头数、怪数和塔数到此末尾,为每个事件创建行并按发生的时间对事件进行排序(平均人头数)。
6. 添加「事件序号」特性,显示每次匹配中的事件顺序。
7. 为行上的每个事件创建一个统一的「事件」特性,包括人头、塔、怪或者『无』事件。
8. 每次匹配时将其转化为行,现在是用列来表示每个事件。
9. 只考虑红队的视角,以便合并列,视蓝队增益为负红队增益。同时增加红队的游戏长度和结果。
10. 将所有空白值 (即在前面步骤中结束的游戏) 替换为匹配的游戏结果,以便所有行中的最后一个事件是匹配结果。
11. 转换为 MDP,其中 P(X_t | X_t-1)用于每个事件数和由金币差值定义的状态之间的所有事件类型。
马尔科夫决策过程输出
使用简易英语的模型 V6 伪代码
我们最终版本的模型简单总结如下:
1. 引入参数
2. 初始化启动状态、启动事件、启动操作
3. 根据 MDP 中定义的首次提供或基于其发生可能性的随机选择操作
4. 当行动赢或输时,结束
5. 跟踪事件中所采取的行动和最终结果(赢/输)
6. 根据最终结果所用的更新规则来更新操作
7. 重复 x 次上述步骤
引入奖励偏好
首先,我们调整模型代码,把奖励归入回报计算中。然后,当我们运行模型时,引入了对某些行为的偏置,现而不是简单地使奖励等于零。
在第一个例子中,我们显示了如果对一个动作进行积极的评价,会发生什么;在第二个例子中,显示对一个动作进行消极的评价,会发生什么。
如果我们积极评价动作『+KILLS』的输出
如果我们消极评价动作『+KILLS』的输出
更真实的玩家偏好
现在我们可以尝试近似模拟玩家的真实偏好。在这个案例中,我们随机化一些奖励以允许遵守以下两条规则:
玩家不想错过任何补兵玩家优先补兵而不是杀人
因此,我们对人头和补兵的奖励都是最小值,而其它行动的奖励都在 和 之间随机生成。
随机化玩家奖励后的输出。
随机化玩家所有动作的奖励后所获得的输出。
最终输出,显示给定当前金币差值状态和分钟的每个动作的值
总结及玩家对奖励的反馈
我过分简化了某些特征(如「kills」实际上并不代表人头的数量),数据也不太可能表示正常的匹配。然而,我希望本文能够清晰地展现一个有趣的概念,鼓励更多人讨论这一领域今后的走向。
首先,我将列出在实现之前需要作出的重要改进:
1. 使用更多能够代表整个玩家群体(而不只是竞争性比赛)的数据计算 MDP。
2. 提高模型效率,将其计算时间控制在更合理的范围。蒙特卡洛以耗时著称,因此我们将探索更高效的算法。
3. 采用更高级的参数优化以进一步改进结果。
4. 捕捉、映射原型玩家对更真实的奖励信号的反馈。
我们引入了针对影响模型输出而给予的奖励,但该如何获得奖励?我们可以考虑几种方法,但是根据我之前的研究,我认为最好的方法就是考虑一种既涉及到行动的个体质量又考虑到转变质量的奖励。
这变得越来越复杂,我不会在此文中展开,但简而言之,我们想为玩家匹配决策,其中下一个最佳决策取决于最新情况。比如,如果一队玩家将对方全部歼灭,他们可能会去拿大龙。我们的模型已经将一个序列中事件发生的概率考虑在内,因此,我们也应该用同样的方式思考玩家的决策。这一想法来自一篇论文《DJ-MC: A Reinforcement-Learning Agent for Music Playlist Recommendation》,该论文阐释了如何更加详细地将反馈映射出来。
反馈的收集方式决定了我们的模型能有多成功。依我之见,我们这么做的最终目标是为玩家的下一步决策提供最佳实时建议。如此一来,玩家就能从根据比赛数据算出的几条最佳决策(根据获胜情况排序)中做出选择。可以在多个游戏中跟踪该玩家的选择,以进一步了解和理解该玩家的偏好。这也意味着,我们不仅可以追踪决策的结果,还能预测该玩家的意图(例如,该玩家试图拆塔结果却被杀了),甚至还能为更高级的分析提供信息。
当然,这样的想法可能造成团队成员意见不符,也可能让游戏变得没那么令人兴奋。但我认为这样的想法可能对低水平或者常规水平的玩家有益,因为这种水平的游戏玩家难以清楚的沟通游戏决策。这也可能帮助识别「毒瘤」玩家,因为团队指望通过投票系统来统一意见,然后就能看出「毒瘤」玩家是不是一直不遵循团队计划,忽略队友。
实时游戏环境中的模型推荐投票系统示例
125 浏览 5 回答
344 浏览 5 回答
289 浏览 3 回答
174 浏览 5 回答
168 浏览 4 回答
212 浏览 4 回答
322 浏览 9 回答
189 浏览 5 回答
197 浏览 10 回答
95 浏览 3 回答
173 浏览 2 回答
356 浏览 4 回答
303 浏览 2 回答
345 浏览 6 回答
359 浏览 6 回答