中国的车联网发展现状及问题分析
车联网发展究竟如何,产业链上的企业是踌躇满志,还是彷徨在路上,甚至是匍匐在现实与理想的边缘?本文从不同角度对车联网的现状做相关的解析,以期能逐一破解车联网发展的怪局,帮助企业理性地进入车联网产业。
严格意义上讲,车联网是指是利用先进的传感技术、网络技术、计算技术及控制等技术,对道路和交通进行全面感知,实现多个系统间大范围、大容量数据的交互,对每一辆汽车进行交通全程控制,对每一条道路进行交通全时空控制,以提供交通效率和交通安全为主的网络与应用。
车联网有三层,第一是感知层,就是RFID等感知系统,这是很多企业正在做的,也是最简单的层面;第二层是互联互通,即车与车、车与路互联互通(注:对于车路互联互通,涉及到智能交通的整个大范畴,本文没有展开来详细分析);第三层是通过云计算等智能计算,调度、管理车辆。
中国车联网的发展离不开整车厂的积极参与及推动,尤其是合资品牌,如Ontar和G-book在国内的大力宣传,培育了国内的用户市场,让消费者知道了什么是Telematics,什么是车联网。国产品牌方面,上汽从最初的积极跟进,之后推出了Inkanet,到后来居上,推出iVoKa。iVoKa也是率先将声控技术引入到车联网的国产服务品牌。整车厂的积极参与,将车联网的概念深入到每一个普通消费者。
车联网的发展,有两个主要市场,一个是商用车市场,另一个是乘用车市场。
商用车市场受政策的影响相对比较大,2010年交通部办公厅发布了《关于加强道路运输车辆动态监管工作的通知》,要求切实加强道路运输车辆动态监管工作,预防和减少道路交通运输事故,自这份通知出台之后,按政策要求,两客一危车辆必须安装相关的车载终端设备,且必须接入到交通部监控平台。
部分省市对货运车辆也做了相关的规定,要求8吨以上的货运车辆必须安装车载终端。因此,商用车市场,政策促进了市场的发展,产品和服务平台都有一定的标准(JT/T794-2011),企业的产品都是根据部标来实现的,最终用户的可选择性不多。
商用车市场,基本上以B2B的模式为主,且以自上而下的项目形式进行市场推广,无论是在收费方面还是在项目推进方面,要容易很多。而乘用车市场则不然,乘用车市场受政策的影响相对小很多,但最终用户的可选择性就非常多。
乘用车市场以B2C为主,对企业的渠道运作能力、市场推广能力、产品研发实力及商业模式等方面要求非常高,乘用车市场发展这几年没有形成一定的用户规模,就有这个原因的存在。
由于商用车市场地域性很强,所以主要市场以后装为主。虽然车厂也推出了相应的品牌,如宇通的安节通,三龙的G-BOS,陕汽重卡的天行健,北汽福田的欧辉,但车厂很难做到这些车联网服务的真正落地。一方面,这些商用车的运营牌照是当地交通部门颁发的,因此,必须接受当地交通部门或安全部门的监管。
另一方面,地方交通部门的监管平台必须接入到交通部平台统一监管。因此,无论车上安装了那个品牌的设备,只要不满足交通部或当地交通部门的要求,车辆就无法接入。除了欧辉还未正式上线之外,其他三个品牌的车联网目前都面临着服务的落地问题,甚至可以说,整车投入使用很长时间,但这些随整车配套的车载终端尚未投入使用。如何加强和传统GPS运营商的合作是整车厂的头等大事。
从目前看,商用车车联网的主要目的一方面是应付交通主管部门的检查,另一方面,用于车辆的安全监控。只是实现车连网,与车联网相差还很远。尤其是对于物流行业而言,只是解决了运输过程的透明化管理,并没有为物流公司或车主带来增值服务。
乘用车市场也分为两大阵营,其一就是以车厂为主导的前装车联网,另外就是以车载终端为主导的后装市场。在后装市场,又延伸出了一个保险车联网市场。
在前装市场,比较有代表性的合资品牌有安吉星、G-book、Carwings及纳智捷。据安吉星官方消息,截至2012年10月,上海安吉星在国内的用户人数已突破50万大关,安吉星已累计为中国车主提供了超过2200万次的导航服务。2200万次,虽然看上去这个数字很多,但仔细计算一下,就发现这个数字并不多,毕竟安吉星进入中国已经3年多了。
自主品牌比较有代表性的有荣威的iVoka,长安的incall,吉利的G-NetLink,一汽的D-Partner。自主品牌车厂基于车联网的平台虽多,但投入商用的车联网系统除了iVoka之外,很多的企业为了宣传需要,只是委托车机厂商搭建了一个DEMO并未真正投入商用。并且基于车联网的车型销售不佳。国内整车厂还属于试水阶段,平台规划尚未确定。
整车厂虽然采取标配捆绑销售的方式迅速积累了一些用户,但由于目前的服务内容及商业模式问题,用户的粘性不高,且续费率非常低,至少目前还看不到明朗的前景,和后装市场类似,车联网无非是给整车的销售增加一个卖点而已。另外,对于合资品牌而言,普遍照搬国外成熟的平台与模式,或留下水土不服的后遗症,毕竟做服务就是做文化,要把服务做好,就得熟悉东方文化。
后装市场经历了2011年的喧嚣之后,经历了一个大起大落的过程,整体归于平静,这也与车机厂商的结构特点有关。车机行业属于高科技制造业,其管理模式及思维方式离不开制造业思维。车联网属于TMT(Technology,Media,Telecom)产业的一个分支,要求企业必须对新技术,新媒体及通信行业有深刻的理解与认识,企业至少需要有互联网基因。而车机厂商目前把制造业的一些成功经验向车联网行业复制,正如有人所说,用富士康的管理经验管理谷歌这样的公司,难免出现一些不适,企业也必须经历这个阵痛期。而现实情况是,车机厂商一旦发现在车联网领域内短期没有效益,必然会考量投资的可行性,不会考虑长线的投资,因此,经历了车联网发展的这四年时间,车机厂商在车联网行业的积极性下降,就有这些原因。
后装市场以往热炒的一键通及实时路况,已经不再是产品的亮点。出现以上变化的主要原因之一是一键通导航的服务粘性不高,而紧急救援业务需要支付给第三方一定的费用,商旅方面需要企业花费大量的时间和经历去整合内容,再加上用户规模有限,也吸引不了携程这样一些传统做商旅企业的关注。另一方面,由于实时路况开通的城市有限,无法大规模商用。进入2012年,保养提醒,远程诊断等与安全车生活有关的内容成为新的选择,值得进步的是车机厂商开始关注产业链,尤其是重视4S店,并开始探讨如何打造车联网的生态系统。
和前装市场相比,后装市场的产品形态可谓是百家争鸣,百花齐放。后装市场的产品有车机自带通讯功能的产品;有以蓝牙为传输介质的产品;有以MirrorLink为技术流的产品;有传统的如GPS车载终端这种黑盒子类型的产品;甚至还有以OBD加手机APP的产品形式。
后装市场,美赛达科技和欧华的车机均自带通讯功能,翼卡车联网的产品传输介质以蓝牙为主,通过蓝牙实现一键通功能。随着技术的不断发展,MirrorLink不断地被车机厂商所接受。目前路畅科技、德赛西威以及科维的烽云令等就是采用MirrorLink技术,可以说MirrorLink是2012年车联网行业的热门关键词之一。
纵观现在的车联网,第一年都是免费,服务内容的单一导致客户对车联网的认可程度不高,因此第二年续费的时候车主根本不买账。由于现阶段车联网的发展尚处于初级阶段,缺乏杀手级的应用,用户对车联网的接受程度较低,服务粘性不高,续费率很低。而车机增加了通讯模块势必增加硬件成本及通讯成本。解决这些问题,不能过度依赖于车机而为车主提供增值服务,车机只是为车主服务的一个载体。理想的方式是,当车主在车上时可以用手机实现联网,既可以降低车机本身的成本和服务成本,又可以实现车联网的一些功能,并能将车主不在线的时间吸引到互联网上来,通过互联网开发出不同的增值服务,将车主吸引过来,在这种情况下MirrorLink就是很好的选择,这种产品也是可以被用户所接受的。因此,MirrorLink技术在车机行业应运而生了。
车联网的核心在于“联”,短期内实现车连网容易,但实现车联网就比较难。由于汽车行业的特殊性,即便通过短距离通信实现车车通信,车路协同,但受政策、标准、产业链利益及车厂的差异化战略等因素,难以形成大规模的用户群体。即便整车厂标配车联网设备、车机厂全部生产车联网设备,每年最多也就是百万级的市场规模,况且车主每天用车的平均时间不超过3个小时,车主也不可能每天都在车上。而手机则不同,手机随身带,一款社交应用,动辄就有上千万的用户规模。MirrorLink的出现,打通了手机和车机的连接通道,可以实现车主与车主之间,车主与非车主之间的相连,有利于形成熟人社会的车联网。
远程诊断成为2012年车联网行业发展的另一个主要关键词,OBD加手机APP的产品形态成为2012年流行的产品形态。苹果在移动互联网领域的迅速发展,带动了整个TMT产业,一些从事移动互联网的企业和手机企业也通过手机APP的方式向车联网行业渗透,而OBD是实现这种渗透的最好载体。2011年6月,元征和中兴联合发布了汽车智能诊断软件和终端,之后,OBD产品在车联网领域开始变得活跃起来。一方面,对于车主而言,车辆的故障诊断、油耗分析、行程分析等功能相对比较实用,也是车联网的主要服务内容。另一方面,随着手机应用的不断发展,基于手机的导航应用已经被大多数年轻用户所接受,手机上有导航,再增加一些与车有关的服务,可以分走一部分传统DVD导航产品的市场。另外,和传统的DVD导航车机相比,此类产品的最大特点是价格便宜、免安装,可以迅速行成用户规模。目前比较有代表性的手机APP诸如多乐车助手、车况检测大师以及车行者。
目前OBD类产品有两大阵营,一大阵营是基于ELM327的蓝牙OBD产品,这类产品的特点是成本低,但做二次开发如里程统计、油耗分析等功能比较麻烦。蓝牙OBD加APP的产品形态更适合于发烧友使用,没有建立相应的生态链,纯属于移动互联网向车联网渗透的另类产品。还有一个主要的问题在于基于ELM327的OBD功耗太大,容易造成馈电。另一大阵营是基于自主方案的OBD产品,这类产品虽然价格相对较高,但可以做一些增值的服务,可扩展性比较强。
后装市场,三大运营商和图商也在积极地布局车联网,如中国移动的位置基地,联通推出的CUTP(ChinaUnicomTelematicsPattern)以及电信的一些车联网项目(如易打车等),但由于体制等原因,电信运营商的车联网之路还不明朗。
图商主要以高德、四维为代表,高德通过布局移动互联网,从而逐步向车联网行业渗透。四维图新则以TSP为目标,推出了趣驾服务品牌。据了解,高德免费导航地图用户数已突破一亿大关,这对于高德向车联网领域的渗透提供了足够的用户基础。另外,由于阿里的入驻,接下来高德势必会将地图变成解决吃住行问题的入口,从手机侧向车联网渗透。
除了以上的一些热门关键词之外,2012年又有一个新现象,就是保险车联网,或者叫保T。近年来,保险行业出现了一个新名词——PAYD,PAYD(Pay-As-You-Drive)是按被保险车辆的行驶里程数进行定价,行驶里程越短车主缴纳保费也越少。作为一种成本节约型、环境友好型的汽车保险创新产品,PAYD在欧美国家日趋流行,不仅受到消费者的青睐,同时还引起环保组织、政府部门的日益关注。
一方面,车险市场竞争日趋激烈,车险费率下行压力加大,为了应对市场竞争,许多保险公司积极创新产品和服务,努力寻求降低风险成本和提高客户忠诚度的有效途径。另一方面,面对全球气候变化的挑战,一些保险公司特别是大型国际保险集团开始采取更加积极主动的应对策略,包括通过提供激励引导客户参与“节能减排”。正是在这样的背景下,PAYD产品应运而生。当然无需车联网也可以获取车辆的行驶里程,也可以实现PAYD,但操作起来比较麻烦,没有车联网这种方式来得直接,通过车联网产品,可以获取车主的驾驶行为,有利于精准的保险定价,同时保险公司也可通过位置服务加快勘察理赔的流程,提高服务质量。另一方面,通过车联网也可以给用户带来一定的价值体验,否则用户不配合。
2011年8月, 北美最大的汽车保险公司StateFarm与车联网服务提供商Hughes结为连理,由此第一个由保险公司主导的车联网商业模式走上了世界舞台。而在中国,已经有一些企业开始进军保险车联网市场,虽然保监会目前还没批准这类保险产品,但保险车联网大势所趋,相信未来保险车联网将活跃于车联网行业。因此,保险车联网这也算是2012年的一个新亮点。
2012年,车联网市场的总体增速比较明显,由于政策的驱动,商用车领域以视频监控,车辆定位为主的车联网产品销量迅速增加。乘用车领域,车厂捆绑式的销售迅速地扩大了用户规模。另一方面作为车机行业的龙头企业,广东好帮手的部分品牌标配蓝牙一键通,迅速地扩大了用户量。美赛达科技通过几年的发展,产品逐步被4S店所接受,通过和广汇集团的合作,在广汇旗下的4S店全面推广,急剧地增加了用户规模。
如果把乘用车车联网的服务内容做一个归纳,那大致分为三大类,分别为安全、便捷及舒适。显然,安全是乘用车车联网最主要的服务内容。对于商用车车联网的服务内容做一个归纳就是解决开源节流及安全问题。从目前服务商提供的内容看,离这个目标还差很远。
以安全为例,汽车的安全措施可以大略地分为主动安全措施(防止事故发生)和被动安全措施(减小事故后果)。无论是主动安全还是被动安全,对于车主而言都非常重要,但国内的车主对被动安全的需求(如软防护的碰撞测试、硬防护的车身结构)要远高于主动安全的需求,并且表现地淋漓尽致。据了解,车主买车时“价格”以16%的比例位居榜首,紧随其后的是安全和质量。主要还是考虑车辆的抗冲击能力,也就是被动安全方面的需求相对要强烈很多,因为这个最能直观体现。
从目前车联网服务提供商所提供的安全方面的内容看,主要还是主动安全措施,也就是防止事故发生。和被动安全有所不同的是,主动安全措施最大的特点就是很难量化。目前车联网所提供的主动安全方面的措施大致有直接和间接两种,直接的有胎压监测、故障预警、碰撞报警、安全气囊弹出报警、紧急救援等,间接的有一键通、声控等措施,当然一键通和声控可以划分到便捷措施更合适。以上这些安全措施,由于很难量化,因此,出现了叫好不叫座的现象,很难让车主对这些项目去买单,这也是客户续费率低的一个主要原因。
涉及到车辆安全,还需要在动力控制、底盘控制及车身等方面做研究,受国内汽车工业水平的影响,后装市场显然在这方面不具备优势,因此,车联网的安全服务内容由整车厂主导比较靠谱。
后装市场应尽可能地提供便捷及舒适方面的应用,这也是沿袭了汽车后市场的特点。汽车后市场本身是汽车产业链的有机组成部分,包括汽车销售领域的金融服务、汽车租赁、保险、广告、装潢、维护、维修与保养以及驾校、停车场、车友俱乐部、救援系统、交通信息服务及二手车等。从后装市场所涉及的领域看,后装市场更应打造熟人社会的车联网,但后装市场在移动互联网方面的反应普遍比较滞后,没有对SNS、社会网络化及熟人社会进行深入地研究,这也是目前行业的主要现状。
通过以上分析,我们不难看出,虽然车联网的用户规模增速明显,但由于商业模式、本地化服务及支付模式等瓶颈的存在,国内车联网目前依然处于初级阶段,尤其是乘用车市场,甚至还在连与联之间徘徊,企业对车联网的认识,处于两个极端,要么过于保守,要么过于激进。对于保守派而言,观望的多,说的多,实际做的少。对于激进派而言,没有深刻理解车联网行业,一旦进入这个行业,总是复制以往的成功经验,一有新的创意,不做调研,大干快上,产品在推广过程一遇到瓶颈,马上开辟新的产品线,因此,出现了太多的产品形态。关于车联网的商业模式,从概念的诞生到现在一直被行业所关注,但没有人能给出一个明确的商业模式,或者很难参考。商业模式需要用户规模,要有用户规模必须要有商业模式,这些问题很纠结。但无论如何,投资车联网不要过于注重短期收益,否则将一无所是。做车联网既拼企业的实力和资源整合能力,也在拼企业的耐力。
“数据 - 数字时代的石油”
“数据是新的石油”
在网络上、媒体上我们经常看到有人这样宣扬。
问题是: 我们能够像提炼石油一样从数据中提炼出价值来吗?
笔者多年从事汽车及出行领域的信息技术(IT)及产品研发,在这里就车联网数据分析的一些实践做个分享,看看能够从这些数据“石油”中提炼点什么,抛砖引玉。
下面的分析是针对单个车辆的车联网数据进行分析,而不是群体车辆的行为分析。
笔者计划从下面几个方面进行探讨(具体的会根据实际情况和各方面的反馈来调整):
- 用户出行行为分析
- 用户驾驶行为分析
- 燃油车车辆动态行为分析
- 电动车电池及充放电行为分析
- 能耗分析
本篇分享一下用户出行行为的分析过程。
先看看车联网数据到底有多大,各家OEM和后装解决方案的数据采集信号、采集频率都不同,也没有行业统一标准。这里举一个例子,让大家粗略感受一下。
- 假设数据采集频率为1 Hz(所有信号每秒采样1次),家用汽车平均每天使用2个小时(燃油车引擎启动就开始采集数据),一年就采集了365 * 2 * 3600 = 2.628 * 106次。
- 如果每次采集的数据量为10 KB,那么,一辆车一年就产生大约26.3 GB 的数据。
- 一年一百万辆装备有车联网的车将会产生26.3 GB * 106= 26.3 PB。(2018年中国有6家OEM年销量过百万)。
- 丰田、大众、雷诺日产2018年全球销量均超过1000万。假设这几家OEM在未来数年内销量均保持这一水平,并且从今年开始实现100%新车车联网,每辆车平均寿命6年,那么6年后这些OEM存量车联网的车就是6000万,每家OEM每年将新增数据:26.3 GB * 60,000,000 = 1578 PB = 1.578 EB/年.
这么大的数据量,采集、传输、存储,如果以现在的技术和市场价格,成本是十分惊人的。所以,笔者大胆猜测,大多数OEM和物流公司在实际运营中都会降低采样频率,或者减少采样信号,或者以事件驱动,而不是以固定频率采样数据,以节省成本,尽管,技术上没有问题。
对上述目标的分析,笔者使用的车联网数据集来自于一辆车联网实验性乘用轿车。数据源本身就是脱敏的,去除了位置信息、用户信息、车辆等静态信息,只有车辆的动态数据。时间跨度为:2017年6月至8月。
采样频率高于1Hz,也就是平均每秒钟采样不止一次。原则上,采样频率越高越好,这样保留了高频信息,可以更加深刻地分析车辆的动态行为。
这几年热得一塌糊涂的无人驾驶,主要传感器的采样频率都不低于10 Hz。为什么采样频率要求这么高呢?比如,在高速公路上以120公里/小时的时速行驶,那么每秒钟行驶的距离是:120000/3600 = 33.3 米/秒。也就是说,在0.1秒的时间里(对应10 Hz),车辆已经行驶了3.33 米,这个距离足以将车辆驶离车道并酿成事故。
有了原始车联网数据(通常以CSV文件格式保存),笔者要对它进行预处理,为后续的数据探索、可视化,以及模型分析准备原料。
笔者使用的工具全程都是 R语言。
如何处理?要不忘初心、牢记使命:本部分数据分析的目的是 – 用户出行行为分析 。
基于该目的,我们所需要的数据项其实很少,只需要下面三项数据就可以了(是不是太简单了点?是的,就是这么简单。就像,都是小麦,光面条就可以做出很多种,更不要说各种面包,还有数不清的 dumpling了):
- 时间戳– 每条记录发生的日期和时间
- 里程表
- 引擎转速– 判断车辆状态
如果有明确的、可靠的信号用于判断车辆状态,那么不建议使用“引擎转速”了。笔者认为这完全取决于实际的数据质量和内容。如果各位大神有更好的解决方案,欢迎分享和交流哦。
把其他的数据项暂时摈弃,只保留这三项,现在可以进行下一步了。
如果上述数据中,不同信号的采集频率不一样,那么,合并(或者叫融合,信号之间的融合)数据是非常重要的一步。合并可以发生在清洗、整理、聚合中间,或之前、之后的某个时间,具体要根据实际数据的情况来决定,很难一概而论。
首先了解选择的数据集的summary信息,可以快速知道哪些字段有数据缺失,有多少缺失。如果有缺失值,需要分析这些数据对我们的分析目的会有什么影响。如果没有什么影响,就删掉它们。
其次,时间戳是以字符串的形式存储的,包括日期和时间,笔者用的数据集精确到毫秒。这样不利于后续的计算和分析。需要把它转化成便于计算和分析的数据。毫秒的精度对我们分析用户出行行为来说没有意义,所以,由时间戳生成年、月、日、时、分、秒,这样,后续可以按照这些时间尺度进行聚合。
最后,按秒对数据进行聚合。选择的数据集高于1Hz的采样频率,但是实际原始数据往往不会100%严格按照相同的采样频率生成数据,有时1秒内有多条记录,有时会有缺失,看起来不是完全连续的。如果是车速等数据,聚合时采用平均值。里程数据是个累计值,所以取每秒内的最后一个数值,为了计算简单,都用平均值也可以,因为1秒内里程数据很难有大的变化。
经过这些步骤后,数据就规整了很多,可以进行下一步了。
将数据分割成一个个单独的驾驶行程,这样可以方便后面的出行行为分析了。
如何判断一个驾驶行程的开始和结束呢?
对于燃油车,一般来说,发动机启动后,才开始采集车联网数据,所以,没有数据就可以假定为车子是熄火的。这里用的数据就是燃油车的数据。
对于纯电动车(BEV),充电的全过程都会采集数据。
对于插电混动(PHEV)车,判断的依据要更加复杂一些,这个问题以后再讨论。
需要注意的是,真实数据通常不可能是理想的,每一步都要仔细检查,如果有疑问,或者不合理,找出那些引起可疑的数据,仔细分析原因,再根据发现的原因进行调整。这是一个不断试验、不断迭代的过程。
完成技术上的分割后,需要合并、过滤,得到相对合理的“有意义的”驾驶行程,在这个示例中,笔者得到了142次驾驶行程。也就是说,从2017年6月至8月的时间里,开了142次车。
处理完这些之后,我们就可以下锅做菜了,看看能不能做出点有意思的东东来吧。
分析的过程通常是由浅入深、由全局到局部。
如果数据足够多,建议先从大的时间尺度开始,比如从年开始,到月、日、小时,再到单个驾驶行程。最后,看看这些驾驶行程之间的关系,行程和各个时间维度之间的关系。一步步深挖。
首先,对整个数据集要有一个总体的认识,这个可以通过统计下面表格中的指标来完成。列出来的指标只是用于示例,具体需要统计哪些值应该根据分析的目的、业务场景、实际的原始数据集等。还是那句话:具体情况,具体分析。
其次,我们看一看该用户每月驾驶(出行)的频次,和旅行的总里程(公里数)。如图1所示,7月份开车的次数和行驶总里程最多,差不多是6月和8月的两倍。
从每月开车的次数来看,7月份开了70次左右,6月份半个月就有接近40次,而8月份仅有34次开车记录。那我们很想知道 8 月份的开车次数为什么减少了那么多呢?
统计一下每天驾驶的次数,如图2所示。结果有些让人意外,6月份从14日至24日(11天),7月份从10至29日(共18天,中间缺了2天),8月份从5至12日,27至31日(总共13天),其他的日期没有车联网数据。接近一半的日期里没有车联网数据。
是什么原因导致的呢?是那些天用户完全没有开车吗?还是由于某种原因,数据没有传输上来呢?
回答这个问题并不难。
我们还是从查看原始数据着手,里程表是不断递增的。比对最后一条记录的里程表和第一条记录的里程表数据得知,两者的差值是5646公里。回想前面表格里统计的“总驾驶里程”为2666公里,这说明在那些缺失数据的日期里,车辆仍然驾驶了接近3000 公里。
这也提醒分析人员,如果再对这批数据按月份进行分析,已经失去了意义。
因为这批原始数据来自于一辆车联网实验性的乘用轿车,我们不能要求太高。但是对我们实践我们的研究方法依然有效。
再前进一步,从日期的角度看看用户驾驶/出行的特征。如图3所示,共统计了三个指标的分布:
1. 左上– 每天驾驶次数的分布,中值是3次,最多有7次。说明该用户开车比较频繁。
2. 右上– 每天行驶距离的分布,中值是63公里左右,最多一天行驶261公里。
3. 左下和右下两张图– 每天驾驶时长的分布,中值在90分钟处,说明该用户每天大约开车一个半小时。用频率图从另一个角度可以看到驾驶时长的分布特征。
在实际工作的时候,分析人员根据实际情况选择该用什么样的图表来更好地展现。
现在分析 单次驾驶的行为特征 。先从最简单的统计特征,单次驾驶距离和驾驶时长,入手。如图4所示,
- 该用户开车的距离多数在10公里以内,或者在30-50公里范围内。
- 每次开车多数分布在5-15分钟内,或者在30-60分钟内。
无论是距离还是时间长度都有两个峰值,是不是有某种背后的原因? 又一次把笔者的胃口吊起来了。
下面我们看一看单次驾驶距离的散点图,如图5所示,每一次驾驶的距离在图中表示为一个小圆点,从6月14日开始的第一次驾驶到8月31日记录的第142次驾驶,总共142个点。
根据前面的距离分布图(图4)得到的启示,我们从下图中可以观察到几个特征:
1. 有一个超过200公里的行程,鹤立鸡群。其余的都没有超过100公里的。
2. 在15公里以下有很多点行驶距离十分接近。
3. 在30-50公里也有很多点的行驶距离十分接近。
我们似乎找到了前述疑问的答案,但是咱们既然是做数据分析,就要显得更加“科学”和“客观”,让数据来说话,而不是凭肉眼观察和猜测,否则,怎么显示出分析师的“逼格”来呢?
如何让数据说话呢? 聚类分析 是个好的工具,尤其是这里只有一个变量,K均值的方法就可以了,简单易行。
一开始,我们并不能确切地知道(假装不知道,这样才能“客观”)该分成几个聚类簇,一个做法是:从K = 1 到n(n 的取值要足够大,以保证最佳簇个数不大于n)都做一次聚类分析,然后比较各个K值下的 Betweens/TSS (簇之间的总平方和 / 总离差平方和),该比值越大,聚类效果越好。一般来说,K值越大,该比值也会越大。极端的情况是,比如,有100个点,分成100个聚类簇,这样当然没有意义。所以这里需要一个主观判断,通常在比值差不多的情况下,应该选择最小的K值作为最佳聚类簇。
在这个例子中,我取n = 10,因为直觉告诉我,最多3或4个聚类簇就够了,在此基础上放宽一到两倍作为n的取值应该足够了。
直觉会告诉我们可能有几个聚类,但是不要完全相信直觉(否则,就不“客观”了),还是应该让数据说话。
这里多啰嗦几句:在做数据分析的时候,直觉很重要,但是笔者建议更多地应该把直觉当成线索、孕育新的想法,就像是侦探破案一样。如果有一些小伙伴一起探索、探讨就更好了,可以时不时地问问:“元芳,你怎么看?”。
好了,把K从1到10循环做聚类分析,将这10个K值对应的Betweens/TSS显示在图上,如图6所示。可以清楚地看到,K = 3 和 K = 4 时,结果非常接近,但是比 K = 2 时显著改善,所以,笔者选定 K = 3 作为最佳聚类簇。
按照K = 3做聚类分析,重新绘制图5:单次驾驶的距离– 散点图,同时用不同的颜色区别聚类簇,如图7所示。
从图中,可以清晰地看出簇1(红色)只有一个点,就是那个单次驾驶距离最大的那个点,超过200公里,再一次鲜艳地鹤立鸡群。
既然簇1(红色)只有一个点,明显是一个特例,就不再深挖了(真相是挖不下去了)。
下面对簇2和簇3分别作进一步的分析。
对簇2(绿色)的驾驶次数,分别按照一天24小时、星期、单次驾驶距离,和单次驾驶时长,作频率分布图,如图8所示。从图中可以观察到下面几个特点:
1. 大部分驾驶行为发生在下午至晚上,以下午3点至5点最多。
2. 周日至周六都有,但是以周二最少。 又是一个线索,不是吗? 值得进一步深挖。限于篇幅,就不再赘述了(累了,歇歇吧)。
3. 驾驶距离大部分不超过10公里。
4. 开车时间大部分不超过20分钟。
好像是一个生活比较有规律的人啊。
同样,对簇3(蓝色)也做同样的分析,如图9所示,仔细观察这些分布图,可以发现下面几个特点:
1. 驾驶的时间十分有规律,大部分发生在早上10 - 11点,和晚上7 - 9点。
2. 周一至周5特别显著,周日完全没有。
3. 驾驶距离大部分出现在30 - 36公里之间。
4. 开车时间大约在30 - 60分钟之间。
从这些特征不难推测,簇3反映的是工作日上下班的驾驶行为。而家里到公司的距离大约30多公里,单程需要开车30分钟至1小时。交通状况还是不错的哦。
平均来看,上班时间大约早上10点,下班时间晚上8点。是不是和某一类熟悉的人群的特征比较吻合啊?有一种似曾相识的感觉。
结合簇2的特征,工作之余,主要在方圆10公里的范围内活动。簇1告诉我们,3个月内仅有一次远门。哈哈,形象更加丰满啦!
一不小心又自嗨了,初当程序员时的毛病,这么多年还是没有完全改掉。别忘了,这3个月里还有一半的日子没有数据呢。
至此,要演示的用户出行行为的分析告一段落了。笔者用到的数据仅有三项:
- 时间戳
- 里程表
- 引擎转速(仅用于推算车辆状态)。
如果辅之以更多的、“相关的”数据字段,我们可以做更加深入的、多个角度的分析。
在这个过程中,如何提出问题、从数据中发现线索、不放弃任何一个疑点,然后像个侦探一样,一步一步地挖掘。坦率地说,这个感觉真的不错。
后续,笔者还会就车联网数据在其他方面的分析,进一步分享,敬请期待!
线性调频扩频技术在车辆远程控制上的应用分析论文
随着汽车保有量的增加、消费者对舒适性的追求,对远距离寻车、车辆信息(包括油量、车辆状况等)及时获取等车辆远距离控制功能提出了新的要求,并逐渐得到了各大车厂的关注。目前工作于315/433 MHz频段的遥控系统,因工作距离短、通信速率低、单向通信等特点,不能满足用户这方而的需求。基于CPS全球定位系统定位、3G通信的Telematics车联网系统,在室内停车场、3G无覆盖的区域也无能为力。
线性调频扩频技术,国内外的研究一直局限在雷达领域,随着美国联邦通信委员会(FCC)制定了民用公共安全、工业、科学与医疗和业余无线电采用扩频通信的标准和规范,目前广泛用于物流管控,工业监测和控制,医疗,安全网络,人员和设备定位,以及汽车自主驾驶的局部定位等领域。
木文提出的车辆远程控制方案,工作于全球适用的2.4 GHz ISM频段(工业、科学和医用频段),通过线性调频扩频技术,有效控制距离超过300 m ,能实现远程遥控、信息交互,结合加速度传感器可以实现包括车辆定位等多种车辆控制功能。
1 CSS线性调频扩频测距技术
采用电磁波测距受环境影响小,能全天候工作,而且电磁波还具有通信功能,使系统设计更简洁。基于CSS技术的测距方法,具有测距精度高、不受多径效应的影响、通信稳定性好、抗干扰能力强等优点。
1.1线性调频信号
Chirp信号是一种扩频信号,在一个信号周期内表现出线性调频的特性,具有很强的自相关性,在求自相关提取信号时具有很好的`抗干扰能力,消除了多径效应的影响。线性调频信号时域图。图1中,横轴是时间,纵轴是频率。接收数据时,利用了脉冲压缩理论,匹配滤波可以在很短的时间内获得很大的能量,接收机通过对能量的捕获能够把数据符号提取出来。线性调频信号经过脉冲压缩之后的窄脉冲信号。
1.2 2次测距法(TWR, Two Way Ranging)
当2个节点的时钟不同步时,运用2次测距法(TWR)能精确地测出两者之间的距离。
2远程控制系统设计
远程控制系统由两部分组成:手持的遥控器和安装在车上的控制器。图4、图5分别是遥控器的系统框图、示意图。遥控器由电源模块、通信模块、显示模块、单片机、按键、加速度计、振动电动机等组成。控制器的系统框图,由电源模块、单片机、通信模块、IO输入输出模块等组成。
采用Nanotron公司的NASTRI作为通信收发芯片[}z,al,工作于2.4 GHz ISM频段,采用CSS扩频技术,具有测距功能,硬件支持频分多址FDMA,带有3个非叠加频率通道和7个叠加通道,支持125 k2M饰S的可配通信速率。
3车辆定位
只要能确定d1,d2,d3,就能根据余弦定理计算出相对角度,从而知道控制器所在车辆相对于遥控器的角度和距离。在B点,遥控器通过测距功能确定车辆的相对距离,但还不能确定车辆的相对方位,因为存在左右对称的2个位置。此时偏离前进方向走动,到C点时,遥控器就能确定车辆方位了。
4车辆远程遥控
本系统支持双向通信,通信速率在125 k2 Mbps可配置,通信距离大于300 m,能实现RISE功能和车辆与遥控器间信息交互功能。在有效通信范围内,系统都能遥控解锁上锁,并能通过设置RISE的有效工作范围,解决因误按动作带来的安全问题。
以遥控解锁为例说明,具体步骤如下。
1)按下遥控器中的Unlock键。
2)遥控器向控制器发出测距请求。
3)控制器收到信息之后,发送测距响应。
4)遥控器将测量得的距离与设定门限(假设:50 m)比较,如果大于50 m,在显示屏上提示遥控超出距离。如果小于等于50 m,遥控器发送解锁命令给控制器。
5)控制器收到解锁信息,验证遥控器的有效性。
6)确认遥控器有效之后,发出解锁命令,并发送解锁结果给遥控器。
7)遥控器收到控制器发送的信息,并在显示屏上提示车辆已解锁。5车辆信息远程交互
本系统的通信距离大于300 m,在有效通信范围内,实现基于无线双向通信的信息交互。如:可以在进入车辆前控制空调,调节车内温度;调节座椅、转向盘等个性化设置;能获得一些车辆的信息,如电池电压、车内外温度等;在车辆有突发情况时,发送信息给遥控器,遥控器通过振动电动机警示。
以获得车辆电池电压信息为例,具体步骤如下。
1)在遥控器中选中车辆信息中的电池电压选项,遥控器向控制器发送获取电池电压请求。 2)控制器收到请求后,验证遥控器的有效性。
3)确认遥控器有效性之后,控制器计算电池的电压,并把结果发送给遥控器。
4)遥控器收到电池电压值后,显示在显示屏上。6车辆远程控制试验文中的系统在试验车上.选择马路边进行了试验验证。选取的测量距离分别是50m, 70m, 100m,150m, 200m, 250m, 300m,在每个点测量20次。
从试验结果可以得出如下结论:距离越远,距离测量精度越低,通信的丢帧率越高。在300 m距离时,测距精度不超过2m;在50 m距离时,不超过1m。能够满足目前功能的需要,通过软件处理能够进一步提高系统的性能。
5结论
本文提出的基于线性调频信号扩频技术的车辆远程控制系统,不仅可以定位车辆,还延长了传统RISE的遥控距离,并可远程获得车辆的实时信息。大大提高了操控的舒适性,是目前Telematics系统的一个很好的补充,对车辆安全控制具有长远的意义。
毕业论文格式
1、论文题目:要求准确、简练、醒目、新颖。
2、目录:目录是论文中主要段落的简表。(短篇论文不必列目录)
3、提要:是文章主要内容的摘录,要求短、精、完整。字数少可几十字,多不超过三百字为宜。
4、关键词或主题词:关键词是从论文的题名、提要和正文中选取出来的,是对表述论文的中心内容有实质意义的词汇。关键词是用作机系统标引论文内容特征的词语,便于信息系统汇集,以供读者检索。每篇论文一般选取3-8个词汇作为关键词,另起一行,排在“提要”的左下方。
主题词是经过规范化的词,在确定主题词时,要对论文进行主题,依照标引和组配规则转换成主题词表中的规范词语。
5、论文正文:
(1)引言:引言又称前言、序言和导言,用在论文的开头。引言一般要概括地写出作者意图,说明选题的目的和意义, 并指出论文写作的范围。引言要短小精悍、紧扣主题。
〈2)论文正文:正文是论文的主体,正文应包括论点、论据、论证过程和结论。主体部分包括以下内容:
a.提出-论点;
b.分析问题-论据和论证;
c.解决问题-论证与步骤;
d.结论。
6、一篇论文的参考文献是将论文在和写作中可参考或引证的主要文献资料,列于论文的末尾。参考文献应另起一页,标注方式按《GB7714-87文后参考文献著录规则》进行。
中文:标题--作者--出版物信息(版地、版者、版期):作者--标题--出版物信息所列参考文献的要求是:
(1)所列参考文献应是正式出版物,以便读者考证。
(2)所列举的参考文献要标明序号、著作或文章的标题、作者、出版物信息。