#爱车进化论# 从迪奥斯车主的进化说到数据极客是如何帮人挑车的
我是2003年高考结束以后,在无聊的暑假中,想起了一句历史名言(大误):“这个世界上本没有大神,他们只是把你们撸啊撸的时间用在了苦逼之上!” 奉行这句话,我很淡定的选择了和2个同学一起去学车这种苦逼。从03年拿本,04年初家里买了第一辆车开始,我到现在也是超过10年的“老司机” (不是下爱情动作片那种老司机)。下面我先简单说一下我的汽车进化,再说一下作为“数据极客”的我现在是怎么帮朋友选车的。
说明:本文中会用到的数据是网络公开数据采集分析结果,不在本文提供,如有需要请大家自行搜索。我的笔名已经变更为极客兔子,不再是单反兔。
一、迪奥斯时期
此车型太久远了,所以只能给出菲亚特官网的链接。
在04年那个苦逼的时代,人民好兄弟老三样:桑塔纳、富康、捷达大行其道,而且价格也不便宜呢,有的要十几万呢。作为刚拿到驾照的萌新 ,家里在慎重考虑之后才让我买的车(其实是我作为疯小子自己各种软磨硬泡)。考虑到价格因素、外观因素、**因素(西耶那是菲亚特的,菲亚特这牌子有多牛逼和多囧,请看下文)。当年就算是马自达323也得十几万,而菲亚特西耶那,凭借1.5的小排量,经济实用的四门三厢车,加上比较中性的红色(男女都能开,得照顾老妈),顶配才10万元的较为低廉的价格(同级别来说不错了,起亚的千里马还要10万多点呢),让我对此车比较心动。多轮对比和商谈之后,在某个汽车交易市场里搞定了这辆车。(当时觉得4S店太贵,做保养和修车什么的就到头了,买车就选了个小地方)
这辆车一共开了8年,最后安心换掉了,2012年,它完成了它的历史使命。小车别的都没什么问题,也比较经济省油,不爽的就是菲亚特公司在国内发展不好,把自己牌子搞砸了。后来菲亚特很多年都因为没有和国内车企合资导致也没有国内生产线,一直卖一些进口车,再后来我就没关注这个品牌在国内的发展了。
为什么说菲亚特很牛?因为舒马赫和法拉利都是它家的,舒马赫还给派力奥做过广告(西耶那的两厢版本)。为什么说菲亚特很囧,主要是因为在国内发展不好,近些年来热门车型都和它没关系,基本上在国内属于小众群体了。
二、成长和蜕变的时期
8年时间,一辆车在一个家庭里的生命已经结束,它可能在北京之外的城市还活在另一个家庭之中,也许还没报废。对我来说,8年的时间,我经历了大学-初期工作经验-出国留学读研三个阶段,每个阶段都有痛苦,有欢乐,有犯傻。大学无聊的学习状态,和初恋分手,追女孩被拒,被歪果仁辱骂等等,这些就像调味料,让这8年的时间,不再平淡。而这辆西耶那,也在陪伴我8年之后,完成了它的使命,最终以1万5的价格置换掉了。
为了兼顾家庭使用和我个人喜好,第二辆车我选择了标致508,这辆车性价比适中,后座空间大,较为舒适。外观较为年轻化比起迈腾等车更容易让年轻人接受。
第二辆车,是个人心态的转变和人生转变的阶段性结果。第一辆车是简单实用兼顾家人使用,第二辆车则是追求年轻、时尚、用车为家人服务(给爹妈当司机)、撩妹的的多重作用。此车性价比在同级别来说还是不错的,不到20万的车,不仅配置较好,而且容易加装舒适性配置。但是也有不少烦人的地方,比如车太大了,很容易被蹭,倒车和掉头也是烦死人不偿命,苦逼的油耗(随便就11-12个油每百公里)。但是较为年轻的外观和沉稳的感受,让此车一直陪伴我。这段期间,我回国并在国企工作,每天承受着上下级压力以及领导最喜欢说的一句话:XX啊,这事情不是你该想的…… 也许我太安逸和图稳定了,所以我最后爆发了。
三、跨越自己,突破自己的时期
我作为比较早些年就开始接触计算机的一代人,电脑和互联网的思维深深地植入我的思维。国企的工作让我积累了工作经验,学会了为人处世,领导对我的评价是:能够尊重传统的事物,接受并快速学习新的事物。这些年的感受,就是不要当愤青,不要轻易否定一个人,不要停止思考,不要被贴上不靠谱的标签,精力是有限的但是可以用在自己最可以创造个人价值的事物上。
随着我遇到了心爱的姑娘(现在的媳妇和家里的LD)以后,人生又一次跨入新的时期。在她的支持和家里的包容之下,我打破铁饭碗,冲向了互联网。
老婆自己的车是一辆卡罗拉,非常经济省油的小车。虽然日系车各种被鄙视,不过其实用度和市场保值能力还是很强的。不过我俩结婚以后,决定换一辆属于我俩的车,这辆车是爱的见证,也是拍老婆马屁的见证(单身狗请无视我们的存在)。
最后,我们选择的是去年到货的5门版MINI Cooper,虽然没有3门版经典和好看,但是胜在即保有mini的外观,又胜任家庭使用。小车开起来不仅非常有力气,而且停车、掉头都很方便,让我欲罢不能(和508对比的时候)。从此我的理念和想法也产生了变化,我不再是躲事和图稳定的那个国企职工,我开始追求我自己感兴趣和喜欢的工作、事物、兴趣爱好。
这辆车就像我现在的心情,追求一定得刺激,但是又不想丢失原本的稳重。mini是一辆可动可静的车,值得品味的是其中的各种设计细节以及英伦风的感受。性价比很低,同等价格买SUV神马的都不叫事,这辆车我觉得只属于核心玩家。
现在,当年的傻小子已经不再小子,90后的手下越来越多,也变成“大叔”和“大爷”这个圈子了。从当年的初入互联网圈子,快速成长为运营总监,低调的努力在这个牛人辈出的圈子里,创造自己的人生价值。
如果认同我,欢迎点赞+打赏。如果不认同我,欢迎打赏+吐槽……(大误)
四、“数据极客”如何帮朋友挑车?
在互联网圈子,我做产品,也做运营,这些经验为我做决策提供了很多帮助。现在因为各种吹嘘,地球人都知道有个大数据,懂行一些的人也知道“Hadoop”、“Spark”等技术,Python和数据采集等等。但是什么叫大数据,其实没有很好的定论,大多数公司在这个苦逼的潮流之下,必须这么叫。我虽然不是技术,但是我一直有学习数据分析的技术和实现,而帮别人挑车也是这玩意实现的一种方式。(这里绝对不说大数据,以为数据量太小了……)
首先,思考以下问题:
1,购车人(也就是我朋友)是否真的需要一辆车?(他的上班通勤情况,是否喜欢旅游,是否喜欢飙车等)
2,购车人购车的核心目的是什么?(深度挖掘他内心的渴望,是撩妹?还是刚性通勤需求?还是觉得摇到号了不用是傻子?还是热血飙车硬汉?)
3,购车人对车辆的那些数据更在意?(外观?性能?性价比?售后服务?油耗?等等)
4,购车人车辆使用的可能性?(例如:70%时间个人通勤,20%时间接父母外出等)
5,市面上现售哪些车辆能满足他以上的需求?
我的一个数学饥渴朋友写过关于选车的算法,根据不同的关键词、权重、分数、心理影响系数来测算什么车比较适合。但是我并不是算法级别的人,我还是个“宝宝”啊 。所以换个角度,从我最擅长的舆论数据分析来看看怎么选车。
既然提到了数据分析,数据从哪里来?当然是网络主流汽车网站啦!也许你很迷茫有哪些网站,实际上找到个排行榜就可以了!
网站很贴心的都给你罗列好了排名高的热门网站。
从舆论和口碑的角度来挑选一辆车的意义是什么呢?那就是网上的车评、评测、试驾、视频等等这些,完全是网络各种“公关”的阵地,你很难看到一辆车很实际的情况以及一些该款车主的心声。而舆论是一种很特殊的东西,可以从中挖掘出一些比较细致的车主想法,而这些想法,经过分析以后,就可能会成为比较可观的购车参考,提供购车决策支持。
但是舆论数据分析也有不好决定的东西,首先是总数据量庞大,除非真的写个算法解决,否则只能从有价值的数据中挖掘。不过,大多数购车人看过网上各种“洗脑”公关稿以后,大家都心里有几款车型做参考和备选。如果没有,那就需要先问自己上面那些问题,想出来自己感兴趣的车型。舆论分析真正能解决的就是这些车型是否值得购买,什么车更值得购买。
数据从哪里来呢?以上那些汽车网站里有新闻、有论坛,在评论和回复中,有各种车友的分享。我只要把朋友关注的几款车型的数据爬下来就可以了(网页爬虫技巧请自行百度)。因为通常数据量不会太大,所以用不用数据库技术都不是太大问题,毕竟这个只是帮朋友一个小忙。
梳理一下以上的流程就是:
1,让朋友根据自己的需求,选几款他感兴趣的车;
2,将这几款车在网络上的评价(新闻评论可以无视,论坛主要看主帖,口碑频道可以仔细看,有图片的优先级高)爬下来;
3,对大量数据进行清洗,其中可以用到语义分析中的分词、观点聚类,也可以用到情感分析;
4,对清洗后的数据进行语义分析,其中可以用到语义分析中的词频分析、典型意见等技术。
下面用一款车型进行一下实战:
我们选择一汽丰田的卡罗拉,这款车是日系的,希望大家不要喷,因为这款车属于经济型车,而且性价比不错,网友评论量比较大,适合作为栗子举起来……
首先我们大批量从排名前50的主流汽车行业网站开始采集卡罗拉相关的新闻下方的评论,加上主流汽车论坛关于卡罗拉帖子的主帖内容,加上百度知道相关回答以及评论(其他问答类网站也可以一并搜索,但是这里我先以百度为主),加上知乎上相关问题的回答和评论(知乎13格比较高,所以不能错过)。以上数据量对于一般人来说就很大了,不过对于所谓的大数据来说还是比较小的。考虑到太久远的数据对朋友购车没有帮助,我只抓取3个月以内的数据,数据量瞬间减少,数据清洗也比较容易。
这里我投机取巧,直接使用全网全媒介监测系统(搞舆情的同行秒懂 ),监测时间为2016年4月16日至7月16日,共获得文章333742篇。其中有效评论大约是143.5万个,将其中纯水军的吐槽、广告、无关信息基本清洗掉之后就是这个结果。
大家可能也注意到了,很多网站都有口碑这一项,比如汽车之家口碑、易车网口碑、新浪汽车口碑等等。这些口碑数据也要统统毫不客气的抓取下来,将其中的综合评价作为评论一样的并入评论库进行分析,对分项(比如油耗、外观、性价比等)数据,可以进行单项分析。
估计看到这里,已经没什么人看的下去了,大概都想骂死我了……所以我不再继续阐述数据的处理和分析过程,直接进入结论。
数据分析的目的是搞明白:
卡罗拉这款车是否值得我朋友购买?(前提条件是朋友已经看上卡罗拉,并且确认这车是他的考虑范围之内的重点车辆)
经过对约158.2万条网络网络评论和约7.1万条口碑评价的分析,得出以下结论:
71.12%的网友对卡罗拉的评价是正面的(那些狂喷日系车的我只能去掉,没有价值),此数据对车不对国家……
词频概率来说,大多数人还是说“不错”,这个太敷衍了。仔细来看的话,主要大家感受还是“舒适”和“适中”,可以看出这款车比较“中庸”,兼顾了大多数人的需求。
从核心关键词以及权重分布来看,大家比较重视卡罗拉的舒适程度、性价比、油门反应、新车味道以及整车动力性等等。因为上面也说了,71%的网友给出了正面评价,而以上所说的关键词,便包含在了这71%之中。
如果我们用语义分析系统对以上所有观点做一个摘要(这个摘要会根据不同的关键词和不同的权重进行计算),我们得出来的是这样一段话:(我限制了文字数,否则可能摘要变得很长……很长…… )
总体来说这款车还不错,从外观,空间,内饰,配置,油耗来说,性价比还是很高的。大家主要对这款车的安全性比较满意,车的安全配置做的还不错,驾驶起来很放心。不满意的地方是部分车型没有倒车影像,感觉挺不方便的。较多数人同意一点,这款车自家用足够。 这些车主是在科鲁兹、标志308、雷凌、速腾、朗逸、宝来、英朗、福睿斯等车型与卡罗拉进行对比并挑选出来的。
观点聚类和分析系统因为复杂度很高,而且需要付出不小的费用,在此我就不使用了……
最终考虑到我朋友是个月薪不高,承受力有限,撩妹需求不大,通勤刚性需求较高,对油耗比较在意,希望汽车比较保值可以将来较高价格置换,对汽车动力性要求不高,对汽车外观要求为较为年轻化,对品牌没有明确喜恶程度,对高端配置(比如自动泊车)没有特别需求等各种因素,我认为卡罗拉是一辆适合他的备选车辆,如果没有其他高于此车评价,又或者外观吸引程度超过此车的车辆的话,我认为他可以考虑购买卡罗拉。
如果你能看到这里,我觉得你一定是色魔张大妈的忠实粉丝,否则我这么长篇大论的“文字型”文章应该会让你非常想K我……
请别K我,我的另一篇文章可以帮助你了解如何写原创才能获得大家的认可和金币。可别以为只有晒肉晒大腿才能当什么值得买的人生赢家,数据分析明明白白告诉你:装修、母婴才是硬道理!
以上!祝能看到最后一行的值友身体倍儿棒,吃嘛嘛香,升职加薪、当上总经理、出任CEO、迎娶白富美、走上人生巅峰!
小编注:文章来自#爱车进化论#征稿活动。人生的每个阶段都有关于车的记忆,这些片段串在一起是你的车辆进化史,也是个人家庭的成长史。本期征稿邀请值友们晒晒那些年陪伴你的座驾,叙述与车相关的故事,说说挑选爱车的方法。参与征稿还有机会赢Volvo XC90原厂车模和大额金币奖励哦~
沈少Neo
校验提示文案
阙地及泉
校验提示文案
三个石头
校验提示文案
thelandshark
就这水平也敢自称“极客”,
就这水平也敢给别人推荐车。。。。
校验提示文案
松花江
校验提示文案
MR_赵
校验提示文案
泡泡的泡的泡
校验提示文案
mvpgaoyu
校验提示文案
三个石头
校验提示文案
林克幽幽
校验提示文案
三个石头
校验提示文案
绯村心太
校验提示文案
阙地及泉
校验提示文案
andylo
校验提示文案
荆轲刺秦王毛腿
校验提示文案
HotToys
校验提示文案
半夜思绪丫
校验提示文案
xumeng0336
校验提示文案
隔壁有老王
校验提示文案
mynameis
校验提示文案
深幽蓝
校验提示文案
乐言6679
校验提示文案
受折磨的姜戈
校验提示文案
全金属外壳
校验提示文案
一只飞翔的小猪
校验提示文案
mvpgaoyu
校验提示文案
小书童玖伍贰柒
校验提示文案
没事儿瞎蹦跶
校验提示文案
苏浅雪
校验提示文案
众泰首席CEO
校验提示文案
不安分的人
校验提示文案
Annida
校验提示文案
youngfun1988
校验提示文案
小芝麻的死情人
校验提示文案
罗大师傅
校验提示文案
mynameis
校验提示文案
隔壁有老王
校验提示文案
xumeng0336
校验提示文案
半夜思绪丫
校验提示文案
HotToys
校验提示文案