当前位置:
文章详情

技术宅用 “大数据” 玩转 ebay竞拍 篇二:利用工具进行数据分析

2014-09-01 17:06:42 672点赞 981收藏 157评论

首先,谢谢很多技术宅、色友、码农以及走过路过的剁手党们对《技术宅用 “大数据” 玩转 ebay老镜头竞拍》的关注,已经集了超过200个赞,让小弟感激涕零利用工具进行数据分析 。不少看官都对数据采集和数据分析的方法感兴趣,为了回报广大看官的深情厚爱,技术宅决定挑战一下自己,尝试用最简单的工具,用最朴实的语言,解密EBAY的竞拍数据分析的思路利用工具进行数据分析 。同时附上一个可用的样例以及源码,希望在Ebay上竞拍各类物品的朋友,可以尝试着自己做一些数据分析。

一、杀只鸡需要用牛刀么?——工具的选用

码农和技术大拿们可能会很失望,我这篇文章写的不是什么高大上爬虫、Oracle、Hadoop,那些企业级的工具对于我们一般的个人玩家而言,太遥远了。虽然那些高大上的东西,哥们都玩过,也没有故意贬低那些工具的意思,只是杀鸡无需用牛刀,而且牛刀未必好使。所以,隆重推出这次玩的工具:Excel(这不算作广告吧?盖茨哥要给我稿费哈!)利用工具进行数据分析 原因很简单,Excel几乎每个人的电脑里都有,就算你水果电脑上都能装Excel了,足够的平民化。上一篇经验分享也提到,其实Excel+vba+数据透视图可以做出很多好玩的东西,哥们喜欢玩Excel也是因为随处都能找到开发环境来调试、修改。

二、竞拍的历史数据是怎么收集回来的?——逐步揭开秘密武器

还是举原来那个老镜头竞拍的例子吧,其实其他东东的竞拍数据分析也是类似的,可以举一反三。假设,我想竞拍康蔡(康泰时.蔡司 CONTAX ZEISS)的50mm焦距最大光圈1.4的老镜头,我会希望能收集近期这个镜头的成交数据来做分析。

1、用Ebay的搜索功能,找到历史成交信息

利用工具进行数据分析

用浏览器打开ebay.com,如果你觉得英文难懂,直接用香港的ebay也行,地址ebay.com.hk 。但我这个例子是在ebay.com上完成的,香港ebay的网站结构不太一样,我后面的程序不能直接使用。凑合着先看看英文的吧!登录Ebay后,在搜索框输入关键词:contax zeiss 50 1.4,点击“Search”

利用工具进行数据分析

你可以发现已经搜出一堆的康蔡50/1.4的镜头出来了。但是我们需要的是对历史数据进行分析,而不是现有正在售卖或者竞拍的产品,因此我们需要对搜索结果进行条件设置。

利用工具进行数据分析

在左边导航栏的Format(类型)中选择“Aution”(竞拍),然后在“More Refinements”,点击打开后如上图,在“Show Only”选项卡中,把“Sold Listing”上打个勾。然后点击右下角的“Go”

利用工具进行数据分析

出来的结果,基本上就是我们需要的一个清单了,也就是最近通过“竞拍”方式成交康蔡50/1.4数据。在上图的方框中,我们可以看到这个镜头的描述标题,成交金额(ebay.com已经帮我们折合成人民币了),成交时间。当然,我们还希望知道更多的信息,例如卖家是谁,运费是多少等等。Ebay也提供了一个比较好的功能,可以让我们设置这个清单上的内容。

利用工具进行数据分析

在网页的接近右上角位置,可以找到个性化设置的入口“Customize...”然后进入设置界面。

利用工具进行数据分析

如上图,我们把Shipping cost(运费),Item number(物品编码),Seller information(商家信息)都打上勾,Items pre page(每页显示的物品数量)直接选200。出来的结果,应该是我们预期的样子了吧?

利用工具进行数据分析

2、来吧,数据自动跑到我这里来吧!

到这里,你可能会想到Excel的作用了,你想一个一个去复试粘贴?还是说整个页面拷到Excel里面去?太棒了!你想的跟我一样!既然是网页类型的表格,肯定可以整到Excel里面去。但是炜哥要告诉你的是,你有没有想过,一次性复制容易做,但每隔一段时间都搞一次多累人啊!哥们不会这样害你的!来,打开Excel,跟着哥做一遍,你也许会有意外的收获。利用工具进行数据分析

利用工具进行数据分析

首先,把这个地址复制下来,这就是我们要的数据来源了!

利用工具进行数据分析

打开Excel,选择“数据--来自网站”

利用工具进行数据分析

在弹开的“新建Web查询”界面中,把刚才复制来的地址粘贴上去,然后点击地址栏右侧的“转到”,如果你在下面的界面中,也能看到刚才一样的页面,以及数据项,恭喜你,成功了一半!如果你看到的清单数据项有丢失,例如没有了商家信息,尝试着在这个界面中登录ebay,或者用IE再登录和设置一下ebay的显示选项。确认没问题了,就发出“导入”指令(看右下角)!

利用工具进行数据分析

顺利的话,应该会弹出上面的对话框让你选择导入信息的放置位置,你直接选左上角的单元格($A$1)就行了。然后用你的小指头点一下“确定”

利用工具进行数据分析

Excel的左下角可能会看到“正在运行后台查询”的字样,表示Excel在努力的干活中,它干的就是传说中“爬虫”干的活。它跑到那个地址上去,把东西拉扯下来,放到你的Excel里面。

利用工具进行数据分析

随着屏幕一闪,Excel很高兴地告诉你:“主人,您要的东西,我帮你搬回来了!”确实,这不就是我要的东西么?起码不用自己逐个复制粘贴啊!用“数据导入”的方式,更大的好处是,如果有新的成交数据出来了,您只需要刷新一下这个数据源,新东西就会自动地跑到你的Excel里面来,省得您每隔几天要去复制粘贴一次,极大地提高生产效率啊!利用工具进行数据分析

利用工具进行数据分析

刷新的功能在上面,有空就打开Excel刷一下,新东西自动抱回家,哈哈!利用工具进行数据分析

三、乾坤大挪移,让数据各就各位吧!

虽然,用Excel可以导入网页数据,定时刷新自动采集也让我们小兴奋了一把,但毕竟这对东西没法直接拿来做分析的,还需要把这些东西弄个表格规整地放好。如果这些竞拍数据,能做成下面格式的表格,就好用多了!表格内容包括:竞拍结束时间、物品标题、卖家帐号、卖家信誉、物品编号、成交价格、出价次数、运费成本等。

利用工具进行数据分析

如果要逐个镜头的数据复制粘贴过来,那跟直接在网页上复制粘贴没啥区别了。放心!技术宅绝不会如此坑人的。对于码农而言,只要是有规律的,就有偷懒的办法!于是,哥切换成“码农”模式,码了大概几百行字,实现了信息的自动抽取。也就是从刚才的网页里面搞来的数据,按照规律,自动填到上面设计的那张表格里面去。

利用工具进行数据分析

篇尾会提供这个样本,大家下载回去之后,可以试试。因为这个样本文件时含有这些数据处理代码的Excel文件(叫做启用宏的工作表),因此打开文件的时候,Excel会问你“是否启用宏”,如果你要执行数据抽取的代码,你需要选择启用宏;如果你不放心炜哥写的宏,担心有什么病毒之类的,可以不启用宏,然后打开宏代码让其他码农高手鉴定一下。

好了,执行“自动抽取竞投信息”后,在Excel的“数据提取”工作表中,所有的竞拍数据,都齐刷刷地躺在那里了。这就是“码农,让世界变得更美好”的传说......利用工具进行数据分析

利用工具进行数据分析

btw,“自动抽取竞投信息”,可以做到数据的增量更新。也就是说,你刷新一下数据源,把新的镜头成交数据拉下来后,再执行“自动抽取竞投信息”的指令,它会自动把已经有的信息过滤掉,只把新增加的成交数据抽出来。

四、运筹帷幄之中,决胜千里之外——EBAY竞投数据分析

巧妇难为无米之炊,现在有米下锅,剩下的事,就好做多了!数据分析的维度,跟你的思路相关,这里只是举两个例子,写太多就变成Excel教程了。例如,我想知道这30多笔的交易里面,成交价格的分布情况如何?这可能有助于我决策竞投的策略!

利用工具进行数据分析

如上图,在Excel中,选择“插入--数据透视表”,在弹开的“创建数据透视表”对话框中,直接点“确定”吧。

利用工具进行数据分析

然后分别把“物品编号”拖到“值”的区域,把“成交价格”拖到“行”的区域。左侧就出现了每个成交价格的统计结果。当然,这还不是我们想要的,我们希望看到的是价格区间的统计分析。

利用工具进行数据分析

用鼠标右键去点“创建组”,然后输入“组合条件”,如下图。

利用工具进行数据分析

直接看结果:

利用工具进行数据分析

嘿嘿,终于像是我们要的东西了吧?历史成交价格的区间分析!再搞个图形化展示一下.....

利用工具进行数据分析

点击数据透视表的区域,在“插入”中选择“二维柱形图”

利用工具进行数据分析

搞定!数据统计结果就是这样出来的。难么?其实并没有太高深的东西,无论你是糕帅富还是屌丝宅,只要会用Excel,都能做出一个很好的数据统计结果。当然,下一步就是数据分析了,也就是解读这些数据,这才能真正对你的竞标决策起到价值性的参考。例如1500~2100这个价值区间,应该就是这只镜头的合理价格区间,但为什么有些成交金额会低至1000元以下?为什么有些会高达2400以上?如果你是一个竞投者,你需要更多的东西去支撑你的决策。利用工具进行数据分析

还能做什么?上一篇经验中提及的东西,其实都可以做,关键在于你的想象力而已。但我只能帮到这个份上了!

又到了总结时间:

1、在Ebay竞拍中,如果你对一类商品的历史成交情况有更多的了解,必定会对你在出价时有更多的价值评估参考,这也是写这篇经验分享的初衷。

2、如果只是个人行为玩玩的话,不建议用太专业化或者企业级的软件,这也是我拿Excel给大家做个示范的出发点。我用过一些专业软件来尝试做这些分析工作,收集过EBAY半年内所有二手镜头的拍卖数据,大概有十几万条,可以做更大范围的数据统计分析,例如,看看哪些镜头是热卖的。但无论用小刀,还是大刀,原理上是一样的。

3、摄影是我的业余爱好,所以拍得不专业;同样,写代码也是我的业余爱好而已,所以范例中的Excel VBA代码仅仅是求目的,不求高深算法或者追求效率的东西。在各位专业码农眼中,那几行代码绝对是垃圾代码,没有面向对象,没有用正则表达式.....对于非专业人士而言,请专业码农口下留情,可以小声吐槽,切勿大声声讨。利用工具进行数据分析

4、Excel样本地址如下:点此下载,因为含有宏代码,也请各位专业码农给予鉴定结果,如果代码是无毒无副作用的,请在文章后面留个言,以资鉴定。

5、给出的只是一个思路和方法,衍生出的应用可以更具想象力,无论你是在EBAY上竞拍老镜头?还是竞拍数码产品?甚至是用在其他网站的数据收集和分析上,思路都是类似的。欢迎各位拍砖和分享新的Idea。

6、有看官说,这不符合张大妈剁手基本原则啊!其实,玩老镜头也好,玩竞拍也好,都是会中毒D利用工具进行数据分析 ,后患无穷,剁手效应至少延续一年以上,直到解毒为止......

最后,能坚持看完的,请给自己32个赞,顺便赏咱一个赞哈!利用工具进行数据分析

展开 收起

China Gold 中国黄金 GX4A001 财富金条 2g Au9999

China Gold 中国黄金 GX4A001 财富金条 2g Au9999

837元起

ICBC 工商银行 香格里拉酒店集团系列 信用卡白金卡 ( 银联+万事达)

ICBC 工商银行 香格里拉酒店集团系列 信用卡白金卡 ( 银联+万事达)

暂无报价

ICBC 工商银行 爱车Plus系列 信用卡白金卡

ICBC 工商银行 爱车Plus系列 信用卡白金卡

暂无报价

京东E卡福气卡500面值(实体卡)京东礼品卡/购物卡/提货卡/预付卡 员工福利客户答谢节日礼品团购

京东E卡福气卡500面值(实体卡)京东礼品卡/购物卡/提货卡/预付卡 员工福利客户答谢节日礼品团购

500元起

中国黄金 京东投资金条Au9999 100g

中国黄金 京东投资金条Au9999 100g

55750元起

中国黄金 Au9999黄金薄片财富投资金条10g

中国黄金 Au9999黄金薄片财富投资金条10g

5780元起

领丰金 黄金投资金条 30g SGJTiao

领丰金 黄金投资金条 30g SGJTiao

暂无报价

周大福 金豆子 福字 小福豆黄金投资金(工费0) 约1g IF1689

周大福 金豆子 福字 小福豆黄金投资金(工费0) 约1g IF1689

635元起

CEB 中国光大银行 移动中青旅联名系列 信用卡白金卡 菁英白金版

CEB 中国光大银行 移动中青旅联名系列 信用卡白金卡 菁英白金版

暂无报价

足金小金豆 1g

足金小金豆 1g

563元起

ICBC 工商银行 无界系列 信用卡白金卡

ICBC 工商银行 无界系列 信用卡白金卡

暂无报价

BOC 中国银行 长城系列 信用卡白金卡

BOC 中国银行 长城系列 信用卡白金卡

暂无报价

China Construction Bank 中国建设银行 美国运通百夫长系列 信用卡金卡 瑰me版

China Construction Bank 中国建设银行 美国运通百夫长系列 信用卡金卡 瑰me版

暂无报价

工商银行 Au9999 如意金条 50g

工商银行 Au9999 如意金条 50g

暂无报价

China Gold 中国黄金 GY4A022 鲤跃龙门千足金金条 7g

China Gold 中国黄金 GY4A022 鲤跃龙门千足金金条 7g

2849元起

BOC 中国银行 长城全币种国际芯片系列 信用卡白金卡

BOC 中国银行 长城全币种国际芯片系列 信用卡白金卡

暂无报价
157评论

  • 精彩
  • 最新
  • 领导问,会hadoop吗,我刚说出excel。。。,领导的砖头已经拍下来了

    校验提示文案

    提交
    建议你开个Excel,把领导拍砖的时间,力度,受力位置以及你的主观痛觉程度等等记录下来。被拍一段时间后,统计分析一下时间维度、力度维度、痛觉维度有没有什么规律,并且预测下次拍砖的时间,或许能避过一些脑震荡的机会..... [邪恶]

    校验提示文案

    提交
    超级有趣的理工男,看多了水帖,这个经验必须点赞啊

    校验提示文案

    提交
    收起所有回复
  • ok.下次我写search(注意,没有solr了)+spark(注意,不是mahout)

    校验提示文案

    提交
    期待专业文章,嘿嘿! [赞一个]

    校验提示文案

    提交
    看名词知水准,坐等给力技术分享~

    校验提示文案

    提交
    收起所有回复
  • 楼主,请教,据说9月1号起海关新政,所有摄影器材不管新旧,一律不得申报入关,莫非楼主都要人肉?

    校验提示文案

    提交
    呃……没听说咧!其他值友有听说这个新政么?

    校验提示文案

    提交
    31号出来的,也是才知道

    校验提示文案

    提交
    还有4条回复
    收起所有回复
  • 原来炜哥才是资深剁手党……你左前方的弟兄前来膜拜

    校验提示文案

    提交
    当色魔张大妈发出的密令传到我们手机上的时候,声音同时响起,然后哥们一起低头,准备剁手! [龇牙]

    校验提示文案

    提交
    收起所有回复
  • [冷汗] 每次只更新软件却不看新版本说明,今天才知道原来Excel支持web数据导入的啊,看来我要找最新版office教程详细重新学习下了。不过这个方法只能获取到搜索结果第一页的内容吧,数据量超过200条就要分页了

    校验提示文案

    提交
    要搞人家成千上万的数据,就需要升级武器了,至少要拿VBA用xml对象来写吧,用爬虫当然也可以。

    校验提示文案

    提交
    教程哪里有啊……求分享

    校验提示文案

    提交
    收起所有回复
  • 再次前来支持楼主,Excel是个很强悍的工具,只是很多人认为它简单。见过一个财务高手用Excel做了个交互式的数据门户,钻取什么的都不在话下,但是她不知道BI是什么。

    Excel本身就是个数据库,也可以作为其他数据库的前端,甚至数据挖掘通过算法插件也可以做,几乎无所不能。

    实际上从业者是非常痛恨微软开发出来的Excel和PowerPoint这两大产品的

    校验提示文案

    提交
    谢谢捧场!有些人,以为懂一点Hadoop,玩过一下Spark,还拿Lucene开发过一个小应用,就觉得自己了解大数据了。其实,就像一个手无缚鸡之力的家伙,捡到屠龙刀,及认为自己是盖世武侠了。武器不在于贵贱,而在于能制敌;技术亦是如此!只要能高效解决问题,ROI高,就是好的解决方案。不是在批判大数据那些高大上的平台,只是需要理性选择工具,如此而已。

    校验提示文案

    提交
    兄弟的理解还是比较到位的。数据分析工作,我认为是技术业务三七开的,业务专家是必须的属性,纯技术型的码农是做不来的。你得知道要分析什么,像你文章提到的,我做了历史成交价格的分布分析,我就能判断出未来合理的成交价,得有大量的这种业务知识,才能做出各种假设,才能用数据去验证,最终通过验证的才会形成规则,规则才能为我所用。所有的技术炒作只在于实现第二步,Hadoop的价值只在于分布式处理加速,实际上现在机器强了单机跑模型也不是不行。而关键的处理逻辑,仍是你把要验证的数据规则,丢到决策树、回归这些传统的算法里去,而出来的模型解读和规则应用也完全是业务上的事,因此说白了技术所占的份额极小,懂点技术就说懂大数据分析那纯粹是胡扯,技术能占三成其实我算很给面子了

    校验提示文案

    提交
    还有1条回复
    收起所有回复
  • 一般般,作为一个excel的小菜鸟想说,LZ这些比偶论坛上膜拜的大神们还差很远。

    校验提示文案

    提交
    我这三脚猫功夫,怎敢跟专业论坛的大神比,惭愧惭愧……工具这东西,实用就行,够用就好!呵呵

    校验提示文案

    提交
    收起所有回复
  • 兄弟思路好,我可以去试试自己的东西了, [惊喜]

    校验提示文案

    提交
    试玩之后,晒晒单? [高兴]

    校验提示文案

    提交
    我那倒是很简单,只是需要长期做数据收集以及价格区间分析! [淡定]

    校验提示文案

    提交
    收起所有回复
  • 一运行宏各种报错......好吧 我承认我是这方面的小白....怎么弄啊?

    校验提示文案

    提交
    EXCEL啥版本啊?报啥错?:(

    校验提示文案

    提交
    收起所有回复
  • 这个现在是不是只能用于EBAY。

    校验提示文案

    提交
    是的,这个EXCEL是EBAY的范例,但数据采集的方法是通用的

    校验提示文案

    提交
    收起所有回复
  • 刚开始学Ebay拍卖,看到楼主此帖,惊呼神人,只是在按图索骥过程中发现在excel复制网站后,打开的数据恢复到了“我们把Shipping cost(运费),Item number(物品编码),Seller information(商家信息)都打上勾,Items pre page(每页显示的物品数量)直接选200”之前的页面,尝试了360已经IE浏览器都是如此,求楼主继续授之以渔。

    校验提示文案

    提交
    在IE里面做,必须登录ebay;同样,在Excel的导入页面预览窗口,也要登录一下Ebay。试试?

    校验提示文案

    提交
    收起所有回复
  • 工具使用很方便,谢谢作者阿 [惊喜]

    校验提示文案

    提交
    工具还能用啊?网页一改版估计就不好使了,但原理不变,呵呵

    校验提示文案

    提交
    收起所有回复
  • 虽然是时隔一年多才偶然看到,还是要感激炜哥,太有用了。专门注册了账号来评论,哈哈
    不知道炜哥能否注意到

    校验提示文案

    提交
    [献花] 炜哥给你献花

    校验提示文案

    提交
    收起所有回复
  • 我去,很厉害。不知道MAC版的excel能搞这些事情不

    校验提示文案

    提交
    mac版的Excel被阉割了很大一部分的功能,特别是一些Windows的控件没法用,受限了。

    校验提示文案

    提交
    收起所有回复
  • 看看。。。。学习下

    校验提示文案

    提交
    这么老的贴还翻出来啊 [喜极而泣]

    校验提示文案

    提交
    收起所有回复
  • 炜哥!求指导。你的excel表使用了,但是数据提取没有更新!怎么可以联系上你?

    校验提示文案

    提交
    网站都改版很多回了,那个Excel肯定不能用了。把你的微信号留言给我,我跟你联系

    校验提示文案

    提交
    收起所有回复
  • Dim dRec As New Scripting.Dictionary '用词典的目的是为了快速比对
    这个报错“用户定义类型未定义”,office 2016

    校验提示文案

    提交
    (⊙o⊙)哇,还有人玩这个啊!要在excel里面指定一个类包

    校验提示文案

    提交
    收起所有回复
  • Seller: satus-ibqauqn(348) 100% View seller's store: Camera-Japan
    Item: 273060281386

    这些都抓不到excel里面

    校验提示文案

    提交
    网站改版之后,结构发生变化,程序就不能直接用了

    校验提示文案

    提交
    按理说是excel直接解析网页抓取的内容,怎么会只抓到一部分另些不得呢

    校验提示文案

    提交
    收起所有回复
  • 请问现在还可以用这个表么?

    校验提示文案

    提交
    不行了吧,ebay都改版不知道多少次了 [尴尬]

    校验提示文案

    提交
    哈哈哈好吧呀,谢谢~

    校验提示文案

    提交
    收起所有回复
  • 冒着被口水淹死的风险,第二季在张大妈的地盘发片了。哥知道有辱了“大数据”,“技术”,“宅”和“摄影”,只是自娱自乐而已啦,大家口下留人 [肿包] !暂时不考虑拍第三季了......敬请不要期待。叩谢! [期待]

    校验提示文案

    提交
提示信息

取消
确认
评论举报

相关好价推荐
查看更多好价

相关文章推荐

更多精彩文章
更多精彩文章
最新文章 热门文章
981
扫一下,分享更方便,购买更轻松