FIC-Excel 篇三:Excel"宗师"技巧: 高效"爬虫", Excel也能做到!

小编注:此篇文章来自#原创新人#活动,成功参与活动将获得额外100金币奖励。详细活动规则,请猛戳此链接

炎炎夏日,突然灵机一动,我们是否可以使用excel获得上海历史若干年的天气数据呢? 想好了就动,先查查互联网吧! (注:今天的文章步骤和截图相对较多)

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

突然找到这么一家网站,看上去是包含我们想要的数据的

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

数据包含历史每一天的最高温,最低温,天气,风向和风力

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

观察URL构成 shanghaitianqi

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

如果选择了2017年1月的天气查询数据,URL就会变成这样子

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

那么可以简单推断,历史数据的获得可以通过以下通项:

Https://15tianqi.cn/[YEAR]shanghai[MONTH]yuetianqi/

接下来让我们开始“爬虫”吧!


步骤1,让我们打开一个Excel,并且选择从网络获取数据

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

这里在高级选项中把我们的URL中可变的部分(以后要作为参数)分割出来

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

点击链接来获得数据

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

步骤2,选择table 0 并且点击编辑来编辑数据 

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

可以看到数据包含一些说明行和分表的字段名。

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

步骤3, 让我们做一些过滤,这里主要为了删除多余的行数

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

步骤4, 用第一行作为表头,这样我们的数据表就有正确的表头了

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

再过滤掉其他重复的信息,因为日期已经作为表头了,那么其它行中的带有字符“日期”的行数就可以删除了!

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

阶段性成果好啦,看到我们已经获得了一个月(如最开始输入的 2017年1月)的数据

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

步骤5, 我们根据气温的数据来制作两个新的字段,数据类型,方便以后运算

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

修改为数值型

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

最高温和最低温都修改出来 (这里PowerQuery会自动提取数值,很方便!!)

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

并且所有的调整步骤都会被记录下来(这也是为什么上篇文章说有了PowerQuery,可以告别VBA了)

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

步骤6, 下来让我们来制作两个参数

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

分别命名为【年】和【月】,注意 !!类型 需要是【文本型】,因为要拼接URL用!!!

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

步骤7, 双击查询的源(Source),来做修改

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

把刚才我们填写  2017 和 1 的地方分别修改成我们建立的参数【年】和【月】

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

步骤8, 鼠标右键Table 这个查询,并创建函数

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

命名函数为 HDTQ (这里随意,我是取了【获得天气】的首字母)

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

创建完成可以看到多了一个函数列在查询侧边栏里面,并且有两个可以输入参数值的位置

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

步骤9, 让我们用新的值, 2016年1月来测试以下有没有数据返回

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

可以看到数据正常获取到了

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

第二个阶段性成果好啦! 接下来我们要一次性获取更多月份数据了!

步骤10, 我们关闭Power Query 并返回到工作簿中-去创建我们需要使用的参数值列表!!

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

步骤11, 创建两个表,包含你要获得的数据的年份和月份并且导入到Power Query中

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

导入以后的样子,会多两个表

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

步骤12,我们需要把Year这张表和Month这张表强行并在一起 

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

步骤13,展开MONTH可以获得所有的列联结果

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

相当于Cross Join 的结果集

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

步骤14,移除空值等不相干数据

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

步骤15,对新生成的表中的数据使用我们之前创建好的函数HDTQ

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

按顺序选择好对应的字段名称来作为参数

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

有时候我们会遇到一些警告,可能是一些安全设置导致的

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

勾选忽略Privacy Level

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

这个时候我们就可以看到对应到每个月的数据表都顺利获得了

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

步骤16,展开数据表我们就可以看到数据了

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

步骤17, 把数据导入到工作簿中,我们选择一个新的工作页

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

大功告成!! 可以看到我们想要的天气数据都顺利输出到Excel 工作簿中了

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

下来,你就可以利用这些数据来研究研究上海的历史天气,气温了。


在任何步骤遇到问题都可以留言,我们会尽力回复的!


推荐关注:
经验
话题:经验 +关注
好文臻选
话题:好文臻选 +关注
生活记录
话题:生活记录 +关注
年终报告的必备技巧
话题:年终报告的必备技巧 +关注
原创新人
话题:原创新人 +关注
Excel能有多厉害?
话题:Excel能有多厉害? +关注
软件技能
分类:软件技能 +关注
FIC-Excel
系列:FIC-Excel +关注

提示

鼠标移到标签上方,

尝试关注标签~

评论81

发表评论请 登录
  • 最新
  • 最热
评论举报

请选择举报理由

1541 81

关注数量超出限制,请先删除部分内容再尝试

关注数量超出限制,
请先删除部分内容再尝试

登录
注册
用户名/邮箱
密码
验证码
看不清?点击更换
看不清?点击更换 忘记密码?

已收藏
去我的收藏夹 >

已取消收藏
去我的收藏夹 >

小提示