FIC-Excel 篇三:Excel"宗师"技巧: 高效"爬虫", Excel也能做到!

2018-08-10 14:02:30 164点赞 1579收藏 78评论

炎炎夏日,突然灵机一动,我们是否可以使用excel获得上海历史若干年的天气数据呢? 想好了就动,先查查互联网吧! (注:今天的文章步骤和截图相对较多)

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

突然找到这么一家网站,看上去是包含我们想要的数据的

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

数据包含历史每一天的最高温,最低温,天气,风向和风力

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

观察URL构成 shanghaitianqi

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

如果选择了2017年1月的天气查询数据,URL就会变成这样子

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

那么可以简单推断,历史数据的获得可以通过以下通项:

Https://15tianqi.cn/[YEAR]shanghai[MONTH]yuetianqi/

接下来让我们开始“爬虫”吧!


步骤1,让我们打开一个Excel,并且选择从网络获取数据

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

这里在高级选项中把我们的URL中可变的部分(以后要作为参数)分割出来

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

点击链接来获得数据

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

步骤2,选择table 0 并且点击编辑来编辑数据

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

可以看到数据包含一些说明行和分表的字段名。

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

步骤3, 让我们做一些过滤,这里主要为了删除多余的行数

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

步骤4, 用第一行作为表头,这样我们的数据表就有正确的表头了

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

再过滤掉其他重复的信息,因为日期已经作为表头了,那么其它行中的带有字符“日期”的行数就可以删除了!

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

阶段性成果好啦,看到我们已经获得了一个月(如最开始输入的 2017年1月)的数据

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

步骤5, 我们根据气温的数据来制作两个新的字段,数据类型,方便以后运算

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

修改为数值型

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

最高温和最低温都修改出来 (这里PowerQuery会自动提取数值,很方便!!)

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

并且所有的调整步骤都会被记录下来(这也是为什么上篇文章说有了PowerQuery,可以告别VBA了)

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

步骤6, 下来让我们来制作两个参数

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

分别命名为【年】和【月】,注意 !!类型 需要是【文本型】,因为要拼接URL用!!!

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

步骤7, 双击查询的源(Source),来做修改

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

把刚才我们填写 2017 和 1 的地方分别修改成我们建立的参数【年】和【月】

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

步骤8, 鼠标右键Table 这个查询,并创建函数

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

命名函数为 HDTQ (这里随意,我是取了【获得天气】的首字母)

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

创建完成可以看到多了一个函数列在查询侧边栏里面,并且有两个可以输入参数值的位置

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

步骤9, 让我们用新的值, 2016年1月来测试以下有没有数据返回

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

可以看到数据正常获取到了

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

第二个阶段性成果好啦! 接下来我们要一次性获取更多月份数据了!

步骤10, 我们关闭Power Query 并返回到工作簿中-去创建我们需要使用的参数值列表!!

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

步骤11, 创建两个表,包含你要获得的数据的年份和月份并且导入到Power Query中

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

导入以后的样子,会多两个表

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

步骤12,我们需要把Year这张表和Month这张表强行并在一起

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

步骤13,展开MONTH可以获得所有的列联结果

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

相当于Cross Join 的结果集

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

步骤14,移除空值等不相干数据

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

步骤15,对新生成的表中的数据使用我们之前创建好的函数HDTQ

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

按顺序选择好对应的字段名称来作为参数

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

有时候我们会遇到一些警告,可能是一些安全设置导致的

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

勾选忽略Privacy Level

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

这个时候我们就可以看到对应到每个月的数据表都顺利获得了

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

步骤16,展开数据表我们就可以看到数据了

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

步骤17, 把数据导入到工作簿中,我们选择一个新的工作页

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

大功告成!! 可以看到我们想要的天气数据都顺利输出到Excel 工作簿中了

Excel\"宗师\"技巧: 高效\"爬虫\", Excel也能做到!

下来,你就可以利用这些数据来研究研究上海的历史天气,气温了。


在任何步骤遇到问题都可以留言,我们会尽力回复的!


展开 收起

JINGDONG 京东 健康甄选 超声波洁牙套餐 单人洁牙+抛光

JINGDONG 京东 健康甄选 超声波洁牙套餐 单人洁牙+抛光

89元起

宝满 WPS2019视频教程 表格文字演示word/excel/ppt办公office在线课程

宝满 WPS2019视频教程 表格文字演示word/excel/ppt办公office在线课程

暂无报价

苏曼网校 Word2016 从入门到精通 视频教程

苏曼网校 Word2016 从入门到精通 视频教程

暂无报价

Photoshop cc2018 全套速成 入门视频课程

Photoshop cc2018 全套速成 入门视频课程

暂无报价

Photoshop CC 全套入门 自学视频课程

Photoshop CC 全套入门 自学视频课程

暂无报价

CAD2019 零基础入门到精通 全套视频课程

CAD2019 零基础入门到精通 全套视频课程

暂无报价

沪江网校 微软MOS认证专业级Word+Excel+PPT(13版)【11.11专享学霸班】

沪江网校 微软MOS认证专业级Word+Excel+PPT(13版)【11.11专享学霸班】

暂无报价

PPT office2016 全套 视频课程

PPT office2016 全套 视频课程

暂无报价

沪江网校 微软MOS认证专业级Word+Excel+PPT(13版)【全额奖学金班】

沪江网校 微软MOS认证专业级Word+Excel+PPT(13版)【全额奖学金班】

暂无报价

沪江网校 微软MOS认证专业级Word+Excel+PPT(13版)【特惠班】

沪江网校 微软MOS认证专业级Word+Excel+PPT(13版)【特惠班】

暂无报价

photoshop cc 广告平面设计在线课程

photoshop cc 广告平面设计在线课程

暂无报价

AutoCAD 室内设计 全套基础基础入门 视频课程

AutoCAD 室内设计 全套基础基础入门 视频课程

暂无报价

PS零基础 全套案例 视频课程

PS零基础 全套案例 视频课程

暂无报价

圈外同学 IDP职业发展规划课

圈外同学 IDP职业发展规划课

暂无报价

CAD2019 机械制图 机械设计制图

CAD2019 机械制图 机械设计制图

暂无报价

Photoshop cs6 平面设计零基础入门 自学基础班 视频课程

Photoshop cs6 平面设计零基础入门 自学基础班 视频课程

暂无报价
78评论

  • 精彩
  • 最新
提示信息

取消
确认
评论举报

相关好价推荐
查看更多好价

相关文章推荐

更多精彩文章
更多精彩文章
最新文章 热门文章
1.5K
扫一下,分享更方便,购买更轻松