条新消息条新评论

登录注册

写篇文章

当前位置：

电子书阅读器

文章详情

个人成长秘籍之三，每天用Python强迫自己看两页书

昨天的<文章>中提到最常用的epub电子书其实是个zip压缩文件，而且已经拿到了书名和作者名，那今天我们就直接取出书的内容。

epub文件里除了opf文件存放书的相关信息外，还有一个ncx文件存放了目录结构，它的内容类似这样

<?xml version='1.0' encoding='utf-8'?>
<ncx xmlns="/z3986/2005/ncx/" version="2005-1" xml:lang="zho">
<head>
<meta content="4" name="dtb:depth"/>
</head>
<docTitle>
<text>书名</text>
</docTitle>
<navMap>
<navPoint class="chapter" id="num_1" playOrder="1">
<navLabel>
<text>前言</text>
</navLabel>
<content src="part0001.html"/>
</navPoint>
<navPoint class="chapter" id="num_2" playOrder="2">
<navLabel>
<text>扉页</text>
</navLabel>
<content src="part0002.html"/>
</navPoint>

英文好的同学又能一眼看出它的结构了。其它的我们先不管，navMap就是导航地图的缩写，navPoint就是章节，content的src就是每页的html文件。了解这点就足够，没必要读xml和dtd等这些信息，xpath直接搞定

def extract_outline(self, f):
with self.book.open(f) as ncx:
try:
c = ncx.read().decode('utf-8')
c = c.replace('n', '').encode('utf-8')
self.outline_file = etree.HTML(c)
outlines = self.outline_file.xpath('//navpoint')
for o in outlines:
chapter = o.find('navlabel').find('text').text
if chapter:
self.outline[chapter] = o.find('content').get('src')
except Exception as e:
print(e)

lxml似乎对xml比较挑剔，用xpath拿不到结果。好在它也支持html，用小写的navpoint就可以取到所有的章节了。我们存放在一个dict里就好。下面就是遍历这个dict，在zip里找到对应的文件。但按道理来说，我们应该回到opf文件，找到对应的目录，然后去找。但最近老不出门，小编比较暴躁。反正一本书就是那些页面，我不相信有重复文件，直接遍历下文件列表，只要文件名相同，就肯定是了。

def get_page(self, page_num):
page = list(self.outline.keys())[page_num - 1]
for f in self.book.filelist:
if self.outline[page] == f.filename.split('/')[-1]:
with self.book.open(f) as p:
html = etree.HTML(p.read().decode('utf-8').replace('n', '').encode('utf-8'))
for e in html.xpath('//*'):
if e.text:
print(e.text)

page_num不应该大于目录dict()的大小，找到对应文件后，可以直接返回html，也可以象我一样用lxml转成text

回到主题，如何强迫自己看书呢。象上次我在<这篇文章>里讲的那样，建一个计划任务，每天发送两章到自己的邮箱就好了, 强迫症的你肯定不会允许未读邮件的存在吧。

展开收起

举报

DigiHacker

111111011040494946644

17文章| 15爆料| 9粉丝

关注

0评论

当前文章无评论，是时候发表评论了

提示信息

取消

确认

评论举报

垃圾广告！低俗色情！人身攻击！疑似水军评论！其他有害！

相关文章推荐

海信墨水屏A10官宣：背屏是磁吸可拆卸设计

海信憋了四年，终于把这台"戒网神器"掏出来了。其实海信在前两个月就预告过 A10 墨水屏手... 阅读全文

+1 14 31 39
Kindle“死刑”倒计时！亚马逊官宣2012年前设备2026年彻底断网

手里还留着十几年前买的Kindle？亚马逊刚刚下了“最后通牒”——2026年5月20日起，... 阅读全文

+1 3 23 16
墨水屏 + 磁吸LCD屏，支持5G全网通，海信憋4年整出双面屏手机

时隔四年，海信全新墨水屏旗舰手机海信A10正式官宣曝光，补齐了海信墨水屏手机产品线的更新空... 阅读全文

+1 3 1 3
海鲜市场淘KPW5？这份验机指南让你不翻车

花三四百块买台二手KPW5，靠谱吗？ Kindle Paperwhite 5自2021年发... 阅读全文

+1 1 3 0
从360×360到5寸全功能LCD，这款双屏手机终于实用了

墨水屏手机一直有个痛点：护眼是真的护眼，但想刷个视频、拍个照、甚至回条微信，体验就有点尴尬... 阅读全文

+1 0 0 1
李雪琴同款阅读器，汉王Clear7锦鲤墨水屏迎来新配色，优缺点汇总

对于注重护眼阅读的用户来说，墨水屏阅读器肯定是必备神器。汉王Clear7锦鲤 7英寸电子书... 阅读全文

+1 0 0 0
2026年学习机品牌推荐：五款AI护眼平板如何选择？

如何为孩子挑选一台真正高效、护眼且能长期陪伴的学习机，成为许多家长关注的焦点。市面上品牌众... 阅读全文

+1 0 0 0
大量小米NAS硬盘涌入闲鱼！来自众筹拆机，单机回收价一千块

最近小米NAS热度很高，7月1日开启众筹，7月9日正式发货，第一批用户今天收到货了。之前很... 阅读全文

+1 71 158 200
手把手教你用N1打造全能软路由：百元成本->旗舰级体验

闲着没事干，淘了两台斐讯N1，就那种N年前的淘汰货机顶盒就行，类似的还有X米、X为等。因为... 阅读全文

+1 34 355 31
可拆卸电池iPhone曝光，苹果这次妥协背后藏着什么算盘？

每次苹果"妥协"，小编都觉得事情没那么简单。USB-C接口、开放侧载、可拆卸电池——欧盟三... 阅读全文

+1 58 108 181
小米NAS 硬件拆解，全网第一？硬件值得肯定，软件妥妥一.....

宝子们，小米 NAS 应该都用到了吧？体验如何？最近系统评测大家应该看得很多了，反正就那么... 阅读全文

+1 62 141 142
老旧笔记本别换 AnduinOS碾压Win11，全中文免驱动，老机流畅起飞

相信不少人家中都压着一台吃灰的老旧笔记本、台式机，大多都是用了十年左右的老设备，扔了可惜、... 阅读全文

+1 31 229 21
评论有奖：小十三摔坏“小智姐姐”哭到破防，AI带来的陪伴，到底算不算真的陪伴

前段时间有个视频，看得挺多人心头一酸的。湖南一个6岁的小女孩，网名叫"小十三"，充电的时候... 阅读全文

+1 75 67 85
实战 WorkBuddy+反爬+爬虫固化 Skill，6大能力搞定浏览器自动化

AI Agent 时代，最大的资源是什么？信息，信息，还是信息。别人的 Agent 可以抓... 阅读全文

+1 24 233 8
18元捡漏全新小米英规90W充电器：实测纹波更低，邪修版原厂平替

大家好，我是爱折腾的煮鸡蛋。这篇分享下跟风入手的小米英规90W充电器，我对功率和纹波做了一... 阅读全文

+1 36 125 85
30元入手CR8809路由器——不是WIFI7不好，而是WIFI6更有性价比

最近老家的旧路由器突发故障，网络极不稳定，经常连上一会儿就掉线，使用体验很差。作为数码玩家... 阅读全文

+1 26 152 66
装了小米全屋智能才明白：1500块够用，8000块这样花最值

装修时看到各种全屋智能方案，心痒痒但又怕花冤枉钱——这是很多人面临的真实纠结。小米全屋智能... 阅读全文

+1 17 218 6
有哪些软件堪称神器，却很少有人用

推荐这几个小众但很有用的软件，有些不一定经常用，它们平时在后台沉默得像不存在，但只要遇到那... 阅读全文

+1 26 209 4
大牌NAS跌成“二手价”！最大支持40T硬盘，性价比吊打小米

前阵子，小米NAS正式开卖，但它没单机版本，目前只能在闲鱼买到不带硬盘的拆机版，全新均价飙... 阅读全文

+1 38 122 67
29元，OPPO刚上架的换电池服务，真的太香啦

OPPO开启官方电池安心换服务，该活动将长期开展，这次的活动时间截止到8月31日，有需求的... 阅读全文

+1 23 128 72

更多精彩文章

李雪琴同款阅读器，汉王Clear7锦鲤墨水屏迎来新配色，优缺点汇总

对于注重护眼阅读的用户来说，墨水屏阅读器肯定是必备神器。汉王Clear7锦鲤 7英寸电子书... 阅读全文

+1 0 0 0
墨水屏 + 磁吸LCD屏，支持5G全网通，海信憋4年整出双面屏手机

时隔四年，海信全新墨水屏旗舰手机海信A10正式官宣曝光，补齐了海信墨水屏手机产品线的更新空... 阅读全文

+1 3 1 3
海鲜市场淘KPW5？这份验机指南让你不翻车

花三四百块买台二手KPW5，靠谱吗？ Kindle Paperwhite 5自2021年发... 阅读全文

+1 1 3 0
海信墨水屏A10官宣：背屏是磁吸可拆卸设计

海信憋了四年，终于把这台"戒网神器"掏出来了。其实海信在前两个月就预告过 A10 墨水屏手... 阅读全文

+1 14 31 39
从360×360到5寸全功能LCD，这款双屏手机终于实用了

墨水屏手机一直有个痛点：护眼是真的护眼，但想刷个视频、拍个照、甚至回条微信，体验就有点尴尬... 阅读全文

+1 0 0 1
Kindle“死刑”倒计时！亚马逊官宣2012年前设备2026年彻底断网

手里还留着十几年前买的Kindle？亚马逊刚刚下了“最后通牒”——2026年5月20日起，... 阅读全文

+1 3 23 16
Kindle老用户慌了！亚马逊官宣2026年这些机型集体停服，你的在列吗

用了十几年的Kindle，突然被亚马逊通知"到点了"——2026年5月20日起，2012年... 阅读全文

+1 0 0 0
天玑8300+LCD彩墨屏！护眼党的终极神机终于来了？

喜欢电子阅读的朋友应该对墨水屏设备不陌生吧，接近纸质书的观感、长时间阅读也不累眼。但要是把... 阅读全文

+1 2 6 7
2026学习机怎么选？看完科大讯飞、学而思、松鼠AI横评，答案太现实了

孩子刷题刷了一学期，成绩却原地踏步——这是很多家长的困惑。问题可能不在孩子不用功，而在于练... 阅读全文

+1 0 1 0
Kindle集体"退休"倒计时！你的老设备还能抢救一下吗

用了十几年的Kindle，明明还能正常翻页看书，却被亚马逊一纸公告宣布"断网"——从202... 阅读全文

+1 0 1 1
亚马逊动刀！200万台Kindle被"判死缓"：赶紧做这件事，否则设备变砖

2026年5月20日，亚马逊正式对2012年及更早发布的Kindle设备“动刀”。从这天起... 阅读全文

+1 1 7 0
亚马逊老Kindle2026年停服，误注销会变砖！三招继续读

抽屉里那台 Kindle Paperwhite 一代，屏幕发黄、边框磨损，但翻页流畅、握持... 阅读全文

+1 1 3 2
百元墨水屏卷疯了！但这三个坑买前必看

2026年上半年，千元以内墨水屏阅读器的产品均价较两年前下降约15%，但分辨率从212PP... 阅读全文

+1 0 0 0
会议整理天花板：讯飞Air2如何让我告别加班噩梦

🍀作为一个每周至少开3场会的职场人，我曾被会议记录逼到崩溃。手写跟不上语速，录音事后整理要... 阅读全文

+1 0 0 0
Kindle退出中国后照样传书！三种零成本方法详解，亲测稳定

2024年6月Kindle正式退出中国市场后，设备本身仍可正常使用，但原有的邮件推送、AP... 阅读全文

+1 2 29 1
2026年高性能墨水屏手机来袭，重回双屏方案，护眼阅读神器

捅破天，墨水屏性能天花板来了，一款主打高性能的墨水屏手机蓄势待发。众所周知，墨水屏设备性能... 阅读全文

+1 0 0 0
12GB内存彩墨屏来了！对比掌阅文石后，差距有点大

BIGME大我在2026年6月为其M10彩色墨水屏电纸书新增了12GB RAM+256GB... 阅读全文

+1 0 1 0
打工人护眼神器✨60Hz 墨水屏显示器太香了

懂啊！长期对着电脑屏幕，眼睛真的快扛不住了😭 直到我挖到了DASUNG 大上科技 Pape... 阅读全文

+1 0 0 0
告别眼疲劳👀！60Hz高刷墨水屏，打工人的护眼天花板？

每天对着电脑敲代码、写方案，眼睛干涩得像进了沙子？😭 传统墨水屏虽然护眼，但翻页卡顿、残影... 阅读全文

+1 0 0 0
Kindle Voyage停产多年，为何老用户仍称它“屏幕封神”？

截至2026年6月，亚马逊Kindle Voyage虽已停产多年，但在二手市场及部分用户群... 阅读全文

+1 0 1 1

更多精彩文章

DigiHacker

111111011040494946644

17文章 15爆料 9粉丝

关注打赏

作者其他文章

查看更多

话题文章推荐

相关好价

热门众测

石头P20 Max深度评测：全覆盖、强清洁、全托管、真智能！

石头P20 Max深度评测：全覆盖、强清洁、全托管、真智能！立即申请

人见四月天，赏春正当时！教你10分钟搞定户外简餐，好吃又健康！

人见四月天，赏春正当时！教你10分钟搞定户外简餐，好吃又健康！立即申请

重新定义洁净的超水解：石头Z1 Ultra 分子筛洗烘一体机

重新定义洁净的超水解：石头Z1 Ultra 分子筛洗烘一体机立即申请

更宽、更强、更聪明｜云鲸 JX——3-4k档唯一AI双目+宽幅履带洗地机器人

更宽、更强、更聪明｜云鲸 JX——3-4k档唯一AI双目+宽幅履带洗地机器人立即申请

石头A30 Pro Steam2.0洗地机实测：双效高温洗地，解锁家庭清洁新体验

石头A30 Pro Steam2.0洗地机实测：双效高温洗地，解锁家庭清洁新体验立即申请

瞬时超充，能否实现深层清洁需求？实测科沃斯T90 PRO滚筒洗地机器人

瞬时超充，能否实现深层清洁需求？实测科沃斯T90 PRO滚筒洗地机器人立即申请

最新文章热门文章

查看更多

下一篇：

我的最简Windows软件分享

认证作者

19

扫一下，分享更方便，购买更轻松

已收藏
去我的收藏夹