自昨天(24 年 2025 月 XNUMX 日)起,最重要的网上书店禁止我们将书籍下载到计算机上,然后将其传输到另一台设备。 在这篇文章中,我们将了解如何继续从亚马逊下载书籍。我澄清说,我们会作弊。它并不是书籍本身的下载,而是一个截屏脚本和识别文本的程序。
很明显,我们不鼓励读者违反条款和条件或知识产权法。但在某些情况下,比如我患有视力障碍,亚马逊阅读器的配置选项不够用,我们需要进行修改。
“为什么不能在电脑里下载更多的书籍?
你必须明白的是,通过亚马逊这样的服务,我们购买的并不是书本身,而是阅读的权利。。本公司保留删除或修改内容的权利。 2009 年, 1984 y 农场叛军 由于出版商没有发布权,因此无法从数千台设备中下载。去年,出版过多本罗尔德·达尔作品的英语出版商 Puffin Books 修订了以下经典作品: 明德 y 查理和巧克力工厂并通过从买家的设备中无缝删除“胖”和“丑”等字眼,使它们更加政治正确。
如果亚马逊继续允许下载到电脑,用户可以完美地恢复原始。现在,如果贝索斯决定通过将你购买的 Atlas 中的墨西哥湾名称改为美国湾来赢得特朗普的支持,那么我们就必须忍受它。
此步骤仅指将书籍下载到您的计算机以便传输到另一台设备;您可以继续从电脑上的 Kindle 阅读器下载书籍以供使用。
如何继续从亚马逊下载书籍
我们要做的是使用 云电子书阅读器 来自亚马逊,以及一个可以截取屏幕截图、自动翻页并重复该过程的脚本。 我们将安装两个程序。 Xdotools 和 Scrot
sudo apt install xdotool scrotA
Xdotoll 模拟鼠标行为,Scrot 负责屏幕截图。
现在我们需要做以下事情:
- 我们开 云端读者。
- 我们选择想要下载的书并打开它。
- 点击左上角的字母并选择 1 列布局。这使得后续的文本识别变得更加容易。
- 不关闭浏览器,我们打开终端,缩小其尺寸并将其放在屏幕左侧。
- 我们写
xdotool getmouselocation
无需按回车键,我们将指针移至 Kindle 阅读器上的翻页按钮 - 我们按下 Enter 键。
- 我们记下终端显示的X和Y值。
接下来我们将创建截屏的脚本。我们将它粘贴到文本编辑器中。
#!/bin/bash
while [ 1 ]; do
xdotool mousemove XXXX YYY click 1 &
scrot -q 100 '%Y-%m-%d-%H:%M:%S.png' -e 'mv $f ~/libro/'
sleep 20
done
该脚本将鼠标指针放在更改按钮的位置(您必须用我们记下的值替换 X 和 Y,更改页面,进行捕获并等待 20 秒重复该过程。
我们用名称保存它 脚本文件
我们使用以下命令创建书籍文件夹:
mkdir libro
我们在浏览器中打开这本书,然后在最小化的终端中写入
./script.sh
我们将浏览器置于全屏并等待它完成捕获最后一页。完成后我们必须关闭终端。
现在我们安装将图片合并成pdf所需的程序
sudo apt install img2pdf
为了进行转换,我们使用以下命令:
find . -name "*.png" -print0 | sort -z | xargs -0 img2pdf -o libro.pdf
在您关闭上一个脚本的时间内可能会有重复的捕获,因此建议在执行命令之前确认一下。
要将 pdf 转换为文本,最好的方法是使用 Google 文档。我们上传文件,点击虚线打开文件菜单,在 使用 Google Docs 打开。 这将自动执行字符识别,您可以将其保存为 odt 或 pdf 格式。
也可以通过命令行完成 但它不适用于复杂的设计。
我们安装程序
sudo apt install ocrmypdf tesseract-ocr tesseract-ocr-spa
我们使用以下命令将 PDF 转换为文本:
ocrmypdf -l spa libro.pdf libro_ocr.pdf