新聞中心
當我們看到一篇好文章時,難免會有想保存的想法,但是會存在作者刪除了文章或者鏈接丟失的情況。所以今天小編教大家如何在python中把html網(wǎng)頁轉(zhuǎn)換成PDF。

Python里面有個模塊是pdfkit,他可以幫咱們把一個html(也就是一個網(wǎng)頁)變成一個pdf文件。
pdfkit是Python對wkhtmltopdf這個把網(wǎng)頁轉(zhuǎn)成pdf工具的一個封裝,所以咱們必須得先安裝一個wkhtmltopdf,這個工具的下載網(wǎng)站是:https://wkhtmltopdf.org/downloads.html,根據(jù)自己的操作系統(tǒng)下載對應(yīng)的版本即可。
ps:這里要記住安裝目錄啊,下面要用到它,不要忘記它的安裝目錄~
上面說到了pdfkit這個模塊,這個是第三方模塊,需要安裝,使用pip安裝即可。
pip install pdfkit
pdfkit它給咱們提供了很多功能,可以給它一個 url,他會自動獲取 url 里面的內(nèi)容,幫你保存好,也可以給他一個 html 文件,也可以保存,也可以給他一個字符串,也可以保存成 pdf。
下面是代碼:
import pdfkit url='https://www.cnblogs.com/sriba/p/8043294.html'#一篇博客的url confg = pdfkit.configuration(wkhtmltopdf='C:\Python35\wkhtmltopdf.exe') #這里指定一下wkhtmltopdf的路徑,這就是我為啥在前面讓記住這個路徑 pdfkit.from_url(url, 'jmeter_下載文件.pdf',configuration=confg) # from_url這個函數(shù)是從url里面獲取內(nèi)容 # 這有3個參數(shù),第一個是url,第二個是文件名,第三個就是khtmltopdf的路徑 #pdfkit.from_file('my.html', 'jmeter_下載文件2.pdf',configuration=confg) # from_file這個函數(shù)是從文件里面獲取內(nèi)容 # 這有3個參數(shù),第一個是一個html文件,第二個是文生成的pdf的名字,第三個就是khtmltopdf的路徑 html='''title
content
'''#這個html是我從一個頁面上拷下來的一段,也可以 #pdfkit.from_string(html, 'jmeter_下載文件3.pdf',configuration=confg) # from_file這個函數(shù)是從一個字符串里面獲取內(nèi)容 # 這有3個參數(shù),第一個是一個字符串,第二個是文生成的pdf的名字,第三個就是khtmltopdf的路徑
學會了的小伙伴以后再也不怕喜歡的文章被刪除或鏈接丟失啦。更多Python學習推薦:PyThon學習網(wǎng)教學中心。
(推薦操作系統(tǒng):windows7系統(tǒng)、Python 3.9.1,DELL G3電腦。)
網(wǎng)站題目:創(chuàng)新互聯(lián)Python教程:Python中怎樣把html網(wǎng)頁轉(zhuǎn)換成pdf
本文網(wǎng)址:http://m.fisionsoft.com.cn/article/ccishci.html


咨詢
建站咨詢
