国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

使用Python將HTML文檔轉(zhuǎn)換為Markdown文檔

syoya / 1253人閱讀

摘要:前言我的個人博客是搭建的,風格我很喜歡,也不打算更換。今天發(fā)現(xiàn)個有趣的庫,可以將轉(zhuǎn)換回試驗了一下效果還不錯。的作用在這里使用號來分割文章的核心內(nèi)容,舍棄博客的和。

前言

我的個人博客是Hexo+Next搭建的,風格我很喜歡,也不打算更換。最近可能電腦不好使了,兩次重裝系統(tǒng),每次都要重新搭建博客,搭建速度也很快,但是依然有個困擾我的問題,那就是電腦卡死的時候有些博客沒有備份,只有上傳到Github生成的html文檔。今天發(fā)現(xiàn)個有趣的python庫,可以將html轉(zhuǎn)換回markdown,試驗了一下效果還不錯。

代碼

下面先上代碼:

#Author:Sun Yan
#Function: convert html to md

import html2text as ht  # pip install html2text
import os 
text_maker = ht.HTML2Text()
#text_maker.ignore_links = True
text_maker.bypass_tables = False
path ="C:Users14050Desktopcode1.html"
htmlfile = open(path,"r",encoding="UTF-8")
htmlpage = htmlfile.read()
text = text_maker.handle(htmlpage)
md = text.split("#")  # split post content
open("1.md","w").write(md[1])  # write file as a md file
說明 安裝庫

在我的電腦上直接pip安裝沒有成功,我是在pypi上下載之后安裝的 html2text

使用

使用也比較簡單,注意兩個地方即可:

忽略鏈接和表格

我這里是按照官方文檔中寫的,實際測試鏈接可以不忽略,表格沒有測試。

2.#的作用

在這里使用#號來分割文章的核心內(nèi)容,舍棄博客的header和footer。

文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/41388.html

相關(guān)文章

  • 使用Python Markdown 生成 html

    摘要:越來越喜歡使用編寫文檔,相對更簡單方便,而且可以渲染輸出自己喜歡的樣式。開發(fā)過程中編寫的文檔方便等版本控制工具管理。完整代碼將上的代碼保存為然后執(zhí)行 越來越喜歡使用markdown編寫文檔,相對doc更簡單方便,而且可以渲染輸出自己喜歡的樣式。開發(fā)過程中編寫的文檔markdown方便svn、git等版本控制工具管理。 安裝 Python-Markdown ,做markdown to h...

    levy9527 評論0 收藏0
  • Django 博客開發(fā)教程 9 - 支持 Markdown 語法和代碼高亮

    摘要:注意如果你按照教程中的方法做完后發(fā)現(xiàn)代碼依然沒有高亮,請依次檢查以下步驟確保在渲染文本時添加了拓展,詳情見上文。有些樣式文件可能對代碼高亮沒有作用,首先嘗試用樣式文件做測試。在支持語法和代碼高亮追夢人物的博客的評論區(qū)留言。 為了讓博客文章具有良好的排版,顯示更加豐富的格式,我們使用 Markdown 語法來書寫我們的博文。Markdown 是一種 HTML 文本標記語言,只要遵循它約定...

    zr_hebo 評論0 收藏0
  • Python-Django

    摘要:使用的形式捕獲值給中得參數(shù),比如,當訪問時,將會將捕獲給這個值會傳到。表示刪除某個分類后該分類下所有的的外鍵設(shè)為空,所以我們同時設(shè)置了。多對多就不同,兩邊都要進行配置。增加基本的用戶認證功能。 準備工作 新建一個Django項目 # 新建一個django項目 $ django-admin startproject mysite # 新建一個app $ django-admin star...

    geekidentity 評論0 收藏0
  • Django搭建個人博客:使用Markdown語法書寫文章

    摘要:重新打開一個命令行窗口,進入虛擬環(huán)境,安裝是一種通用語法高亮顯示器,可以幫助我們自動生成美化代碼塊的樣式文件。 上一章我們實現(xiàn)了文章詳情頁面。為了讓文章正文能夠進行標題、加粗、引用、代碼塊等不同的排版(像在Office中那樣!),我們將使用Markdown語法。 安裝Markdown Markdown是一種輕量級的標記語言,它允許人們使用易讀易寫的純文本格式編寫文檔,然后轉(zhuǎn)換成有效的或...

    沈建明 評論0 收藏0
  • [原]文檔定義應用:數(shù)據(jù)科學的文檔革命

    摘要:對于數(shù)據(jù)科學的研究可以說已經(jīng)是本文我將介紹如何以文檔定義應用的方式成為數(shù)據(jù)科學中的標準交付。參考前文解密的數(shù)據(jù)科學部門如果構(gòu)建知識倉庫,作為一個謝大大的死忠,我很自然選擇了作為我文檔輸出的首選工具。 showImg(https://segmentfault.com/img/remote/1460000006760433?w=423&h=426); 概述 隨著近年來,Rstudio 通過...

    wh469012917 評論0 收藏0

發(fā)表評論

0條評論

syoya

|高級講師

TA的文章

閱讀更多
最新活動
閱讀需要支付1元查看
<