Skip to content

Latest commit

 

History

History
22 lines (14 loc) · 525 Bytes

README.md

File metadata and controls

22 lines (14 loc) · 525 Bytes

HtmlToMarkdown

  • Converting HTML(url / .html) to Markdown or Plain Text.
  • 转换HTML(支持url或本地html文件)为Markdown格式 或 Plain Text纯文本。

table2md.py(已废弃)手动实现table转Markdown。

Environment

python 3.6.0

Usage

  1. 安装依赖

     pip install -r requirements.txt
    
  2. 实例化并获取Markdown格式 或 Plain Text纯文本

     source = 'https://www.baidu.com/'
     obj = HtmlToMarkdown(source)
    
     print(obj.markdown())
     print(obj.text())