6款Python 特殊文本格式處理庫,必知必會了解一下
二話不說, Python 編寫的用來解析和操作特殊文本格式的庫,了解一下~
1
Tablib
https://www.oschina.net/p/Tablib
Tablib 是一個用來處理與表格格式數據有關的 Python 庫,允許導入、導出、管理表格格式數據,並具備包括切片、動態列、標籤和過濾,以及格式化導入和導出等高級功能。
Tablib 支持導出/導入的格式包括:Excel 、JSON 、YAML 、HTML 、TSV 和 CSV ,暫不支持 XML 。
2
Openpyxl
https://www.oschina.net/p/openpyxl
Openpyxl 是一個用於讀寫 Excel 2010 xlsx / xlsm / xltx / xltm 文件的 Python 庫。
Openpyxl 為 Python 原生讀取/寫入 Office Open XML 格式而生,最初是基於 PHPExcel 而開發。
3
unoconv
https://www.oschina.net/p/unoconv
unoconv,全稱為 Universal Office Converter ,是一個命令行工具,可在 LibreOffice/OpenOffice 支持的任意文件格式之間進行轉換。
unoconv 支持批量轉換文檔,還可以結合 asciidoc和 docbook2odf / xhtml2odt 來創建 PDF 或 Word(.doc) 文件。
4
PyPDF2
https://www.oschina.net/p/pypdf
PyPDF2 是一個純 Python PDF 庫,能夠分割、合併、裁剪和轉換 PDF 文件頁面。它還可以添加自定義數據、查看選項和密碼到 PDF 文件。
PyPDF2 可以從 PDF 中檢索文本和元數據,也可以將整個文件合併在一起。
5
Mistune
Mistune 是一個純 Python 實現的 Markdown 解析器,功能齊全,包括表格、注釋、代碼塊等。
Mistune 據稱是所有純 Python markdown 解析器中速度最快的(基準測試結果)。它在設計時考慮了模塊化,以提供一個清晰易用的可擴展的 API 。
6
csvkit
https://www.oschina.net/p/csvkit
csvkit 號稱是處理 csv 文件的瑞士軍刀,集成了 csvlook , csvcut 和 csvsql 等實用工具,可以以表格形式顯示 CSV 文件,輕鬆選取 CSV 指定列,以及在其上執行 SQL 操作。
csvkit 是一個命令行工具,靈感來自 pdftk 、gdal 和其它類似工具。
文章來源:開源中國
想要用Python做大事,學人工智慧吧
搶座人工智慧+大數據試聽課,快戳我!快戳我!快戳我!火火火


※Python成長日記-初識裝飾器
※day02.Linux、編輯器、伺服器Python教程
TAG:Python |