當前位置:
首頁 > 科技 > Jupyter Notebook的三大短板,都被這個新工具補齊了

Jupyter Notebook的三大短板,都被這個新工具補齊了

夏乙 發自 凹非寺

量子位 出品 | 公眾號 QbitAI

在機器學習和數據科學領域,Jupyter已經家喻戶曉。它把筆記、代碼、圖表、注釋融合在一個互動式的筆記本里,還能添加各種擴展功能。可謂機器學習入門進階研究之神器。

可是,神器也有短板

文件是固定的JSON格式,體積還非常大;

要在瀏覽器里編輯文檔好煩,好懷念自己喜歡的編輯器;

版本控制好艱難,想用標準的合併工具來協作,可是人家只支持文本!

最近推出的一個工具,幫Jupyter Notebook把這些短板補齊了。

這個工具叫Jupytext,顧名思義,能夠把Jupyter Notebook的內容轉化成純文本,用你最順手的IDE打開。

於是,編輯協作版本控制等一系列問題,迎刃而解。

Jupytext現在支持的語言還不能覆蓋Jupyter Notebook的全部,但搞定了最流行的幾種。它支持Jupyter Notebook和下面這些格式之間的相互轉換:

Julia腳本(.jl)、Python腳本(.py)、R腳本(.R)、Markdown文件(.md)、R Markdown文件(.Rmd)。

Jupytext作者Marc Wouts在一篇博客里展示了怎樣藉助這個工具在IDE或者編輯器里來編輯Jupyter Notebook、進行版本控制。

上面就是Jupytext使用過程的一個例子:把一個Jupyter Notebook存儲為.ipynb和.py兩種文件格式、用PyCharm打開.py腳本來修改代碼、保存之後刷新瀏覽器,就能在Jupyter Notebook里看到新結果了。

想要在一大堆代碼和筆記里查找內容、編輯、執行cell、debug……用IDE比用Jupyter Notebook要方便得多。

上圖則是對文本執行版本檢查,然後將有意義的差異合併的過程。

看起來不錯,怎麼安裝呢?

這個工具支持pypi.安裝,代碼是這樣的:

在Jupyter Notebook的元數據里輸入jupytext_formats,就能激活筆記本和文本文件的配對,實現在IDE里編輯腳本,Notebook里也跟著更新的效果。

如果想在編輯文本文件的時候還開著Jupyter,可以在一個單元格里運行%autosave 0,關掉Jupyter的自動保存功能。

最後,附上Jupytext的傳送門:

https://github.com/mwouts/jupytext

加入社群

量子位AI社群28群開始招募啦,歡迎對AI感興趣的同學,在量子位公眾號(QbitAI)對話界面回復關鍵字「交流群」,獲取入群方式;

此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。

進專業群請在量子位公眾號(QbitAI)對話界面回復關鍵字「專業群」,獲取入群方式。(專業群審核較嚴,敬請諒解)

誠摯招聘

量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復「招聘」兩個字。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 量子位 的精彩文章:

馬斯克發推:8月特斯拉Autopilot實現完全自動駕駛
AI大牛發起神秘字母接龍,起因竟然是……

TAG:量子位 |