Jupyter NoteBook
Jupyter是一個開源的交互式計算環境:
特點
- 交互式編程:支持以單元格為單位編寫和運行代碼,用戶可以實時看到代碼的執行結果,便于逐步調試和理解代碼邏輯。
- 多語言支持:不僅支持Python,還能使用R、Julia等多種編程語言,滿足不同用戶的需求。
- 文檔與代碼結合:可以在代碼單元格之間插入Markdown格式的文本單元格,用于記錄代碼的思路、解釋分析結果、撰寫文檔等,將代碼和文檔緊密結合,方便分享和交流。
- 數據可視化方便:能夠輕松地將數據可視化,直接在筆記本中顯示圖表、圖像等可視化結果,有助于數據分析和探索。
- 可擴展性強:有豐富的插件和擴展可供使用,能夠根據用戶的具體需求進行功能擴展和定制。
界面
- 單元格:分為代碼單元格和文本單元格。代碼單元格用于編寫和運行代碼,文本單元格使用Markdown語法編寫文本,可用于記錄說明、解釋代碼等。
- 菜單和工具欄:提供了各種操作選項,如新建、打開、保存文件,運行單元格代碼,中斷或重啟內核等功能。
使用方法
- 創建和打開筆記本:在Jupyter啟動界面中,可以創建新的筆記本,選擇編程語言,也可以打開已有的筆記本文件。
- 編寫和運行代碼:在代碼單元格中輸入代碼后,按下
Shift + Enter
組合鍵或點擊工具欄中的運行按鈕來執行代碼。代碼的輸出結果會顯示在單元格下方。 - 編輯文本單元格:在文本單元格中可以使用Markdown語法進行文本編輯,如設置標題、插入列表、添加鏈接、圖片等。編輯完成后,同樣可以使用
Shift + Enter
組合鍵將其轉換為渲染后的格式。 - 管理內核:可以通過菜單中的選項來中斷、重啟內核,以解決代碼運行中的錯誤或重新初始化環境。
應用場景
- 數據分析與探索:數據分析師可以使用Jupyter進行數據清洗、分析和可視化,快速探索數據的特征和規律。
- 機器學習和深度學習:研究人員和工程師可以在Jupyter中進行模型的開發、訓練和調試,方便地試驗不同的算法和參數。
- 教學與學習:教師可以使用Jupyter編寫教學筆記、布置作業和示例代碼,學生可以通過運行代碼來理解知識點,進行實踐操作。
- 文檔編寫與分享:將代碼和相關的說明文檔整合在一起,形成可分享的文檔,方便與他人交流和協作。
注
Jupyter現在是數據科學、機器學習等領域中不可或缺的工具。筆者也一直使用這個工具。主要的免費在線網站列在下面,筆者自己常用的是天翼云和科賽網的工具站。天池的也很好,但只有三個月的免費時間。
- 百度AI Studio:該平臺自帶numpy、pandas、matplotlib、sklearn、paddlepaddle等常用庫,無需搭建,登陸即可使用,適合進行機器學習、深度學習等相關實驗。
- 阿里天池:它提供了在線的Jupyter環境,具備豐富的數據集和一些機器學習、數據挖掘的相關工具,方便用戶進行數據分析和模型訓練等操作。
- 科賽網(Kesci):就是和鯨社區。該平臺提供2核,8G內存服務器,有在線Jupyter環境,適合進行數據科學相關的學習和實踐,并且有一些競賽和項目可供參與。
- Cube Studio:這是開源的一站式機器學習平臺,支持多租戶、SSO單點登錄,提供在線Jupyter環境,還支持多種機器學習和深度學習框架,以及模型的訓練、管理和推理服務等。
- Python Jupyter VIP:該平臺驗證手機號可免費使用,但會限制每個賬號的CPU、內存和運行Notebook的個數等,適合學習Python語法。
- Google Colab:
- 特點:由Google提供,托管在云端。可通過Google賬戶登錄使用,能輕松進行數據分析、機器學習實驗等編程任務。集成了眾多常用的Python庫,如NumPy、Pandas、Matplotlib等,還提供免費的GPU計算資源,能顯著加速深度學習模型訓練等計算密集型任務,支持版本控制(Git集成)。
- 使用方法:點擊右上角“登錄”按鈕,使用Google賬戶登錄。在其中可方便地創建和編輯Notebook,編寫文本時在新的Markdown單元格中輸入內容,按下“Shift+Enter”鍵可將Markdown內容渲染為HTML格式文本;運行代碼單元格同樣按“Shift+Enter”鍵。
- Jupyter Notebook Online:
- 特點:官方提供的在線服務,可通過GitHub賬號登錄,也支持Google、Facebook、LinkedIn等賬號登錄。登錄后能創建、編輯和運行Jupyter Notebook。
- 使用方法:訪問其網站,通過相應賬號登錄后,按照界面提示進行操作,創建Notebook并編寫代碼等內容,使用“Shift+Enter”鍵運行單元格。
- Microsoft Azure Notebooks:
- 特點:由Microsoft Azure提供,可在線編寫和運行Python代碼,基于云計算技術,方便在不同設備上訪問Notebook,能創建Python、R和F# Notebook,并與GitHub集成。
- 使用方法:訪問相關網站,注冊登錄后,根據指引創建Notebook,選擇對應的編程語言,在單元格中編寫代碼并運行。
- CoCalc:
- 特點:基于云的計算平臺,支持創建和共享Jupyter Notebook,支持多種編程語言和交互式計算。
- 使用方法:訪問其官網,注冊賬號后登錄,創建Notebook文檔,即可開始編寫代碼和進行交互計算。
- Python.jupyter.vip:
- 特點:能免費使用,只要能上網就可登錄,不占用本地電腦資源,但有一定限制,注冊時需驗證手機以獲得賬號和密碼,每個賬號的CPU、內存及運行NoteBook的個數等可能受限,不過用于學習Python語法基本夠用。
- JupyterLite:
- 特點:是精簡版本的JupyterLab,只要有GitHub賬號就可快速配置專屬的Python運行環境。
- 使用方法:登錄個人GitHub賬號,訪問JupyterLite。將該倉庫克隆到個人賬戶下;在個人GitHub界面下點擊設置部分,選擇Pages選項,將默認行為改為Github Actions;選擇Actions菜單,重新初始化運行,運行成功后通過瀏覽器訪問配置好的地址即可使用。