前不久,JetBrains團隊發布了Datalore,這是一款基于云的web應用程序,用于構建機器學習模型并在Python中創建豐富的可視化。
最新的測試版本旨在簡化構建機器學習模型的流程,并幫助開發人員進行數據分析。由于Datalore的智能編碼輔助功能,豐富的增量計算和內置工具,對于數據科學家而言,處理復雜數據變得比以往任何時候都容易。機器學習是關于Python的,Datalore也不例外。
Datalore
Datalore提供了許多工具,盡可能提高機器學習生產力。易于使用的代碼編輯器具有智能代碼完成,檢查,快速修復和導航功能。它可以檢查程序員的工作,并利用這些自動化流程加速代碼寫入過程。
基本上,一旦程序員點擊了一個特定意圖,Datalore會自動上傳、訓練、測試、分割數據集,進行圖形設計甚至生成新的代碼。
這個新工具還可以讓程序員更輕松地了解機器學習模型如何隨著多次編輯而發生變化。由于其增量式計算,如果將一些變量或參數更改為模型,則可以預測會發生什么。屏幕右側的輸出始終反映最新結果,便于實時檢查。
Datalore配備了幾乎所有的Python機器學習工具,包括numpy,pandas和sklearn內置庫。同時,Datalore還提供了兩個高級內置庫——基于ggplot的R實現:datalore.plot和一個可以交互式將圖片添加到datalore.geo_maps分析中的庫。
開發人員可以根據模型的計算需求選擇實例,實例從中等(4GB RAM)到超大(61 GB RAM)規模不等,如果確實需要增加可用計算能力,JetBrains也提供額外選項。
此外,Datalore還附帶了基本內置數據集和文件管理器。由于自動保存功能,不會丟失任何數據,歷史文件可確保永遠不會丟失重要的工作文件。程序員還可以實時遠程訪問工作簿和代碼編輯器,添加代碼并撰寫評論。
如果有興趣試用Datalore,需要注冊JetBrains帳戶。不過,他們也有面向學生和創業公司的折扣版本以及開源項目許可證。目前,Datalore仍在開發中,因此所有反饋都可以通過Datalore論壇進行。