140種Python標準庫、第三方庫和外部工具都有了

導讀:Python數據工具箱涵蓋從數據源到數據可視化的完整流程中涉及到的常用庫、函數和外部工具。其中既有Python內置函數和標準庫,又有第三方庫和工具。

這些庫可用于文件讀寫、網絡抓取和解析、數據連接、數清洗轉換、數據計算和統計分析、圖像和視頻處理、音頻處理、數據挖掘/機器學習/深度學習、數據可視化、交互學習和集成開發以及其他Python協同數據工作工具。

?

作者:宋天龍? 來源:大數據(ID:hzdashuju)

?

為了區分不同對象的來源和類型,本文將在描述中通過以下方法進行標識:

?

  • Python內置函數:Python自帶的內置函數。函數無需導入,直接使用。例如要計算-3.2的絕對值,直接使用abs函數,方法是

?

abs(-3.2) 

?

  • Python標準庫:Python自帶的標準庫。Python標準庫無需安裝,只需要先通過import方法導入便可使用其中的方法。例如導入string模塊,然后使用其中的find方法:

import stringstring.find('abcde','b')
  • 第三方庫:Python的第三方庫。這些庫需要先進行安裝(部分可能需要配置)。

?

  • 外部工具:非Python寫成的庫或包,用于Python數據工作的相關工具。

?

推薦度」3星最高,1星最低。

?

?

01 文件讀寫

?

文件的讀寫包括常見的txt、Excel、xml、二進制文件以及其他格式的數據文本,主要用于本地數據的讀寫。

?

?

1. open(name[, mode[, buffering]])

?

  • 類型:Python內置函數

  • 描述:Python默認的文件讀寫方法

  • 推薦度:★★★

?

2. numpy.loadtxt、numpy.load和numpy.fromfile

?

  • 類型:第三方庫

  • 描述:Numpy自帶的讀寫函數,包括loadtxt、load和fromfile,用于文本、二進制文件讀寫

  • 推薦度:★★★

?

3. pandas.read_*

?

  • 類型:第三方庫

  • 描述:Pandas自帶的read文件方法,例如ead_csv、read_fwf、read_table等,用于文本、Excel、二進制文件、HDF5、表格、SAS文件、SQL數據庫、Stata文件等的讀寫

  • 推薦度:★★★

?

4. xlrd

?

  • 類型:第三方庫

  • 描述:用于Excel文件讀取

  • 推薦度:★★

?

5. xlwt

?

  • 類型:第三方庫

  • 描述:用于Excel文件寫入

  • 推薦度:★★

?

6. pyexcel-xl

?

  • 類型:第三方庫

  • 描述:用于Excel文件讀寫

  • 推薦度:★★

?

7. xluntils

?

  • 類型:第三方庫

  • 描述:用于Excel文件讀寫

  • 推薦度:★★

?

8. pyExcelerator

?

  • 類型:第三方庫

  • 描述:用于Excel文件讀寫

  • 推薦度:

?

9. openpyxl

?

  • 類型:第三方庫

  • 描述:用于Excel文件讀寫

  • 推薦度:

?

10. lxml

?

  • 類型:第三方庫

  • 描述:xml和HTML讀取和解析

  • 推薦度:★★★

?

11. xml

?

  • 類型:Python標準庫

  • 描述:xml對象解析和格式化處理

  • 推薦度:★★★

?

12. libxml2

?

  • 類型:第三方庫

  • 描述:xml對象解析和格式化處理

  • 推薦度:

?

13. xpath

?

  • 類型:第三方庫

  • 描述:xml對象解析和格式化處理

  • 推薦度:★★

?

14. win32com

?

  • 類型:第三方庫

  • 描述:有關Windows系統操作、Office(Word、Excel等)文件讀寫等的綜合應用庫

  • 推薦度:

?

?

02 網絡抓取和解析

?

網絡抓取和解析用于從互聯網中抓取信息,并對HTML對象進行處理,有關xml對象的解析和處理的庫在“01 文件讀寫”中找到。

?

?

15. requests

?

  • 類型:第三方庫

  • 描述:網絡請求庫,提供多種網絡請求方法并可定義復雜的發送信息

  • 推薦度:★★★

?

16. urllib

?

  • 類型:Python標準庫

  • 描述:Python自帶的庫,簡單的讀取特定URL并獲得返回的信息

  • 推薦度:★★

?

17. urllib2

?

  • 類型:Python標準庫

  • 描述:Python自帶的庫,讀取特定URL并獲得返回的信息,相對于urllib可處理更多HTTP信息,例如cookie、身份驗證、重定向等

  • 推薦度:★★

?

18. urlparse

?

  • 類型:Python標準庫

  • 描述:Python自帶的URL解析庫,可自動解析URL不同的域、參數、路徑等

  • 推薦度:★★★

?

19. HTMLParser

?

  • 類型:Python標準庫

  • 描述:Python自帶的HTML解析模塊,能夠很容易的實現HTML文件的分析

  • 推薦度:★★★

?

20. Scapy

?

  • 類型:第三方庫

  • 描述:分布式爬蟲框架,可用于模擬用戶發送、偵聽和解析并偽裝網絡報文,常用于大型網絡數據爬取

  • 推薦度:★★★

?

21. Beautiful Soup

?

  • 類型:第三方庫

  • 描述:Beautiful Soup是網頁數據解析和格式化處理工具,通常配合Python的urllib、urllib2等庫一起使用

  • 推薦度:★★★

?

?

03 數據庫連接

?

數據庫連接可用于連接眾多數據庫以及訪問通用數據庫接口,可用于數據庫維護、管理和增、刪、改、查等日常操作。

?

?

22. mysql-connector-python

?

  • 類型:第三方庫

  • 描述:MySQL官方驅動連接程序

  • 推薦度:★★★

?

23. pymysql

?

  • 類型:第三方庫

  • 描述:MySQL連接庫,支持Python3

  • 推薦度:★★★

?

24. MySQL-python

?

  • 類型:第三方庫

  • 描述:MySQL連接庫

  • 推薦度:★★

?

25. cx_Oracle

?

  • 類型:第三方庫

  • 描述:Oracle連接庫

  • 推薦度:★★★

?

26. psycopg2

?

  • 類型:第三方庫

  • 描述:Python編程語言中非常受歡迎的PostgreSQL適配器

  • 推薦度:★★★

?

27. redis

?

  • 類型:Python標準庫

  • 描述:Redis連接庫

  • 推薦度:★★★

?

28. pymongo

?

  • 類型:第三方庫

  • 描述:MongoDB官方驅動連接程序

  • 推薦度:★★★

?

29. HappyBase

?

  • 類型:第三方庫

  • 描述:HBase連接庫

  • 推薦度:★★★

?

30. py2neo

?

  • 類型:第三方庫

  • 描述:Neo4j連接庫

  • 推薦度:★★★

?

31. cassandra-driver

?

  • 類型:第三方庫

  • 描述:Cassandra(1.2+)和DataStax Enterprise(3.1+)連接庫

  • 推薦度:★★★

?

32. sqlite3

?

  • 類型:Python標準庫

  • 描述:Python自帶的模塊,用于操作SQLite數據庫

  • 推薦度:★★★

?

33. pysqlite2

?

  • 類型:第三方庫

  • 描述:SQLite 3.x連接庫

  • 推薦度:★★

?

34. bsddb3

?

  • 類型:第三方庫

  • 描述:Berkeley DB連接庫

?

35. bsddb

?

  • 類型:Python標準庫

  • 描述:Python自帶的模塊,提供了一個到Berkeley DB庫的接口

  • 推薦度:★★

?

36. dbhash

?

  • 類型:Python標準庫

  • 描述:Python自帶的模塊,dbhash模塊提供了使用BSD數據庫庫打開數據庫的功能。該模塊鏡像了提供對DBM樣式數據庫訪問的其他Python數據庫模塊的接口。bsddb模塊需要使用dbhash

  • 推薦度:★★

?

37. adodb

?

  • 類型:第三方庫

  • 描述:ADOdb是一個數據庫抽象庫,支持常見的數據和數據庫接口并可自行進行數據庫擴展,該庫可以對不同數據庫中的語法進行解析和差異化處理,具有很高的通用性

  • 推薦度:★★★

?

38. SQLObject

?

  • 類型:第三方庫

  • 描述:SQLObject是一種流行的對象關系管理器,用于向數據庫提供對象接口,其中表為類、行為實例、列為屬性

  • 推薦度:★★

?

39. SQLAlchemy

?

  • 類型:第三方庫

  • 描述:SQLAlchemy是Python SQL工具包和對象關系映射器,為應用程序開發人員提供了SQL的全部功能和靈活性控制

  • 推薦度:★★

?

40. ctypes

?

  • 類型:第三方庫

  • 描述:ctypes是Python的一個外部庫,提供和C語言兼容的數據類型,可以很方便地調用C DLL中的函數

  • 推薦度:★★★

?

41. pyodbc

?

  • 類型:第三方庫

  • 描述:Python通過ODBC訪問數據庫的接口庫

  • 推薦度:★★★

?

42. Jython

?

  • 類型:第三方庫

  • 描述:Python通過JDBC訪問數據庫的接口庫

  • 推薦度:★★★

?

?

04 數據清洗轉換

?

數據清洗轉換主用于數據正式應用之前的預處理工作。

?

?

43. frozenset([iterable])

?

  • 類型:Python內置函數

  • 描述:返回一個新的frozenset對象,可選擇從iterable取得的元素

  • 推薦度:★★★

?

44. int(x)

?

  • 類型:Python內置函數

  • 描述:返回x的整數部分

  • 推薦度:★★★

?

45. isinstance(object, classinfo)

?

  • 類型:Python內置函數

  • 描述:返回object是否是指定的classinfo實例信息

  • 推薦度:★★★

?

46. len(s)

?

  • 類型:Python內置函數

  • 描述:返回對象的長度或項目數量

  • 推薦度:★★★

?

47. long(x)

?

  • 類型:Python內置函數

  • 描述:返回由字符串或數字x構造的長整型對象

  • 推薦度:★★★

?

48. max(iterable[, key])

?

  • 類型:Python內置函數

  • 描述:返回一個可迭代或最大的兩個或多個參數中的最大項

  • 推薦度:★★★

?

49. min(iterable[, key])

?

  • 類型:Python內置函數

  • 描述:返回一個可迭代或最大的兩個或多個參數中的最小項

  • 推薦度:★★★

?

50. range(start, stop[, step])

?

  • 類型:Python內置函數

  • 描述:用于與for循環一起創建循環列表,通過指定start(開始)、stop(結束)和step(步長)控制迭代次數并獲取循環值

  • 推薦度:★★★

?

51. raw_input(prompt)

?

  • 類型:Python內置函數

  • 描述:捕獲用戶輸入并作為字符串返回(不推薦使用input作為用戶輸入的捕獲函數)

  • 推薦度:★★★

?

52. round(number[, ndigits])

?

  • 類型:Python內置函數

  • 描述:返回number小數點后ndigits位的四舍五入的浮點數

  • 推薦度:★★★

?

53. set([iterable])

?

  • 類型:Python內置函數

  • 描述:返回一個新的集合對象,可選擇從iterable獲取的元素

  • 推薦度:★★★

?

54. slice(start, stop[, step])

?

  • 類型:Python內置函數

  • 描述:返回表示由范圍(start、stop、step)指定的索引集的切片對象

  • 推薦度:★★

?

55. sorted(iterable[, cmp[, key[, reverse]]])

?

  • 類型:Python內置函數

  • 描述:從iterable的項中返回一個新的排序列表

  • 推薦度:★★★

?

56. xrange(start, stop[, step])

?

  • 類型:Python內置函數

  • 描述:此函數與range()非常相似,但返回一個xrange對象而不是列表

  • 推薦度:★★★

?

57. string

?

  • 類型:Python標準庫

  • 描述:字符串處理庫,可實現字符串查找、分割、組合、替換、去重、大小寫轉換及其他格式化處理

  • 推薦度:★★★

?

58. re

?

  • 類型:Python標準庫

  • 描述:正則表達式模塊,在文本和字符串處理中經常使用

  • 推薦度:★★★

?

59. random

?

  • 類型:Python標準庫

  • 描述:該模塊為各種分布實現偽隨機數生成器,支持數據均勻分布、正態(高斯)分布、對數正態分布、負指數分布、伽馬和β分布等

  • 推薦度:★★★

?

60. os

?

  • 類型:Python標準庫

  • 描述:用于新建、刪除、權限修改、切換路徑等目錄操作,以及調用執行系統命令

  • 推薦度:★★★

?

61. os.path

?

  • 類型:Python標準庫

  • 描述:針對目錄的遍歷、組合、分割、判斷等操作,常用于數據文件的判斷、查找、合并

  • 推薦度:★★★

?

62. prettytable

?

  • 類型:Python標準庫

  • 描述:格式化表格輸出模塊

  • 推薦度:★★

?

63. json

?

  • 類型:Python標準庫

  • 描述:Python對象與json對象的轉換

  • 推薦度:★★★

?

64. base64

?

  • 類型:Python標準庫

  • 描述:將任意二進制字符串編碼和解碼為文本字符串的Base16,Base32和Base64

  • 推薦度:★★★

?

?

05 數據計算和統計分析

?

數據計算和統計分析主要用于數據探查、計算和初步數據分析等工作。

?

?

65. numpy

?

  • 類型:第三方庫

  • 描述:NumPy是Python科學計算的基礎工具包,很多Python數據計算工作庫都依賴它

  • 推薦度:★★★

?

66. scipy

?

  • 類型:第三方庫

  • 描述:Scipy是一組專門解決科學和工程計算不同場景的主題工具包

  • 推薦度:★★★

?

67. pandas

?

  • 類型:第三方庫

  • 描述:Pandas是一個用于Python數據分析的庫,它的主要作用是進行數據分析。Pandas提供用于進行結構化數據分析的二維的表格型數據結構DataFrame,類似于R中的數據框,能提供類似于數據庫中的切片、切塊、聚合、選擇子集等精細化操作,為數據分析提供了便捷

  • 推薦度:★★★

?

68. statsmodels

?

  • 類型:第三方庫

  • 描述:Statsmodels是Python的統計建模和計量經濟學工具包,包括一些描述性統計、統計模型估計和統計測試,集成了多種線性回歸模型、廣義線性回歸模型、離散數據分布模型、時間序列分析模型、非參數估計、生存分析、主成分分析、核密度估計以及廣泛的統計測試和繪圖等功能

  • 推薦度:★★★

?

69. abs(x)

?

  • 類型:Python內置函數

  • 描述:返回x的絕對值

  • 推薦度:★★★

?

70. cmp(x, y)

?

  • 類型:Python內置函數

  • 描述:比較兩個對象x和y,并根據結果返回一個整數。如果x <y,則返回值為負數,如果x == y則為零,如果x> y則返回值為正

  • 推薦度:★★

?

71. float(x)

?

  • 類型:Python內置函數

  • 描述:返回從數字或字符串x構造的浮點數

  • 推薦度:★★★

?

72. pow(x, y[, z])

?

  • 類型:Python內置函數

  • 描述:返回x的y次冪。如果z存在,則返回x的y次冪,模z

  • 推薦度:★★★

?

73. sum(iterable[, start])

?

  • 類型:Python內置函數

  • 描述:從左到右依次迭代,返回總和

  • 推薦度:★★★

?

74. math

?

  • 類型:Python標準庫

  • 描述:數學函數庫,包括正弦、余弦、正切、余切、弧度轉換、對數運算、圓周率、絕對值、取整等數學計算方法

  • 推薦度:★★★

?

75. cmath

?

  • 類型:Python標準庫

  • 描述:與math基本一致,區別是cmath運算的是復數

  • 推薦度:★★

?

76. decimal

?

  • 類型:Python標準庫

  • 描述:10進制浮點運算

  • 推薦度:★★

?

77. fractions

?

  • 類型:Python標準庫

  • 描述:分數模塊提供對有理數算術的支持

  • 推薦度:★★

?

?

06 自然語言處理和文本挖掘

?

自然語言處理和文本挖掘庫主要用于以自然語言文本為對象的數據處理和建模。

?

?

78. nltk

?

  • 類型:第三方庫

  • 描述:NLTK是一個Python自然語言處理工具,它用于對自然語言進行分類、解析和語義理解。目前已經有超過50種語料庫和詞匯資源

  • 推薦度:★★★

?

79. pattern

?

  • 類型:第三方庫

  • 描述:Pattern是一個網絡數據挖掘Python工具包,提供了用于網絡挖掘(如網絡服務、網絡爬蟲等)、自然語言處理(如詞性標注、情感分析等)、機器學習(如向量空間模型、分類模型等)、圖形化的網絡分析模型

  • 推薦度:★★★

?

80. gensim

?

  • 類型:第三方庫

  • 描述:Gensim是一個專業的主題模型(發掘文字中隱含主題的一種統計建模方法)Python工具包,用來提供可擴展統計語義、分析純文本語義結構以及檢索語義上相似的文檔

  • 推薦度:★★★

?

81. 結巴分詞

?

  • 類型:第三方庫

  • 描述:結巴分詞是國內流行的Python文本處理工具包,分詞模式分為三種模式:精確模式、全模式和搜索引擎模式,支持繁體分詞、自定義詞典等,是非常好的Python中文分詞解決方案,可以實現分詞、詞典管理、關鍵字抽取、詞性標注等

  • 推薦度:★★★

?

82. SnowNLP

?

  • 類型:第三方庫

  • 描述:SnowNLP是一個Python寫的類庫,可以方便的處理中文文本內容。該庫是受到了TextBlob的啟發而針對中文處理寫的類庫,和TextBlob不同的是這里沒有用NLTK,所有的算法都是自己實現的,并且自帶了一些訓練好的字典

  • 推薦度:★★

?

83. smallseg

?

  • 類型:第三方庫

  • 描述:Smallseg是一個開源的、基于DFA的輕量級的中文分詞工具包。可自定義詞典、切割后返回登錄詞列表和未登錄詞列表、有一定的新詞識別能力

  • 推薦度:★★

?

84. spaCy

?

  • 類型:第三方庫

  • 描述:spaCy是一個Python自然語言處理工具包,它結合Python和Cython使得自然語言處理能力達到了工業強度

  • 推薦度:★★★

?

85. TextBlob

?

  • 類型:第三方庫

  • 描述:TextBlob 是一個處理文本數據的Python庫,可用來做詞性標注、情感分析、文本翻譯、名詞短語抽取、文本分類等

  • 推薦度:★★

?

86. PyNLPI

?

  • 類型:第三方庫

  • 描述:PyNLPI是一個適合各種自然語言處理任務的集合庫,可用于中文文本分詞、關鍵字分析等,尤其重要的是其支持中英文映射,支持UTF-8和GBK編碼的字符串等

  • 推薦度:★★★

?

87. synonyms

?

  • 類型:第三方庫

  • 描述:中文近義詞工具包,可用于自然語言理解的很多任務:文本對齊,推薦算法,相似度計算,語義偏移,關鍵字提取,概念提取,自動摘要,搜索引擎等。

  • 推薦度:★★★

?

?

07 圖像和視頻處理

?

圖像處理和視頻處理主要適用于基于圖像的操作、處理、分析和挖掘,如人臉識別、圖像識別、目標跟蹤、圖像理解等。

?

?

88. PIL/Pillow

?

  • 類型:第三方庫

  • 描述:PIL是一個常用的圖像讀取、處理和分析的庫,提供了多種數據處理、變換的操作方法和屬性。PIL僅支持到2.7版本且已經很久沒有更新,一群志愿者基于PIL發布了新的分支Pillow。Pillow同時支持Python2和Python3并且加入很多新的功能

  • 推薦度:★★

?

89. OpenCV

?

  • 類型:第三方庫

  • 描述:OpenCV是一個強大的圖像和視頻工作庫。它提供了多種程序接口,支持跨平臺(包括移動端)應用。OpenCV的設計效率很高,它以優化的C / C ++編寫,庫可以利用多核處理。除了對圖像進行基本處理外,還支持圖像數據建模,并預制了多種圖像識別引擎,如人臉識別

  • 推薦度:★★★

?

90. scikit-image

?

  • 類型:第三方庫

  • 描述:scikit-image(也稱skimage)是一個圖像處理庫,支持顏色模式轉換、濾鏡、繪圖、圖像處理、特征檢測等多種功能

  • 推薦度:★★

?

91. imageop

?

  • 類型:Python標準庫

  • 描述:Python自帶的函數,對圖像基本操作,包括裁剪、縮放、模式轉換

  • 推薦度:

?

92. colorsys

?

  • 類型:Python標準庫

  • 描述:Python自帶的函數,實現不同圖像色彩模式的轉換

  • 推薦度:

?

93. imghdr

?

  • 類型:Python標準庫

  • 描述:Python自帶的函數,返回圖像文件的類型

  • 推薦度:

?

?

08 音頻處理

?

音頻處理主要適用于基于聲音的處理、分析和建模,主要應用于語音識別、語音合成、語義理解等。

?

?

94. TimeSide

?

  • 類型:第三方庫

  • 描述:TimeSide是一個能夠進行音頻分析、成像、轉碼、流媒體和標簽處理的Python框架,可以對任何音頻或視頻內容非常大的數據集進行復雜的處理

  • 推薦度:★★★

?

95. audiolazy

?

  • 類型:第三方庫

  • 描述:audiolazy是一個用于實時聲音數據流處理的庫,支持實時數據應用處理、無限數據序列表示、數據流表示等

  • 推薦度:★★

?

96. pydub

?

  • 類型:第三方庫

  • 描述:pydub支持多種格式聲音文件,可進行多種信號處理(例如壓縮、均衡、歸一化)、信號生成(例如正弦、方波、鋸齒等)、音效注冊、靜音處理等

  • 推薦度:★★★

?

97. audioop

?

  • 類型:Python標準庫

  • 描述:Python自帶的函數,可實現對聲音片段的一些常用操作

  • 推薦度:★★

?

98. tinytag

?

  • 類型:第三方庫

  • 描述:tinytag用于讀取多種聲音文件的元數據,涵蓋MP3、OGG、OPUS、MP4、M4A、FLAC、WMA、Wave等格式

  • 推薦度:★★

?

99. aifc

?

  • 類型:Python標準庫

  • 描述:Python自帶的函數,讀寫AIFF和AIFC文件

  • 推薦度:

?

100. sunau

?

  • 類型:Python標準庫

  • 描述:Python自帶的函數,讀寫Sun AU文件

  • 推薦度:

?

101. wave

?

  • 類型:Python標準庫

  • 描述:Python自帶的函數,讀寫WAV文件

  • 推薦度:★★

?

102. chunk

?

  • 類型:Python標準庫

  • 描述:Python自帶的函數,讀取EA IFF 85塊格式的文件

  • 推薦度:

?

103. sndhdr

?

  • 類型:Python標準庫

  • 描述:Python自帶的函數,返回聲音文件的類型

  • 推薦度:

?

104. ossaudiodev

?

  • 類型:Python標準庫

  • 描述:該模塊支持訪問OSS(開放聲音系統)音頻接口

  • 推薦度:★★★

?

?

09 數據挖掘/機器學習/深度學習

?

數據挖掘、機器學習和深度學習等是Python進行數據建模和挖掘學習的核心模塊。

?

?

105. Scikit-Learn

?

  • 類型:第三方庫

  • 描述:scikit-learn(也稱SKlearn)是一個基于Python的機器學習綜合庫,內置監督式學習和非監督式學習機器學習方法,包括各種回歸、聚類、分類、流式學習、異常檢測、神經網絡、集成方法等主流算法類別,同時支持預置數據集、數據預處理、模型選擇和評估等方法,是一個非常完整、流行的機器學習工具庫

  • 推薦度:★★★

?

106. TensorFlow

?

  • 類型:第三方庫

  • 描述:TensorFlow 是谷歌的第二代機器學習系統,內建深度學習的擴展支持,任何能夠用計算流圖形來表達的計算,都可以使用 TensorFlow

  • 推薦度:★★★

?

107. NuPIC

?

  • 類型:第三方庫

  • 描述:NuPIC是一個以HTM(分層時間記憶)學習算法為工具的機器智能平臺。NuPIC適合于各種各樣的問題,尤其適用于檢測異常和預測應用

  • 推薦度:★★★

?

108. PyTorch

?

  • 類型:第三方庫

  • 描述:PyTorch是FaceBook推出的深度學習框架,它基于Python(而非lua)產生,它提供的動態計算圖是顯著區別于Tensorflow等其他學習框架的地方。

  • 推薦度:★★

?

109. Orange

?

  • 類型:第三方庫

  • 描述:Orange通過圖形化操作界面,提供交互式數據分析功能,尤其適用于分類、聚類、回歸、特征選擇和交叉驗證工作

  • 推薦度:★★★

?

110. theano

?

  • 類型:第三方庫

  • 描述:Theano是非常成熟的深度學習庫。它與Numpy緊密集成,支持GPU計算、單元測試和自我驗證

  • 推薦度:★★★

?

111. keras

?

  • 類型:第三方庫

  • 描述:Keras是一個用Python編寫的高級神經網絡API,能夠運行在TensorFlow或者Theano之上,它的開發重點是實現快速實驗

  • 推薦度:★★

?

112. neurolab

?

  • 類型:第三方庫

  • 描述:Neurolab是具有靈活網絡配置和Python學習算法的基本神經網絡算法庫。它包含通過遞歸神經網絡(RNN)實現的不同變體,該庫是同類RNN API中最好的選擇之一

  • 推薦度:★★

?

113. PyLearn2

?

  • 類型:第三方庫

  • 描述:PyLearn2是基于Theano的深度學習庫,它旨在提供極大的靈活性,并使研究人員可以進行自由可控制,參數和屬性的靈活、開放配置是亮點

  • 推薦度:★★★

?

114. OverFeat

?

  • 類型:第三方庫

  • 描述:OverFeat是一個深度學習庫,主要用于圖片分類、定位物體檢測

  • 推薦度:★★

?

115. Pyevolve

?

  • 類型:第三方庫

  • 描述:Pyevolve是一個完整的遺傳算法框架,也支持遺傳編程

  • 推薦度:★★

?

116. Caffe2

?

  • 類型:第三方庫

  • 描述:Cafffe2也是FaceBook推出的深度學習框架,相比于PyTorch 更適合于研究,Caffe2 適合大規模部署,主要用于計算機視覺,它對圖像識別的分類具有很好的應用效果

  • 推薦度:★★

?

?

10?數據可視化

?

數據可視化主要用于做數據結果展示、數據模型驗證、圖形交互和探查等方面。

?

?

117. Matplotlib

?

  • 類型:第三方庫

  • 描述:Matplotlib是Python的2D繪圖庫,它以各種硬拷貝格式和跨平臺的交互式環境生成出版質量級別的圖形,開發者可以僅需要幾行代碼,便可以生成多種高質量圖形

  • 推薦度:★★★

?

118. pyecharts

?

  • 類型:第三方庫

  • 描述:基于百度Echarts的強大的可視化工具庫,其提供的圖形功能眾多,尤其對于復雜關系的展示能力較強

  • 推薦度:★★★

?

119. seaborn

?

  • 類型:第三方庫

  • 描述:Seaborn是在Matplotlib的基礎上進行了更高級的API封裝,它可以作為Matplotlib的補充

  • 推薦度:★★★

?

120. bokeh

?

  • 類型:第三方庫

  • 描述:Bokeh是一種交互式可視化庫,可以在WEB瀏覽器中實現美觀的視覺效果

  • 推薦度:★★★

?

121. Plotly

?

  • 類型:第三方庫

  • 描述:Plotly提供的圖形庫可以進行在線WEB交互,并提供具有出版品質的圖形,支持線圖、散點圖、區域圖、條形圖、誤差條、框圖、直方圖、熱圖、子圖、多軸、極坐標圖、氣泡圖、玫瑰圖、熱力圖、漏斗圖等眾多圖形

  • 推薦度:★★★

?

122. VisPy

?

  • 類型:第三方庫

  • 描述:VisPy是用于交互式科學可視化的Python庫,旨在實現快速,可擴展和易于使用

  • 推薦度:★★

?

123. PyQtGraph

?

  • 類型:第三方庫

  • 描述:PyQtGraph是一個建立在PyQt4 / PySide和numpy之上的純Python圖形和GUI庫,主要用于數學/科學/工程應用

  • 推薦度:★★

?

124. ggplot

?

  • 類型:第三方庫

  • 描述:ggplot是用Python實現的圖形輸出庫,類似于 R中的圖形展示版本

  • 推薦度:★★★

?

?

11?交互學習和集成開發

?

交互學習和集成開發主要用來做Python開發、調試和集成之用,包括Python集成開發環境和IDE。

?

?

125. IPython/ Jupyter

?

  • 類型:第三方庫

  • 描述:IPython 是一個基于Python 的交互式shell,比默認的Python shell 好用得多,支持變量自動補全、自動縮進、交互式幫助、魔法命令、系統命令等,內置了許多很有用的功能和函數。從IPython4.0開始,IPython衍生出了IPython和Jupyter兩個分支。在該分支正式出現之前,IPython其實已經擁有了ipython notebook功能,因此,Jupyter更像是一個ipython notebook的升級版。

  • 推薦度:★★★

?

126. Elpy

?

  • 類型:第三方庫

  • 描述:Elpy是Emacs用于Python的開發環境,它結合并配置了許多其他軟件包,它們都是用Emacs Lisp和Python編寫的

  • 推薦度:★★

?

127. PTVS

?

  • 類型:第三方庫

  • 描述:Visual Studio 的 Python 工具

  • 推薦度:★★

?

128. PyCharm

?

  • 類型:外部工具

  • 描述:PyCharm帶有一整套可以幫助用戶在使用Python語言開發時提高其效率的工具,比如調試、語法高亮、項目管理、代碼跳轉、智能提示、自動完成、單元測試、版本控制并可集成IPython、系統終端命令行等,在PyCharm里幾乎就可以實現所有有關Python工作的全部過程

  • 推薦度:★★★

?

129. LiClipse

?

  • 類型:外部工具

  • 描述:LiClipse是基于Eclipse的免費多語言 IDE,通過其中的PyDev可支持 Python開發應用

  • 推薦度:★★

?

130. Spyder

?

  • 類型:外部工具

  • 描述:Spyder是一個開源的Python IDE,由IPython和眾多流行的Python庫的支持,是一個具備高級編輯、交互式測試、調試以及數字計算環境的交互式開發環境

  • 推薦度:★★

?

?

12?其他Python協同數據工作工具

?

其他Python協同數據工作工具指除了上述主題以外,其他在數據工作中常用的工具或庫。

?

131. tesseract-ocr

?

  • 類型:外部工具

  • 描述:這是一個Google支持的開源OCR圖文識別項目,支持超過200種語言(包括中文),并支持自定義訓練字符集,支持跨Windows、Linux、Mac OSX 多平臺使用

  • 推薦度:★★★

?

132. RPython

?

  • 類型:第三方庫

  • 描述:R集成庫

  • 推薦度:★★★

?

133. Rpy2

?

  • 類型:第三方庫

  • 描述:Python連接R的庫

?

134. matpython

?

  • 類型:第三方庫

  • 描述:MATLAB集成庫

  • 推薦度:★★★

?

135. Lunatic Python

?

  • 類型:第三方庫

  • 描述:Lua集成庫

  • 推薦度:★★

?

136. PyCall.jl

?

  • 類型:第三方庫

  • 描述:Julia集成庫

  • 推薦度:★★

?

137. PySpark

?

  • 類型:第三方庫

  • 描述:Spark提供的Python API

  • 推薦度:★★★

?

138. dumbo

?

  • 類型:第三方庫

  • 描述:這個模塊可以讓Pythoner輕松的編寫和運行 Hadoop 程序,程序版本比較早,可以作為參考

  • 推薦度:★★

?

139. dpark

?

  • 類型:第三方庫

  • 描述:Python對Spark的克隆版本,類MapReduce框架

  • 推薦度:★★

?

140. streamparse

?

  • 類型:第三方庫

  • 描述:Streamparse允許通過Storm對實時數據流運行Python代碼

  • 推薦度:★★★

?


關于作者:宋天龍,大數據技術專家,觸脈咨詢合伙人兼副總裁,前Webtrekk中國區技術和咨詢負責人(Webtrekk,德國的在線數據分析服務提供商)。擅長數據挖掘、建模、分析與運營,精通端到端數據價值場景設計、業務需求轉換、數據結構梳理、數據建模與學習以及數據工程交付。

原文地址:https://mp.weixin.qq.com/s?__biz=MjM5ODE1NDYyMA==&mid=2653393556&idx=1&sn=a68f7112d32c79a449730eb9002b00f6&chksm=bd1c2a878a6ba391b7ade98b3c1dbe56fa4e3b5a70af7f53dc146f8f3ec9f20ff03ecea5624c&mpshare=1&scene=1&srcid=#rd

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/285720.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/285720.shtml
英文地址,請注明出處:http://en.pswp.cn/news/285720.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【CC精品教程】任務一:CC新建工程、添加照片、相機參數設置、選擇坐標系統

《無人機航空攝影測量精品教程》合集目錄(Pix4d、CC、EPS、PhotoScan、Inpho) 同Pix4d一樣,CC(Context Capture),也稱Smart 3D,也是無人機航測中人手必備的一款軟件,在空三運算,三維模型構建等傾斜攝影測量方面有很大的優勢,精度也相當高。本CC系列精品教程從項目的角…

C語言試題八十七之實現選擇排序算法

??個人主頁:個人主頁 ??系列專欄:C語言試題200例目錄 ??推薦一款刷算法、筆試、面經、拿大公司offer神器 ?? 點擊跳轉進入網站 ?作者簡介:大家好,我是碼莎拉蒂,CSDN博客專家(全站排名Top 50),阿里云博客專家、51CTO博客專家、華為云享專家 1、題目 C語言選擇排…

java concurrent之前戲synchronized

對于多線程共享資源的情況須要進行同步&#xff0c;以避免一個線程的修改被還有一個線程的修改所覆蓋。最普遍的同步方式就是synchronized。把代碼聲明為synchronized。有兩個重要后果&#xff0c;一般是指該代碼具有 原子性&#xff08;atomicity&#xff09;和 可見性&#x…

開源項目【zheng】搭建流程

2019獨角獸企業重金招聘Python工程師標準>>> 搭建過程 項目地址 https://gitee.com/shuzheng/zheng這兩篇寫的比較詳細的搭建過程&#xff0c;結合一下就沒什么問題了。 https://my.oschina.net/yzuzhang/blog/1538555http://www.jianshu.com/p/b2fb42e17b581.JDK 1…

簡述HTML DOM及其節點分類

在JavaScript中&#xff0c;document這個對象大家一定很熟悉&#xff0c;哪怕是剛剛開始學習的新人&#xff0c;也會很快接觸到這個對象。而document對象不僅僅是一個普通的JavaScript內置對象&#xff0c;它還是一個巨大API的核心對象&#xff0c;這個巨大的API就是DOM&#x…

【CC精品教程】任務二:導入像控點、差分POS,空三平差權重設置,提交自由空三

《無人機航空攝影測量精品教程》合集目錄(Pix4d、CC、EPS、PhotoScan、Inpho) 【CC精品教程】任務一:CC新建工程、添加照片、相機參數設置、選擇坐標系統 本任務接著上一個任務,繼續完成CC項目作業,主要內容有:導入像控點、選擇空間參考系統,導入差分POS,空三平差權重設…

[轉]如何進行單元測試

一、單元測試步驟 代碼編寫完成后的單元測試工作主要分為兩個步驟&#xff1a; 人工靜態檢查 人工靜態檢查是測試的第一步&#xff0c;這個階段工作主要是保證代碼算法的邏輯正確性&#xff08;盡量通過人工檢查發現代碼的邏輯錯誤&#xff09;、清晰性、規范性、一致性、算法…

WPF 基礎控件之 TabControl樣式

其他基礎控件1.Window2.Button3.CheckBox4.ComboBox5.DataGrid 6.DatePicker7.Expander8.GroupBox9.ListBox10.ListView11.Menu12.PasswordBox13.TextBox14.RadioButton15.ToggleButton16.Slider 17.TreeView TabControl 實現下面的效果1&#xff09;TabControl來實現動畫&…

開發團隊測試的難與易

做了多年的研發工程師&#xff0c;在所處的環境中&#xff0c;所接觸的開發人員中很少有看重對自己代碼進行測試這項工作的。大多研發人員往往是寫好了代碼運行起來&#xff0c;簡單做下測試&#xff0c;甚至不去測試就拋給接口使用者或者質量管理人員。而且理由很充分“沒時間…

C語言試題八十八之實現選冒泡排序算法

??個人主頁:個人主頁 ??系列專欄:C語言試題200例目錄 ??推薦一款刷算法、筆試、面經、拿大公司offer神器 ?? 點擊跳轉進入網站 ?作者簡介:大家好,我是碼莎拉蒂,CSDN博客專家(全站排名Top 50),阿里云博客專家、51CTO博客專家、華為云享專家 1、題目 C語言實現冒…

兩個數值交換位置

2019獨角獸企業重金招聘Python工程師標準>>> 先說非計算機專業都能理解的。 int a 10; int b 20; 方法一&#xff1a; int c a; a b; b c; System.out.println("a"a",b"b); 方法二&#xff1a; a a b; b a - b; a a - b; System.out…

教你如何在Android 6.0上創建系統懸浮窗

郭霖大神的文章:http://mp.weixin.qq.com/s?__bizMzA5MzI3NjE2MA&mid2650235949&idx1&sn0f7eded67f834d38b02f8872768cb68a&scene0#wechat_redirect今天周二&#xff0c;又該跟大家分享由我執筆的文章了。從之前我寫的deep links、通知欄微技巧這兩篇文章中&a…

【CC精品教程】任務三:CC刺像控點,提交空三,新建重建項目(三維格網、三維點云、DOM和DSM)

《無人機航空攝影測量精品教程》合集目錄(Pix4d、CC、EPS、PhotoScan、Inpho) 【CC精品教程】任務一:CC新建工程、添加照片、相機參數設置、選擇坐標系統 【CC精品教程】任務二:導入像控點、差分POS,空三平差權重設置,提交自由空三 主要任務是準確的刺像控點,提交空三,…

官宣.NET 7 預覽版5

點擊上方藍字關注我們&#xff08;本文閱讀時間&#xff1a;12分鐘)今天我們發布了 .NET 7 預覽版 5。.NET 7 的這個預覽版包括對通用數學的改進&#xff0c;方便了 API 作者&#xff0c;使其更輕松&#xff0c;一個新的 ML.NET 文本分類 API&#xff0c;增加了最先進的深度學習…

[轉]Android產品研發(十九)

轉載請標明出處&#xff1a;一片楓葉的專欄 上一篇文章中我們講解了webview中問題集錦&#xff0c;講解了webview的性能優化、webview種入Cookie信息、activity退出的時候清除webview信息報錯、如何通過java代碼和js代碼相互交互、webview如何下載文件以及騰訊的X5瀏覽服務等知…

C語言試題八十九之實現插入排序算法

??個人主頁:個人主頁 ??系列專欄:C語言試題200例目錄 ??推薦一款刷算法、筆試、面經、拿大公司offer神器 ?? 點擊跳轉進入網站 ?作者簡介:大家好,我是碼莎拉蒂,CSDN博客專家(全站排名Top 50),阿里云博客專家、51CTO博客專家、華為云享專家 1、題目 C語言實現現…

【CC精品教程】ContextCapture 10.17安裝教程(附CC10.17安裝包下載)

《無人機航空攝影測量精品教程》合集目錄(Pix4d、CC、EPS、PhotoScan、Inpho) CC10.17相比之前的版本有了好的新的功能和優點,在傾斜攝影測量中有了更多的優勢,精度和運行速度有了很大的提升。本文講解CC的安裝,附CC10.17安裝包下載,是您航測傾斜攝影測量的入門必備。 文…

centos7 kickstart 使用小結

1、添加參數使網卡名稱變為eth 1bootloader --locationmbr --append"net.ifnames0 biosdevname0 rhgb quiet" 2、psize使用說明&#xff1a;修改vg PE16m 默認4m 支持256G磁盤&#xff0c;適當的調整pesize,可以更多的使用磁盤空間 1volgroup Vol1--pesize16384 pv.…

IOS-網絡(文件上傳)

1 //2 // ViewController.m3 // IOS_0206_文件上傳4 //5 // Created by ma c on 16/2/6.6 // Copyright © 2016年 博文科技. All rights reserved.7 //8 9 #import "ViewController.h"10 #define BWFileBoundary "----------BowenKeJi"11 #define…

mac SecureCRT設置

參考&#xff1a; http://www.2cto.com/os/201407/320292.html SecureCRT 設置 1&#xff09;每次登陸都要輸入密碼&#xff1a; Global Option -> General 取消&#xff1a;Use Keychain前面的勾 2&#xff09;Logon Actions Logon Actions很強大&#xff0c;和python里…