大家好,小編來為大家解答以下問題,python3.5安裝教程及環境配置,python3.7.2安裝與配置,現在讓我們一起來看看吧!
python 從爬蟲開始(一)
Python 簡介
首先簡介一下Python和爬蟲的關系與概念,python 是一門編程語言,爬蟲是python語言的一種應用場景。因為其簡單和容易入門,被很多人所喜愛,也是比較熱門的一款語言,在2019年5月的調查排行中,python 語言排行在第四名,因為Python的語言特色(簡短快捷)被稱為腳本語言,又能夠和多平臺多語言交互和結合使用,也被稱為“膠水語言”,python不是萬能的,但是卻可以應用到很多場景,最出名的就是應用在網絡爬蟲和人工智能的研究方面,今天就先談談爬蟲,后面會談到人工智能的應用和場景python工程師證書怎么考。
python 環境安裝與配置
我們磨刀不誤砍柴工,開始編程之前,先安裝好python的環境和響應的配置:
這里提供python 3.6版本的下載鏈接(目前最新是3.7版本,也可以下載3.7版本)鏈接:https://pan.baidu.com/s/1gxtwAqIGEey3KYwiaOgDew
提取碼:hk13
上面是基于windows10/windows7/windows8 64位 版本的安裝程序,如果想要安裝其他系統的版本,點擊下面的鏈接 下載
提示:
1.安裝的位置最好放置在非系統盤,便于以后的第三方包的安裝與卸載(很多小迷糊,默認安裝后,一旦要改變一些環境變量或者路徑之后,發現自己程序執行權限有問題或者一些奇怪錯誤)
2.安裝之后,如非必要不要使用全部第三方包自動升級的腳本,在以后的文章中,我會提供自動更新第三方包的腳本和實現原理的講解,這里暫時不提。
python ide 的安裝與使用
這里推薦兩個軟件用于Python程序的編寫,其中之一是非常熱門的pycharm鏈接:https://pan.baidu.com/s/11bD88RTW4lSLHVqu7GQ4qw
提取碼:vqoh
安裝很簡單,還是遵守盡量不安裝到C盤的原則,安裝之后在設置里勾選好需要的Python開發環境既Python安裝的路徑(python.exe所在路徑)我安裝的位置就是在這里F:\python36,根據自己的實際情況修改
還有一個軟件當然就是Subline Text3 啦,這個軟件用于編寫Python程序的優勢在于方便處理多種不同的編碼以及其他編程語言,并且在pycharm中啟動程序有可能出現第三方包已經安裝但是無法被成功引入的情況。還有一點,sublime Text 可以培養比較好的編程習慣(瞎掰的)根據自己的實際需求選擇任意一個軟件安裝使用即可。
鏈接:https://pan.baidu.com/s/1EY7bTRIpvgyQsnQJbhQ16Q
提取碼:qurr
當然如果不需要額外的軟件,在配置好系統環境變量之后,直接cmd ,然后輸入python,可以啟動python自帶的IDE,不過用這個方式進行函數測試還不錯,如果用于開發,我只能稱呼你為最強!!
以下是配置環境變量 右鍵電腦——屬性——高級系統設置——環境變量,然后在系統變量和用戶變量中分別找到path,然后把下圖兩個環境變量配置好。(只配置第一個環境變量就可以啟動Python IDE,第二個環境變量是為了在cmd下可以直接啟動pip,這個下次用到再細說)
python 實現第一句代碼
print(“hello world!”)
如果再ide里輸出成功,恭喜你可以開始Python的開發之路了
啰嗦一句:這里啟動ide的方式前面也說了,運行腳本的方法提一下,
這是python自帶的ide
這是通過cmd啟動其他軟件編寫的py文件,py屬于可執行文件,可以直接雙擊運行,但是雙擊運行結束后就會關閉彈窗,對于新手來說最好還是通過cmd啟動,便于調試和查看結果。
python 引入第三方包
Python 引入第三方包的方式是通過 import 包名
import os
from PIL import Image
print("hello world!")
python 是非常靈活的一種語言,可以引入一個包的所有方法,例如第一句,也可以引入一個包的其中一種方法,例如第二句,同樣的自己也可以編寫方法,然后被引入,也可以打包成相應的方法API,上傳python開發社區,被更多人使用(扯遠了)
剛才這三行代碼,在運行的時候會出現錯誤,錯誤提示 no moodul named PIL
不要方,這是因為我們只安裝了程序,沒有引入PIL這個第三方包,當然比較新的版本已經把PIL加入了系統安裝包之中
我只是為了引入接下來的內容
遇到這樣的錯誤,我們可以使用這句代碼來解決 pip install 包名
如果再之前環境配置的時候已經把F:\python36\Scripts配置到path中之后,可以直接
安裝完成后,在運行發現就沒有錯誤提示啦
Python 實現一個爬蟲吧
from urllib.request import urlopen
from urllib.request import Request
url="https://www.csdn.net/"
req=Request(url)
content=urlopen(req).read().decode("utf-8")
print(content)
人狠話不多,先上代碼,這是非常簡單的一個爬蟲,代碼會爬取csdn首頁的網頁信息,并輸出在命令窗
噠噠噠,已經拿到了csdn首頁的網頁代碼數據了,但是這肯定不是我們需要的內容呀,我們需要提取出對我們有意義的數據,具體的方法就留在下一篇文章里了,打字真累,喜歡就點個贊吧,謝謝!
從爬蟲開始(二)——簡單網絡爬蟲進階