python收集數據程序_基于Python語言的互聯網數據收集軟件的設計

軟件建立所需的工具及其版本

編寫環境與

IDE

Python3.5.2

Windows10

PyCharm

2016.3

Sublime

Text3

第三方庫與版本號

Requests

2.12.1

BeautifulSoup

4.5.1

PYQT5

5.8.1

Pyinstaller

庫的作用

用于爬蟲編寫

用于爬蟲編寫

用于軟件

GUI

設計

用于封裝

python

程序

1.1

百度地圖數據的抓取

一般我們研究區域污染狀況成因時,

需要找出污染源的坐

標,

就宏觀研究而言,

百度地圖是一個很好的選擇。經過分析,

百度地圖提供一個接口:

http://map.baidu.com/?newmap=1&req?

flag=pcmap&biz=1&from=webmap&da_par=direct&pcevaname=

pc4.1&qt=con&from=webmap&c=233&wd={}&pn={}

。其中

wd

表的是所需的查找內容,

pn

用于翻頁。需要指出的是,

如果訪

問過于快速,

會出現訪問不成功現象,

這時需要放慢抓取速度

與設置斷點續傳的功能

[3]

。抓取數據坐標是百度墨卡托坐標,

與經緯度坐標有很大出入,

需要進行坐標轉換。

1.2

空氣質量數據的抓取設計

本軟件的空氣質量數據來源于網站:

http://www.pm25.in/

在抓取中由于

PC

端的網頁采取的

Ajax

所以學采用

Selenium

Phantomjs

抓取,

但是會大量占用電腦內存與

CPU

。故筆者將

Headers

設置成手機以便正常抓取。由于代碼較長不在此

放出。

1.3

空間熱度圖與點密度圖繪制的設計

可以運用

Python

的標準庫

matplotlib

繪制空間的點密度,

密度圖,

及將上述地圖中收集的數據反應的地圖中。本軟件只

是應用

hexbin

函數做了簡單的繪制。由于需要將

matplotlib

PyQt5

開發的窗口內代碼較長,

不再給出。

2

基于

PyQt5

GUI

設計

2.1

功能的描述

運用

PyQt5

進行

GUI

設計,

將上述

6

個爬蟲進行封裝

[2]

。其

中空氣質量按鈕對應空氣質量數據收集

(自動每一小時收集一

次)

。其中,

坐標轉換按鈕為百度地圖收集的數據的坐標轉換

(需要

key

2.2

界面的設計與運行情況

為了簡化界面,

將界面中的菜單欄與狀態欄統統刪除,

留下

6

個爬蟲的相關按鈕并盡可能放大

,

如圖

2

。為了保證界

面的美觀性,

不再允許用戶將界面最大化,

即固定主界面的大

小。其中空氣質量數據,

氣象數據,

百度地圖,

高德地圖的二級

界面基本一致,

輸入爬取內容與保存位置點擊開始即可。

對于地圖繪制功能,

是本軟件實現的難點內容。需要將

matplotlib

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/534918.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/534918.shtml
英文地址,請注明出處:http://en.pswp.cn/news/534918.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Mysql保存是事件驅動嗎_【CHRIS RICHARDSON 微服務系列】事件驅動的數據管理-5

編者的話 |本文來自 Nginx 官方博客,是「Chris Richardson 微服務」系列的第五篇文章。第一篇文章介紹了微服務架構模式,并且討論了使用微服務的優缺點;第二和第三篇描述了微服務架構模塊間通訊的不同方面;第四篇研究了服務發現中…

chrome postman插件_收集了一些Chrome插件神器,助你快速成為老司機

剛開始開發項目的時候,我一直都在用火狐,因為它有一個fireBug插件,特別好用(目前已不支持),也不知道什么時候,就一直用起來Chrome瀏覽器了,可能是因為它有強大的插件作為后盾吧。開發了這么多年&#xff0c…

phpmyadmin 導出mysql,在phpmyadmin中導入/導出非常大的mysql數據庫

i have a db in phpmyadmin having 3000000 records. i want to export this to another pc. now when i export this only 200000 entries exported into .sql file and that is also not imported on the other pc.解決方案Answering this for anyone else who lands here. I…

python字符串是否包含某元素_Python實現判斷一個字符串是否包含子串的方法總結...

本文實例總結了Python實現判斷一個字符串是否包含子串的方法。分享給大家供大家參考,具體如下: 1.使用成員操作符 in >>> snihao,shijie >>> tnihao >>> result t in s >>> print result True 2.使用string模塊的f…

python怎么全選_有沒有一種方法可以在Python網頁上模擬“全選復制粘貼”?

我對Python相當陌生,我不知道selenium是什么,但是如果您能夠找到某種模式,您應該能夠執行您描述的內容。關鍵是找到一個模式。下面是幾個示例腳本,它們可能會讓您了解如何開始。在import urllib2from bs4 import BeautifulSoupf …

python當前時間怎么弄_python獲取當前時間

我有的時候寫程序要用到當前時間,我就想用python去取當前的時間,雖然不是很難,但是老是忘記,用一次丟一次, 為了能夠更好的記住,我今天特意寫下這篇文章,如果你覺的對你有用的話,可以…

window.open不重復打開同一個名稱的窗口_干貨滿滿|Ctrl鍵的正確打開方式

“ctrl”是鍵盤中一個常用的鍵,全名為"control",中文意為"控制",在計算機基礎中稱為“控制鍵”。那么你知道“ctrl”都能控制什么嗎?難道只知道 “ctrl”C 復制、“ctrl”V 粘貼 這些?&#xff1f…

java 按位_Java中的按位運算

一、位運算符簡介:1.按位與&。如果兩個整形數據 a、b 對應位都是1,則結果位才為1,否則為0,(int 最大值0x7fffffff ):1 int a 0x7fffffff;2 int b 12;3 int c 0;4 int aAndB a&b; //aAndB is 125 int aAndC a&c; …

jmeter安裝包_分布式執行jmeter腳本步驟(非GUI)

備注:【Linux查看服務器是32位還是64位命令】uname -mgetconf LONG_BIT1.Linux環境安裝jmeter可參考https://www.cnblogs.com/surewing/p/9271886.html如需要用到3臺客戶機,分別在三臺機器中安裝,以下安裝之前需安裝jdk環境1)將jm…

java mapreduce程序_簡單的java Hadoop MapReduce程序(計算平均成績)從打包到提交及運行...

[TOC]簡單的java Hadoop MapReduce程序(計算平均成績)從打包到提交及運行程序源碼import java.io.IOException;import java.util.Iterator;import java.util.StringTokenizer;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.Path;import org.apache…

python刪除列表一段元素_Python基礎--list列表刪除元素

列表中刪除元素主要分為以下 3 種場景: 根據目標元素所在位置的索引進行刪除,可以使用 del 關鍵字或者 pop() 方法; 根據元素本身的值進行刪除,可使用列表(list類型)提供的 remove() 方法; 將列…

microbit編程_使用圖形化編程實現主控板與手機藍牙通訊(2019.3.25)

本文轉自:DFRobot創客社區原文鏈接:[Mind]使用圖形化編程實現主控板與手機藍牙通訊-Mind論壇-DF創客社區?mc.dfrobot.com.cn本帖最后由 Forgotten 于 2019-3-25 12:58 編輯做項目時我們經常會遇到藍牙的問題,例如使用appinventor制作一個app…

山海伏妖錄java_山海伏妖錄攻略大全 劇情結局加點妖獸大全

山海伏妖錄是一款非常經典的ARPG游戲,其中有許多的劇情,結局,妖獸以及加點方案。Remilia為大家帶來山海伏妖錄攻略大全,各種攻略都能在這里查到,助您暢玩山海伏妖錄!山海伏妖錄人物介紹配角介紹山海伏妖錄結…

spark環境搭建java_Spark MLlib 環境搭建超詳細教程

1、系統及環境版本系統:Win7 旗艦版 64位 sp1JDK:1.8.0Spark:2.3.2Hadoop:2.7Scala:2.11.8文章最后,有所有版本的下載鏈接,不用再去折騰版本之間的問題。2、環境下載2.1 Spark 下載spark2.2 had…

python自動發郵件附件_python自動發送帶附件的郵件(163郵箱,親測可用)

1.設置發送郵件郵箱的SMTP服務 https://www.360kuai.com/pc/927b9f8da3555bb70?cota4&kuai_so1&tj_urlxz&sign360_57c3bbd1&refer_sceneso_1 設置步驟時,記住設置的郵箱的獨立密碼,在以下腳本中能夠用到2. python腳本 import smtplib f…

java 導出bcp文件格式_使用BCP導出導入數據

bcp 實用工具可以在 Microsoft SQL Server 實例和用戶指定格式的數據文件間大容量復制數據。 使用 bcp 實用工具可以將大量新行導入 SQL Server 表,或將表數據導出到數據文件。 除非與 queryout 選項一起使用,否則使用該實用工具不需要了解 Transact-SQL…

learnpythonthehardway下載_LearnPythonTheHardWay學習筆記1:學習環境搭建

覺得學習這本書應該有筆記,所以就從這里開始吧。 學習資料: 1.《笨辦法學Python》(承德-至陽整理 2013/7/19) 2.《Learn Python The Hard Way,3rd Edition》 (Zed A. Shaw 2010) 一、準備學習環境 &#xf…