獲取一篇新聞的全部信息

給定一篇新聞的鏈接newsUrl,獲取該新聞的全部信息

標題、作者、發布單位、審核、來源

發布時間:轉換成datetime類型

點擊:

  • newsUrl
  • newsId(使用正則表達式re)
  • clickUrl(str.format(newsId))
  • requests.get(clickUrl)
  • newClick(用字符串處理,或正則表達式)
  • int()

整個過程包裝成一個簡單清晰的函數。

 1 import requests
 2 import re
 3 from bs4 import BeautifulSoup
 4 def click(url):#獲取點擊次數
 5     id=re.findall('(\d{1,5})',url)[-1]
 6     clickUrl='http://oa.gzcc.cn/api.php?op=count&id={}&modelid=80'.format(id)
 7     res=requests.get(clickUrl)
 8     newsClick=res.text.split('.html')[-1].lstrip("('").rstrip("');")
 9     return newsClick
10 
11 def newsdt(showinfo):#轉換成datetime類型
12     newsDate=showinfo.split()[0].split(':')[1]
13     newsTime=showinfo.split()[1]
14     newsDT=newsDate+' '+newsTime
15     #newsDT=datetime.strptime(newsDT,'%Y-%m-%d %H:%M:%S')
16     return newsDT
17 
18 def newsid(url):#獲取新聞編號
19     newsID=re.findall('(\d{1,5})',url)[-1]
20     return  newsID
21 
22 def news(url):
23     res=requests.get(url)
24     res.encoding='utf-8'
25     soup=BeautifulSoup(res.text,'html.parser')
26     title=soup.select('.show-title')[0].text
27     showinfo=soup.select('.show-info')[0].text
28     newsDT=newsdt(showinfo)
29     author=soup.select('.show-info')[0].text.split()[2]#獲取作者
30     check=soup.select('.show-info')[0].text.split()[3]#獲取審核
31     comefrom=soup.select('.show-info')[0].text.split()[4]#獲取來源
32     detail=soup.select('.show-content ')[0].text#獲取新聞的具體內容
33     newsID=newsid(url)#獲取新聞編號
34     newsClick=click(url)#獲取點擊次數
35     title='新聞標題:'+title
36     newsClick='文章點擊次數:'+newsClick
37     newsID='新聞編號:'+newsID
38     newsDT='發布日期:'+newsDT
39     pr=(newsClick,title,newsDT,newsID,author,check,comefrom,detail)#輸出新聞的各種信息
40     return pr
41 url='http://news.gzcc.cn/html/2019/jxky_0329/11100.html'
42 print(news(url))
View Code

?

轉載于:https://www.cnblogs.com/hzj111/p/10637364.html

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/279784.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/279784.shtml
英文地址,請注明出處:http://en.pswp.cn/news/279784.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

上twitter_如何在Twitter上更改您的顯示名稱

上twitterUnlike Facebook, Twitter has never insisted people user their real names. In fact, there’s a long tradition of people changing their names to a joke or pun because it’s Christmas or Halloween, or just for no reason at all. 與Facebook不同&#xf…

技術走向管理一些思考(1)-性格特質和自我管理

技術走向管理一些思考-文件夾 1,管理需具備的性格特質 贊賞他人:以一種不以自我為中心的合作的方式和他人相處,能平靜和客觀地接受不同的人。放下自己的性格、喜好,去贊賞不同類型的人。不是通過個人友誼或者熟悉程度。而是通過某…

網橋

配置實現網橋 網橋:即橋接 把一套機器上的若干個網絡接口 “連接” 起來,其結果是,其中一個網口收到的報文會被復制給其他網口并發送出去。以使得網口之間的報文能夠互相轉發。網橋就是這樣一個設備,它有若干個網口,并…

Newtonsoft.Json Deserialize Type 或者 同類型 變量 反序列化

Newtonsoft.Json 經常再用 這樣的需求 還是很少用 場景 方法一:根據 Type 反序列化 int demo 0; string jsongString JsonConvert.SerializeObject(demo); int jsonDemo JsonConvert.DeserializeObject(jsongString, demo.GetType()); 方法二 根據 同類型變量 序…

raspberry pi_在月光下將Raspberry Pi變成蒸汽機

raspberry piValve’s Steam Machines aim to bring your Steam game library right into your living room (but at a rather steep premium). Today we’ll show you how to bring your Steam library (plus all your other computer games) to your living room for a fract…

文檔測試【轉載】

原文來自:51Testing軟件測試網采編 作者: 仙靈測試(sinablog) 原文鏈接:http://www.51testing.com/html/61/n-237961.html 1、文檔的種類 ● 聯機幫助文檔或用戶手冊 這是人們最容易想到的文檔。用戶手冊是隨軟件發布而印制的小冊子…

NOI2019省選模擬賽 第三場

傳送門 明明沒參加過卻因為點進去結果狂掉\(rating\)…… \(A\) 集合 如果我們記 \[f_k\sum_{i1}^nT^i{n-i\choose k}\] 那么答案顯然就是\(f_{k-1}\) 然后就可以開始推倒了 \[ \begin{aligned} f_k &\sum_{i1}^nT^i{n-i\choose k}\\ &\sum_{i1}^nT^i{n-i-1\choose k}\…

MySql數據庫出現 1396錯誤

1、安裝MySql數據庫后。創建新的用戶。有可能會出現 1396這個錯誤, 2、解決的辦法如下:假裝有你需要創建的這個用戶、先刪了。再創建。 3、這樣就可以解決用戶創建不成功的問題了。 轉載于:https://www.cnblogs.com/chifa/p/9362882.html

如何使用wink框架_如何解決Wink Hub的Z-Wave連接問題

如何使用wink框架Overall, the Wink hub works extremely well…but sometimes the devices you have connected to it can act a little wonky. Here are some things you can do in order to fix any connection issues with all of those Z-Wave sensors and devices connec…

Tomcat服務器啟動錯誤之Offending class: javax/servlet/Servlet.class

引子 最近在基于Wex5項目開發中,遇到使用過程中與Tomcat功能有關的錯誤提示, 如題所示。最終的解決方法就是刪除掉項目上與tomcat沖突的jar包。 org.apache.catalina.loader.WebappClassLoader validateJarFile ??: validateJarFile(/Users/zxzpc/…

面向對象進階(二)----------類的內置方法

一、isinstance(obj,cls)和issubclass(sub,super) 1. isinstance(obj,cls): 檢查是否obj是否是類 cls 的對象 class Player:passp Player()print(isinstance(p, Player))>>> Ture 2. issubclass(sub, super): 檢查sub類是否是 super 類的派生類 class Player:passcla…

BZOJ.3265.志愿者招募加強版(費用流SPFA)

題目鏈接 見上題。 每類志愿者可能是若干段&#xff0c;不滿足那個...全幺模矩陣(全單位模矩陣)的條件&#xff0c;所以線性規劃可能存在非整數解。 于是就可以用費用流水過去順便拿個rank2 233. //20704kb 300ms #include <queue> #include <cstdio> #include &…

谷歌相冊_Google相冊中的新存檔功能是什么?

谷歌相冊If you’re a Google Photos user, you’ve may have seen a new feature called “Archive” show up in the app’s sidebar. if not, don’t stress—it’s just now rolling out and not everyone has it yet. Since it’s new, here’s a quick look at what it i…

CenterOS 7安裝Nginx

1.wget http://nginx.org/packages/centos/7/noarch/RPMS/nginx-release-centos-7-0.el7.ngx.noarch.rpm下載對應當前系統版本的nginx包(package) 2.rpm -ivh nginx-release-centos-7-0.el7.ngx.noarch.rpm建立nginx的yum倉庫 3.yum install nginx 下載并安裝nginx systemctl s…

Java的組合排列問題

從4個人中選2個人參加活動&#xff0c;一共有6種選法。 從n個人中選m個人參加活動&#xff0c;一共有多少種選法&#xff1f;C(m/n)C((m-1)/(n-1))C(m/(n-1))數學算法 public class Main {public static void main(String[] args) {System.out.println("請輸入總人數:&quo…

阿里云一鍵建站產品,阿里云自營建站-中小企業建站首選

阿里云推出的自營建站服務&#xff0c;這對于中小企業來說簡直是福利了&#xff0c;現在一般的公司都開始有了自己的官網&#xff0c;有可能就是因為你的官網設計的標準&#xff0c;大氣&#xff0c;客戶就會對你的信任度增加&#xff0c;從而促進一筆不小的訂單&#xff0c;這…

航拍拉近拉遠鏡頭_什么是遠攝鏡頭?

航拍拉近拉遠鏡頭Telephoto lenses can be incredibly useful, but how is it different from other lenses, and when should you use it? 遠攝鏡頭可能非常有用&#xff0c;但是它與其他鏡頭有什么不同&#xff1f;何時使用&#xff1f; 什么是遠攝鏡頭&#xff1f; (What I…

數據庫的簡單了解

數據庫一、什么是數據庫存儲數據的倉庫將數據有組織&#xff0c;按照特定的格式存儲在介質上叫做數據庫二、比較多個數據庫系統a) Oracle 最好的數據庫沒有之一b) SQL server 最好的數據庫(windows)c) MySQL 甲骨文(Oracle) sun 開源三、SQL語言a) SQL(結構化查詢語句) …

阿里云對象存儲OSS支持版本管理特性

2019獨角獸企業重金招聘Python工程師標準>>> 阿里云對象存儲OSS現已經全面支持“對象版本管理”特性。該功能適用于所有的存儲類型以及區域。當Bucket啟用該特性后&#xff0c;“對象版本管理”功能可以保護和恢復誤刪除、誤覆蓋的數據。 對象存儲OSS“版本管理”具…

Python第一天學習---基礎語法

1.字符串的用法(String) Python 中的字符串有兩種索引方式&#xff0c;從左往右以 0 開始&#xff0c;從右往左以 -1 開始。Python中的字符串不能改變。Python 沒有單獨的字符類型&#xff0c;一個字符就是長度為 1 的字符串這三點是我覺得Python字符處理特別的一點 我們來看第…