我想請求一個rss程序的幫助。我所做的是收集包含我項目相關信息的網站,然后檢查它們是否有rss提要。
鏈接存儲在txt文件中(每行一個鏈接)。
因此,我有一個txt文件,其中包含了需要檢查rss的基本url。在
我找到了這個代碼,這會使我的工作更容易。在import requests
from bs4 import BeautifulSoup
def get_rss_feed(website_url):
if website_url is None:
print("URL should not be null")
else:
source_code = requests.get(website_url)
plain_text = source_code.text
soup = BeautifulSoup(plain_text)
for link in soup.find_all("link", {"type" : "application/rss+xml"}):
href = link.get('href')
print("RSS feed for " + website_url + "is -->" + str(href))
get_rss_feed("http://www.extremetech.com/")
但是我想從txt文件中打開我收集的url,而不是逐個鍵入每個url。在
所以我試著用這個來擴展程序:
^{pr2}$
但這返回一個錯誤,即beauthoulsoup不是http客戶端。在
我還擴展了以下內容:def open()
f = open("file.txt")
lines = f.readlines()
return lines
但這給了我一個用“,”分隔的列表
如果有人能幫助我,我將非常感激