# 豆瓣電影信息爬蟲(展示效果如下圖所示:)
這是一個功能強大的豆瓣電影信息爬蟲程序,可以獲取豆瓣電影 Top 250 的詳細信息。
## 功能特點
- 自動爬取豆瓣電影 Top 250 的所有電影信息
- 支持分頁獲取,每頁 25 部電影,共 10 頁
- 獲取每部電影的詳細信息,包括:
- 標題
- 評分
- 導演
- 主演
- 類型
- 上映日期
- 劇情簡介
- 自動保存電影信息為 JSON 文件
- 內置反爬蟲機制,添加隨機延時
- 支持連續查詢多部電影
## 安裝依賴
在運行程序之前,請先安裝所需的依賴:
```bash
pip install -r requirements.txt
```
## 使用方法
1. 運行程序:
```bash
python app1.py
```
2. 程序會首先獲取豆瓣電影 Top 250 的列表(這可能需要一些時間)
3. 顯示帶編號的電影列表(1-250)
4. 輸入電影編號(1-250)來查詢具體電影信息
5. 查詢結果會顯示在控制臺,并自動保存為 JSON 文件
6. 可以繼續查詢其他電影,或輸入 'q' 退出
## 輸出文件
- 每部電影的信息會保存為單獨的 JSON 文件
- 文件名格式:`電影名稱.json`
- JSON 文件包含完整的電影信息,包括標題、評分、導演、主演等
## 注意事項
- 請確保網絡連接正常
- 由于豆瓣網站的反爬蟲機制,程序添加了隨機延時(1-3秒)
- 如果遇到網絡問題,程序會繼續嘗試獲取其他電影的信息
- 建議不要頻繁運行程序,以免被豆瓣封禁 IP
- 所有電影信息都會保存在當前目錄下
## 依賴版本
- requests==2.31.0
- beautifulsoup4==4.12.2