1.分析網頁,獲取代碼,提取時間
想要提取出彈幕所在的節點,我們要使用 Beautiful Soup 解析模塊,需要從 bs4 中導入 BeautifulSoup 模塊
創建一個 BeautifulSoup 對象,傳入變量 xml 和解析器 lxml,將該對象賦值給變量?soup。
接著使用 find_all() 函數中,傳入 name 參數,其參數值為 d?。將返回的由所有 d 節點組成的列表,賦值給變量?content_all。
2.彈幕的發送時間進行統計,繪制折線圖
我們可使用?for 循環遍歷?range()?函數生成的?0-24?的數字。
將?30*x+1?賦值給變量 start,?30*(x+1)?賦值給變量 end;
使用?格式化?start 和 end,用?短橫線相連?并賦值給?segment_range。
把 segment_range 作為字典?subtitlesDict 的鍵,添加進字典中,再將字典中鍵所對應的值設置為 0。
在 add_xaxis() 函數中傳入一個參數,這個參數的類型是列表,列表中的元素順序表示折線圖 x 軸從左到右的刻度。
在這里我們要傳入所有的月份,可以使用?keys()?函數獲取字典中所有的鍵,再使用?list()?函數將格式轉換成列表。