? ??簡數采集器是新一代的網站文章采集和發布平臺,完全在線配置和使用云采集,功能強大,操作簡單,配置快捷高效。
簡數不僅提供網頁文章采集、數據批量處理、定時采集、定時定量自動發布等基本功能,還集成強大的SEO工具與接入多家原創AI,并創新實現了采集規則智能生成引擎特色功能:只需輸入網址,系統自動完成采集規則配置,大幅提升了采集配置和發布效率。
采集簡單,發布也很輕松:支持一鍵發布到WorpPress、帝國、織夢、ZBlog、Discuz、Destoon、Typecho、Emlog、Mipcms、米拓、易優CMS、蘋果CMS、PHPCMS、PbootCMS和迅睿等CMS網站系統,還可以發布到自定義Http接口,基本所有網站都能發布!
下面詳細介紹一下使用簡數進行文章采集,原創AI處理并發布的網站的方法。
詳細使用步驟:
第一步:創建采集任務
第二步:完善列表頁的智能抽取結果
第三步:完善詳情頁的智能抽取結果
第四步:啟動運行
第五步:接入AI原創API
第六步:數據發布到網站
第一步:創建采集任務
??左側菜單 “創建采集任務” ,輸入任務名和要采集的 “列表頁” 網址,詳情頁鏈接非必填,系統會自動識別。
??輸入后點擊 “下一步”。
第二步:完善列表頁的智能抽取結果
??系統會先采用智能算法獲取列表頁中的詳情頁鏈接(多個),用戶可以雙擊打開檢查,如果非所需鏈接,可以打開 “列表提取器” 自定義修改,只需要在可視化界面上用鼠標點選。
智能獲取結果如下圖:
??補充:列表頁采集頁數,在完成任務配置后的 “基本信息&入口網址” --》“采集起始網址” 中進行配置。
列表提取器可視化操作界面?如下圖所示:
第三步:完善詳情頁的智能抽取結果
??獲取了多個詳情頁鏈接后,系統會使用首個詳情頁鏈接為模板進行智能抽取主要數據內容(如:標題,作者,發布日期,內容,標簽等)
詳情頁智能抽取結果如下:
??如果智能抽取的內容非所需的,可打開 "詳情提取器" 自定義修改。如下圖:
可以對左側的各字段進行修改、增加和刪除等。
還可以對每個字段進行數據處理:替換,提取,過濾,設置默認值等等,如下圖:
第四步:啟動采集
采集規則配置完成后,即可啟動運行,進行數據采集了:
??采集后的數據結果,在該采集任務的“結果數據&發布”里面,您可以在這里對數據進行修改或者直接導出excel或發布你的網站(WordPress,Zblog,HTTP接口,數據庫等)。
?
第五步:接入AI原創API
簡數采集器支持調用第三方AI原創API接口,分析處理采集數據內容。
目前支持的第三方API接入:
- DeepSeek
- 豆包
- 文心一言
- Kimi
- 通義千問
- 星火、智譜和混元等
第六步:數據發布到網站
采集結果數據可以發布到:各種CMS系統(WordPress,織夢,帝國,zblog,Destoon,Discuz,Typecho,Emlog,Mipcms,蘋果cms,Phpcms,易優cms,米拓cms,云優cms,Phpwind,PbootCMS等)、自定義http接口等。
數據導出格式目前支持Excel、Word、Json、Sql、CSV、TXT、Html等格式。
發布到CMS主要三個步驟:
一、在用戶網站安裝發布插件(插件市場安裝或復制文件到目錄即可)
二、在簡數控制臺任務的“發布目標配置”項中添加發布目標
三、在任務的“結果數據&發布”列表中對數據進行發布
?完成,數據采集+原創處理+發布到網站就這么簡單!!!