php 開源 采集,迅睿CMS 火車頭內容采集

采集工具:火車采集器 v7.6

采集模塊:新聞 News

一、編寫采集入庫腳本接口

新建:./api/caiji.php

/**

*?數據采集

*/

define('IS_API',?basename(__FILE__,?'.php'));?//?項目標識

define('SELF',?pathinfo(__FILE__,?PATHINFO_BASENAME));?//?該文件的名稱

require('../index.php');?//?引入主文件

新建:./dayrui/My/Api/Caiji.php

$this->_module_init('news');?//?news?是模塊目錄

if?($_GET['action']?==?'category')?{

//?顯示欄目

foreach?($this->module['category']?as?$t)?{

if?($t['child']?==?0?&&?$t['tid']?==?1)?{

echo?'

'.$t['name'].'<=>'.$t['id'].'

'.PHP_EOL;

}

}

}?else?{

//?入庫數據

$data?=?$_REQUEST;

//?發布者id?1

$data['uid']?=?1;

//?發布者賬號?admin

$data['author']?=?'admin';

//?主表字段

$fields[1]?=?$this->get_cache('table-'.SITE_ID,?$this->content_model->dbprefix(SITE_ID.'_'.MOD_DIR));

$cache?=?$this->get_cache('table-'.SITE_ID,?$this->content_model->dbprefix(SITE_ID.'_'.MOD_DIR.'_category_data'));

$cache?&&?$fields[1]?=?array_merge($fields[1],?$cache);

//?附表字段

$fields[0]?=?$this->get_cache('table-'.SITE_ID,?$this->content_model->dbprefix(SITE_ID.'_'.MOD_DIR.'_data_0'));

$cache?=?$this->get_cache('table-'.SITE_ID,?$this->content_model->dbprefix(SITE_ID.'_'.MOD_DIR.'_category_data_0'));

$cache?&&?$fields[0]?=?array_merge($fields[0],?$cache);

//?去重復

$fields[0]?=?array_unique($fields[0]);

$fields[1]?=?array_unique($fields[1]);

$save?=?[];

//?主表附表歸類

foreach?($fields?as?$ismain?=>?$field)?{

foreach?($field?as?$name)?{

isset($data[$name])?&&?$save[$ismain][$name]?=?$data[$name];

}

}

if?(!$data['catid'])?{

exit('欄目為空');

}

$save[1]['uid']?=?$save[0]['uid']?=?$data['uid'];

$save[1]['catid']?=?$save[0]['catid']?=?$data['catid'];

$save[1]['url']?=?'';

$save[1]['status']?=?9;?//9表示正常發布,1表示審核里面

$save[1]['hits']?=?0;

$save[1]['displayorder']?=?0;

$save[1]['link_id']?=?0;

$save[1]['comments']?=?0;

$save[1]['avgsort']?=?0;

$save[1]['inputtime']?=?$save[1]['updatetime']?=?SYS_TIME?+?rand(0,?7200);

$save[1]['inputip']?=?'127.0.0.1';

//?驗證標題重復

if?($this->content_model->table(SITE_ID.'_'.MOD_DIR)->where('title',?$save[1]['title'])->counts())?{

echo?'重復';exit;

}

$rt?=?$this->content_model->save(0,?$save);

if?($rt['code'])?{

exit('成功');

}?else?{

exit('失敗');

}

}

exit;

腳本文件中可以定義發布者等一些預定義字段默認值,如果你不會php的話可以保持默認

然后關閉系統的跨站提交驗證。

二、火車采集器編寫web發布規則

e971d5225e417dc7fa4fdf0ffcf139ae.png

三、新建一個在線發布模塊

48f5dfafa22459e0c50d3b6650a0a2f0.png

四、填寫獲取欄目列表的參數

3e87bccd5a4eddc74308a8cfe3b3e692.png

按照上面的格式寫就ok了

五、內容發布規則參數

9d946889363d2e5e07719d9ca9bdb3c1.png

1 發布地址,按照上面的就ok

2 表單參數,這里是你采集的字段

3 成功標志碼:成功

六、保存模塊

3f4ddb5be3c92c34e840f879dbae8776.png

七、然后返回web發布配置里面

ac5e01fec28dbc2928716daa7dfdf91a.png

按照圖中的參數配置,點“獲取欄目”,如果可以獲取到就表示成功了一大半了

八、測試入庫發布

2e841b8963fc9419cf4ef160d0d6fb14.png

九、后臺查看采集內容

19d75b112708e4b7d72ce652b4e8d9f6.png

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/534199.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/534199.shtml
英文地址,請注明出處:http://en.pswp.cn/news/534199.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

英文數據集txt_YOLOv5在建筑工地中安全帽佩戴檢測的應用(已開源+數據集)

點擊上方“計算機視覺cv”即可“進入公眾號”重磅干貨第一時間送達前言隨著人工智能的發展&#xff0c;現在越來越多的場景需要人工智能。在工廠的廠區中以安全為首&#xff0c;但工人普遍缺乏佩戴安全帽意識&#xff1b;工廠環境復雜&#xff0c;有各種各樣的禁止進入的區域&a…

浪潮集團PHP,浪潮php實習第一天(初識php)

先推薦幾個比較好的php初學者資料php manual.chm(可在csdn下載頻道下載&#xff0c;可查到大部分函數)比較好的開發工具1 eclipse PDT(對eclipse比較熟悉的比較適應)2.zendStudio(公認的最好的php集成開發環境)php沒有想象中的那么難學&#xff0c;不僅僅是它的語法&#xff0c…

檢測到目標url存在內部ip地址泄露_Cendertron,動態爬蟲與敏感信息泄露檢測

Cendertron&#xff0c;動態爬蟲與敏感信息泄露檢測Cendertron Crawler RendertronCendertron https://url.wx-coder.cn/HinPM 是基于 Puppeteer 的 Web 2.0 動態爬蟲與敏感信息泄露檢測工具。其依托于 xe-crawler 的通用爬蟲、調度與緩存模型&#xff0c;新增了 Monkey Test…

wamp2 php配置,wamp安裝后自定義配置的方法

WampServer是目前應用非常廣泛的PHP集成開發環境&#xff0c;本文就來講述Wamp安裝后自定義配置的方法。供大家參考借鑒。具體如下&#xff1a;wamp2.5安裝完畢后&#xff0c;自己手動重新設置了apache的默認根目錄。但是發現本機可以訪問&#xff0c;別人不能訪問。提示信息為…

屏幕壞點檢測圖片_iPhone新機如何檢測質量 iPhone新機檢測質量步驟【詳解】

iPhone新機怎么檢測好壞_iPhone新機檢測質量方法 說實話&#xff0c;蘋果對于iPhone的品控把握確實一代不如一代&#xff0c;特別是去年發布的iPhone7系列&#xff0c;很多用戶都反映自己新買的手機存在劃痕、屏幕發黃、掉漆等問題。那么當我們購買一部全新的iPhone7時&#xf…

php 安全mysql,關于php:我從mysql注入安全嗎?

本問題已經有最佳答案&#xff0c;請猛點這里訪問。這是否足以避免SQL注入&#xff1f;這里只需要mysql_real_escape_string()方法。在將數據插入數據庫之前&#xff0c;不應該執行htmlentities()或urlencode()。這些方法通常是在呈現您提供給用戶的視圖期間編寫的代碼。避免SQ…

excel單元格斜線_怎么在excel中畫斜線?怎么在excel表格中畫斜線?

在excel表格中畫斜線的技巧教程&#xff1a;1.在Excel中打開一個空白工作簿。 2.您可以在任何大小的單元格中執行此操作&#xff0c;但是如果先將其增大則更容易理解。為此&#xff0c;我們只需單擊并按住第1行和第2行之間的線&#xff0c;然后將其拖動到所需的高度即可。然后對…

php報表數據打印機,通過打印機打印帶打印功能的php表

我有以下php表,我如何只在php表中添加打印功能&#xff1f;點擊一個按鈕,下面的表格通過打印機打印,我試過’CTRL P’,我只得到頁面的html部分示例頁眉,頁腳,導航欄,而不是結果php結果echo "FILEIDFirstnameLastnameIssue DateInterest RateTermsBalance OutstandingBalan…

xbox one s驅動_理想照進現實 理想ONE開始接受預定

2016年4月22日&#xff0c;車和家創始人&CEO李想在源碼資本第二屆碼會年會首談車和家&#xff0c;改造城市出行。車和家 創始人&CEO 李 想2016年碼會年會演講2019年4月10日&#xff0c;增程式智能電動車「理想ONE」正式公布售價并開始接受預訂&#xff0c;并將于2019年…

two+few+arguments+php,PHP5.5 ~ PHP7.2 新特性整理

PHP5.5 ~ PHP7.2 新特性整理一、從PHP 5.5.x 移植到 PHP 5.6.x使用表達式定義常量在之前的 PHP 版本中&#xff0c; 必須使用靜態值來定義常量&#xff0c;聲明屬性以及指定函數參數默認值。 現在你可以使用包括數值、字符串字面量以及其他常量在內的數值表達式來 定義常量、聲…

date設置時間_解決 IDEA 無法找到 java.util.Date 的問題

原文首發于 https://studyidea.cn/問題最近在項目中頻繁使用到 java.util.Date&#xff0c;但是使用 IDEA 提示查找 Date 類&#xff0c;卻無法找到 java.util.Date。可以看到&#xff0c;智能提示的結果沒有 java.util.Date。沒辦法&#xff0c;只能暫時手動導入該包。最近閑下…

mysql插入語句例句,一句簡單的MySql插入語句怎么寫 ?

守候你守候我insert into 表名 values(default,"名字","2011-04-15 12:22:25"); //default可以換成null------------------------------insert into 表名 (name,datetime) values("名字","2011-04-15 12:22:25");使用SQL語法大寫&…

vue key重復_【第2112期】 import { reactive } from #39;vue#39;

前言今日早讀文章由Anthony Fu授權分享。Anthony Fu&#xff0c;是 Vue 的 Core Team 的一員&#xff0c;在 Vue主要負責 vue/composition-api 這個項目的維護。這是一個面向 Vue 2 的插件&#xff0c;它在 Vue 2 中增加了 Vue 3 的 Composition API 的支持。最近也加入了 Vite…

matlab系統穩定性分析,控制系統穩定性分析的MATLAB實現

收稿日期 :200706220 基金項目 :周口師范學院青年基金資助項目(No. ZKNUQN200621) 作者簡介 :劉  偉(1976 - ) ,女 ,河南太康人 ,助教 ,碩士 ,主要從事電力系統及其自動化仿真研究. 第 25 卷 第 2 期 周口師范學院學報 2008 年 3 月 Vol. 25 No. 2 Journal of Zhoukou Normal …

路由器下一跳地址怎么判斷_網絡基本功三:細說路由器

介紹以太網交換機工作在第二層即數據鏈路層&#xff0c;用于在同一網絡內部轉發以太網幀。但是&#xff0c;當源和目的IP地址位于不同網絡時&#xff0c;以太網幀必須發送給路由器。路由器負責在不同網絡間傳輸報文&#xff0c;通過路由表來決定最佳轉發路徑。當主機將報文發送…

HTML多選mysql,html多選下拉框 | 學步園

一個jquery ui,實現html的多選下拉框&#xff0c;在下拉里面加checkbox&#xff0c;不改變頁面的提交特性&#xff0c;只是動態的改變select選中的多選數據。jsp頁面例子&#xff1a;pageEncoding"UTF-8" import"java.util.*,java.text.*"%>String path…

利用逆矩陣解線性方程組_經典Jacobi方法用于求解矩陣特征值

1、引言求解線性方程組在許多領域中都有重要應用&#xff0c;寫成矩陣的形式&#xff1a; 。求解 可以寫成&#xff1a; &#xff0c;這里需要求解矩陣 的逆。《線性代數》中給出的方法主要有兩類&#xff1a;1、設置增廣矩陣&#xff0c;利用高斯消元法&#xff0c;通過初等行…

filename: core/loader.php,使用第三方包后出現的這個錯誤,你們都遇到過嗎?

使用了一些第三方包&#xff0c;經常會發現&#xff0c;引入某些第三方包后(比如在laravel5.6中引入viacreative/sudo-su)&#xff0c;使用命令行工具會遇到這樣的錯誤提示&#xff0c;卸載了第三方包后重新安裝vendor目錄問題立馬解決。真是把人頭發都愁白了&#xff1a;PHP F…

python函數的作用域_python學習第五篇 函數 變量作用域

原博文 2019-07-18 23:40 ? 函數 函數是組合好的&#xff0c;可以重復使用的&#xff0c;用來實現單一或相關聯功能的代碼片段作用 能提高應用的模塊性和代碼的重復利用率函數的創建 第一函數的規則 1.函數代碼塊一def關鍵字開頭&#xff0c;后接函數標識符名稱和圓括號‘&…

js post中文亂碼 php,AJAX之POST數據中文亂碼如何解決

本文主要和大家分享AJAX之POST數據中文亂碼如何解決&#xff0c;前端使用encodeURI進行編碼&#xff0c;希望能幫助到大家。var param encodeURI(param);$.ajax({url: url,methodtype: "POST",async: false,timeout: 60000,contentType: "application/json&quo…