軟件介紹
易得網(wǎng)站數(shù)據(jù)采集系統(tǒng)通用版,通過(guò)編寫(xiě)或者下載規(guī)則,對(duì)所選網(wǎng)站進(jìn)行數(shù)據(jù)采集的系統(tǒng),可以采集大部分網(wǎng)站的數(shù)據(jù),并保存圖片文件。是建站不可或缺的數(shù)據(jù)采集利器。而且該采集器為開(kāi)源代碼,符中文注釋?zhuān)奖阈薷暮蛯W(xué)習(xí)。 該采集系統(tǒng)有如下特點(diǎn): 主流語(yǔ)言 - 采用php+mysql編寫(xiě)而成,安裝對(duì)應(yīng)服務(wù)器即可。 完全開(kāi)源 - 開(kāi)源代碼,且代碼均有中文注釋?zhuān)奖愎芾砼c學(xué)習(xí)交流。 規(guī)則自定義 - 可以自定義采集規(guī)則,可以采集大部分網(wǎng)站內(nèi)容。 數(shù)據(jù)修改 - 自定義修改規(guī)則,優(yōu)化數(shù)據(jù)內(nèi)容。 數(shù)據(jù)保存 - 數(shù)組形態(tài),系列化數(shù)據(jù)保存至文件或數(shù)據(jù)庫(kù),方便上傳、調(diào)用。 圖片讀取 - 可以讀取內(nèi)容的圖片,并保持至本地。 編碼控制 - 轉(zhuǎn)換編碼,可以保存gb2312,gbk等編碼至utf-8。 標(biāo)簽清理 - 可以自定義保留的標(biāo)簽,清理掉不必要標(biāo)簽。 安全性能 - 通過(guò)密碼控制讀取,遠(yuǎn)程讀取亦安全。 操作簡(jiǎn)單 - 一鍵讀取操作,可以按規(guī)則分組讀取,或指定規(guī)則id讀取,單一id讀取。 規(guī)則分組 - 按規(guī)則分組讀取數(shù)據(jù),及時(shí)更新采集數(shù)據(jù)。 自定義讀取 - 按自定義規(guī)則id讀取數(shù)據(jù),有效更及時(shí)。 JS讀取 - 運(yùn)用js控制讀取時(shí)效,降低服務(wù)器負(fù)載。 超時(shí)控制 - 可設(shè)定頁(yè)面執(zhí)行時(shí)間, 減少timeout錯(cuò)誤。 多次讀取 - 可設(shè)定對(duì)網(wǎng)頁(yè)多次讀取控制,可以更有效的讀取數(shù)據(jù)。 錯(cuò)誤控制 - 如果多次出錯(cuò),可以停止讀取,減小服務(wù)器資源占用。 負(fù)載控制 - 多文件夾保存數(shù)據(jù),可以有效的解決多文件下服務(wù)器負(fù)載。 數(shù)據(jù)修改 - 不僅可以瀏覽數(shù)據(jù),而且可以對(duì)主體數(shù)據(jù)進(jìn)行修改。 規(guī)則分析 - 可以向其他人分享您的規(guī)則,讓更多人使用。 規(guī)則下載 - 下載分享規(guī)則,快速獲取需要的內(nèi)容。