使用方法
1、首先在地址欄輸入待采集的網(wǎng)頁地址,如果待采集網(wǎng)頁已經(jīng)在IE類瀏覽器中打開了,那么軟件的網(wǎng)址列表中 將自動會加入此地址的,你只要下拉選擇一下就會打開了。 2、再點擊抓取測試按鈕,看看網(wǎng)頁源碼及該網(wǎng)頁中所含的表格數(shù)量,網(wǎng)頁源碼在軟件下面的文本框中顯示,網(wǎng) 頁中所含的表格數(shù)及表頭信息在軟件左上角列表框中顯示。 3、從表格數(shù)列表中選擇你要抓取的表格,此時表格左上角第一格文字將顯示在軟件的表格左上角第一格內(nèi)容 輸入框中,表格所含字段(列)將顯示在軟件左側(cè)的中間列表中。 4、再選擇你要采集的表格數(shù)據(jù)的字段(列),如果不選擇,將全部采集。 5、選擇你是否要抓取表格的表頭行,保存時是否顯示表格線,如果網(wǎng)頁表格中有字段有鏈接,你可以選擇是否 包含鏈接地址,如果有且要采集其鏈接地址,那么你不能同時選擇包含表頭行。 6、如果你要采集的表格數(shù)據(jù)只有一個網(wǎng)頁,那么你現(xiàn)在就可直接點擊抓取表格抓取了,如果前面不選擇包含表 格線,表格數(shù)據(jù)將以CVS格式保存,此格式可用微軟EXCEL軟件直接打開轉(zhuǎn)為EXCEL表格,如果前面選擇包含表 格線,表格數(shù)據(jù)將以TXT格式保存,可用記事本軟件打開查看,直接具有表格線,也很清晰。 7、如果你要采集的表格數(shù)據(jù)有連續(xù)多個頁面,并且你都想將其采集下來,那么,請再設(shè)置程序采集下一頁及后 續(xù)頁面的方式,可以是根據(jù)鏈接名打開下頁,鏈接名稱幾乎大部分頁面都是“下一頁”,你看頁面,找到后 輸入即可,如果網(wǎng)頁沒有下一頁鏈接,但是網(wǎng)址中包含頁數(shù),那么你也可選擇根據(jù)網(wǎng)址中的頁數(shù)打開,你可 以選擇從前到后,如從1頁到10頁,也可選擇從后到前,如從10頁到1頁,在頁數(shù)輸入框中輸入即可,但此時 網(wǎng)址中代表頁數(shù)的位置要用“(*)”代替,否則程序?qū)⒉徽J識。 8、再選擇是定時采集或等待網(wǎng)頁打開并加載結(jié)束后立即采集,定時采集是程序根據(jù)一個設(shè)定的很小的時間間隔 去判斷打開的頁面中是否有你要的表格,有就采集,而網(wǎng)頁加載后采集是只要是要采集的網(wǎng)頁已經(jīng)打開了, 程序就會立即進行采集,兩者各有特色,看需要選擇。 9、最后,就是你點擊一下抓取表格按鈕,就可以泡杯咖啡逍遙去了! 10、如果是你已經(jīng)比較熟悉了你要采集的網(wǎng)頁的信息,而且要采集指定表格的所有字段,你也可以輸入需要的一 些信息后,不經(jīng)過抓取測試等操作,直接點擊抓取表格的。