動(dòng)易采集全書_動(dòng)易Cms教程
我用動(dòng)易這么多年了,以前用過不少程序,覺得還是動(dòng)易的比較好用,但是動(dòng)易的采集系統(tǒng)真的很一般,當(dāng)然凡事有利必有弊,動(dòng)易的優(yōu)點(diǎn)非常突出,這里我們也不必多說,相信這里的朋友都非常清楚,下面我就動(dòng)易采集系統(tǒng)作一下具體的闡述!
我用動(dòng)易采集真的是費(fèi)了一番周折,用到現(xiàn)在,也有很多心得體會(huì),下面與大家共享,寫的很倉(cāng)促比較亂,假如不清楚的可以到我的站點(diǎn)來共同探討,網(wǎng)址是www.xian99.com 講的不對(duì)的地方請(qǐng)指出,有更好意見的朋友快跟!
項(xiàng)目治理:
1、選擇添加新項(xiàng)目,找到你需要采集的頁(yè)面→復(fù)制網(wǎng)址到新聞網(wǎng)址列表框,項(xiàng)目名稱隨便填(主要是給你自己記憶備忘用)→下一步
2、項(xiàng)目編輯列表設(shè)置:
這里填寫就要注重點(diǎn)了,找到你要采集的新聞列表的第一個(gè)信息標(biāo)題的地方,一般標(biāo)題前面這里會(huì)有一個(gè)table標(biāo)簽,選擇這個(gè)table標(biāo)簽前面的具有典型特征的一些代碼,代碼具體選多少呢,分2種情況,一是有分頁(yè)的列表,簡(jiǎn)單說就是列表最下面有下一頁(yè)或者有1、2、3、等頁(yè)面鏈接的,二是沒有分頁(yè)的,簡(jiǎn)單說就是列表只有1頁(yè),只有1頁(yè)的情況好辦,這里可以隨便選了,只要保證不重復(fù)就行了。但是有分頁(yè)的列表頁(yè)就要麻煩一些,這時(shí)候選取代碼的原則是:在保證沒有重復(fù)代碼的前提下,盡量選擇少一點(diǎn)的代碼,因?yàn)榇a越多越輕易出錯(cuò),越不能保證每個(gè)列表頁(yè)面都有這些代碼了,這是經(jīng)驗(yàn)之談,當(dāng)然也不一定,有些網(wǎng)頁(yè)代碼格式非常統(tǒng)一,那么這種網(wǎng)頁(yè)就好采集,列表開始代碼也好填一些。什么是具有典型特征的代碼呢?就是基本上每個(gè)列表頁(yè)都有的代碼,但是這個(gè)頁(yè)碼在所有的列表頁(yè)中又是唯一的,不重復(fù)。
設(shè)置列表索引分頁(yè):
對(duì)于有分頁(yè)的列表頁(yè),這時(shí)候必須要設(shè)置列表分頁(yè)代碼了,否則只能采集第一頁(yè)的列表內(nèi)容了。這個(gè)時(shí)候的訣竅是找到“下一頁(yè)”這幾個(gè)字,這幾個(gè)字前面必然有一個(gè)鏈接“a href="”標(biāo)簽,把這個(gè)復(fù)制到下頁(yè)開始的框框去,然后將這個(gè)標(biāo)簽的最后網(wǎng)頁(yè)文件后面的代碼一直到“下一頁(yè)”這幾個(gè)字全部復(fù)制到下頁(yè)結(jié)束框中去,舉個(gè)例子說明一下:比如
| <TABLE WIDTH="390" BORDER="0" CELLSPACING="1" CELLPADDING="0" BGCOLOR="#CCCCCC" ALIGN="CENTER"> <TR ALIGN="CENTER" BGCOLOR="#FFFFFF"> <TD HEIGHT="20"><P> <a >【下一頁(yè)】</a> <a >【尾頁(yè)】</a> 【第1頁(yè) 共5頁(yè)】 </P></TD> </TR> </TABLE> |
。