如果需要采集的內(nèi)容不都在詳情頁,部分在詳情頁的分頁或下級頁面(跳轉(zhuǎn)子頁面)中,例如內(nèi)容分頁,下載頁,多選項卡頁等,可使用簡數(shù)采集器的分頁采集功能來解決,具體使用方法如下:
簡數(shù)采集器實現(xiàn)內(nèi)容分頁采集,只需簡單幾步配置采集分頁區(qū)域即可,操作步驟如下:
1)在詳情頁提取器,先完成正文內(nèi)容(content字段)的基礎(chǔ)采集配置;
2)勾選content字段的【該字段內(nèi)容有多分頁】選項;
3)啟用【分頁點選開關(guān)】 (顯示 √ 標志),然后點選分頁所在區(qū)域,保存完成配置;
當采集內(nèi)容在詳情頁內(nèi)的鏈接指向頁面時(即下級頁面,例如下載頁、多選項卡頁等),可按以下操作獲?。?br>
在詳情頁提取器中,勾選對應(yīng)字段的【該字段內(nèi)容有多分頁】選項 -》啟用【分頁點選開關(guān)】 (顯示 √ 標志),然后選擇包含下級頁面跳轉(zhuǎn)鏈接的區(qū)域。
比如下圖,課程介紹是詳情頁,還需要采集章節(jié)目錄頁里的內(nèi)容,對應(yīng)字段分頁區(qū)域則應(yīng)選擇包含章節(jié)目錄跳轉(zhuǎn)鏈接的區(qū)域。
在瀏覽器訪問跳轉(zhuǎn)頁面鏈接(如章節(jié)目錄頁面),獲取要采集的目錄內(nèi)容區(qū)域的xpath值:
//*[@class="chapter-ul"]
備注:如何獲取xpath值可查看《Xpath常見語法使用詳細教程》。
在簡數(shù)采集器詳情頁提取器對應(yīng)字段的當前字段Xpath處,填寫下級頁面內(nèi)容的xpath值://*[@class="chapter-ul"],保存后測試采集,檢查效果。