行業軟件就是針對特定行業而專門制定的、具有明顯行業特性的軟件。 八爪魚采集器這款軟件可以說是一款幫助用戶輕松爬取網上的數據的軟件,當然會Python的自己就可以寫爬蟲,但是使用這款軟件也相當于自己寫爬蟲,但是更加的簡單,僅僅需要將爬取的規則導入就可以了,還有很多的模板,小編整理了一下這款軟件的使用教程,方便大家更快的上手。 使用教程一、使用模板采集數據顧名思義,采集模板是由軟件提供的、做好的采集模板,目前已有200+采集模板,涵蓋主流網站的采集場景。模板數還在不斷增加。 【使用模板采集數據】時,只需輸入幾個參數(網址、關鍵詞、頁數等),就能在幾分鐘內快速獲取到目標網站數據。(類似PPT模板,只需修改關鍵信息就能直接使用,無需自己從頭配置。) 1、如何找到所需的【采集模板】 ① 首頁【輸入框】 在客戶端首頁【輸入框】中,輸入目標網站名稱,八爪魚自動尋找相關的采集模板。將鼠標移到需要的模板上并單擊,進入模板詳情頁面。 注意,請確保輸入的網站名稱正確,否則可能無法查找到相關模板。 鼠標放到圖片上,右鍵,選擇【在新標簽頁中打開圖片】可查看高清大圖 下文其他圖片同理 ② 首頁【熱門采集模板】 點擊【熱門采集模板】中的模板,或者【更多>>】,進入采集模板展示頁面。可通過【模板類型】、【搜索模板】多種方法,尋找目標模板。 ③ 沒有所需的模板 如果沒有找到想要的模板,請進入模板展示頁面后,點擊右上角【我想要新模板】,提交新模板制作需求。 官方會評估需求,排期制作新的模板。 ![]() 2、【采集模板】如何使用 Step1:進入【模板詳情頁】后,仔細閱讀【模板介紹】、【采集字段預覽】、【采集參數預覽】、【示例數據】,確認此模板采的數據符合需求。 注意:模板中的字段是固定的,無法自行增加字段。如果想要增加模板中的字段,請聯系官方客服。 Step2:確定模板符合需求以后,點擊【立即使用】,自行【配置參數】。常見的參數有關鍵詞、頁數、城市、URL等。 請認真查看【模板介紹】中的使用方法說明和參數說明,輸入格式正確的參數,否則將影響模板的使用。 Step3:然后點擊【保存并啟動】,選擇啟動【本地采集】。八爪魚自動啟動1個采集任務并采集數據。 ![]() Step4:數據采集完成以后,可以需要的格式導出。這里以導出為【Excel】為例。 ![]() 數據示例: ![]() 通過【采集模板】創建并保存的任務,會放在【我的任務】中。在【我的任務】界面,可以對任務進行多種操作并查看任務采集到的歷史數據。 怎么自定義采集? 使用【智能識別】 【智能識別】,只需輸入網址,自動智能識別網頁數據。支持自動識別列表型網頁數據、滾動和翻頁。 在首頁輸入框中,輸入目標網址,點擊【開始采集】。八爪魚自動打開網頁并開始智能識別。 給它一點時間,等待智能識別完成。 智能識別成功,一個網頁可能有多組數據,八爪魚會將所有數據識別出來,然后智能推薦最常用的那組。如果推薦的不是想要的,可自行【切換識別結果】。同時,可自動識別出網頁的滾動和翻頁。此示例網址,無需滾動,只需翻頁,故只識別并勾選【翻頁并采集多頁數據】。 自動識別完成后,點擊【生成采集設置】,可自動生成相應的采集流程,方便用戶編輯修改。 然后,點擊左上角的【采集】,選擇【啟動本地采集】,八爪魚就會開始全自動采集數據。 采集完成后,以所需的方式導出數據即可。 通過【智能識別】創建并保存的任務,會放在【我的任務】中。在【我的任務】界面,可以對任務進行多種操作并查看任務采集到的歷史數據。 值得注意的是,目前自動識別,僅支持識別列表型網頁、滾動和翻頁 行業軟件具有針對性強、易操作等特點。 |
溫馨提示:喜歡本站的話,請收藏一下本站!