發(fā)表時間:2024-06-29 來源:明輝站整理相關(guān)軟件相關(guān)文章人氣:
Web Data Miner(數(shù)據(jù)提取工具)是一款簡單好用的數(shù)據(jù)提取工具,可幫助用戶從網(wǎng)站上提取需要的數(shù)據(jù),并將其導出到Excel表格中。軟件支持創(chuàng)建任務(wù),在短時間內(nèi)即可完成所有頁面的提取工作,不僅省了去大量的麻煩,同時也節(jié)省了很多時間,提高工作的效率,通過是還支持自動保存以及自動暫停功能,有效避免數(shù)據(jù)丟失,并消除了某些網(wǎng)站被IP地址阻塞的風險。
功能介紹
1、以表格形式從網(wǎng)頁中提取數(shù)據(jù)。
2、從不同的布局網(wǎng)站提取數(shù)據(jù)。
3、從網(wǎng)頁中提取文本,html,圖像,鏈接和URL。
4、從外部鏈接和自定義鏈接中提取數(shù)據(jù)。
5、自動跟隨頁面提取數(shù)據(jù)。
6、保存提取的數(shù)據(jù)以消除丟失數(shù)據(jù)的風險。
7、自動暫?煞乐沟V工被某些網(wǎng)站阻止。
8、將收藏的網(wǎng)站列表添加為書簽。
9、用戶可以安排將來的日期和時間來提取數(shù)據(jù)。
10、將數(shù)據(jù)保存為CSV,TXT格式。
常見問題
1、如何開始記錄配置的過程?
輸入網(wǎng)站URL,然后等待加載瀏覽器。一旦打開了要抓取數(shù)據(jù)的網(wǎng)站,您必須單擊“開始配置”按鈕。
輸入網(wǎng)站URL,然后等待加載瀏覽器。一旦網(wǎng)站為After star配置之后,您必須單擊要從網(wǎng)頁中刪除的項目。Web Data Miner工具從打開的網(wǎng)頁中刪除單擊的項目或類似項目。
2、如何從網(wǎng)頁中選擇要報廢的數(shù)據(jù)?
Web Data Miner具有良好的功能,可從網(wǎng)頁中剪貼文本,html,圖像和鏈接,在“捕獲的數(shù)據(jù)工具箱”窗口中,您可以選擇用于剪貼數(shù)據(jù)類型的選項。例如,我們選擇捕獲文本,然后單擊捕獲文本按鈕。
Web Data Miner具有良好的功能,可從網(wǎng)頁中剪貼文本,html,圖像和鏈接,在“捕獲的數(shù)據(jù)工具箱”窗口中,您可以選擇用于剪貼數(shù)據(jù)類型的選項。例如,我們選擇捕獲文本,然后單擊捕獲文本按鈕。
Web Data Miner會自動識別相似的項目并添加到給定列名稱中的捕獲數(shù)據(jù)預(yù)覽列表中。通過類似的過程,您可以從網(wǎng)頁中抓取更多數(shù)據(jù)。
3、如何從下一個后續(xù)鏈接中提取數(shù)據(jù)?
追蹤連結(jié):
如果要從網(wǎng)頁中存在的另一個鏈接中刪除更多數(shù)據(jù),則必須選擇“跟隨鏈接”選項。當您單擊“跟隨鏈接”按鈕時,智能數(shù)據(jù)刮板將導航到單擊項目鏈接,并且在頁面加載后,您可以通過相同的過程從導航頁面中刮取更多數(shù)據(jù)。
網(wǎng)絡(luò)數(shù)據(jù)挖掘器 網(wǎng)絡(luò)數(shù)據(jù)挖掘器 網(wǎng)絡(luò)數(shù)據(jù)挖掘器 網(wǎng)絡(luò)數(shù)據(jù)挖掘器
停止捕捉:
捕獲后,您只需要停止即可開始挖掘。
4、如何根據(jù)您記錄的配置從網(wǎng)站開始挖掘數(shù)據(jù)?
開始挖掘
通過單擊“開始挖掘”按鈕配置所有數(shù)據(jù)時,可以從WebPages挖掘數(shù)據(jù)。
5、從多個頁面報廢數(shù)據(jù)
要從多個頁面抓取數(shù)據(jù),您必須配置“設(shè)置下一頁鏈接”。 設(shè)置下一頁鏈接時,您可以允許智能數(shù)據(jù)抓取器從所有要挖掘的頁面或頁面數(shù)中挖掘數(shù)據(jù)。
6、如何暫停,停止和保存提取的數(shù)據(jù)?
您可以在采礦時暫停和停止該過程。挖掘完成后,您可以將挖掘數(shù)據(jù)保存到Excel(.csv)文件或文本文件中。
7、如何從可以是自定義鏈接和鏈接列表的外部鏈接中提取數(shù)據(jù)?
使用外部鏈接
自定義鏈接:在“自定義鏈接”選項中,您可以提供更改字段為數(shù)字的鏈接。它還將有助于從多個頁面中抓取數(shù)據(jù)。在此選項中,您將鏈接分為三個部分。如果包含則在更改字段之前鏈接,更改字段之前更改字段和更改字段之后(最后提交)的字段(如果包含),您還可以設(shè)置要挖掘的頁面數(shù)。更改字段將以1的增量更改。
鏈接列表:在此列表中,您可以提供許多鏈接或從文本文件中加載包含相似數(shù)據(jù)的鏈接,并且在配置了*個鏈接后,智能數(shù)據(jù)抓取工具從所有鏈接中挖掘數(shù)據(jù)。
8、如何更改自動暫停,自動保存和頁面加載超時的設(shè)置?
設(shè)定值
自動保存礦工數(shù)據(jù):當您通過設(shè)置“頁數(shù)后保存”和“保存位置”允許智能數(shù)據(jù)刮板自動保存數(shù)據(jù)時,它將在挖掘時在給定位置自動保存數(shù)據(jù)。
自動暫停:您還可以通過設(shè)置給定分鐘后和給定分鐘數(shù)的暫停來設(shè)置自動暫停。此設(shè)置可以防止礦工被某些網(wǎng)站阻止。
超時:您還可以設(shè)置網(wǎng)頁加載的超時時間。
9、如何計劃任務(wù)以使流程自動化?
在“計劃程序”窗口中,您可以看到列表計劃任務(wù),您可以編輯,刪除,還可以計劃新任務(wù)。
您可以通過給定的任務(wù)名稱調(diào)度時間配置文件來調(diào)度新任務(wù)并保存文件。
10、如何為您喜歡的網(wǎng)站添加書簽?
通過使用書簽按鈕,您可以為自己喜歡的網(wǎng)站添加書簽。
騰訊視頻官方版 | 45.34MB
愛奇藝視頻官方正式版 | 35.10MB
暴風影音最新版下載 | 50.3MB
QQ音樂官方正式版 | 24.2MB
酷狗音樂2022下載 | 37MB