網(wǎng)友評(píng)分:
5分
Hypermaker html viewer(html查看器) V3001.32 官方版
風(fēng)越網(wǎng)頁(yè)批量填表工具 V5.28 綠色版
Fiddler4網(wǎng)頁(yè)抓包軟件 V5.0.2 官方版
飛騰反黃軟件 V2.3.0.1010 官方版
全能模擬王自動(dòng)點(diǎn)擊軟件 V17.1.1 綠色最新版
Sangfor WebShellKiller(網(wǎng)站暗鏈檢測(cè)工具) V3.3.0.2 綠色免費(fèi)版
Easy Web Editor(可視化網(wǎng)頁(yè)制作軟件) V2016.40.1 官方版
Google Web Designer(網(wǎng)頁(yè)編輯器) V8.0.3.0603 官方版
SysNucleus WebHarvy 是一款非常好用的網(wǎng)頁(yè)數(shù)據(jù)采集軟件,它可以幫助用戶輕松的從網(wǎng)頁(yè)上提取數(shù)據(jù)并保存為不同的格式,還支持提取視頻、圖片等各種類型的文件。
1、SysNucleus WebHarvy可以讓您分析網(wǎng)頁(yè)上的數(shù)據(jù)
2、可以顯示從一個(gè)HTML地址上分析連接數(shù)據(jù)
3、可以延伸到下一個(gè)網(wǎng)頁(yè)頁(yè)面
4、可以指定搜索數(shù)據(jù)的范圍以及內(nèi)容
5、可以將掃描的圖片下載保存
6、支持在瀏覽器上復(fù)制鏈接搜索
7、支持配置對(duì)應(yīng)資源項(xiàng)目搜索
8、可以使用項(xiàng)目名稱以及資源名稱查找
9、SysNucleus WebHarvy可以輕松提取數(shù)據(jù)
10、提供更高級(jí)的多詞語(yǔ)搜索以及多頁(yè)搜索
簡(jiǎn)易網(wǎng)頁(yè)搜刮:WebHarvy的指向和點(diǎn)擊界面使Web Scraping很容易。絕對(duì)不需要編寫任何代碼或腳本來(lái)刮取數(shù)據(jù)。您將使用WebHarvy的內(nèi)置瀏覽器加載網(wǎng)站,并且可以通過(guò)單擊鼠標(biāo)來(lái)選擇要提取的數(shù)據(jù)。就這么簡(jiǎn)單!(視頻)
智能模式檢測(cè):自動(dòng)識(shí)別網(wǎng)頁(yè)中出現(xiàn)的數(shù)據(jù)模式。因此,如果您需要從網(wǎng)頁(yè)上抓取項(xiàng)目列表(名稱,地址,電子郵件,價(jià)格等),則無(wú)需進(jìn)行任何其他配置。如果數(shù)據(jù)重復(fù),WebHarvy將自動(dòng)對(duì)其進(jìn)行刮擦。 保存到文件或數(shù)據(jù)庫(kù)
您可以用多種格式保存從網(wǎng)站提取的數(shù)據(jù)。當(dāng)前版本的WebHarvy Web搜尋軟件允許您將提取的數(shù)據(jù)另存為Excel,XML,CSV,JSON或TSV文件。您也可以將抓取的數(shù)據(jù)導(dǎo)出到SQL數(shù)據(jù)庫(kù)。(了解更多)
抓取多頁(yè):網(wǎng)站通常會(huì)在多個(gè)頁(yè)面中顯示諸如產(chǎn)品列表或搜索結(jié)果之類的數(shù)據(jù)。WebHarvy可以自動(dòng)爬網(wǎng)并從多個(gè)頁(yè)面提取數(shù)據(jù)。只需指出“加載下一頁(yè)的鏈接”,WebHarvy Web Scraper就會(huì)自動(dòng)從所有頁(yè)面抓取數(shù)據(jù)。(了解更多)
提交關(guān)鍵字:通過(guò)自動(dòng)提交輸入關(guān)鍵字列表以搜索表單來(lái)擦除數(shù)據(jù)??梢詫⑷我鈹?shù)量的輸入關(guān)鍵字提交到多個(gè)輸入文本字段以執(zhí)行搜索。可以從輸入關(guān)鍵字所有組合的搜索結(jié)果中提取數(shù)據(jù)。(了解更多)(視頻)
保護(hù)隱私:為了匿名抓取并防止Web抓取軟件被Web服務(wù)器阻止,您可以選擇通過(guò)代理服務(wù)器或VPN訪問(wèn)目標(biāo)網(wǎng)站??梢允褂脝蝹€(gè)代理服務(wù)器地址或代理服務(wù)器地址列表。(了解更多)
類別抓?。鹤ト」ぞ呤鼓梢詮逆溄恿斜碇凶ト?shù)據(jù),這些鏈接會(huì)導(dǎo)致網(wǎng)站中出現(xiàn)類似的頁(yè)面/列表。這使您可以使用單一配置在網(wǎng)站內(nèi)抓取類別和子類別。(了解更多)(視頻)
常用表達(dá):允許您在網(wǎng)頁(yè)的文本或HTML源上應(yīng)用正則表達(dá)式(RegEx)并抓取匹配的部分。這項(xiàng)功能強(qiáng)大的技術(shù)可在您抓取數(shù)據(jù)時(shí)提供更大的靈活性。(了解更多) (RegEx教程)
JavaScript支持:提取數(shù)據(jù)之前,請(qǐng)?jiān)跒g覽器中運(yùn)行您自己的JavaScript代碼。它可用于與頁(yè)面元素進(jìn)行交互,修改DOM或調(diào)用已在目標(biāo)頁(yè)面中實(shí)現(xiàn)的JavaScript函數(shù)。(了解更多)
圖像提取:可以下載圖像或提取圖像URL。WebHarvy可以自動(dòng)提取顯示在電子商務(wù)網(wǎng)站產(chǎn)品詳細(xì)信息頁(yè)面中的多個(gè)圖像。(了解更多)
自動(dòng)化瀏覽器任務(wù):WebHarvy可以輕松配置為執(zhí)行諸如單擊鏈接,選擇列表/下拉選項(xiàng),向字段輸入文本,滾動(dòng)頁(yè)面,打開(kāi)彈出窗口等任務(wù)。
技術(shù)援助:購(gòu)買WebHarvy后,您將在購(gòu)買之日起的1年內(nèi)獲得我們的免費(fèi)更新和免費(fèi)支持。
標(biāo)簽: 數(shù)據(jù)采集 網(wǎng)頁(yè)采集
關(guān)于本站|下載幫助|下載聲明|軟件發(fā)布|聯(lián)系我們
Copyright ? 2005-2025 m.virtualinsta360.com.All rights reserved.
浙ICP備2024132706號(hào)-1 浙公網(wǎng)安備33038102330474號(hào)