當下軟件園 / 匯聚當下最新最酷的軟件下載站!
當下軟件園

您的位置: 首頁 > 應用軟件 > 編程工具 > Crawlab(分布式爬蟲管理軟件) V0.5.1 官方版

  Crawlab是基于Golang的分布式爬蟲管理平臺,支持Python、NodeJS、Go、Java、PHP等多種編程語言以及多種爬蟲框架,分為Docker、直接部署、Kubernetes三種安裝方式!

Crawlab

【功能介紹】

  Crawlab架構:Crawlab的架構包括了一個主節(jié)點(Master Node)和多個工作節(jié)點(Worker Node),以及負責通信和數據儲存的Redis和MongoDB數據庫。

  前端應用向主節(jié)點請求數據,主節(jié)點通過MongoDB和Redis來執(zhí)行任務派發(fā)調度以及部署,工作節(jié)點收到任務之后,開始執(zhí)行爬蟲任務,并將任務結果儲存到MongoDB。架構相對于v0.3.0之前的Celery版本有所精簡,去除了不必要的節(jié)點監(jiān)控模塊Flower,節(jié)點監(jiān)控主要由Redis完成。

  主節(jié)點:主節(jié)點是整個Crawlab架構的核心,屬于Crawlab的中控系統(tǒng)。主節(jié)點負責與前端應用進行通信,并通過Redis將爬蟲任務派發(fā)給工作節(jié)點。同時,主節(jié)點會同步(部署)爬蟲給工作節(jié)點,通過Redis和MongoDB的GridFS。

Crawlab

  工作節(jié)點:工作節(jié)點的主要功能是執(zhí)行爬蟲任務和儲存抓取數據與日志,并且通過Redis的PubSub跟主節(jié)點通信。通過增加工作節(jié)點數量,Crawlab可以做到橫向擴展,不同的爬蟲任務可以分配到不同的節(jié)點上執(zhí)行。

  MongoDB:MongoDB是Crawlab的運行數據庫,儲存有節(jié)點、爬蟲、任務、定時任務等數據,另外GridFS文件儲存方式是主節(jié)點儲存爬蟲文件并同步到工作節(jié)點的中間媒介。

  Redis:Redis是非常受歡迎的Key-Value數據庫,在Crawlab中主要實現節(jié)點間數據通信的功能。例如,節(jié)點會將自己信息通過HSET儲存在Redis的nodes哈希列表中,主節(jié)點根據哈希列表來判斷在線節(jié)點。

  前端:前端是一個基于Vue-Element-Admin的單頁應用。其中重用了很多Element-UI的控件來支持相應的展示。

軟件特別說明

標簽: Crawlab

其他版本下載
網友評論
回頂部 去下載

關于本站|下載幫助|下載聲明|軟件發(fā)布|聯系我們

Copyright ? 2005-2024 m.virtualinsta360.com.All rights reserved.

浙ICP備2024132706號-1 浙公網安備33038102330474號