更新日期:2022/02/04
版本号:v0.2.2
核心技术栈:Python3
|| Selenium
[注意] 本文档将以如下参考配置进行项目说明
- 开发工具:
PyCharm 2021.3 (Community Edition)
、Anaconda(env Python3.9)
- 操作系统:
Windows 10.0.19041
、Ubuntu 20.04 LTS
如下以 Ubuntu 20.04 LTS
环境为例介绍快速部署上手指南。
git clone https://github.com/RobAI-Lab/sspanel-mining.git /home/sspanel-mining
# /home/sspanel-mining
cd /home/sspanel-mining && pip install -r requirements.txt && cd src
# /home/sspanel-mining/src
python3 main.py install
# /home/sspanel-mining/src
python3 main.py mining --env=production --collector --classifier --source=local
分类器输出与运行时的通信状态有关,有一定的误判概率,也有一定的时效性。
运行结果以 .txt
文件存储在 ./sspanel-mining/src/databse/sspanel_hosts
中。
-
其中
dataset_{datetime}.txt
为采集器(Collector)输出结果,其存储本轮采集获取的暴露在公网上的SSPanel-Uim
站点链接。 -
classifier
文件夹中存放着分类器(Classifier)的输出结果。 -
分类数据将以 .csv 文件形式存储在
/database/staff_hosts/classifier
中:- 标签解释如下:
Normal
:无验证站点Google reCAPTCHA
:Google reCAPTCHA 人机验证GeeTest Validation
:极验滑块验证(绝大多数)/选择文字验证(极小概率)Email Validation
:邮箱验证(开放域名)SMS
:手机短信验证 [钓鱼执法?]CloudflareDefenseV2
:站点正在被攻击 or 高防服务器阻断了爬虫流量
- 存在以下几种 限型实例:
限制注册(邮箱)
:要求使用指定域名的邮箱接收验证码限制注册(邀请)
:要求必须使用有效邀请码注册请求异常(ERROR:STATUS_CODE)
:请求异常,携带相应状态码拒绝注册
:管理员关闭注册接口危险通信
:HTTP 直连站点
- 标签解释如下:
更多注意事项详见 注意事项