agent主机下线问题,agent日志打印防篡改校验失败或者防篡改校验错误次数大于10次,不再上报数据

这个问题注意几点,按照顺序依次排查下
1、 可能是agent主机ping不通server主机,或访问不到server端口,我们可以在agent主机使用ping [server主机IP]telnet [server主机IP] 9999来测试连通性
2、 server和agent的主机系统时间差不能大于15个小时,若时间差不超过15小时打印【防篡改校验错误】类似信息,忽略即可,不会有影响
3、 是不是agent的进程wgcloud-agent被kill掉了,或者agent主机重启或断电,导致agent没有运行,我们再把agent启动就可以了
agent进程莫名奇妙的被kill停止运行,如何处理
4、 wgcloud-server-release.jar不要编辑修改,也不要改文件名称,若编辑过,请还原到安装包里的原始wgcloud-server-release.jar即可
5、 server和agent要保持同一个版本号,如何查看server和agent的版本号
6、server端的守护进程(wgcloud-daemon-release)不要关闭,特别是Windows不要关闭守护进程窗口。若是Linux,守护进程可能是被kill了,查看守护进程是否还存活(ps -ef | grep wgcloud
还有一种可能是server部署在Windows,不小心左键点击守护进程的窗口,进入编辑模式了,右击恢复就好了
如果是此原因导致的话,重启server即可(守护进程会随着server启动),1小时内所有被控端agent会陆续恢复上线,也可以手动重启agent(立即上线)
7、 修改了守护进程wgcloud-daemon-release的默认端口导致的,但是server配置文件中没有同步修改守护进程端口,查看修改说明
8、查看server本机是否能正常访问http://localhost:9997获得返回值,如:2faa233a1400201bedc199fe1d8ab393,若server主机的localhost不能使用,可以在配置文件server/config/application.yml,将如下配置项中的localhost改成server主机ip
注意,如果改成IP后,检查下是否有防火墙拦截该端口9997
9、在server日志看看,是不是server连不上数据库了,如果是这种情况的话,处理好server后,agent就会在1小时内陆续上线,也可以重启agent会立即上线
10、server如果运行在arm、龙芯等系统,需要将守护进程wgcloud-daemon-release替换为对应的版本,点击下载

11、如果server或守护进程(wgcloud-daemon-release)长时间没有启动运行,那么当server重新启动后,agent会在1小时内陆续自动恢复上线,不用重启agent。也可以手动重启agent,会立刻恢复上线
12、检查是不是有安全软件,设置了一些过滤规则,导致agent无法将数据上报给server
13、如果是在docker部署 server,我们检查下是否把config/application.yml中的守护进程url中的localhost改为宿主机ip了,如下
一般需要改下,除非是docker容器内可以访问http://localhost:9997的话,那就可以不改