统一日志方案选型

发布一下 2022年05月15日 08:16 0 0

1 方案背景

云原生架构下的日志方案比基于物理机、虚拟机场景的日志架构设计有较大的差异，比如：

1）动态的日志环境，在 kubernetes 集群环境下，应用的弹性伸缩、Pod的销毁和漂移、working节点的上线和下线都是常态，这种情况下日志的存在是瞬间的，伴随着Pod的销毁和漂移日志会被动销毁，因此日志数据需要被实时采集到集中式的存储设备中，同时对于日志采集器在此动态和复杂环境下的扩展性和适配性有新的要求。

2）资源消耗，在原有的传统ELK架构中，基于 JDK 的 Logstash 和 Filebeat 预期分别会消耗500M、12M左右的内存，在微服务、云原生的架构下，服务通常都会拆的很小，因此数据采集对于服务自身的资源消耗要尽可能的少。

3）日志平台的运维代价，运维一套动态环境下的日志采集和日志管理平台是复杂和繁琐的，日志平台应该作为底层基础设施，随业务需要快速部署，并支持水平扩展。

4）便捷的日志分析、日志系统最核心的功能是问题排查，问题排查的速度直接决定了事故响应速度、损失大小。一套可视化、高性能、智能分析的功能可以帮助用户快速定位问题。

核心需求描述：

全局 grep
根据关键字，搜索系统中出现的所有地方
快速定位日志
根据机器名、ip、服务名等条件快速定位日志
主机与云原生统一技术栈
减少使用学习成本，降低系统复杂性

2 方案选型

云原生架构下的日志采集解决方案

编号	方案	优点	缺点
1	每个app的镜像中都集成日志收集组件，如logback-redis-appender	部署方便，kubernetes的yaml文件无须特别配置，可以灵活地为每个app自定义日志采集规则	强耦合，应用侵入式，不方便应用和日志收集组件升级和维护且会导致镜像过大
2	app的Pod内单独创建一个日志采集容器跟app的容器一起运行	低耦合，扩展性强，方便维护和升级	需要对 kubernetes 的yaml文件进行单独配置，略显繁琐
3	以 DaemonSet 方式在每个工作节点上启动一个日志采集的Pod, 将所有的Pod的日志都挂载到宿主机上	完全解耦，性能最高，管理起来最方便	需要统一日志收集规则，目录和输出方式