基础架构部文档
基础架构部文件格式标准参考
技术文档
mr_doc 接入ucenter 认证登录
loki日志收集
https证书与ssl/tls 加密
FTP 主动模式和被动模式的区别
Hadoop-windows10安装部署Hadoop2.7.3
JKS和PFX证书文件格式相互转换方法
KVM 基础操作
k8s nginx ingress日志收集到ELK并分析
Django基础
clash http代理 socks代理服务器搭建 配置
Ubuntu 22.04 安装 FFmpeg v7.0
Office正版化项目的个人体验和心得
重置jenkins构建历史
K8S实施方案
k8s的yaml文件语法
Docker的优势与虚拟机的区别
问题处理文档
HR推送数据问题处理报
Nginx从入门到放弃01-nginx基础安装
Nginx从入门到放弃02-Nginx基本命令和新建WEB站点
Nginx从入门到放弃03-Nginx调优
Nginx从入门到放弃04-Nginx的N种特别实用示例
JMeter教程
01-mariadb编译安装
02-mariadb二进制安装
Docker修改默认的存储路径
01-influxdb2时序数据库简介及安装
02-influxdb2时序数据库核心概念
03-influxdb2时序数据库flux查询语言
04-influxdb2--Python客户端influxdb-client
05-Spring boot 集成influxdb2
06-influxdb2其他知识
OA添加waf后相关问题的解决过程
排除java应用cpu使用率过高
exsi迁移文档
视频测试
阿里云产品试题
超融合服务器和传统服务器的区别
Serv-U问题集锦
文件夹共享操作手册
磁盘脱机处理方案
Office内存或磁盘空间不足处理方法
Cmd中ping不是内部或外部命令的解决方法
ELK 搭建文档
限制用户的远程桌面会话数量
Docker快速安装rocketmq、redis、zookeeper
超融合建设方案
git 入门
HR系统写入ES数据报错403
ELK搭建文档
KVM 安装和基础使用文档
helm 安装 rancher
访问共享提示禁用当前用户解决方法
K8S StorageClass搭建
KVM 扩展磁盘
借助sasl构建基于AD用户验证的SVN服务器
fastdfs编译安装并迁移数据
关闭系统保护的必要性
SCF 前置机部署
阿里云OSS学习文档
阿里云学习文档-VPC
(k8s踩坑)namespace无法删除
rancher-helm安装
zookeeper集群安装
批量替换K8s secrets 中某个特定域名的tls证书
kibana 批量创建索引模式
centos7 恢复Yum使用
ACP云计算部分知识点总结
Loki 日志系统搭建文档
自动更新k8s集群中所有名称空间中特定证书
AI分享
(AI)函数调用与MCP调用的区别
安装戴尔DELL Optilex 7040 USB驱动时提示无法定位程序输入点 kernel32\.dll
新华三服务器EXSI 显卡直通
本文档使用「觅思文档专业版」发布
-
+
首页
Loki 日志系统搭建文档
#### **一、基础环境准备** 1. **配置默认 StorageClass** 确保集群存在可用的存储类(以 `aly-nas-storageclass` 为例): ```bash kubectl-tools patch storageclass aly-nas-storageclass -p '{"metadata": {"annotations": {"storageclass.kubernetes.io/is-default-class":"true"}}}' ``` 2. **创建命名空间** ```bash kubectl-tools create ns loki kubectl-tools create ns loki-logging ``` --- #### **二、部署 Loki 服务** 1. **准备 Values 文件 (**`tqls-prd-values.yaml`**)** 核心配置包括存储后端、索引策略、副本数等: ```yaml loki: schemaConfig: configs: - from: "2024-04-01" store: tsdb object_store: s3 schema: v13 index: prefix: loki_index_ period: 24h storage_config: aws: region: oss-cn-beijing bucketnames: tq-loki-prd s3forcepathstyle: false limits_config: allow_structured_metadata: true volume_enabled: true retention_period: 360h # 28天保留周期 querier: max_concurrent: 4 storage: type: s3 bucketNames: chunks: tq-loki-prd ruler: tq-loki-prd admin: tq-loki-prd s3: endpoint: oss-cn-beijing-internal.aliyuncs.com region: oss-cn-beijing secretAccessKey: QG4ebNSWwSlodIeJv1pB5OFDj83XGW accessKeyId: LTAI5tAMWVqKhKYt7ihPHuEb signatureVersion: v4 s3ForcePathStyle: false deploymentMode: SimpleScalable backend: replicas: 2 read: replicas: 2 write: replicas: 3 minio: enabled: false ``` 2. **安装 Loki** ```bash helm --kubeconfig=/etc/kubernetes-tools/kubeconfig install --values tqls-prd-values.yaml loki -n loki . ``` 3. **配置 Compactor(通过 ConfigMap)** 在 Rancher 中修改 `loki` ConfigMap,添加压缩与清理策略: ```yaml compactor: working_directory: /var/loki compaction_interval: 10m retention_enabled: true retention_delete_delay: 2h retention_delete_worker_count: 150 delete_request_store: s3 ``` 4. 修改镜像地址 将所有镜像的仓库从docker.io 修改为 harbor.tqsys.cn/public/ 启动顺序依次为 ```shell loki-chunks-cache loki-results-cache loki-backend loki-write loki-read loki-gateway 开放主机8080端口 固定在node10.7.8.238上 loki-canary ``` --- #### **三、部署 Promtail 日志采集** 1. **安装 Promtail** ```bash helm --kubeconfig=/etc/kubernetes-tools/kubeconfig upgrade --install loki-promtail -n loki-logging -f promtail-values.yaml . ``` 2. **镜像替换(若使用私有仓库)** 修改 Promtail 的镜像地址为私有仓库: ```yaml image: repository: harbor.tqsys.cn/public/promtail tag: 2.9.3 ``` 3. **修改secret loki-promtail** 配置租户 ID 及 Loki 地址: ```yaml promtail: enabled: true config: clients: - url: http://10.7.8.238:8080/loki/api/v1/push tenant_id: k8s-tools # 根据环境调整(如 k8s-ack、k8s-prd) ``` --- #### **四、部署 Grafana 可视化** 1. **安装 Grafana** ```bash helm --kubeconfig=/etc/kubernetes-tools/kubeconfig install grafana -n loki-logging . ``` 2. **配置数据源** 在 Grafana 中添加 Loki 数据源: - **URL**: `http://10.7.8.238:8080` - **HTTP Header**: `X-Scope-OrgID: k8s-tools`(按环境调整) 3. **访问配置** 创建 Ingress 或 NodePort 暴露 Grafana 服务,获取初始密码: ```bash kubectl-tools get secret --namespace loki-logging loki-promtail-grafana -o jsonpath="{.data.admin-password}" | base64 --decode ``` --- #### **五、多集群日志接入** 1. **ACK 集群** ```bash kubectl-ack create ns loki-logging helm --kubeconfig=/etc/kubernetes-ack/kubeconfig upgrade --install loki-promtail -n loki-logging -f promtail-values.yaml . ``` - 修改 `tenant_id: k8s-ack` 2. **PRD 集群** ```bash kubectl-prd create ns loki-logging helm --kubeconfig=/etc/kubernetes-prd/kubeconfig upgrade --install loki-promtail -n loki-logging -f promtail-values.yaml . ``` - 修改 `tenant_id: k8s-prd` --- #### **六、验证与维护** 1. **组件状态检查** ```bash kubectl-tools get pods -n loki # 检查 Loki 组件 kubectl-tools get pods -n loki-logging # 检查 Promtail 和 Grafana ``` 2. **日志查询测试** 在 Grafana Explore 界面选择对应租户 ID,使用 LogQL 查询日志(如 `{namespace="default"}`)。 3. **维护注意事项** - **避免 Helm 覆盖**:不同环境的 Helm Release 名称需唯一(如 `loki-promtail-ack`)。 - **存储清理**:通过 Compactor 策略自动清理过期日志。 - **监控告警**:集成 Prometheus 监控 Loki/Promtail 资源使用。
杨超
2025年4月1日 08:40
转发文档
收藏文档
上一篇
下一篇
手机扫码
复制链接
手机扫一扫转发分享
复制链接
Markdown文件
Word文件
PDF文档
PDF文档(打印)
分享
链接
类型
密码
更新密码
有效期