可观测性
功能概述:可观测性是iFlow CLI的监控分析系统,提供性能监控、使用分析和调试支持。
学习时间:10-15分钟
前置要求:了解基本的JSON配置,熟悉系统监控概念
什么是可观测性
可观测性是iFlow CLI提供的监控分析系统,让您能够深入了解CLI的性能表现、运行状态和使用情况。通过启用可观测性功能,您可以获得追踪数据、性能指标和结构化日志,从而更好地监控操作、调试问题和优化使用体验。
核心特点
| 特点 | 说明 | 优势 |
|---|---|---|
| 标准化协议 | 基于OpenTelemetry标准构建 | 兼容各种监控后端 |
| 多种数据类型 | 支持追踪、指标、日志三种数据 | 全面的可观测性 |
| 灵活配置 | 支持本地和云端多种输出方式 | 适应不同部署环境 |
| 隐私保护 | 可配置是否记录敏感信息 | 保护用户隐私 |
| 性能优化 | 异步处理,不影响CLI性能 | 无感知监控 |
工作原理
可观测性数据流
CLI操作 → 数据收集 → 数据处理 → 数据输出 → 监控分析
↓
[用户行为] → [追踪记录] → [指标聚合] → [本地/云端] → [性能洞察]
技术架构
- 数据收集:基于OpenTelemetry SDK自动收集性能数据
- 数据处理:结构化处理,支持过滤和聚合
- 数据输出:支持本地文件、OTLP端点、云服务等多种输出
- 隐私保护:可配置的数据脱敏和过滤机制
详细功能说明
配置管理
可观测性功能支持多种灵活的配置方式,主要通过配置文件和环境变量进行管理,CLI标志可以覆盖特定会话的设置。
配置优先级
| 优先级 | 配置方式 | 说明 |
|---|---|---|
| 最高 | CLI标志 | 临时覆盖当前会话 |
| 高 | 环境变量 | 全局环境配置 |
| 中 | 项目配置 | .iflow/settings.json |
| 低 | 用户配置 | ~/.iflow/settings.json |
| 最低 | 默认值 | 系统默认设置 |
CLI标志参数
| 参数 | 功能 | 示例 |
|---|---|---|
--telemetry / --no-telemetry | 启用/禁用可观测性 | iflow --telemetry |
--telemetry-target <local|gcp> | 设置输出目标 | iflow --telemetry-target local |
--telemetry-otlp-endpoint <URL> | 设置OTLP端点 | iflow --telemetry-otlp-endpoint http://localhost:4317 |
--telemetry-outfile <path> | 导出到文件 | iflow --telemetry-outfile ./metrics.json |
--telemetry-log-prompts | 记录提示词 | iflow --telemetry-log-prompts |
环境变量
| 变量名 | 作用 | 示例 |
|---|---|---|
OTEL_EXPORTER_OTLP_ENDPOINT | 设置OTLP导出端点 | http://localhost:4317 |
默认设置
| 配置项 | 默认值 | 说明 |
|---|---|---|
telemetry.enabled | false | 默认关闭可观测性 |
telemetry.target | local | 本地输出 |
telemetry.otlpEndpoint | http://localhost:4317 | 本地OTLP端点 |
telemetry.logPrompts | true | 记录提示词 |
配置示例
本地开发环境
在 .iflow/settings.json 中启用本地可观测性:
{
"telemetry": {
"enabled": true,
"target": "gcp"
},
"sandbox": false
}
导出到文件
您可以将所有可观测性数据导出到本地文件,方便进行详细分析和检查。
只需使用 --telemetry-outfile 标志并指定输出文件路径即可开启文件导出功能。注意这个功能需要配合 --telemetry-target=local 使用。
iflow --telemetry --telemetry-target=local --telemetry-outfile=/path/to/telemetry.log "your prompt"
运行 OTEL 收集器
OTEL 收集器是一个强大的服务,负责接收、处理和导出可观测性数据。 CLI 通过高效的 OTLP/gRPC 协议发送数据。
想了解 更多 OTEL 导出器的标准配置?请查看 官方文档 获取详细信息。
本地部署
使用 npm run telemetry -- --target=local 命令可以轻松自动化设置本地可观测性管道,包括自动配置 .iflow/settings.json 文件中的必要设置。脚本会帮您安装 otelcol-contrib(OpenTelemetry 收集器)和 jaeger(用于可视化追踪的 Jaeger UI)。
使用步骤:
-
运行命令: 在仓库根目录执行以下命令:
npm run telemetry -- --target=local脚本会自动为您完成以下工作:
- 按需下载 Jaeger 和 OTEL 组件
- 启动本地 Jaeger 实例
- 启动配置好的 OTEL 收集器来接收 iFlow CLI 数据
- 自动在您的工作区设置中启用可观测性
- 退出时自动禁用可观测性
-
查看追踪: 打开浏览器访问 http://localhost:16686 来使用 Jaeger UI。在这里您可以深入查看 iFlow CLI 操作的详细追踪信息。
-
检查日志和指标: 脚本会将 OTEL 收集器的输出(包括日志和指标)保存到
~/.iflow/tmp/<projectHash>/otel/collector.log。脚本会提供便捷的查看链接和本地命令来跟踪您的可观测性数据。 -
停止服务: 在运行脚本的终端中按
Ctrl+C即可停止 OTEL 收集器和 Jaeger 服务。
日志和指标参考
以下部分详细介绍了 iFlow CLI 生成的日志和指标结构,帮助您更好地理解和分析数据。
- 所有日志和指标都包含
sessionId作为通用标识属性。
日志
日志记录了特定事件的时间戳信息,iFlow CLI 会记录以下重要事件:
-
iflow_cli.config:此事件在启动时发生一次,包含 CLI 的配置。- 属性:
model(字符串)embedding_model(字符串)sandbox_enabled(布尔值)core_tools_enabled(字符串)approval_mode(字符串)api_key_enabled(布尔值 )vertex_ai_enabled(布尔值)code_assist_enabled(布尔值)log_prompts_enabled(布尔值)file_filtering_respect_git_ignore(布尔值)debug_mode(布尔值)mcp_servers(字符串)
- 属性:
-
iflow_cli.user_prompt:此事件在用户提交提示时发生。- 属性:
prompt_lengthprompt(如果log_prompts_enabled配置为false,则排除此属性)auth_type
- 属性:
-
iflow_cli.tool_call:此事件为每个函数调用发生。- 属性:
function_namefunction_argsduration_mssuccess(布尔值)decision(字符串:"accept"、"reject" 或 "modify",如果适用)error(如果适用)error_type(如果适用)
- 属性:
-
iflow_cli.api_request:此事件在向 iFlow API 发出请求时发生。- 属性:
modelrequest_text(如果适用)
- 属性:
-
iflow_cli.api_error:此事件在 API 请求失败时发生。- 属性:
modelerrorerror_typestatus_codeduration_msauth_type
- 属性:
-
iflow_cli.api_response:此事件在收到来自 iFlow API 的响应时发生。- 属性:
modelstatus_codeduration_mserror(可选)input_token_countoutput_token_countcached_content_token_countthoughts_token_counttool_token_countresponse_text(如果适用)auth_type
- 属性:
-
iflow_cli.flash_fallback:此事件在 iFlow CLI 切换到 flash 作为回退时发生。- 属性:
auth_type
- 属性:
-
iflow_cli.slash_command:此事件在用户执行斜杠命令时发生。- 属性:
command(字符串)subcommand(字符串,如果适用)
- 属性:
指标
指标提供了随时间变化的数值化行为测量,iFlow CLI 收集以下关键指标:
-
iflow_cli.session.count(计数器,整数):每次 CLI 启动时递增一次。 -
iflow_cli.tool.call.count(计数器,整数):计算工具调用次数。- 属性:
function_namesuccess(布尔值)decision(字符串:"accept"、"reject" 或 "modify",如果适用)
- 属性:
-
iflow_cli.tool.call.latency(直方图,毫秒):测量工具调用延迟。- 属性:
function_namedecision(字符串:"accept"、"reject" 或 "modify",如果适用)
- 属性:
-
iflow_cli.api.request.count(计数器,整数):计算所有 API 请求。- 属性:
modelstatus_codeerror_type(如果适用)
- 属性:
-
iflow_cli.api.request.latency(直方图,毫秒):测量 API 请求延迟。- 属性:
model
- 属性:
-
iflow_cli.token.usage(计数器,整数):计算使用的令牌数量。- 属性:
modeltype(字符串:"input"、"output"、"thought"、"cache" 或 "tool")
- 属性:
-
iflow_cli.file.operation.count(计数器,整数):计算文件操作次数。- 属性:
operation(字符串:"create"、"read"、"update"):文件操作的类型。lines(整数,如果适用):文件中的行数。mimetype(字符串,如果适用):文件的 MIME 类型。extension(字符串,如果适用):文件的扩展名。
- 属性:
云部署环境
对于云部署,请参考以下平台的可观测性集成指南:
Google Cloud Platform (GCP)
配置示例
{
"telemetry": {
"enabled": true,
"target": "gcp",
"gcpProjectId": "your-project-id",
"gcpServiceAccount": "path/to/service-account.json"
}
}
环境变量设置
export GOOGLE_APPLICATION_CREDENTIALS="path/to/service-account.json"
export GOOGLE_CLOUD_PROJECT="your-project-id"
其他云平台
AWS集成
- 支持通过OTLP协议向AWS X-Ray发送追踪数据
- 可配置CloudWatch指标收集
Azure集成
- 支持Application Insights集成
- 提供Azure Monitor兼容的数据格式