跳转至

LiteLLM 内部文档索引

本目录收录部署、运维、配置相关的补充文档,内容均为上游仓库未覆盖的项目定制细节。


chat-completions — 下游请求参数全景

面向下游应用开发人员,解释 /v1/chat/completions 到底能传哪些字段。


billing-and-pricing — 计费与价格系统

  • README — 整体架构图与两条计费路径速查
  • 01-model-cost-map — 价格 JSON 文件的下载、初始化、本地 backup、热重载与局限
  • 02-pgsql-lifecycle — PostgreSQL 价格数据的存储、加密、启动加载、30s 轮询
  • 03-ui-pricing — UI 价格展示来源、字段优先级、编辑保存 API
  • 04-billing-flow — 路由层计费触发、custom_pricing 判断、UUID/JSON 路径
  • 05-cache-pricing-bugs — Anthropic cache 计费已知 bug、根因与修复配置方法
  • 06-s3-cost-map — 从 S3 兼容存储签名读取 model cost map

trace-id — 全链路追踪(Trace ID / Session ID)

面向接入方与运维:trace_id 怎么传、流到哪里、UI 怎么搜、出问题怎么排。


health-check — 心跳与模型健康巡检

面向运维与开发:proxy 后台对每个上游模型 deployment 的周期性真实推理调用如何工作、怎么压成本、怎么排障。

  • README — 整体架构图、配置项速查、决策树
  • 01-mechanism — 启动入口、主循环、SharedHealthCheckManager 决策流程
  • 02-config-reference — YAML / 环境变量 / model_info 字段全集
  • 03-cost-reduction — 心跳成本三因子 + 推荐组合 + 常见误区
  • 04-troubleshooting — 排障路径、多 Pod fallback 放大 bug、实战案例

prompt-caching — 上游 Prompt Cache 与路由黏性


cooldown — 冷却期与路由避让

  • README — 总览架构图、触发路径速查、决策树
  • 01-mechanism — 触发调用点、白名单、V1/V2 路径、Redis key、TTL 恢复
  • 02-config-reference — YAML / 环境变量 / 单 deployment 配置 / Prometheus 指标
  • 03-best-practices — 推荐 cooldown_time、跟 retry/fallback 叠加、常见误区
  • 04-troubleshooting — 排障路径、状态观测、故障复现验证

errors — 错误体系全链路

面向运维与开发:25 个异常类的语义、上游 status_code 映射、Router 决策、症状反查。和 cooldown/ 互补。


rate-limiting — 限流与额度(quota)