监控与分析
DeepSeek 提供全面的监控和分析工具,帮助您了解 API 使用情况、性能指标和成本分析。
使用情况监控
实时监控面板
访问 DeepSeek 控制台 查看实时监控数据:
- API 调用次数: 实时和历史调用统计
- 响应时间: 平均响应时间和延迟分布
- 成功率: API 调用成功率和错误统计
- 并发连接: 当前活跃连接数
关键指标
指标 | 描述 | 单位 |
---|---|---|
QPS | 每秒查询数 | 次/秒 |
延迟 | 平均响应时间 | 毫秒 |
可用性 | 服务可用率 | 百分比 |
错误率 | 请求错误比例 | 百分比 |
性能分析
响应时间分析
javascript
// 监控 API 响应时间
const startTime = Date.now();
const response = await fetch('/api/chat/completions', {
method: 'POST',
headers: { 'Authorization': 'Bearer YOUR_API_KEY' },
body: JSON.stringify(requestData)
});
const responseTime = Date.now() - startTime;
console.log(`API 响应时间: ${responseTime}ms`);
性能优化建议
- 批量处理: 使用批量 API 减少请求次数
- 缓存策略: 缓存常用的响应结果
- 连接复用: 使用 HTTP/2 和连接池
- 地域选择: 选择最近的 API 端点
成本分析
Token 使用统计
- 输入 Token: 请求中的 token 数量
- 输出 Token: 响应中的 token 数量
- 总计费用: 基于 token 使用量的费用
成本优化
python
# 监控 token 使用量
def monitor_token_usage(response):
usage = response.get('usage', {})
prompt_tokens = usage.get('prompt_tokens', 0)
completion_tokens = usage.get('completion_tokens', 0)
total_tokens = usage.get('total_tokens', 0)
print(f"输入 Token: {prompt_tokens}")
print(f"输出 Token: {completion_tokens}")
print(f"总 Token: {total_tokens}")
# 计算成本
cost = calculate_cost(prompt_tokens, completion_tokens)
print(f"本次请求成本: ${cost:.4f}")
告警设置
自定义告警
在控制台中设置自定义告警规则:
- 使用量告警: 当 token 使用量超过阈值时告警
- 错误率告警: 当错误率超过设定值时告警
- 延迟告警: 当响应时间超过预期时告警
- 配额告警: 当接近配额限制时告警
告警通知
支持多种告警通知方式:
- 邮件通知: 发送到指定邮箱
- 短信通知: 发送到手机号码
- Webhook: 发送到自定义 URL
- 钉钉/企业微信: 集成企业通讯工具
日志分析
访问日志
json
{
"timestamp": "2024-01-15T10:30:00Z",
"request_id": "req_123456789",
"method": "POST",
"endpoint": "/v1/chat/completions",
"status_code": 200,
"response_time": 1250,
"tokens": {
"prompt": 50,
"completion": 100,
"total": 150
},
"model": "deepseek-chat",
"user_id": "user_abc123"
}
错误日志
json
{
"timestamp": "2024-01-15T10:35:00Z",
"request_id": "req_987654321",
"error_code": "rate_limit_exceeded",
"error_message": "Rate limit exceeded",
"status_code": 429,
"user_id": "user_def456"
}
报表生成
使用报表
- 日报: 每日使用情况汇总
- 周报: 周度趋势分析
- 月报: 月度成本和使用统计
- 自定义报表: 根据需求生成特定报表
数据导出
支持多种格式的数据导出:
- CSV: 表格数据导出
- JSON: 结构化数据导出
- PDF: 可视化报表导出
- API: 通过 API 获取监控数据
API 监控接口
获取使用统计
bash
curl -X GET "https://api.deepseek.com/v1/usage/statistics" \
-H "Authorization: Bearer YOUR_API_KEY" \
-G -d "start_date=2024-01-01" \
-d "end_date=2024-01-31"
响应示例
json
{
"period": {
"start": "2024-01-01T00:00:00Z",
"end": "2024-01-31T23:59:59Z"
},
"statistics": {
"total_requests": 10000,
"successful_requests": 9950,
"failed_requests": 50,
"total_tokens": 1500000,
"average_response_time": 1200,
"total_cost": 150.00
}
}
最佳实践
监控策略
- 设置合理阈值: 根据业务需求设置告警阈值
- 定期检查: 定期查看监控数据和趋势
- 性能基线: 建立性能基线用于对比分析
- 容量规划: 基于监控数据进行容量规划
故障排查
- 查看错误日志: 分析错误模式和频率
- 检查网络状况: 确认网络连接稳定性
- 验证 API 密钥: 确保密钥有效且权限正确
- 联系技术支持: 必要时联系技术支持团队