List LLM metrics

POST

https://api.respan.ai/api/dashboard/llm-metrics/

POST

/api/dashboard/llm-metrics/

$ curl -X POST https://api.respan.ai/api/dashboard/llm-metrics/ \
>      -H "Authorization: Bearer <respanApiKey>" \
>      -H "Content-Type: application/json" \
>      -d '{}'

200Successful

1 [
2   {
3     "date_group": "2024-04-20T14:00:00Z",
4     "number_of_requests": 1250,
5     "total_cost": 345.75,
6     "total_prompt_tokens": 150000,
7     "total_completion_tokens": 300000,
8     "total_tokens": 450000,
9     "error_count": 15,
10     "error_percentage": 1.2,
11     "average_prompt_tokens": 120,
12     "average_completion_tokens": 240,
13     "average_tokens": 360,
14     "average_cost": 0.28,
15     "average_tps": 15.5,
16     "average_latency": 350.4,
17     "average_ttft": 120.7,
18     "prompt_cache_hit_tokens": 45000,
19     "reasoning_tokens": 50000,
20     "cache_hit_percentage": 10,
21     "requests_per_second": 0.35
22   }
23 ]

Returns LLM usage metrics (requests, tokens, cost, latency, cache hit rate, etc.) bucketed by time_tick (minute / hour / day).

Authentication

AuthorizationBearer

Use your Respan API key for Respan API authentication. Enter only the Respan API key value; clients send Authorization: Bearer <RESPAN_API_KEY>. For /api/responses, OpenAI or Azure OpenAI provider credentials go in Settings -> Providers or the request body credential_override field, not in this auth field.

Query parameters

summary_typeenumOptionalDefaults to all

Preset time range. Use this or explicit start_time / end_time.

datedateOptional

Base date used with summary_type presets.

start_timedatetimeOptional

Optional explicit ISO start time.

end_timedatetimeOptional

Optional explicit ISO end time.

time_tickenumOptionalDefaults to hour

Bucket granularity for time-series responses.

Allowed values:

timezone_offsetdoubleOptionalDefaults to 0

Timezone offset, in hours, used when resolving preset ranges.

fetch_filtersenumOptionalDefaults to true

Whether to include available filter options in the response.

Allowed values:

Request

This endpoint expects an object.

filtersobjectOptional

Filter criteria. See Filters API Reference for operator syntax.

Response

Successful response.

date_groupdatetime

Bucket start time, ISO 8601.

number_of_requestsinteger

total_costdouble

total_prompt_tokensinteger

total_completion_tokensinteger

total_tokensinteger

error_countinteger

error_percentagedouble

average_prompt_tokensinteger

average_completion_tokensinteger

average_tokensinteger

average_costdouble

average_tpsdouble

average_latencydouble

average_ttftdouble

prompt_cache_hit_tokensinteger

reasoning_tokensinteger

cache_hit_percentagedouble

requests_per_seconddouble