Class: ActiveAgent::Providers::Common::Usage

Inherits:

BaseModel

Object
BaseModel
ActiveAgent::Providers::Common::Usage

show all

Defined in:: lib/active_agent/providers/common/usage.rb

Overview

Normalizes token usage statistics across AI providers.

Providers return usage data in different formats with different field names. This model normalizes them into a consistent structure, automatically calculating total_tokens if not provided.

Examples:

Accessing normalized usage data

usage = response.normalized_usage
usage.input_tokens      #=> 100
usage.output_tokens     #=> 25
usage.total_tokens      #=> 125
usage.cached_tokens     #=> 20 (if available)

Provider-specific details

usage.provider_details  #=> { "completion_tokens_details" => {...}, ... }
usage.duration_ms       #=> 5000 (for Ollama)
usage.service_tier      #=> "standard" (for Anthropic)

Instance Attribute Summary collapse

#audio_tokens ⇒ Integer^?

Available from: - OpenAI: sum of prompt_tokens_details.audio_tokens and completion_tokens_details.audio_tokens.
#cache_creation_tokens ⇒ Integer^?

Available from: - Anthropic: cache_creation_input_tokens.
#cached_tokens ⇒ Integer^?

Available from: - OpenAI: prompt_tokens_details.cached_tokens or input_tokens_details.cached_tokens - Anthropic: cache_read_input_tokens.
#duration_ms ⇒ Integer^?

Available from: - Ollama: total_duration (converted from nanoseconds).
#input_tokens ⇒ Integer

Normalized from: - OpenAI Chat/Embeddings: prompt_tokens - OpenAI Responses API: input_tokens - Anthropic: input_tokens - Ollama: prompt_eval_count - OpenRouter: prompt_tokens.
#output_tokens ⇒ Integer

Normalized from: - OpenAI Chat: completion_tokens - OpenAI Responses API: output_tokens - Anthropic: output_tokens - Ollama: eval_count - OpenRouter: completion_tokens - OpenAI Embeddings: 0 (no output tokens).
#provider_details ⇒ Hash

Preserves provider-specific information that doesn’t fit the normalized structure.
#reasoning_tokens ⇒ Integer^?

Available from: - OpenAI Chat: completion_tokens_details.reasoning_tokens - OpenAI Responses: output_tokens_details.reasoning_tokens.
#service_tier ⇒ String^?

Available from: - Anthropic: service_tier (“standard”, “priority”, “batch”).
#total_tokens ⇒ Integer

Automatically calculated as input_tokens + output_tokens if not provided by provider.

Class Method Summary collapse

.calculate_tokens_per_second(tokens, duration_ns) ⇒ Float^?
.convert_nanoseconds_to_ms(nanoseconds) ⇒ Integer^?
.from_anthropic(usage_hash) ⇒ Usage

Creates a Usage object from Anthropic usage data.
.from_ollama(usage_hash) ⇒ Usage

Creates a Usage object from Ollama usage data.
.from_openai_chat(usage_hash) ⇒ Usage

Creates a Usage object from OpenAI Chat Completion usage data.
.from_openai_embedding(usage_hash) ⇒ Usage

Creates a Usage object from OpenAI Embedding API usage data.
.from_openai_responses(usage_hash) ⇒ Usage

Creates a Usage object from OpenAI Responses API usage data.
.from_openrouter(usage_hash) ⇒ Usage

Creates a Usage object from OpenRouter usage data.
.from_provider_usage(usage_hash) ⇒ Usage^?

Auto-detects the provider format and creates a normalized Usage object.

Instance Method Summary collapse

#+(other) ⇒ Usage

Sums all token counts from two Usage objects.
#initialize(attributes = {}) ⇒ Usage constructor

Automatically calculates total_tokens if not provided.

Methods inherited from BaseModel

#<=>, #==, attribute, #deep_compact, #deep_dup, delegate_attributes, drop_attributes, inherited, #inspect, keys, #merge!, required_attributes, #serialize, #to_h, #to_hash

Constructor Details

#initialize(attributes = {}) ⇒ `Usage`

Automatically calculates total_tokens if not provided.

Parameters:

attributes (Hash) (defaults to: {})

Options Hash (attributes):

:input_tokens (Integer)
:output_tokens (Integer)
:total_tokens (Integer) — default: calculated if not provided
:cached_tokens (Integer)
:reasoning_tokens (Integer)
:audio_tokens (Integer)
:cache_creation_tokens (Integer)
:service_tier (String)
:duration_ms (Integer)
:provider_details (Hash)

# File 'lib/active_agent/providers/common/usage.rb', line 123

def initialize(attributes = {})
  super
  # Calculate total_tokens if not provided
  self.total_tokens ||= (input_tokens || 0) + (output_tokens || 0)
end

Instance Attribute Details

#audio_tokens ⇒ `Integer`^?

Available from:

OpenAI: sum of prompt_tokens_details.audio_tokens and completion_tokens_details.audio_tokens

Returns:

(Integer, nil)

80	# File 'lib/active_agent/providers/common/usage.rb', line 80 attribute :audio_tokens, :integer

#cache_creation_tokens ⇒ `Integer`^?

Available from:

Anthropic: cache_creation_input_tokens

Returns:

(Integer, nil)

87	# File 'lib/active_agent/providers/common/usage.rb', line 87 attribute :cache_creation_tokens, :integer

#cached_tokens ⇒ `Integer`^?

Available from:

OpenAI: prompt_tokens_details.cached_tokens or input_tokens_details.cached_tokens
Anthropic: cache_read_input_tokens

Returns:

(Integer, nil)

65	# File 'lib/active_agent/providers/common/usage.rb', line 65 attribute :cached_tokens, :integer

#duration_ms ⇒ `Integer`^?

Available from:

Ollama: total_duration (converted from nanoseconds)

Returns:

(Integer, nil)

101	# File 'lib/active_agent/providers/common/usage.rb', line 101 attribute :duration_ms, :integer

#input_tokens ⇒ `Integer`

Normalized from:

OpenAI Chat/Embeddings: prompt_tokens
OpenAI Responses API: input_tokens
Anthropic: input_tokens
Ollama: prompt_eval_count
OpenRouter: prompt_tokens

Returns:

(Integer)

39	# File 'lib/active_agent/providers/common/usage.rb', line 39 attribute :input_tokens, :integer, default: 0

#output_tokens ⇒ `Integer`

Normalized from:

OpenAI Chat: completion_tokens
OpenAI Responses API: output_tokens
Anthropic: output_tokens
Ollama: eval_count
OpenRouter: completion_tokens
OpenAI Embeddings: 0 (no output tokens)

Returns:

(Integer)

51	# File 'lib/active_agent/providers/common/usage.rb', line 51 attribute :output_tokens, :integer, default: 0

#provider_details ⇒ `Hash`

Preserves provider-specific information that doesn’t fit the normalized structure. Useful for debugging or provider-specific features.

Returns:

(Hash)

108	# File 'lib/active_agent/providers/common/usage.rb', line 108 attribute :provider_details, default: -> { {} }

#reasoning_tokens ⇒ `Integer`^?

Available from:

OpenAI Chat: completion_tokens_details.reasoning_tokens
OpenAI Responses: output_tokens_details.reasoning_tokens

Returns:

(Integer, nil)

73	# File 'lib/active_agent/providers/common/usage.rb', line 73 attribute :reasoning_tokens, :integer

#service_tier ⇒ `String`^?

Available from:

Anthropic: service_tier (“standard”, “priority”, “batch”)

Returns:

(String, nil)

94	# File 'lib/active_agent/providers/common/usage.rb', line 94 attribute :service_tier, :string

#total_tokens ⇒ `Integer`

Automatically calculated as input_tokens + output_tokens if not provided by provider.

Returns:

(Integer)

57	# File 'lib/active_agent/providers/common/usage.rb', line 57 attribute :total_tokens, :integer

Class Method Details

.calculate_tokens_per_second(tokens, duration_ns) ⇒ `Float`^?

Parameters:

tokens (Integer, nil)
duration_ns (Integer, nil)

Returns:

(Float, nil)

# File 'lib/active_agent/providers/common/usage.rb', line 377

def self.calculate_tokens_per_second(tokens, duration_ns)
  return nil unless tokens && duration_ns && duration_ns > 0

  (tokens.to_f / (duration_ns / 1_000_000_000.0)).round(2)
end

.convert_nanoseconds_to_ms(nanoseconds) ⇒ `Integer`^?

Parameters:

nanoseconds (Integer, nil)

Returns:

(Integer, nil)

# File 'lib/active_agent/providers/common/usage.rb', line 368

def self.convert_nanoseconds_to_ms(nanoseconds)
  return nil unless nanoseconds

  (nanoseconds / 1_000_000.0).round
end

.from_anthropic(usage_hash) ⇒ `Usage`

Creates a Usage object from Anthropic usage data.

Examples:

Usage.from_anthropic({
  "input_tokens" => 2095,
  "output_tokens" => 503,
  "cache_read_input_tokens" => 1500,
  "cache_creation_input_tokens" => 2051,
  "service_tier" => "standard"
})

Parameters:

usage_hash (Hash)

Returns:

(Usage)

# File 'lib/active_agent/providers/common/usage.rb', line 257

def self.from_anthropic(usage_hash)
  return nil unless usage_hash

  usage = usage_hash.deep_symbolize_keys

  new(
    **usage.slice(:input_tokens, :output_tokens, :service_tier),
    input_tokens: usage[:input_tokens] || 0,
    output_tokens: usage[:output_tokens] || 0,
    cached_tokens: usage[:cache_read_input_tokens],
    cache_creation_tokens: usage[:cache_creation_input_tokens],
    provider_details: usage.slice(:cache_creation, :server_tool_use).compact
  )
end

.from_ollama(usage_hash) ⇒ `Usage`

Creates a Usage object from Ollama usage data.

Examples:

Usage.from_ollama({
  "prompt_eval_count" => 50,
  "eval_count" => 25,
  "total_duration" => 5000000000,
  "load_duration" => 1000000000
})

Parameters:

usage_hash (Hash)

Returns:

(Usage)

# File 'lib/active_agent/providers/common/usage.rb', line 284

def self.from_ollama(usage_hash)
  return nil unless usage_hash

  usage = usage_hash.deep_symbolize_keys

  new(
    input_tokens: usage[:prompt_eval_count] || 0,
    output_tokens: usage[:eval_count] || 0,
    duration_ms: convert_nanoseconds_to_ms(usage[:total_duration]),
    provider_details: {
      load_duration_ms: convert_nanoseconds_to_ms(usage[:load_duration]),
      prompt_eval_duration_ms: convert_nanoseconds_to_ms(usage[:prompt_eval_duration]),
      eval_duration_ms: convert_nanoseconds_to_ms(usage[:eval_duration]),
      tokens_per_second: calculate_tokens_per_second(usage[:eval_count], usage[:eval_duration])
    }.compact
  )
end

.from_openai_chat(usage_hash) ⇒ `Usage`

Creates a Usage object from OpenAI Chat Completion usage data.

Examples:

Usage.from_openai_chat({
  "prompt_tokens" => 100,
  "completion_tokens" => 25,
  "total_tokens" => 125,
  "prompt_tokens_details" => { "cached_tokens" => 20 },
  "completion_tokens_details" => { "reasoning_tokens" => 3 }
})

Parameters:

usage_hash (Hash)

Returns:

(Usage)

# File 'lib/active_agent/providers/common/usage.rb', line 168

def self.from_openai_chat(usage_hash)
  return nil unless usage_hash

  usage = usage_hash.deep_symbolize_keys
  prompt_details = usage[:prompt_tokens_details] || {}
  completion_details = usage[:completion_tokens_details] || {}

  audio_sum = [
    prompt_details[:audio_tokens],
    completion_details[:audio_tokens]
  ].compact.sum

  new(
    **usage.slice(:total_tokens),
    input_tokens: usage[:prompt_tokens] || 0,
    output_tokens: usage[:completion_tokens] || 0,
    cached_tokens: prompt_details[:cached_tokens],
    reasoning_tokens: completion_details[:reasoning_tokens],
    audio_tokens: audio_sum > 0 ? audio_sum : nil,
    provider_details: usage.slice(:prompt_tokens_details, :completion_tokens_details).compact
  )
end

.from_openai_embedding(usage_hash) ⇒ `Usage`

Creates a Usage object from OpenAI Embedding API usage data.

Examples:

Usage.from_openai_embedding({
  "prompt_tokens" => 8,
  "total_tokens" => 8
})

Parameters:

usage_hash (Hash)

Returns:

(Usage)

# File 'lib/active_agent/providers/common/usage.rb', line 201

def self.from_openai_embedding(usage_hash)
  return nil unless usage_hash

  usage = usage_hash.deep_symbolize_keys

  new(
    **usage.slice(:total_tokens),
    input_tokens: usage[:prompt_tokens] || 0,
    output_tokens: 0, # Embeddings don't generate output tokens
    provider_details: usage.except(:prompt_tokens, :total_tokens)
  )
end

.from_openai_responses(usage_hash) ⇒ `Usage`

Creates a Usage object from OpenAI Responses API usage data.

Examples:

Usage.from_openai_responses({
  "input_tokens" => 150,
  "output_tokens" => 75,
  "total_tokens" => 225,
  "input_tokens_details" => { "cached_tokens" => 50 },
  "output_tokens_details" => { "reasoning_tokens" => 10 }
})

Parameters:

usage_hash (Hash)

Returns:

(Usage)

# File 'lib/active_agent/providers/common/usage.rb', line 227

def self.from_openai_responses(usage_hash)
  return nil unless usage_hash

  usage = usage_hash.deep_symbolize_keys
  input_details = usage[:input_tokens_details] || {}
  output_details = usage[:output_tokens_details] || {}

  new(
    **usage.slice(:input_tokens, :output_tokens, :total_tokens),
    input_tokens: usage[:input_tokens] || 0,
    output_tokens: usage[:output_tokens] || 0,
    cached_tokens: input_details[:cached_tokens],
    reasoning_tokens: output_details[:reasoning_tokens],
    provider_details: usage.slice(:input_tokens_details, :output_tokens_details).compact
  )
end

.from_openrouter(usage_hash) ⇒ `Usage`

Creates a Usage object from OpenRouter usage data.

OpenRouter uses the same format as OpenAI Chat Completion.

Examples:

Usage.from_openrouter({
  "prompt_tokens" => 14,
  "completion_tokens" => 4,
  "total_tokens" => 18
})

Parameters:

usage_hash (Hash)

Returns:

(Usage)



315
316
317

# File 'lib/active_agent/providers/common/usage.rb', line 315

def self.from_openrouter(usage_hash)
  from_openai_chat(usage_hash)
end

.from_provider_usage(usage_hash) ⇒ `Usage`^?

Note:

Detection is based on hash structure rather than native gem types because we cannot force-load all provider gems. This allows the framework to work with only the gems the user has installed.

Auto-detects the provider format and creates a normalized Usage object.

Examples:

Usage.from_provider_usage(some_usage_hash)

Parameters:

usage_hash (Hash)

Returns:

(Usage, nil)

# File 'lib/active_agent/providers/common/usage.rb', line 330

def self.from_provider_usage(usage_hash)
  return nil unless usage_hash.is_a?(Hash)

  usage = usage_hash.deep_symbolize_keys

  # Detect Ollama by presence of nanosecond duration fields
  if usage.key?(:total_duration)
    from_ollama(usage_hash)
  # Detect Anthropic by presence of cache_creation or service_tier
  elsif usage.key?(:cache_creation) || usage.key?(:service_tier)
    from_anthropic(usage_hash)
  # Detect OpenAI Responses API by input_tokens/output_tokens with details
  elsif usage.key?(:input_tokens) && usage.key?(:input_tokens_details)
    from_openai_responses(usage_hash)
  # Detect OpenAI Chat/OpenRouter by prompt_tokens/completion_tokens
  elsif usage.key?(:completion_tokens)
    from_openai_chat(usage_hash)
  # Detect OpenAI Embedding by prompt_tokens without completion_tokens
  elsif usage.key?(:prompt_tokens)
    from_openai_embedding(usage_hash)
  # Default to raw initialization
  else
    new(usage_hash)
  end
end

Instance Method Details

#+(other) ⇒ `Usage`

Sums all token counts from two Usage objects.

Examples:

usage1 = Usage.new(input_tokens: 100, output_tokens: 50)
usage2 = Usage.new(input_tokens: 75, output_tokens: 25)
combined = usage1 + usage2
combined.input_tokens  #=> 175
combined.output_tokens #=> 75
combined.total_tokens  #=> 250

Parameters:

other (Usage)

Returns:

(Usage)

# File 'lib/active_agent/providers/common/usage.rb', line 141

def +(other)
  return self unless other

  self.class.new(
    input_tokens:          self.input_tokens  + other.input_tokens,
    output_tokens:         self.output_tokens + other.output_tokens,
    total_tokens:          self.total_tokens  + other.total_tokens,
    cached_tokens:         sum_optional(self.cached_tokens,         other.cached_tokens),
    cache_creation_tokens: sum_optional(self.cache_creation_tokens, other.cache_creation_tokens),
    reasoning_tokens:      sum_optional(self.reasoning_tokens,      other.reasoning_tokens),
    audio_tokens:          sum_optional(self.audio_tokens,          other.audio_tokens)
  )
end

Class: ActiveAgent::Providers::Common::Usage

Overview

Examples:

Accessing normalized usage data

Provider-specific details

Instance Attribute Summary collapse

Class Method Summary collapse

Instance Method Summary collapse

Methods inherited from BaseModel

Constructor Details

#initialize(attributes = {}) ⇒ Usage

Instance Attribute Details

#audio_tokens ⇒ Integer?

#cache_creation_tokens ⇒ Integer?

#cached_tokens ⇒ Integer?

#duration_ms ⇒ Integer?

#input_tokens ⇒ Integer

#output_tokens ⇒ Integer

#provider_details ⇒ Hash

#reasoning_tokens ⇒ Integer?

#service_tier ⇒ String?

#total_tokens ⇒ Integer

Class Method Details

.calculate_tokens_per_second(tokens, duration_ns) ⇒ Float?

.convert_nanoseconds_to_ms(nanoseconds) ⇒ Integer?

.from_anthropic(usage_hash) ⇒ Usage

Examples:

.from_ollama(usage_hash) ⇒ Usage

Examples:

.from_openai_chat(usage_hash) ⇒ Usage

Examples:

.from_openai_embedding(usage_hash) ⇒ Usage

Examples:

.from_openai_responses(usage_hash) ⇒ Usage

Examples:

.from_openrouter(usage_hash) ⇒ Usage

Examples:

.from_provider_usage(usage_hash) ⇒ Usage?

Examples:

Instance Method Details

#+(other) ⇒ Usage

Examples:

#initialize(attributes = {}) ⇒ `Usage`

#audio_tokens ⇒ `Integer`^?

#cache_creation_tokens ⇒ `Integer`^?

#cached_tokens ⇒ `Integer`^?

#duration_ms ⇒ `Integer`^?

#input_tokens ⇒ `Integer`

#output_tokens ⇒ `Integer`

#provider_details ⇒ `Hash`

#reasoning_tokens ⇒ `Integer`^?

#service_tier ⇒ `String`^?

#total_tokens ⇒ `Integer`

.calculate_tokens_per_second(tokens, duration_ns) ⇒ `Float`^?

.convert_nanoseconds_to_ms(nanoseconds) ⇒ `Integer`^?

.from_anthropic(usage_hash) ⇒ `Usage`

.from_ollama(usage_hash) ⇒ `Usage`

.from_openai_chat(usage_hash) ⇒ `Usage`

.from_openai_embedding(usage_hash) ⇒ `Usage`

.from_openai_responses(usage_hash) ⇒ `Usage`

.from_openrouter(usage_hash) ⇒ `Usage`

.from_provider_usage(usage_hash) ⇒ `Usage`^?

#+(other) ⇒ `Usage`