Class: Agentic::Learning::StrategyOptimizer

Inherits:

Object

Object
Agentic::Learning::StrategyOptimizer

show all

Defined in:: lib/agentic/learning/strategy_optimizer.rb

Overview

StrategyOptimizer improves execution strategies based on historical performance data. It uses insights from the PatternRecognizer to automatically generate optimized strategies for tasks, agents, and plans.

Examples:

Optimizing a prompt template

history_store = Agentic::Learning::ExecutionHistoryStore.new
recognizer = Agentic::Learning::PatternRecognizer.new(history_store: history_store)
optimizer = Agentic::Learning::StrategyOptimizer.new(
  pattern_recognizer: recognizer,
  history_store: history_store
)

improved_prompt = optimizer.optimize_prompt_template(
  original_template: "Please research the following topic: {topic}",
  agent_type: "research_agent"
)

Instance Method Summary collapse

#apply_optimizations(target, registry) ⇒ Hash

Apply learned optimizations to existing configurations.
#generate_performance_report(agent_type) ⇒ Hash

Generate a performance report for a specific agent type.
#initialize(options = {}) ⇒ StrategyOptimizer constructor

Initialize a new StrategyOptimizer.
#optimize_llm_parameters(original_params, agent_type, options = {}) ⇒ Hash

Optimize LLM parameters based on historical performance.
#optimize_prompt_template(original_template, agent_type, options = {}) ⇒ Hash

Optimize a prompt template based on historical performance.
#optimize_task_sequence(original_sequence, plan_type, options = {}) ⇒ Hash

Optimize task sequence based on historical performance.

Constructor Details

#initialize(options = {}) ⇒ `StrategyOptimizer`

Initialize a new StrategyOptimizer

Parameters:

options (Hash) (defaults to: {}) —

Configuration options

Options Hash (options):

:logger (Logger) —

Custom logger (defaults to Agentic.logger)
:pattern_recognizer (PatternRecognizer) —

Pattern recognizer for insights
:history_store (ExecutionHistoryStore) —

History store for performance data
:llm_client (LlmClient) —

LLM client for generating optimizations (optional)
:optimization_interval_hours (Integer) —

Hours between optimization attempts (defaults to 24)
:auto_apply_optimizations (Boolean) —

Whether to automatically apply optimizations (defaults to false)

# File 'lib/agentic/learning/strategy_optimizer.rb', line 32

def initialize(options = {})
  @logger = options[:logger] || Agentic.logger
  @pattern_recognizer = options[:pattern_recognizer] || raise(ArgumentError, "pattern_recognizer is required")
  @history_store = options[:history_store] || raise(ArgumentError, "history_store is required")
  @llm_client = options[:llm_client]
  @optimization_interval_hours = options[:optimization_interval_hours] || 24
  @auto_apply_optimizations = options.fetch(:auto_apply_optimizations, false)
  @optimization_cache = {}
  @last_optimization = {}
end

Instance Method Details

#apply_optimizations(target, registry) ⇒ `Hash`

Apply learned optimizations to existing configurations

Parameters:

target (Symbol) —

Type of target to optimize (:prompts, :parameters, :sequences)
registry (Hash) —

Registry of current configurations

Returns:

(Hash) —

Results of optimization applications

# File 'lib/agentic/learning/strategy_optimizer.rb', line 188

def apply_optimizations(target, registry)
  results = {}

  case target
  when :prompts
    registry.each do |key, template|
      agent_type = extract_agent_type_from_key(key)
      next unless agent_type

      result = optimize_prompt_template(template, agent_type)
      results[key] = result

      if result[:optimized] && @auto_apply_optimizations
        # Logic to apply optimization to registry would go here
        @logger.info("Auto-applied optimized prompt for #{key}")
      end
    end

  when :parameters
    registry.each do |key, params|
      agent_type = extract_agent_type_from_key(key)
      next unless agent_type

      result = optimize_llm_parameters(params, agent_type)
      results[key] = result

      if result[:optimized] && @auto_apply_optimizations
        # Logic to apply optimization to registry would go here
        @logger.info("Auto-applied optimized parameters for #{key}")
      end
    end

  when :sequences
    registry.each do |key, sequence|
      plan_type = key.to_s

      result = optimize_task_sequence(sequence, plan_type)
      results[key] = result

      if result[:optimized] && @auto_apply_optimizations
        # Logic to apply optimization to registry would go here
        @logger.info("Auto-applied optimized sequence for #{key}")
      end
    end
  end

  results
end

#generate_performance_report(agent_type) ⇒ `Hash`

Generate a performance report for a specific agent type

Parameters:

agent_type (String) —

The agent type to report on

Returns:

(Hash) —

Performance report with metrics and optimization suggestions

# File 'lib/agentic/learning/strategy_optimizer.rb', line 241

def generate_performance_report(agent_type)
  performance = @pattern_recognizer.analyze_agent_performance(agent_type)

  if performance[:insufficient_data]
    return {
      agent_type: agent_type,
      status: :insufficient_data,
      message: "Not enough execution data to generate a meaningful report"
    }
  end

  # Get recommendations
  recommendations = @pattern_recognizer.recommend_optimizations(agent_type)

  {
    agent_type: agent_type,
    status: :complete,
    timestamp: Time.now.iso8601,
    metrics: {
      success_rate: performance[:success_rate][:overall],
      trend: performance[:success_rate][:trend],
      sample_size: performance[:success_rate][:sample_size]
    },
    performance_trends: performance[:performance_trends],
    failure_patterns: performance[:failure_patterns],
    recommendations: recommendations
  }
end

#optimize_llm_parameters(original_params, agent_type, options = {}) ⇒ `Hash`

Optimize LLM parameters based on historical performance

Parameters:

original_params (Hash) —

The original LLM parameters
agent_type (String) —

The agent type using these parameters
options (Hash) (defaults to: {}) —

Optimization options

Options Hash (options):

:force (Boolean) —

Force optimization even if recently optimized
:optimization_strategy (Symbol) —

Strategy to use (:conservative, :balanced, :aggressive)

Returns:

(Hash) —

Optimization result with improved parameters and explanation

# File 'lib/agentic/learning/strategy_optimizer.rb', line 99

def optimize_llm_parameters(original_params, agent_type, options = {})
  cache_key = "params:#{agent_type}:#{Digest::MD5.hexdigest(original_params.to_s)}"

  # Check cache and optimization interval
  unless options[:force]
    if @optimization_cache[cache_key] &&
        @last_optimization[cache_key] &&
        @last_optimization[cache_key] > Time.now - (@optimization_interval_hours * 3600)
      return @optimization_cache[cache_key]
    end
  end

  # Get performance data
  performance = @pattern_recognizer.analyze_agent_performance(agent_type)

  if performance[:insufficient_data]
    @logger.info("Insufficient data to optimize LLM parameters for #{agent_type}")
    return {
      optimized: false,
      reason: "Insufficient performance data",
      original_params: original_params,
      improved_params: original_params.dup
    }
  end

  # Generate optimization
  optimization = generate_optimized_parameters(original_params, agent_type, performance, options)

  # Cache result
  @optimization_cache[cache_key] = optimization
  @last_optimization[cache_key] = Time.now

  optimization
end

#optimize_prompt_template(original_template, agent_type, options = {}) ⇒ `Hash`

Optimize a prompt template based on historical performance

Parameters:

original_template (String) —

The original prompt template
agent_type (String) —

The agent type using this prompt
options (Hash) (defaults to: {}) —

Optimization options

Options Hash (options):

:force (Boolean) —

Force optimization even if recently optimized
:optimization_strategy (Symbol) —

Strategy to use (:conservative, :balanced, :aggressive)
:context (Hash) —

Additional context for optimization

Returns:

(Hash) —

Optimization result with improved template and explanation

# File 'lib/agentic/learning/strategy_optimizer.rb', line 52

def optimize_prompt_template(original_template, agent_type, options = {})
  cache_key = "prompt:#{agent_type}:#{Digest::MD5.hexdigest(original_template)}"

  # Check cache and optimization interval
  unless options[:force]
    if @optimization_cache[cache_key] &&
        @last_optimization[cache_key] &&
        @last_optimization[cache_key] > Time.now - (@optimization_interval_hours * 3600)
      return @optimization_cache[cache_key]
    end
  end

  # Get performance data
  performance = @pattern_recognizer.analyze_agent_performance(agent_type)

  if performance[:insufficient_data]
    @logger.info("Insufficient data to optimize prompt for #{agent_type}")
    return {
      optimized: false,
      reason: "Insufficient performance data",
      original_template: original_template,
      improved_template: original_template
    }
  end

  # Generate optimization
  optimization = if @llm_client
    generate_optimized_prompt_with_llm(original_template, agent_type, performance, options)
  else
    generate_optimized_prompt_heuristic(original_template, agent_type, performance, options)
  end

  # Cache result
  @optimization_cache[cache_key] = optimization
  @last_optimization[cache_key] = Time.now

  optimization
end

#optimize_task_sequence(original_sequence, plan_type, options = {}) ⇒ `Hash`

Optimize task sequence based on historical performance

Parameters:

original_sequence (Array<Hash>) —

Original task sequence
plan_type (String) —

The type of plan
options (Hash) (defaults to: {}) —

Optimization options

Options Hash (options):

:force (Boolean) —

Force optimization even if recently optimized

Returns:

(Hash) —

Optimization result with improved sequence and explanation

# File 'lib/agentic/learning/strategy_optimizer.rb', line 141

def optimize_task_sequence(original_sequence, plan_type, options = {})
  cache_key = "sequence:#{plan_type}:#{Digest::MD5.hexdigest(original_sequence.to_s)}"

  # Check cache and optimization interval
  unless options[:force]
    if @optimization_cache[cache_key] &&
        @last_optimization[cache_key] &&
        @last_optimization[cache_key] > Time.now - (@optimization_interval_hours * 3600)
      return @optimization_cache[cache_key]
    end
  end

  # Get historical plan executions
  end_time = Time.now
  start_time = end_time - (30 * 24 * 60 * 60) # 30 days

  plan_history = @history_store.get_history(
    plan_id: plan_type,
    start_time: start_time,
    end_time: end_time
  )

  if plan_history.size < 5
    @logger.info("Insufficient data to optimize task sequence for #{plan_type}")
    return {
      optimized: false,
      reason: "Insufficient plan execution data",
      original_sequence: original_sequence,
      improved_sequence: original_sequence.dup
    }
  end

  # Generate optimization
  optimization = generate_optimized_sequence(original_sequence, plan_history, options)

  # Cache result
  @optimization_cache[cache_key] = optimization
  @last_optimization[cache_key] = Time.now

  optimization
end

Class: Agentic::Learning::StrategyOptimizer

Overview

Examples:

Optimizing a prompt template

Instance Method Summary collapse

Constructor Details

#initialize(options = {}) ⇒ StrategyOptimizer

Instance Method Details

#apply_optimizations(target, registry) ⇒ Hash

#generate_performance_report(agent_type) ⇒ Hash

#optimize_llm_parameters(original_params, agent_type, options = {}) ⇒ Hash

#optimize_prompt_template(original_template, agent_type, options = {}) ⇒ Hash

#optimize_task_sequence(original_sequence, plan_type, options = {}) ⇒ Hash

#initialize(options = {}) ⇒ `StrategyOptimizer`

#apply_optimizations(target, registry) ⇒ `Hash`

#generate_performance_report(agent_type) ⇒ `Hash`

#optimize_llm_parameters(original_params, agent_type, options = {}) ⇒ `Hash`

#optimize_prompt_template(original_template, agent_type, options = {}) ⇒ `Hash`

#optimize_task_sequence(original_sequence, plan_type, options = {}) ⇒ `Hash`