Class: Ragdoll::MetadataGenerator

Inherits:

Object

Object
Ragdoll::MetadataGenerator

show all

Defined in:: app/services/ragdoll/metadata_generator.rb

Overview

Service for generating structured metadata using LLM providers Leverages structured output capabilities to ensure consistent metadata schemas

Instance Method Summary collapse

#generate_audio_metadata(document) ⇒ Object

Generate metadata for audio content.
#generate_for_document(document) ⇒ Object

Generate metadata for a document based on its content and type.
#generate_image_metadata(document) ⇒ Object

Generate metadata for image content.
#generate_mixed_metadata(document) ⇒ Object

Generate metadata for mixed/multi-modal content.
#generate_pdf_metadata(document) ⇒ Object

Generate metadata for PDF content.
#generate_text_metadata(document) ⇒ Object

Generate metadata for text content.
#initialize(llm_client: nil) ⇒ MetadataGenerator constructor

A new instance of MetadataGenerator.

Constructor Details

#initialize(llm_client: nil) ⇒ `MetadataGenerator`

Returns a new instance of MetadataGenerator.



7
8
9

# File 'app/services/ragdoll/metadata_generator.rb', line 7

def initialize(llm_client: nil)
  @llm_client = llm_client || default_llm_client
end

Instance Method Details

#generate_audio_metadata(document) ⇒ `Object`

Generate metadata for audio content

# File 'app/services/ragdoll/metadata_generator.rb', line 55

def generate_audio_metadata(document)
  audio_content = document.audio_contents.first
  return {} unless audio_content

  schema = Ragdoll::MetadataSchemas::AUDIO_SCHEMA

  # Use transcript if available, otherwise analyze audio directly
  prompt = if audio_content.transcript.present?
             build_audio_transcript_analysis_prompt(audio_content.transcript, audio_content.duration)
           else
             # This would require audio-capable models or speech-to-text preprocessing
             build_audio_analysis_prompt(audio_content)
           end

  generate_structured_metadata(prompt, schema)
end

#generate_for_document(document) ⇒ `Object`

Generate metadata for a document based on its content and type

# File 'app/services/ragdoll/metadata_generator.rb', line 12

def generate_for_document(document)
  case document.document_type
  when "text", "markdown", "html"
    generate_text_metadata(document)
  when "image"
    generate_image_metadata(document)
  when "audio"
    generate_audio_metadata(document)
  when "pdf", "docx"
    generate_pdf_metadata(document)
  when "mixed"
    generate_mixed_metadata(document)
  else
    generate_text_metadata(document) # fallback
  end
end

#generate_image_metadata(document) ⇒ `Object`

Generate metadata for image content

# File 'app/services/ragdoll/metadata_generator.rb', line 42

def generate_image_metadata(document)
  # For images, we need to use vision-capable models
  image_content = document.image_contents.first
  return {} unless image_content&.image_attached?

  schema = Ragdoll::MetadataSchemas::IMAGE_SCHEMA
  prompt = build_image_analysis_prompt(image_content)

  # This would use a vision model like GPT-4V, Claude 3, etc.
  generate_structured_metadata(prompt, schema, content_type: "image", image: image_content.image)
end

#generate_mixed_metadata(document) ⇒ `Object`

Generate metadata for mixed/multi-modal content

# File 'app/services/ragdoll/metadata_generator.rb', line 84

def generate_mixed_metadata(document)
  schema = Ragdoll::MetadataSchemas::MIXED_SCHEMA

  # Combine analysis from all content types
  content_summaries = []

  document.text_contents.each do |text|
    content_summaries << { type: "text", content: text.content[0..500] }
  end

  document.image_contents.each do |image|
    content_summaries << { type: "image", description: image.description || "Image content" }
  end

  document.audio_contents.each do |audio|
    content_summaries << { type: "audio", transcript: audio.transcript || "Audio content" }
  end

  prompt = build_mixed_analysis_prompt(content_summaries)
  generate_structured_metadata(prompt, schema)
end

#generate_pdf_metadata(document) ⇒ `Object`

Generate metadata for PDF content

# File 'app/services/ragdoll/metadata_generator.rb', line 73

def generate_pdf_metadata(document)
  text_content = document.text_contents.map(&:content).join("\n\n")
  return {} if text_content.blank?

  schema = Ragdoll::MetadataSchemas::PDF_SCHEMA
  prompt = build_pdf_analysis_prompt(text_content, document.file_metadata)

  generate_structured_metadata(prompt, schema)
end

#generate_text_metadata(document) ⇒ `Object`

Generate metadata for text content

# File 'app/services/ragdoll/metadata_generator.rb', line 30

def generate_text_metadata(document)
  # Combine all text content from the document
  text_content = document.text_contents.map(&:content).join("\n\n")
  return {} if text_content.blank?

  schema = Ragdoll::MetadataSchemas::TEXT_SCHEMA
  prompt = build_text_analysis_prompt(text_content)

  generate_structured_metadata(prompt, schema)
end

Class: Ragdoll::MetadataGenerator

Overview

Instance Method Summary collapse

Constructor Details

#initialize(llm_client: nil) ⇒ MetadataGenerator

Instance Method Details

#generate_audio_metadata(document) ⇒ Object

#generate_for_document(document) ⇒ Object

#generate_image_metadata(document) ⇒ Object

#generate_mixed_metadata(document) ⇒ Object

#generate_pdf_metadata(document) ⇒ Object