Class: Langchain::LLM::Replicate

Inherits:

Object
Base
Langchain::LLM::Replicate

Defined in:: lib/langchain/llm/replicate.rb

Overview

Wrapper around Replicate.com LLM provider

Gem requirements:

gem "replicate-ruby", "~> 0.2.2"

Use it directly:

replicate = Langchain::LLM::Replicate.new(api_key: ENV["REPLICATE_API_KEY"])

Or pass it to be used by a vector search DB:

chroma = Langchain::Vectorsearch::Chroma.new(
  url: ENV["CHROMA_URL"],
  index_name: "...",
  llm: replicate
)

Constant Summary collapse

DEFAULTS =

{
  # TODO: Figure out how to send the temperature to the API
  temperature: 0.01, # Minimum accepted value
  # TODO: Design the interface to pass and use different models
  completion_model_name: "replicate/vicuna-13b",
  embeddings_model_name: "creatorrr/all-mpnet-base-v2",
  dimensions: 384
}.freeze

Instance Attribute Summary

Attributes inherited from Base

#client

Instance Method Summary collapse

#complete(prompt:, **params) ⇒ Langchain::LLM::ReplicateResponse

Generate a completion for a given prompt.
#embed(text:) ⇒ Langchain::LLM::ReplicateResponse (also: #generate_embedding)

Generate an embedding for a given text.
#initialize(api_key:, default_options: {}) ⇒ Replicate constructor

Intialize the Replicate LLM.
#summarize(text:) ⇒ String

Generate a summary for a given text.

Methods inherited from Base

#chat, #default_dimensions

Methods included from DependencyHelper

#depends_on

Constructor Details

#initialize(api_key:, default_options: {}) ⇒ `Replicate`

Intialize the Replicate LLM

Parameters:

api_key (String) —

The API key to use

# File 'lib/langchain/llm/replicate.rb', line 35

def initialize(api_key:, default_options: {})
  depends_on "replicate-ruby", req: "replicate"

  ::Replicate.configure do |config|
    config.api_token = api_key
  end

  @client = ::Replicate.client
  @defaults = DEFAULTS.merge(default_options)
end

Instance Method Details

#complete(prompt:, **params) ⇒ `Langchain::LLM::ReplicateResponse`

Generate a completion for a given prompt

Parameters:

prompt (String) —

The prompt to generate a completion for

Returns:

(Langchain::LLM::ReplicateResponse) —

Reponse object

# File 'lib/langchain/llm/replicate.rb', line 69

def complete(prompt:, **params)
  response = completion_model.predict(prompt: prompt)

  until response.finished?
    response.refetch
    sleep(0.1)
  end

  Langchain::LLM::ReplicateResponse.new(response, model: @defaults[:completion_model_name])
end

#embed(text:) ⇒ `Langchain::LLM::ReplicateResponse` Also known as: generate_embedding

Generate an embedding for a given text

Parameters:

text (String) —

The text to generate an embedding for

Returns:

(Langchain::LLM::ReplicateResponse) —

Response object

# File 'lib/langchain/llm/replicate.rb', line 52

def embed(text:)
  response = embeddings_model.predict(input: text)

  until response.finished?
    response.refetch
    sleep(0.1)
  end

  Langchain::LLM::ReplicateResponse.new(response, model: @defaults[:embeddings_model_name])
end

#summarize(text:) ⇒ `String`

Generate a summary for a given text

Parameters:

text (String) —

The text to generate a summary for

Returns:

(String) —

The summary

# File 'lib/langchain/llm/replicate.rb', line 86

def summarize(text:)
  prompt_template = Langchain::Prompt.load_from_path(
    file_path: Langchain.root.join("langchain/llm/prompts/summarize_template.yaml")
  )
  prompt = prompt_template.format(text: text)

  complete(
    prompt: prompt,
    temperature: @defaults[:temperature],
    # Most models have a context length of 2048 tokens (except for the newest models, which support 4096).
    max_tokens: 2048
  )
end

Class: Langchain::LLM::Replicate

Overview

Constant Summary collapse

Instance Attribute Summary

Attributes inherited from Base

Instance Method Summary collapse

Methods inherited from Base

Methods included from DependencyHelper

Constructor Details

#initialize(api_key:, default_options: {}) ⇒ Replicate

Instance Method Details

#complete(prompt:, **params) ⇒ Langchain::LLM::ReplicateResponse

#embed(text:) ⇒ Langchain::LLM::ReplicateResponse Also known as: generate_embedding

#summarize(text:) ⇒ String

#initialize(api_key:, default_options: {}) ⇒ `Replicate`

#complete(prompt:, **params) ⇒ `Langchain::LLM::ReplicateResponse`

#embed(text:) ⇒ `Langchain::LLM::ReplicateResponse` Also known as: generate_embedding

#summarize(text:) ⇒ `String`