Class: Langchain::Vectorsearch::Elasticsearch

Inherits:

Base

Object
Base
Langchain::Vectorsearch::Elasticsearch

show all

Defined in:: lib/langchain/vectorsearch/elasticsearch.rb

Constant Summary

Constants inherited from Base

Base::DEFAULT_METRIC

Instance Attribute Summary collapse

#es_client ⇒ Object

Wrapper around Elasticsearch vector search capabilities.
#index_name ⇒ Object

Wrapper around Elasticsearch vector search capabilities.
#options ⇒ Object

Wrapper around Elasticsearch vector search capabilities.

Attributes inherited from Base

#client, #llm

Instance Method Summary collapse

#add_texts(texts: []) ⇒ Elasticsearch::Response

Add a list of texts to the index.
#ask(question:, k: 4) {|String| ... } ⇒ String

Ask a question and return the answer.
#create_default_schema ⇒ Elasticsearch::Response

Create the index with the default schema.
#default_query(query_vector) ⇒ Object
#default_schema ⇒ Object
#default_vector_settings ⇒ Object
#delete_default_schema ⇒ Elasticsearch::Response

Deletes the default schema.
#initialize(url:, index_name:, llm:, api_key: nil, es_options: {}) ⇒ Elasticsearch constructor

A new instance of Elasticsearch.
#remove_texts(ids: []) ⇒ Elasticsearch::Response

Remove a list of texts from the index.
#similarity_search(text: "", k: 10, query: {}) ⇒ Elasticsearch::Response

Search for similar texts.
#similarity_search_by_vector(embedding: [], k: 10, query: {}) ⇒ Elasticsearch::Response

Search for similar texts by embedding.
#update_texts(texts: [], ids: []) ⇒ Elasticsearch::Response

Add a list of texts to the index.
#vector_settings ⇒ Object

Methods inherited from Base

#add_data, #destroy_default_schema, #generate_hyde_prompt, #generate_rag_prompt, #get_default_schema, logger_options, #similarity_search_with_hyde

Methods included from DependencyHelper

#depends_on

Constructor Details

#initialize(url:, index_name:, llm:, api_key: nil, es_options: {}) ⇒ `Elasticsearch`

Returns a new instance of Elasticsearch.

# File 'lib/langchain/vectorsearch/elasticsearch.rb', line 34

def initialize(url:, index_name:, llm:, api_key: nil, es_options: {})
  require "elasticsearch"

  @options = {
    url: url,
    request_timeout: 20,
    log: false
  }.merge(es_options)

  @es_client = ::Elasticsearch::Client.new(**options)
  @index_name = index_name

  super(llm: llm)
end

Instance Attribute Details

#es_client ⇒ `Object`

Wrapper around Elasticsearch vector search capabilities.

Setting up Elasticsearch:

Get Elasticsearch up and running with Docker: www.elastic.co/guide/en/elasticsearch/reference/current/docker.html
Copy the HTTP CA certificate SHA-256 fingerprint and set the ELASTICSEARCH_CA_FINGERPRINT environment variable
Set the ELASTICSEARCH_URL environment variable

Gem requirements:

gem "elasticsearch", "~> 8.0.0"

Usage:

llm = Langchain::LLM::OpenAI.new(api_key: ENV["OPENAI_API_KEY"])
es = Langchain::Vectorsearch::Elasticsearch.new(
  url: ENV["ELASTICSEARCH_URL"],
  index_name: "docs",
  llm: llm,
  es_options: {
    transport_options: {ssl: {verify: false}},
    ca_fingerprint: ENV["ELASTICSEARCH_CA_FINGERPRINT"]
  }
)

es.create_default_schema
es.add_texts(texts: ["..."])
es.similarity_search(text: "...")



32
33
34

# File 'lib/langchain/vectorsearch/elasticsearch.rb', line 32

def es_client
  @es_client
end

#index_name ⇒ `Object`

Wrapper around Elasticsearch vector search capabilities.

Setting up Elasticsearch:

Get Elasticsearch up and running with Docker: www.elastic.co/guide/en/elasticsearch/reference/current/docker.html
Copy the HTTP CA certificate SHA-256 fingerprint and set the ELASTICSEARCH_CA_FINGERPRINT environment variable
Set the ELASTICSEARCH_URL environment variable

Gem requirements:

gem "elasticsearch", "~> 8.0.0"

Usage:

llm = Langchain::LLM::OpenAI.new(api_key: ENV["OPENAI_API_KEY"])
es = Langchain::Vectorsearch::Elasticsearch.new(
  url: ENV["ELASTICSEARCH_URL"],
  index_name: "docs",
  llm: llm,
  es_options: {
    transport_options: {ssl: {verify: false}},
    ca_fingerprint: ENV["ELASTICSEARCH_CA_FINGERPRINT"]
  }
)

es.create_default_schema
es.add_texts(texts: ["..."])
es.similarity_search(text: "...")



32
33
34

# File 'lib/langchain/vectorsearch/elasticsearch.rb', line 32

def index_name
  @index_name
end

#options ⇒ `Object`

Wrapper around Elasticsearch vector search capabilities.

Setting up Elasticsearch:

Get Elasticsearch up and running with Docker: www.elastic.co/guide/en/elasticsearch/reference/current/docker.html
Copy the HTTP CA certificate SHA-256 fingerprint and set the ELASTICSEARCH_CA_FINGERPRINT environment variable
Set the ELASTICSEARCH_URL environment variable

Gem requirements:

gem "elasticsearch", "~> 8.0.0"

Usage:

llm = Langchain::LLM::OpenAI.new(api_key: ENV["OPENAI_API_KEY"])
es = Langchain::Vectorsearch::Elasticsearch.new(
  url: ENV["ELASTICSEARCH_URL"],
  index_name: "docs",
  llm: llm,
  es_options: {
    transport_options: {ssl: {verify: false}},
    ca_fingerprint: ENV["ELASTICSEARCH_CA_FINGERPRINT"]
  }
)

es.create_default_schema
es.add_texts(texts: ["..."])
es.similarity_search(text: "...")



32
33
34

# File 'lib/langchain/vectorsearch/elasticsearch.rb', line 32

def options
  @options
end

Instance Method Details

#add_texts(texts: []) ⇒ `Elasticsearch::Response`

Add a list of texts to the index

Parameters:

texts (Array<String>) (defaults to: []) —

The list of texts to add

Returns:

(Elasticsearch::Response) —

from the Elasticsearch server

# File 'lib/langchain/vectorsearch/elasticsearch.rb', line 52

def add_texts(texts: [])
  body = texts.map do |text|
    [
      {index: {_index: index_name}},
      {input: text, input_vector: llm.embed(text: text).embedding}
    ]
  end.flatten

  es_client.bulk(body: body)
end

#ask(question:, k: 4) {|String| ... } ⇒ `String`

Ask a question and return the answer

Parameters:

question (String) —

The question to ask
k (Integer) (defaults to: 4) —

The number of results to have in context

Yields:

(String) —

Stream responses back one String at a time

Returns:

(String) —

The answer to the question

# File 'lib/langchain/vectorsearch/elasticsearch.rb', line 146

def ask(question:, k: 4, &block)
  search_results = similarity_search(query: question, k: k)

  context = search_results.map do |result|
    result[:input]
  end.join("\n---\n")

  prompt = generate_rag_prompt(question: question, context: context)

  messages = [{role: "user", content: prompt}]
  response = llm.chat(messages: messages, &block)

  response.context = context
  response
end

#create_default_schema ⇒ `Elasticsearch::Response`

Create the index with the default schema

Returns:

(Elasticsearch::Response) —

Index creation

# File 'lib/langchain/vectorsearch/elasticsearch.rb', line 91

def create_default_schema
  es_client.indices.create(
    index: index_name,
    body: default_schema
  )
end

#default_query(query_vector) ⇒ `Object`

# File 'lib/langchain/vectorsearch/elasticsearch.rb', line 127

def default_query(query_vector)
  {
    script_score: {
      query: {match_all: {}},
      script: {
        source: "cosineSimilarity(params.query_vector, 'input_vector') + 1.0",
        params: {
          query_vector: query_vector
        }
      }
    }
  }
end

#default_schema ⇒ `Object`

# File 'lib/langchain/vectorsearch/elasticsearch.rb', line 114

def default_schema
  {
    mappings: {
      properties: {
        input: {
          type: "text"
        },
        input_vector: vector_settings
      }
    }
  }
end

#default_vector_settings ⇒ `Object`



106
107
108

# File 'lib/langchain/vectorsearch/elasticsearch.rb', line 106

def default_vector_settings
  {type: "dense_vector", dims: llm.default_dimensions}
end

#delete_default_schema ⇒ `Elasticsearch::Response`

Deletes the default schema

Returns:

(Elasticsearch::Response) —

Index deletion

# File 'lib/langchain/vectorsearch/elasticsearch.rb', line 100

def delete_default_schema
  es_client.indices.delete(
    index: index_name
  )
end

#remove_texts(ids: []) ⇒ `Elasticsearch::Response`

Remove a list of texts from the index

Parameters:

ids (Array<Integer>) (defaults to: []) —

The list of ids to delete

Returns:

(Elasticsearch::Response) —

from the Elasticsearch server

# File 'lib/langchain/vectorsearch/elasticsearch.rb', line 81

def remove_texts(ids: [])
  body = ids.map do |id|
    {delete: {_index: index_name, _id: id}}
  end

  es_client.bulk(body: body)
end

#similarity_search(text: "", k: 10, query: {}) ⇒ `Elasticsearch::Response`

Search for similar texts

Parameters:

text (String) (defaults to: "") —

The text to search for
k (Integer) (defaults to: 10) —

The number of results to return
query (Hash) (defaults to: {}) —

Elasticsearch query that needs to be used while searching (Optional)

Returns:

(Elasticsearch::Response) —

The response from the server

# File 'lib/langchain/vectorsearch/elasticsearch.rb', line 167

def similarity_search(text: "", k: 10, query: {})
  if text.empty? && query.empty?
    raise "Either text or query should pass as an argument"
  end

  if query.empty?
    query_vector = llm.embed(text: text).embedding

    query = default_query(query_vector)
  end

  es_client.search(body: {query: query, size: k}).body
end

#similarity_search_by_vector(embedding: [], k: 10, query: {}) ⇒ `Elasticsearch::Response`

Search for similar texts by embedding

Parameters:

embedding (Array<Float>) (defaults to: []) —

The embedding to search for
k (Integer) (defaults to: 10) —

The number of results to return
query (Hash) (defaults to: {}) —

Elasticsearch query that needs to be used while searching (Optional)

Returns:

(Elasticsearch::Response) —

The response from the server

# File 'lib/langchain/vectorsearch/elasticsearch.rb', line 186

def similarity_search_by_vector(embedding: [], k: 10, query: {})
  if embedding.empty? && query.empty?
    raise "Either embedding or query should pass as an argument"
  end

  query = default_query(embedding) if query.empty?

  es_client.search(body: {query: query, size: k}).body
end

#update_texts(texts: [], ids: []) ⇒ `Elasticsearch::Response`

Add a list of texts to the index

Parameters:

texts (Array<String>) (defaults to: []) —

The list of texts to update
texts (Array<Integer>) (defaults to: []) —

The list of texts to update

Returns:

(Elasticsearch::Response) —

from the Elasticsearch server

# File 'lib/langchain/vectorsearch/elasticsearch.rb', line 67

def update_texts(texts: [], ids: [])
  body = texts.map.with_index do |text, i|
    [
      {index: {_index: index_name, _id: ids[i]}},
      {input: text, input_vector: llm.embed(text: text).embedding}
    ]
  end.flatten

  es_client.bulk(body: body)
end

#vector_settings ⇒ `Object`



110
111
112

# File 'lib/langchain/vectorsearch/elasticsearch.rb', line 110

def vector_settings
  options[:vector_settings] || default_vector_settings
end

Class: Langchain::Vectorsearch::Elasticsearch

Constant Summary

Constants inherited from Base

Instance Attribute Summary collapse

Attributes inherited from Base

Instance Method Summary collapse

Methods inherited from Base

Methods included from DependencyHelper

Constructor Details

#initialize(url:, index_name:, llm:, api_key: nil, es_options: {}) ⇒ Elasticsearch

Instance Attribute Details

#es_client ⇒ Object

#index_name ⇒ Object

#options ⇒ Object

Instance Method Details

#add_texts(texts: []) ⇒ Elasticsearch::Response

#ask(question:, k: 4) {|String| ... } ⇒ String

#create_default_schema ⇒ Elasticsearch::Response

#default_query(query_vector) ⇒ Object

#default_schema ⇒ Object

#default_vector_settings ⇒ Object

#delete_default_schema ⇒ Elasticsearch::Response

#remove_texts(ids: []) ⇒ Elasticsearch::Response

#similarity_search(text: "", k: 10, query: {}) ⇒ Elasticsearch::Response

#similarity_search_by_vector(embedding: [], k: 10, query: {}) ⇒ Elasticsearch::Response

#update_texts(texts: [], ids: []) ⇒ Elasticsearch::Response

#vector_settings ⇒ Object

#initialize(url:, index_name:, llm:, api_key: nil, es_options: {}) ⇒ `Elasticsearch`

#es_client ⇒ `Object`

#index_name ⇒ `Object`

#options ⇒ `Object`

#add_texts(texts: []) ⇒ `Elasticsearch::Response`

#ask(question:, k: 4) {|String| ... } ⇒ `String`

#create_default_schema ⇒ `Elasticsearch::Response`

#default_query(query_vector) ⇒ `Object`

#default_schema ⇒ `Object`

#default_vector_settings ⇒ `Object`

#delete_default_schema ⇒ `Elasticsearch::Response`

#remove_texts(ids: []) ⇒ `Elasticsearch::Response`

#similarity_search(text: "", k: 10, query: {}) ⇒ `Elasticsearch::Response`

#similarity_search_by_vector(embedding: [], k: 10, query: {}) ⇒ `Elasticsearch::Response`

#update_texts(texts: [], ids: []) ⇒ `Elasticsearch::Response`

#vector_settings ⇒ `Object`