Class: Transformers::DebertaV2::DebertaV2ForSequenceClassification

Inherits:

DebertaV2PreTrainedModel

Object
Torch::NN::Module
PreTrainedModel
DebertaV2PreTrainedModel
Transformers::DebertaV2::DebertaV2ForSequenceClassification

show all

Defined in:: lib/transformers/models/deberta_v2/modeling_deberta_v2.rb

Instance Attribute Summary

Attributes inherited from PreTrainedModel

#config

Instance Method Summary collapse

#forward(input_ids: nil, attention_mask: nil, token_type_ids: nil, position_ids: nil, inputs_embeds: nil, labels: nil, output_attentions: nil, output_hidden_states: nil, return_dict: nil) ⇒ Object
#get_input_embeddings ⇒ Object
#initialize(config) ⇒ DebertaV2ForSequenceClassification constructor

A new instance of DebertaV2ForSequenceClassification.
#set_input_embeddings(new_embeddings) ⇒ Object

Constructor Details

#initialize(config) ⇒ `DebertaV2ForSequenceClassification`

Returns a new instance of DebertaV2ForSequenceClassification.

# File 'lib/transformers/models/deberta_v2/modeling_deberta_v2.rb', line 930

def initialize(config)
  super(config)

  num_labels = config.getattr("num_labels", 2)
  @num_labels = num_labels

  @deberta = DebertaV2Model.new(config)
  @pooler = ContextPooler.new(config)
  output_dim = @pooler.output_dim

  @classifier = Torch::NN::Linear.new(output_dim, num_labels)
  drop_out = config.getattr("cls_dropout", nil)
  drop_out = drop_out.nil? ? @config.hidden_dropout_prob : drop_out
  @dropout = StableDropout.new(drop_out)

  # Initialize weights and apply final processing
  post_init
end

Instance Method Details

#forward(input_ids: nil, attention_mask: nil, token_type_ids: nil, position_ids: nil, inputs_embeds: nil, labels: nil, output_attentions: nil, output_hidden_states: nil, return_dict: nil) ⇒ `Object`

# File 'lib/transformers/models/deberta_v2/modeling_deberta_v2.rb', line 957

def forward(
  input_ids: nil,
  attention_mask: nil,
  token_type_ids: nil,
  position_ids: nil,
  inputs_embeds: nil,
  labels: nil,
  output_attentions: nil,
  output_hidden_states: nil,
  return_dict: nil
)
  return_dict = !return_dict.nil? ? return_dict : @config.use_return_dict

  outputs = @deberta.(input_ids, token_type_ids: token_type_ids, attention_mask: attention_mask, position_ids: position_ids, inputs_embeds: inputs_embeds, output_attentions: output_attentions, output_hidden_states: output_hidden_states, return_dict: return_dict)

  encoder_layer = outputs[0]
  pooled_output = @pooler.(encoder_layer)
  pooled_output = @dropout.(pooled_output)
  logits = @classifier.(pooled_output)

  loss = nil
  if !labels.nil?
    if @config.problem_type.nil?
      if @num_labels == 1
        # regression task
        loss_fn = Torch::NN::MSELoss.new
        logits = logits.view(-1).to(labels.dtype)
        loss = loss_fn.(logits, labels.view(-1))
      elsif labels.dim == 1 || labels.size(-1) == 1
        label_index = (labels >= 0).nonzero
        labels = labels.long
        if label_index.size(0) > 0
          labeled_logits = Torch.gather(logits, 0, label_index.expand(label_index.size(0), logits.size(1)))
          labels = Torch.gather(labels, 0, label_index.view(-1))
          loss_fct = Torch::NN::CrossEntropyLoss.new
          loss = loss_fct.(labeled_logits.view(-1, @num_labels).float, labels.view(-1))
        else
          loss = Torch.tensor(0).to(logits)
        end
      else
        log_softmax = Torch::NN::LogSoftmax.new(-1)
        loss = -(log_softmax.(logits) * labels).sum(-1).mean
      end
    elsif @config.problem_type == "regression"
      loss_fct = Torch::NN::MSELoss.new
      if @num_labels == 1
        loss = loss_fct.(logits.squeeze, labels.squeeze)
      else
        loss = loss_fct.(logits, labels)
      end
    elsif @config.problem_type == "single_label_classification"
      loss_fct = Torch::NN::CrossEntropyLoss.new
      loss = loss_fct.(logits.view(-1, @num_labels), labels.view(-1))
    elsif @config.problem_type == "multi_label_classification"
      loss_fct = Torch::NN::BCEWithLogitsLoss.new
      loss = loss_fct.(logits, labels)
    end
  end
  if !return_dict
    output = [logits] + outputs[1..]
    return !loss.nil? ? [loss] + output : output
  end

  SequenceClassifierOutput.new(loss: loss, logits: logits, hidden_states: outputs.hidden_states, attentions: outputs.attentions)
end

#get_input_embeddings ⇒ `Object`



949
950
951

# File 'lib/transformers/models/deberta_v2/modeling_deberta_v2.rb', line 949

def get_input_embeddings
  @deberta.get_input_embeddings
end

#set_input_embeddings(new_embeddings) ⇒ `Object`



953
954
955

# File 'lib/transformers/models/deberta_v2/modeling_deberta_v2.rb', line 953

def set_input_embeddings(new_embeddings)
  @deberta.set_input_embeddings(new_embeddings)
end

Class: Transformers::DebertaV2::DebertaV2ForSequenceClassification

Instance Attribute Summary

Attributes inherited from PreTrainedModel

Instance Method Summary collapse

Methods inherited from DebertaV2PreTrainedModel

Methods inherited from PreTrainedModel

Methods included from ClassAttribute

Methods included from ModuleUtilsMixin

Constructor Details

#initialize(config) ⇒ DebertaV2ForSequenceClassification

Instance Method Details

#forward(input_ids: nil, attention_mask: nil, token_type_ids: nil, position_ids: nil, inputs_embeds: nil, labels: nil, output_attentions: nil, output_hidden_states: nil, return_dict: nil) ⇒ Object

#get_input_embeddings ⇒ Object

#set_input_embeddings(new_embeddings) ⇒ Object

#initialize(config) ⇒ `DebertaV2ForSequenceClassification`

#forward(input_ids: nil, attention_mask: nil, token_type_ids: nil, position_ids: nil, inputs_embeds: nil, labels: nil, output_attentions: nil, output_hidden_states: nil, return_dict: nil) ⇒ `Object`

#get_input_embeddings ⇒ `Object`

#set_input_embeddings(new_embeddings) ⇒ `Object`