Class: Transformers::XlmRoberta::XLMRobertaForTokenClassification

Inherits:

XLMRobertaPreTrainedModel

Object
Torch::NN::Module
PreTrainedModel
XLMRobertaPreTrainedModel
Transformers::XlmRoberta::XLMRobertaForTokenClassification

show all

Defined in:: lib/transformers/models/xlm_roberta/modeling_xlm_roberta.rb

Instance Attribute Summary

Attributes inherited from PreTrainedModel

#config

Instance Method Summary collapse

#forward(input_ids: nil, attention_mask: nil, token_type_ids: nil, position_ids: nil, head_mask: nil, inputs_embeds: nil, labels: nil, output_attentions: nil, output_hidden_states: nil, return_dict: nil) ⇒ Object
#initialize(config) ⇒ XLMRobertaForTokenClassification constructor

A new instance of XLMRobertaForTokenClassification.

Constructor Details

#initialize(config) ⇒ `XLMRobertaForTokenClassification`

Returns a new instance of XLMRobertaForTokenClassification.

# File 'lib/transformers/models/xlm_roberta/modeling_xlm_roberta.rb', line 1080

def initialize(config)
  super(config)
  @num_labels = config.num_labels

  @roberta = XLMRobertaModel.new(config, add_pooling_layer: false)
  classifier_dropout = !config.classifier_dropout.nil? ? config.classifier_dropout : config.hidden_dropout_prob
  @dropout = Torch::NN::Dropout.new(p: classifier_dropout)
  @classifier = Torch::NN::Linear.new(config.hidden_size, config.num_labels)

  # Initialize weights and apply final processing
  post_init
end

Instance Method Details

#forward(input_ids: nil, attention_mask: nil, token_type_ids: nil, position_ids: nil, head_mask: nil, inputs_embeds: nil, labels: nil, output_attentions: nil, output_hidden_states: nil, return_dict: nil) ⇒ `Object`

# File 'lib/transformers/models/xlm_roberta/modeling_xlm_roberta.rb', line 1093

def forward(
  input_ids: nil,
  attention_mask: nil,
  token_type_ids: nil,
  position_ids: nil,
  head_mask: nil,
  inputs_embeds: nil,
  labels: nil,
  output_attentions: nil,
  output_hidden_states: nil,
  return_dict: nil
)
  return_dict = !return_dict.nil? ? return_dict : @config.use_return_dict

  outputs = @roberta.(input_ids, attention_mask: attention_mask, token_type_ids: token_type_ids, position_ids: position_ids, head_mask: head_mask, inputs_embeds: inputs_embeds, output_attentions: output_attentions, output_hidden_states: output_hidden_states, return_dict: return_dict)

  sequence_output = outputs[0]

  sequence_output = @dropout.(sequence_output)
  logits = @classifier.(sequence_output)

  loss = nil
  if !labels.nil?
    # move labels to correct device to enable model parallelism
    labels = labels.to(logits.device)
    loss_fct = Torch::NN::CrossEntropyLoss.new
    loss = loss_fct.(logits.view(-1, @num_labels), labels.view(-1))
  end

  if !return_dict
    output = [logits] + outputs[2..]
    return !loss.nil? ? [loss] + output : output
  end

  TokenClassifierOutput.new(loss: loss, logits: logits, hidden_states: outputs.hidden_states, attentions: outputs.attentions)
end

Class: Transformers::XlmRoberta::XLMRobertaForTokenClassification

Instance Attribute Summary

Attributes inherited from PreTrainedModel

Instance Method Summary collapse

Methods inherited from XLMRobertaPreTrainedModel

Methods inherited from PreTrainedModel

Methods included from ClassAttribute

Methods included from ModuleUtilsMixin

Constructor Details

#initialize(config) ⇒ XLMRobertaForTokenClassification

Instance Method Details

#forward(input_ids: nil, attention_mask: nil, token_type_ids: nil, position_ids: nil, head_mask: nil, inputs_embeds: nil, labels: nil, output_attentions: nil, output_hidden_states: nil, return_dict: nil) ⇒ Object

#initialize(config) ⇒ `XLMRobertaForTokenClassification`

#forward(input_ids: nil, attention_mask: nil, token_type_ids: nil, position_ids: nil, head_mask: nil, inputs_embeds: nil, labels: nil, output_attentions: nil, output_hidden_states: nil, return_dict: nil) ⇒ `Object`