Class: Rumale::Optimizer::YellowFin

Inherits:

Object

Object
Rumale::Optimizer::YellowFin

show all

Includes:: Base::BaseEstimator

Defined in:: lib/rumale/optimizer/yellow_fin.rb

Overview

YellowFin is a class that implements YellowFin optimizer.

Reference

1. Zhang and I. Mitliagkas, “YellowFin and the Art of Momentum Tuning,” CoRR abs/1706.03471, 2017.

Examples:

optimizer = Rumale::Optimizer::YellowFin.new(learning_rate: 0.01, momentum: 0.9, decay: 0.999, window_width: 20)
estimator = Rumale::LinearModel::LinearRegression.new(optimizer: optimizer, random_seed: 1)
estimator.fit(samples, values)

Instance Attribute Summary

Attributes included from Base::BaseEstimator

#params

Instance Method Summary collapse

#call(weight, gradient) ⇒ Numo::DFloat

Calculate the updated weight with adaptive momentum coefficient and learning rate.
#initialize(learning_rate: 0.01, momentum: 0.9, decay: 0.999, window_width: 20) ⇒ YellowFin constructor

Create a new optimizer with YellowFin.

Constructor Details

#initialize(learning_rate: 0.01, momentum: 0.9, decay: 0.999, window_width: 20) ⇒ `YellowFin`

Create a new optimizer with YellowFin.

Parameters:

learning_rate (Float) (defaults to: 0.01) —

The initial value of learning rate.
momentum (Float) (defaults to: 0.9) —

The initial value of momentum.
decay (Float) (defaults to: 0.999) —

The smooting parameter.
window_width (Integer) (defaults to: 20) —

The sliding window width for searching curvature range.

# File 'lib/rumale/optimizer/yellow_fin.rb', line 27

def initialize(learning_rate: 0.01, momentum: 0.9, decay: 0.999, window_width: 20)
  check_params_float(learning_rate: learning_rate, momentum: momentum, decay: decay)
  check_params_integer(window_width: window_width)
  check_params_positive(learning_rate: learning_rate, momentum: momentum, decay: decay, window_width: window_width)
  @params = {}
  @params[:learning_rate] = learning_rate
  @params[:momentum] = momentum
  @params[:decay] = decay
  @params[:window_width] = window_width
  @smth_learning_rate = learning_rate
  @smth_momentum = momentum
  @grad_norms = nil
  @grad_norm_min = 0.0
  @grad_norm_max = 0.0
  @grad_mean_sqr = 0.0
  @grad_mean = 0.0
  @grad_var = 0.0
  @grad_norm_mean = 0.0
  @curve_mean = 0.0
  @distance_mean = 0.0
  @update = nil
end

Instance Method Details

#call(weight, gradient) ⇒ `Numo::DFloat`

Calculate the updated weight with adaptive momentum coefficient and learning rate.