RubyDoc.info: Class: MixTokenizer – Documentation for mix-language (1.0.2)

#access! ⇒ `Object`



11
12
13

# File 'lib/ruby/new_tokenizer.rb', line 11

def access!
  @state = :access
end

#access? ⇒ `Boolean`

Returns:

(Boolean)



7
8
9

# File 'lib/ruby/new_tokenizer.rb', line 7

def access?
  @state == :access
end

#access_token ⇒ `Object`



15
16
17

# File 'lib/ruby/new_tokenizer.rb', line 15

def access_token
  add_token '·' + @token
end

#add_token(token, value = token) ⇒ `Object`



19
20
21

# File 'lib/ruby/new_tokenizer.rb', line 19

def add_token (token, value = token)
  @token_stream << [token, [value, [@filename, @line]]]
end

#adjust_indent ⇒ `Object`

# File 'lib/ruby/new_tokenizer.rb', line 23

def adjust_indent
  current_indent = @token.length
  previous_indent = @indent_stack.last
  
  if current_indent > previous_indent
    indent_token
  elsif current_indent < previous_indent
    unless @indent_stack.include?(current_indent)
      raise SyntaxError, "Indent error: #{@filename}:#{@line}"
    end
    
    outdent_token until @indent_stack.last == current_indent
  end
end

#comparison_token ⇒ `Object`



38
39
40

# File 'lib/ruby/new_tokenizer.rb', line 38

def comparison_token
  add_token @token + '='
end

#double_token? ⇒ `Boolean`

Returns:

(Boolean)

# File 'lib/ruby/new_tokenizer.rb', line 42

def double_token?
  lookahead?(@token) do
    @token *= 2
    yield
  end
end

#getch ⇒ `Object`



7
8
9

# File 'lib/ruby/tokenizer.rb', line 7

def getch
  @script[@pointer += 1]
end

#handle_token ⇒ `Object`

# File 'lib/ruby/new_tokenizer.rb', line 53

def handle_token
  case @token
    when ?~
      lookahead?(?~) { skip_to_end_of_line } || skip_whitespace
    
    when ' ', ?\t
      no_access!
    
    when ?\n
      return if line_empty?
      
      @token = ''
      scan_token(/ /)
      return if lookahead?(?\n) { @empty_lines += 1; unscan }
      
      newline_token
      adjust_indent
    
    when ??, ?., ?;, ?,, ?(, ?{
      no_access!
      plain_token
    
    when ?], ?}, ?)
      access!
      plain_token
    
    when ?[, ?:, ?#
      (access?) ? access_token : plain_token
      no_access!
    
    when ?!, ?=
      no_access!
      lookahead?(?=) { comparison_token } || plain_token
    
    when ?+, ?*, ?/, ?%
      no_access!
      lookahead?(?=) { operator_assignment_token } || plain_token
    
    when ?-
      return if lookahead?(?=) { operator_assignment_token }
      return if lookahead?(/[0-9]/) { negative_token; unscan }
      
      (unary_minus_possible?) ? unary_minus_token : plain_token
      no_access!
    
    when ?>, ?<
      no_access!
      return if double_token? { lookahead?(?=) { operator_assignment_token } || plain_token }
      lookahead?(?=) { comparison_token } || plain_token
    
    when ?&, ?|
      no_access!
      return if double_token? { lookahead?(?=) { operator_assignment_token } || plain_token }
      plain_token
    
    when /[0-9]/
      access!
      scan_token(/\./)
      scan_token(/[0-9]/)
      number_token
    
    when /[A-Z]/
      no_access!
      scan_token(/[_a-zA-Z0-9]/)
      mixin_token
    
    when ?'
      access!
      @token = ""
      scan_token(/[^']/)
      getch
      
      lookahead?(?:) do
        return if lookahead?(/[^a-z]/) do
          no_access!
          key_token
        end
      end
      
      string_token
    
    when /[_a-z]/
      access!
      scan_token(/[_a-zA-Z0-9]/)
      scan_token(/[?!]/)
      
      lookahead?(?:) do
        return if lookahead?(/[^a-z]/) do
          no_access!
          key_token
        end
      end
      
      (keyword?) ? keyword_token : identifier_token
      
      case @token = getch
        when ?:, ?#
          access_token
        when ?[
          access_token
          no_access!
        else
          unscan
      end
    
    else
      raise SyntaxError, "Invalid token `#{@token}': #{@filename}:#{@line}"
  end
end

#identifier_token ⇒ `Object`



163
164
165

# File 'lib/ruby/new_tokenizer.rb', line 163

def identifier_token
  add_token :IDENTIFIER, @token.to_sym
end

#indent_token ⇒ `Object`

# File 'lib/ruby/new_tokenizer.rb', line 167

def indent_token
  @indent_stack << @token.length
  add_token :INDENT
end

#key_token ⇒ `Object`



172
173
174

# File 'lib/ruby/new_tokenizer.rb', line 172

def key_token
  add_token :KEY, @token.to_sym
end

#keyword? ⇒ `Boolean`

Returns:

(Boolean)

# File 'lib/ruby/new_tokenizer.rb', line 176

def keyword?
  %w|app break case
    elsif else false
    if null return
    self switch true
    unless until while|.include? @token
end

#keyword_token ⇒ `Object`



184
185
186

# File 'lib/ruby/new_tokenizer.rb', line 184

def keyword_token
  add_token @token.upcase.to_sym
end

#line_empty? ⇒ `Boolean`

Returns:

(Boolean)

# File 'lib/ruby/new_tokenizer.rb', line 188

def line_empty?
  if @state == :newline
    @empty_lines += 1
    return true
  end
end

#lookahead?(pattern) ⇒ `Boolean`

Returns:

(Boolean)

# File 'lib/ruby/new_tokenizer.rb', line 211

def lookahead? (pattern)
  if getch =~ Regexp.new(pattern)
    yield
    true
  else
    unscan
    false
  end
end

#mixin_token ⇒ `Object`



195
196
197

# File 'lib/ruby/new_tokenizer.rb', line 195

def mixin_token
  add_token :MIXIN, @token.to_sym
end

#negative_token ⇒ `Object`



199
200
201

# File 'lib/ruby/new_tokenizer.rb', line 199

def negative_token
  add_token :NEGATIVE
end

#newline_token ⇒ `Object`

# File 'lib/ruby/new_tokenizer.rb', line 203

def newline_token
  add_token :NEWLINE
  
  @line += (@empty_lines + 1)
  @empty_lines = 0
  @state = :newline
end

#no_access! ⇒ `Object`



221
222
223

# File 'lib/ruby/new_tokenizer.rb', line 221

def no_access!
  @state = :no_access
end

#number_token ⇒ `Object`



225
226
227

# File 'lib/ruby/new_tokenizer.rb', line 225

def number_token
  add_token :NUMBER, @token.to_i
end

#operator_assignment_token ⇒ `Object`



229
230
231

# File 'lib/ruby/new_tokenizer.rb', line 229

def operator_assignment_token
  add_token '·=', @token
end

#outdent_token ⇒ `Object`

# File 'lib/ruby/new_tokenizer.rb', line 233

def outdent_token
  @indent_stack.pop
  add_token :OUTDENT
end

#plain_token ⇒ `Object`



238
239
240

# File 'lib/ruby/new_tokenizer.rb', line 238

def plain_token
  add_token @token
end

#scan_token(pattern) ⇒ `Object`

# File 'lib/ruby/new_tokenizer.rb', line 242

def scan_token (pattern)
  while (c = getch) =~ pattern
    @token << c
  end
  
  unscan
end

#skip_to_end_of_line ⇒ `Object`

# File 'lib/ruby/new_tokenizer.rb', line 250

def skip_to_end_of_line
  :skip until getch =~ /\n/
  unscan
end

#skip_whitespace ⇒ `Object`

# File 'lib/ruby/new_tokenizer.rb', line 255

def skip_whitespace
  :skip while getch =~ /\s/
  unscan
end

#string_token ⇒ `Object`



260
261
262

# File 'lib/ruby/new_tokenizer.rb', line 260

def string_token
  add_token :STRING, @token
end

#token(token, value = token) ⇒ `Object`



11
12
13

# File 'lib/ruby/tokenizer.rb', line 11

def token (token, value = token)
  @tokens << [token, [value, [@filename, @line]]]
end

#tokenize(filename, script, token_stream) ⇒ `Object`

# File 'lib/ruby/tokenizer.rb', line 15

def tokenize (filename, script, tokens)
  @filename = filename
  @script = script
  @tokens = tokens
  
  @line = 1
  @pointer = -1
  @indent_stack = [0]
  @state = :newline
  
  empty_lines = 0
  
  while c = getch
    case c
      when ?~
        if getch == ?~
          :skip until getch =~ /\n/
          unscan
          next
        end
        
        unscan
        :skip while getch =~ /\s/
        unscan
      
      when ' ', ?\t
        @state = :space if @state == :reference
      
      when ?\n
        if @state == :newline
          empty_lines += 1
          next
        end
        
        current_indent = 0
        previous_indent = @indent_stack.last
        
        while (c = getch) == ' '
          current_indent += 1
        end
        
        unscan
        
        if c == ?\n
          empty_lines += 1
          next
        end
        
        @state = :newline
        token :NEWLINE
        
        @line += (empty_lines + 1)
        empty_lines = 0
        
        if current_indent > previous_indent
          @indent_stack << current_indent
          token :INDENT
        elsif current_indent < previous_indent
          unless @indent_stack.include?(current_indent)
            raise(SyntaxError, "Indent error: #{@filename}:#{@line}")
          end
          
          until @indent_stack.last == current_indent
            @indent_stack.pop
            token :OUTDENT
          end
        end
      
      when ?!, ?=
        @state = :begin
        
        if getch == ?=
          token c + '='
        else
          unscan
          token c
        end
      
      when ?+, ?*, ?/, ?%
        @state = :begin
        
        if getch == ?=
          token '·=', c
        else
          unscan
          token c
        end
      
      when ?-
        if getch == ?=
          token '·=', c
        elsif c =~ /[0-9]/
          token :NEGATIVE
          unscan
        else
          unscan
          
          if @state == :begin || @state == :newline
            token '-·'
          else
            token '-'
          end
        end
        
        @state = :begin
      
      when ??, ?., ?;, ?,, ?(, ?{
        @state = :begin
        token c
      
      when ?'
        @state = :reference
        
        s = ""
        
        until (c = getch) == ?'
          s << c
        end
        
        token :STRING, s
      
      when ?>, ?<
        @state = :begin
        
        if getch == c
          if getch == ?=
            token '·=', c * 2
          else
            unscan
            token c * 2
          end
        else
          unscan
          
          if getch == ?=
            token c + '='
          else
            unscan
            token c
          end
        end
      
      when ?&, ?|
        @state = :begin
        
        if getch == c
          if getch == ?=
            token c + c + '='
          else
            unscan
            token c + c
          end
        else
          unscan
          token c
        end
      
      when /[0-9]/
        @state = :reference
        value = c
        
        while (c = getch) =~ /[0-9]/
          value << c
        end
        
        unscan
        
        token :NUMBER, value.to_i
      
      when ?], ?}, ?)
        @state = :reference
        token c
      
      when ?:, ?[, ?#
        if @state == :reference
          token '·' + c
        else
          token c
        end
        
        @state = :begin
      
      when /[A-Z]/
        @state = :begin
        value = c
        
        while (c = getch) =~ /[_a-zA-Z0-9]/
          value << c
        end
        
        unscan
        
        token :MIXIN, value.to_sym
      
      when /[_a-z]/
        @state = :reference
        value = c
        
        while (c = getch) =~ /[_a-zA-Z0-9]/
          value << c
        end
        
        if c == ?:
          if getch =~ /[a-z]/
            unscan
          else
            @state = :begin
            token :KEY, value.to_sym
            unscan
            next
          end
          
          unscan
        elsif c == ?? || c == ?!
          value << c
        else
          unscan
        end
        
        if %w:
          app break case
          elsif else false if
          null return self
          switch true unless
          until while
        :
        .include?(value)
          token value.upcase.to_sym
        else
          token :IDENTIFIER, value.to_sym
        end
        
        case c = getch
          when ?:, ?#
            token '·' + c
          when ?[
            token '·['
            @state = :begin
          else
            unscan
        end
      
      else
        raise SyntaxError, "Invalid token `#{c}': #{@filename}:#{@line}"
    end
  end
  
  @tokens
end

#unary_minus_possible? ⇒ `Boolean`

Returns:

(Boolean)



279
280
281

# File 'lib/ruby/new_tokenizer.rb', line 279

def unary_minus_possible?
  @state == :begin || @state == :newline
end

#unary_minus_token ⇒ `Object`



283
284
285

# File 'lib/ruby/new_tokenizer.rb', line 283

def unary_minus_token
  add_token '-·'
end

#unscan ⇒ `Object`



265
266
267

# File 'lib/ruby/tokenizer.rb', line 265

def unscan
  @pointer -= 1
end

Class: MixTokenizer

Overview

Instance Method Summary collapse

Instance Method Details

#access! ⇒ `Object`

#access? ⇒ `Boolean`

#access_token ⇒ `Object`

#add_token(token, value = token) ⇒ `Object`

#adjust_indent ⇒ `Object`

#comparison_token ⇒ `Object`

#double_token? ⇒ `Boolean`

#getch ⇒ `Object`

#handle_token ⇒ `Object`

#identifier_token ⇒ `Object`

#indent_token ⇒ `Object`

#key_token ⇒ `Object`

#keyword? ⇒ `Boolean`

#keyword_token ⇒ `Object`

#line_empty? ⇒ `Boolean`

#lookahead?(pattern) ⇒ `Boolean`

#mixin_token ⇒ `Object`

#negative_token ⇒ `Object`

#newline_token ⇒ `Object`

#no_access! ⇒ `Object`

#number_token ⇒ `Object`

#operator_assignment_token ⇒ `Object`

#outdent_token ⇒ `Object`

#plain_token ⇒ `Object`

#scan_token(pattern) ⇒ `Object`

#skip_to_end_of_line ⇒ `Object`

#skip_whitespace ⇒ `Object`

#string_token ⇒ `Object`

#token(token, value = token) ⇒ `Object`

#tokenize(filename, script, token_stream) ⇒ `Object`

#unary_minus_possible? ⇒ `Boolean`

#unary_minus_token ⇒ `Object`

#unscan ⇒ `Object`

Class: MixTokenizer

Overview

Instance Method Summary collapse

Instance Method Details

#access! ⇒ Object

#access? ⇒ Boolean

#access_token ⇒ Object

#add_token(token, value = token) ⇒ Object

#adjust_indent ⇒ Object

#comparison_token ⇒ Object

#double_token? ⇒ Boolean

#getch ⇒ Object

#handle_token ⇒ Object

#identifier_token ⇒ Object

#indent_token ⇒ Object

#key_token ⇒ Object

#keyword? ⇒ Boolean

#keyword_token ⇒ Object

#line_empty? ⇒ Boolean

#lookahead?(pattern) ⇒ Boolean

#mixin_token ⇒ Object

#negative_token ⇒ Object

#newline_token ⇒ Object

#no_access! ⇒ Object

#number_token ⇒ Object

#operator_assignment_token ⇒ Object

#outdent_token ⇒ Object

#plain_token ⇒ Object

#scan_token(pattern) ⇒ Object

#skip_to_end_of_line ⇒ Object

#skip_whitespace ⇒ Object

#string_token ⇒ Object

#token(token, value = token) ⇒ Object

#tokenize(filename, script, token_stream) ⇒ Object

#unary_minus_possible? ⇒ Boolean

#unary_minus_token ⇒ Object

#unscan ⇒ Object

#access! ⇒ `Object`

#access? ⇒ `Boolean`

#access_token ⇒ `Object`

#add_token(token, value = token) ⇒ `Object`

#adjust_indent ⇒ `Object`

#comparison_token ⇒ `Object`

#double_token? ⇒ `Boolean`

#getch ⇒ `Object`

#handle_token ⇒ `Object`

#identifier_token ⇒ `Object`

#indent_token ⇒ `Object`

#key_token ⇒ `Object`

#keyword? ⇒ `Boolean`

#keyword_token ⇒ `Object`

#line_empty? ⇒ `Boolean`

#lookahead?(pattern) ⇒ `Boolean`

#mixin_token ⇒ `Object`

#negative_token ⇒ `Object`

#newline_token ⇒ `Object`

#no_access! ⇒ `Object`

#number_token ⇒ `Object`

#operator_assignment_token ⇒ `Object`

#outdent_token ⇒ `Object`

#plain_token ⇒ `Object`

#scan_token(pattern) ⇒ `Object`

#skip_to_end_of_line ⇒ `Object`

#skip_whitespace ⇒ `Object`

#string_token ⇒ `Object`

#token(token, value = token) ⇒ `Object`

#tokenize(filename, script, token_stream) ⇒ `Object`

#unary_minus_possible? ⇒ `Boolean`

#unary_minus_token ⇒ `Object`

#unscan ⇒ `Object`