Module: SPARQL::Grammar::Lexer::UTF_8

Defined in:
lib/sparql/grammar/lexer.rb

Overview

UTF-8 regular expressions for Ruby 1.8.x.

Constant Summary

U_CHARS1 =
Regexp.compile(<<-EOS.gsub(/\s+/, ''))
 \\xC3[\\x80-\\x96]|                (?# [\\u00C0-\\u00D6]|)
 \\xC3[\\x98-\\xB6]|                (?# [\\u00D8-\\u00F6]|)
 \\xC3[\\xB8-\\xBF]|[\\xC4-\\xCB][\\x80-\\xBF]|   (?# [\\u00F8-\\u02FF]|)
 \\xCD[\\xB0-\\xBD]|                (?# [\\u0370-\\u037D]|)
 \\xCD\\xBF|[\\xCE-\\xDF][\\x80-\\xBF]|       (?# [\\u037F-\\u1FFF]|)
 \\xE0[\\xA0-\\xBF][\\x80-\\xBF]|          (?# ...)
 \\xE1[\\x80-\\xBF][\\x80-\\xBF]|          (?# ...)
 \\xE2\\x80[\\x8C-\\x8D]|              (?# [\\u200C-\\u200D]|)
 \\xE2\\x81[\\xB0-\\xBF]|              (?# [\\u2070-\\u218F]|)
 \\xE2[\\x82-\\x85][\\x80-\\xBF]|          (?# ...)
 \\xE2\\x86[\\x80-\\x8F]|              (?# ...)
 \\xE2[\\xB0-\\xBE][\\x80-\\xBF]|          (?# [\\u2C00-\\u2FEF]|)
 \\xE2\\xBF[\\x80-\\xAF]|              (?# ...)
 \\xE3\\x80[\\x81-\\xBF]|              (?# [\\u3001-\\uD7FF]|)
 \\xE3[\\x81-\\xBF][\\x80-\\xBF]|          (?# ...)
 [\\xE4-\\xEC][\\x80-\\xBF][\\x80-\\xBF]|      (?# ...)
 \\xED[\\x80-\\x9F][\\x80-\\xBF]|          (?# ...)
 \\xEF[\\xA4-\\xB6][\\x80-\\xBF]|          (?# [\\uF900-\\uFDCF]|)
 \\xEF\\xB7[\\x80-\\x8F]|              (?# ...)
 \\xEF\\xB7[\\xB0-\\xBF]|              (?# [\\uFDF0-\\uFFFD]|)
 \\xEF[\\xB8-\\xBE][\\x80-\\xBF]|          (?# ...)
 \\xEF\\xBF[\\x80-\\xBD]|              (?# ...)
 \\xF0[\\x90-\\xBF][\\x80-\\xBF][\\x80-\\xBF]|   (?# [\\u{10000}-\\u{EFFFF}])
 [\\xF1-\\xF2][\\x80-\\xBF][\\x80-\\xBF][\\x80-\\xBF]|
 \\xF3[\\x80-\\xAF][\\x80-\\xBF][\\x80-\\xBF]    (?# ...)
EOS
U_CHARS2 =
Regexp.compile(<<-EOS.gsub(/\s+/, ''))
 \\xC2\\xB7|                    (?# \\u00B7|)
 \\xCC[\\x80-\\xBF]|\\xCD[\\x80-\\xAF]|       (?# [\\u0300-\\u036F]|)
 \\xE2\\x80\\xBF|\\xE2\\x81\\x80          (?# [\\u203F-\\u2040])
EOS