Module: Translatomatic::EscapedUnicode

Defined in:: lib/translatomatic/escaped_unicode.rb

Overview

Module to encode and decode unicode chars. This code is highly influced by Florian Frank’s JSON gem

Class Method Summary collapse

.escape(text) ⇒ String

Decodes all unicode chars into escape sequences.
.unescape(text) ⇒ String

Decodes all unicode chars from escape sequences.

Class Method Details

.escape(text) ⇒ `String`

Decodes all unicode chars into escape sequences

Parameters:

text (String)

Returns:

(String) —

The decoded text for chaining

# File 'lib/translatomatic/escaped_unicode.rb', line 32

def self.escape(text)
  string = text.dup
  string.force_encoding(::Encoding::ASCII_8BIT)
  string.gsub!(/["\\\x0-\x1f]/n) { |c| MAP[c] || c }
  string.gsub!(/(
    (?:
      [\xc2-\xdf][\x80-\xbf]    |
      [\xe0-\xef][\x80-\xbf]{2} |
      [\xf0-\xf4][\x80-\xbf]{3}
      )+ |
      [\x80-\xc1\xf5-\xff]       # invalid
      )/nx) { |c|
        c.size == 1 and raise t("unicode.invalid_byte", byte: c)
        s = c.encode("utf-16be", "utf-8").unpack('H*')[0]
        s.force_encoding(::Encoding::ASCII_8BIT)
        s.gsub!(/.{4}/n, '\\\\u\&')
        s.force_encoding(::Encoding::UTF_8)
      }
  string.force_encoding(::Encoding::UTF_8)
  text.replace string
  text
end

.unescape(text) ⇒ `String`

Decodes all unicode chars from escape sequences