Method: MyMatrix.cp932ize
- Defined in:
- lib/mymatrix.rb
.cp932ize(str) ⇒ Object
CP932範囲外の文字コードを変換する関数。ruby1.9の正規表現(鬼車)のため、1.8では使えない。
1000 1001 1002 1003 1004 1005 1006 1007 1008 1009 1010 1011 1012 1013 1014 1015 1016 1017 1018 1019 1020 1021 1022 1023 1024 1025 1026 1027 1028 1029 1030 1031 1032 1033 1034 1035 1036 1037 1038 |
# File 'lib/mymatrix.rb', line 1000 def self.cp932ize(str) out = str.dup cases = [ #['−', '―'], #MINUS SIGN(U+2212) to FULLWIDTH HYPHEN-MINUS(U+2015)(windows) #↑仕様としては上記が正しいが、運用上MINUS SIGN(U+2212) は FULLWIDTH HYPHEN-MINUS(U+FF0D)に変換する #キー入力時にMacとWindowsで同じ文字コードとなることが望ましいため。 ['〜','~'], #WAVE DASH (U+301C) to FULLWIDTH TILDE(U+FF5E)(windows) ['‖','∥'], #DOUBLE VERTICAL LINE (U+2016, "‖") を PARALLEL TO (U+2225, "∥") に ['—', '―'], #EM DASH (U+2014, "—") を HORIZONTAL BAR (U+2015, "―") に #以下、キー入力を想定した変換。 ['ー', 'ー'], #MacのハイフンF7(google ime)→Windows(googleime):同じ ['ー', 'ー'], #MacのハイフンF8(google ime)→Windows(googleime):同じ ['−', '-'], #MacのハイフンF9[−](google ime)→Windows[-](googleime):違う。MINUS SIGN(U+2212) to FULLWIDTH HYPHEN-MINUS(U+FF0D) ['-', '-'], #MacのハイフンF10(google ime)→Windows(googleime):同じ #ユニコード固有文字:ノーブレークスペース ['[\u00A0]', ' '], #yen ['[\u00A5]', '¥'], # éとè:eの上に´と` ['[\u00E9]', 'e'],['[\u00E8]', 'e'], # todo:よく使う文字(http://www.geocities.jp/laut6/mojibakesetumei/mojibakesetumei2.html より) #spaces ['[\u2000]', ' '],['[\u2001]', ' '],['[\u2002]', ' '],['[\u2003]', ' '],['[\u2004]', ' '],['[\u2005]', ' '],['[\u2006]', ' '],['[\u2007]', ' '],['[\u2008]', ' '],['[\u2009]', ' '],['[\u200A]', ' '],['[\u205F]', ' '], #Japanese Addresses ['鵢崎', 'みさ崎'], ['繫', '繋'], ['萊', '莱'] ] cases.each do |c| out.gsub!(/#{c[0]}/, c[1]) end return out end |