Sparkle’s Workshop

ruby and unicode

Posted on December 11, 2006 - Filed Under Uncategorized |

unicode是ruby的痛
习惯了unicode的java转到ruby真是痛苦
也不知道同为CJK地带的ruby作者为什么不重视这个
虽然提供了jcode.rb来处理一些基本的unicode事情,但是并不完美
一下是jcode.rb的基本用法

    require "jcode"
    $KCODE = "u"
    str.each_char
    str.jlength

其实还有更简单的方法,没有必要使用jcode.rb
ruby的正则表达式可以处理unicode
我们可以利用这个来做一些简单的操作

    strs = str.scan(/./mu)
    strs.each
    strs[0,400].join
    strs.length

m就是mutilline
而u就是unicode匹配
我更倾向使用这种方法

Most Commented Posts

Comments

Leave a Reply