您的位置:首页 > 编程语言 > Lua

lua 计算utf8格式的字符串的长度

2016-12-30 11:16 387 查看
获取一个字符串的utf8格式下的长度,并且返回一个存储着每个单字的表

function string.utf8Len(str)
local len = #str
local left = 0
local arr = {0, 0xc0, 0xe0, 0xf0, 0xf8, 0xfc}  
local length = 0
local startNum = 1
local wordLen = 0
local strTb = {}
while left ~= len then
local temp = string.byte(str,startNum)    --将字符串的某个字符转换成十六进制
local i   = #arr
while arr[i] then
if temp >= arr[i] then
left = left + i
break
end
i = i - 1
end
length = length + 1

wordLen = i + wordLen

        local tmpString = string.sub(convertStr, startNum, wordLen)

        startNum = startNum + i

        strTb[#strTb + 1] = tmpString

end

return lenght ,strTb

end

string.char 函数和string.byte函数用来将字符在字符和数字之间转换。string.char获取0个或多个整数,

将每一个数字转换成字符,然后返回一个所有这些字符连接起来的字符串。string.byte(s, i)

将字符串s的第i个字符的转换成整数;第二个参数是可选的,缺省情况下i=1。

下面的例子中,我们假定字符用ASCII表示:

print(string.char(97)) --> a

i = 99; print(string.char(i, i+1, i+2)) --> cde

print(string.byte("abc")) --> 97

print(string.byte("abc", 2)) --> 98

print(string.byte("abc", -1)) --> 99

上面最后一行,我们使用负数索引访问字符串的最后一个字符。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  lua utf-8 utf8