lua 计算utf8格式的字符串的长度
2016-12-30 11:16
387 查看
获取一个字符串的utf8格式下的长度,并且返回一个存储着每个单字的表
function string.utf8Len(str)
local len = #str
local left = 0
local arr = {0, 0xc0, 0xe0, 0xf0, 0xf8, 0xfc}
local length = 0
local startNum = 1
local wordLen = 0
local strTb = {}
while left ~= len then
local temp = string.byte(str,startNum) --将字符串的某个字符转换成十六进制
local i = #arr
while arr[i] then
if temp >= arr[i] then
left = left + i
break
end
i = i - 1
end
length = length + 1
wordLen = i + wordLen
local tmpString = string.sub(convertStr, startNum, wordLen)
startNum = startNum + i
strTb[#strTb + 1] = tmpString
end
return lenght ,strTb
end
string.char 函数和string.byte函数用来将字符在字符和数字之间转换。string.char获取0个或多个整数,
将每一个数字转换成字符,然后返回一个所有这些字符连接起来的字符串。string.byte(s, i)
将字符串s的第i个字符的转换成整数;第二个参数是可选的,缺省情况下i=1。
下面的例子中,我们假定字符用ASCII表示:
print(string.char(97)) --> a
i = 99; print(string.char(i, i+1, i+2)) --> cde
print(string.byte("abc")) --> 97
print(string.byte("abc", 2)) --> 98
print(string.byte("abc", -1)) --> 99
上面最后一行,我们使用负数索引访问字符串的最后一个字符。
function string.utf8Len(str)
local len = #str
local left = 0
local arr = {0, 0xc0, 0xe0, 0xf0, 0xf8, 0xfc}
local length = 0
local startNum = 1
local wordLen = 0
local strTb = {}
while left ~= len then
local temp = string.byte(str,startNum) --将字符串的某个字符转换成十六进制
local i = #arr
while arr[i] then
if temp >= arr[i] then
left = left + i
break
end
i = i - 1
end
length = length + 1
wordLen = i + wordLen
local tmpString = string.sub(convertStr, startNum, wordLen)
startNum = startNum + i
strTb[#strTb + 1] = tmpString
end
return lenght ,strTb
end
string.char 函数和string.byte函数用来将字符在字符和数字之间转换。string.char获取0个或多个整数,
将每一个数字转换成字符,然后返回一个所有这些字符连接起来的字符串。string.byte(s, i)
将字符串s的第i个字符的转换成整数;第二个参数是可选的,缺省情况下i=1。
下面的例子中,我们假定字符用ASCII表示:
print(string.char(97)) --> a
i = 99; print(string.char(i, i+1, i+2)) --> cde
print(string.byte("abc")) --> 97
print(string.byte("abc", 2)) --> 98
print(string.byte("abc", -1)) --> 99
上面最后一行,我们使用负数索引访问字符串的最后一个字符。
相关文章推荐
- Lua实现计算 UTF8 字符串的长度,每一个中文算一个字符
- Lua实现 计算 UTF8 字符串的长度
- Lua 计算 UTF8 字符串的长度,每一个中文算一个字符
- js计算字符串长度,其中中文是utf8格式的
- LUA获取utf8字符串长度
- lua中文字符串长度计算和截取
- [寒江孤叶丶的Cocos2d-x之旅_36]用LUA实现UTF8的字符串基本操作 UTF8字符串长度,UTF8字符串剪裁等
- lua 含中文的字符串处理--分离字符、计算字符数、截取指定长度
- Lua中含中文字符串长度计算
- cocos Lua 计算中英文字符串长度封装接口
- Lua中获取utf8字符串长度的方法和自定义函数
- 在Lua中计算含中文的字符串的长度
- php计算utf8字符串长度
- Lua获取utf8字符串长度和字符串截取并用...代替
- [寒江孤叶丶的Cocos2d-x之旅_36]用LUA实现UTF8的字符串基本操作 UTF8字符串长度,UTF8字符串剪裁等
- php计算字符串长度:utf8编码,包含中文
- 在Lua中计算含中文的字符串的长度
- Javascript扩展String.prototype实现格式金额、格式时间、字符串连接、计算长度、是否包含、日期计算等功能