lua的正则表达式匹配英文如何判断只能为中文或英文或中英结合?

如:有一个lua文件中有许多行代码中嘟包含“中文”的地方LuaStudio支持正则表达式匹配英文搜索,那如何才能找出代码中双引号中的中文我说的是双引号中间的中文,这个正则表达式匹配英文应该如何写... 如:有一个lua文件中有许多行代码中都包含 “中文”的地方,LuaStudio支持正则表达式匹配英文搜索那如何才能找出代碼中双引号中的中文?我说的是双引号中间的中文 这个正则表达式匹配英文应该如何写?求大神帮忙公司新出的游戏要发布一个海外蝂本,所以要将代码中的中文全部找出来存到一个文件中然后翻译成英文。
 



意:这个函5261数假设4102你的“中文”是1653GB2312编码如果是UTF-8编码,需偠改一下

PS: 你们公司是哪个公司啊?这样的水平还发布海外版本的游戏不是说你哦,而是你们公司

你对这个回答的评价是?


引号中文嘚引号号只能用中文全角引号英文用半角引号

你对这个回答的评价是?

下载百度知道APP抢鲜体验

使用百度知道APP,立即抢鲜体验你的手機镜头里或许有别人想知道的答案。

}

在OpenResty中同时存在两套正则表达式匹配英文规范: Lua 语言的规范和Nginx的规范,即使您对 Lua 语言中的规范非常熟悉我们仍不建议使用 Lua 中的正则表达式匹配英文。一是因为 Lua 中正则表達式匹配英文的性能并不如 Nginx 中的正则表达式匹配英文优秀;二是 Lua 中的正则表达式匹配英文并不符合 POSIX 规范而 Nginx 中实现的是标准的 POSIX 规范,后者奣显更具备通用性

Lua 中的正则表达式匹配英文与Nginx中的正则表达式匹配英文相比,有5%-15%的性能损失而且Lua将表达式编译成Pattern之后,并不会将Pattern缓存而是每此使用都重新编译一遍,潜在地降低了性能 Nginx 中的正则表达式匹配英文可以通过参数缓存编译过后的Pattern,不会有类似的性能损失

o選项参数用于提高性能,指明该参数之后被编译的Pattern将会在worker进程中缓存,并且被当前worker进程的每次请求所共享Pattern缓存的上限值通过lua_regex_cache_max_entries来修改。


 

呮有第一次匹配的结果被返回如果没有匹配,则返回nil;或者匹配过程中出现错误时也会返回nil,此时错误信息会被保存在err中

当匹配的芓符串找到时,一个Lua table captures会被返回captures[0]中保存的就是匹配到的字串,captures[1]保存的是用括号括起来的第一个子模式的结果captures[2]保存的是第二个子模式的结果,依次类似

上面例子中,匹配的字符串是1234因此m[0] == "1234",但是没有用括号括起来的子模式因此,m[1]m[2]等均为nil。

命名方式的捕获从v0.7.14版本后开始支持,如下所示:

例2中为什么m[1]等于nil?因为在给定的模式串中最先匹配的是hello,因此其他子模式在找到的匹配串中查找不到对应的匹配串,因此除了hello子模式外,其他的子模式的匹配结果都是nil一定要记住,是谁最先被匹配的

options选项可以是下面的取值的组合:

a 锚定模式,只从头开始匹配. 
d DFA模式或者称最长字符串匹配语义,需要PCRE 6.0+支持.
D 允许重复的命名的子模式该选项需要PCRE 8.12+支持,例如
i 大小写不敏感模式.
 为了達到最佳性能该选项总是应该和'o'选项搭配使用. 
o 一次编译模式,启用worker-process级别的编译正则表达式匹配英文的缓存.

第四个可选参数ctx可以传入一个Lua Table传入的Lua Table可以是一个空表,也可以是包含pos字段的Lua Table如果传入的是一个空的Lua Table,那么ngx.re.match将会从subject字符串的起始位置开始匹配查找,查找到匹配串後修改pos的值为匹配字符串的下一个位置的值,并将pos的值保存到ctx中如果匹配失败,那么pos的值保持不变;如果传入的是一个非空的Lua Table即指萣了pos的初值,那么ngx.re.match将会从指定的pos的位置开始进行匹配如果匹配成功了,修改pos的值为匹配字符串的下一个位置的值并将pos的值保存到ctx中,洳果匹配失败那么pos的值保持不变。

如果需要传入ctx参数但并不需要第三个可选参数options时,第三个参数也不能简单去掉这时需要传入一个涳的字符串作为第三个参数的值。

第四个可选参数还不是很熟悉暂且留空。

该方法与ngx.re.match方法基本类似不同的地方在于ngx.re.find返回的是匹配的字串的起始位置索引和结束位置索引,如果没有匹配成功那么将会返回两个nil,如果匹配出错还会返回错误信息到err中。

该方法相比ngx.re.match不会創建新的Lua字符串,也不会创建新的Lua Table因此,该方法比ngx.re.match更加高效因此,在可以使用ngx.re.find的地方应该尽量使用

第五个参数可以指定返回第几个孓模式串的起始位置和结束位置的索引值,默认值是0此时将会返回匹配的整个字串;如果nth等于1,那么将返回第一个子模式串的始末位置嘚索引值;如果nth等于2那么将返回第二个子模式串的始末位置的索引值,依次类推如果nth指定的子模式没有匹配成功,那么将会返回两个nil

与ngx.re.match相似,区别在于该方法返回的是一个Lua的迭代器这样就可以通过迭代器遍历所有匹配的结果。

如果匹配失败将会返回nil,如果匹配出現错误那么还会返回错误信息到err中。


更多情时候只需要把迭代过程放入一个while循环中即可:
 
 

ngx.re.gmatch返回的迭代器只能在一个请求所在的环境中使用,就是说我们不能把返回的迭代器赋值给持久存在的命名空间(比如一个Lua Packet)中的某一个变量。

该方法主要实现匹配字符串的替换會用replace替换匹配的字串,replace可以是纯字符串也可以是使用0,1等子模式串的形式,ngx.re.sub返回进行替换后的完整的字符串同时返回替换的总个数;options选項,与ngx.re.match中的options选项是一样的

在上面例子中,01表示第一个子模式匹配的字串,以此类推

可以用大括号{}将相应的0,12…括起来,以区分一般的数字:

如果想在replace字符串中显示进行转义(不要用反斜杠$对美元符号进行转义,这种方法不会得到期朢的结果):

通过函数形式返回的替换字符串中的美元符号$不再是特殊字符而只是被看作一个普通字符。

该方法与ngx.re.sub是类似的但是该方法进行的是全局替换。

}

贴一段匹配中英文混合输入的代碼

flytip("抱歉您输入的内容含有非法字符或屏蔽词,请重新输入")
flytip("抱歉,您输入的字符长度有误请重新输入。")
flytip("抱歉您输入的内容含有非法芓符或屏蔽词,请重新输入")

1:反射的概念 反射是指一类应用,它们能够自描述和自控制.也就是说,这类应用通过采用某种机制来实现对自己行為的描述(self-representation)和监测(examination),并能根据自 ... ...

1.申请的内存所在位置 自由存储区(free store)是C++基于new操作符的一个抽象概念,凡是new进行内存申请,该内存为自由存储区.堆是操作系统中的术语,是操作系统所维护的一块特殊内存,用于 ... ...

正常操作发现报标题错误,百度后解决思路如下(@参考文章)转到选项下面,勾选覆盖现有数據库即可 ...

目录 组队后的团队项目的整体计划安排 项目logo及思维导图 项目logo 思维导图 产品思维导图 产品思维导图-引导 产品思维导图-后端数据处理.存储 产品思维导图-短信识别 产品思维导图-智能分析 ... ...

}

我要回帖

更多关于 正则表达式匹配英文 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信