站长资源数据库

使用正则表达式匹配tsql注释语句

整理:jimmy2024/12/23浏览2
简介让我们来看一些例子:复制代码 代码如下:--获取表的count信息select count(*) from T with(nolock)--获取特定值的count信息select count(*) from T with(nolock)where v = '--value'--获取表'T'的c

让我们来看一些例子:

复制代码 代码如下:
--获取表的count信息
select count(*) from T with(nolock)

--获取特定值的count信息
select count(*) from T with(nolock)
where v = '--value'

--获取表'T'的count信息
select count(*) from T with(nolock)

SELECT * from T --获取表T
Where P

我们先来试着给出一个简单的匹配:
复制代码 代码如下:
\-\-[^\r\n]*$

你会发现,它连第二条的SQL也匹配到了,这是不对的。看起来,我们应该排除"'"里面的, 我们再来改改:
复制代码 代码如下:
\-\-[^\'\r\n]{0,}$

还是不对,这下虽然第二条的SQL没有匹配,但连第三条的都不匹配了,看起来还是不对。

那到底怎么样才能真正匹配到所有的SQL注释呢?

首先我们来总结一下SQL注释的一些特点:

1. 以--开头

2. 注释的内容,应该不会被包含在一对''之内

3. 注释应该只会在最后,前面可以可选的出现一些语句

好了,收集到了这些之后,我们最终的SQL注释的语法也出来了:
复制代码 代码如下:
\-\-([^\'\r\n]{0,}(\'[^\'\r\n]{0,}\'){0,1}[^\'\r\n]{0,}){0,}$

这一下,四条SQL的注释全匹配到了,正则表达式太强大了吧。

这个SQL语句有一个小小问题,就是后面不能有一个单的单引号存在,否则就会匹配有问题。(因为人们的习惯对于这种分隔符默认是成双出现的,这个小问题其实也是可以忽略的)