详解用 SQL 提取字符串中的字母

263 阅读1分钟

问题描述
我们在进行数据处理时,可能经常需要对不同类型的字符进行抽取。比如一些产品型号,批次之类的会使用字母表示,这个时候该如何提取这些数据呢?

问题分析
不管是字母,还是数字,我们都可以使用相应的匹配规则来抽取出来。但是由于字母是混合在字符串中,我们需要循环对其进行匹配。

具体解法
我们创建一个函数,通过调用这个函数来找出所有的字母。

CREATE FUNCTION dbo.GET_LETTER (@Str VARCHAR(100))
RETURNS VARCHAR(100)
AS
BEGIN
WHILE PATINDEX('%[^a-z]%', @Str) > 0
BEGIN
SET @Str = STUFF(@Str, PATINDEX('%[^a-z]%', @Str), 1, '');
END;
RETURN @Str;
END;
GO

代码解读
上面的解法主要使用了两个函数,PATINDEX函数和STUFF函数

PATINDEX函数

PATINDEX ( '%pattern%' , expression )
返回pattern字符串在表达式expression里第一次出现的位置,起始值从1开始算。
例如
SELECT PATINDEX('%SQL%','SQL数据库开发')
结果:

因为SQL就在第一位,所以返回结果为1

STUFF函数

STUFF ( expression1 , start , length ,expression2 )

字符串expression1 从start位置开始,删除长度为length的字符后,在start后面填充expression2。
例如
SELECT STUFF('SQL,开发',4,1,'数据库')

结果:

上面的示例是将","删除后,替换成了"数据库"

测试函数
理解完上面的函数,我们来测试一下我们自定义的函数GET_LETTER ()

SELECT dbo.GET_LETTER('SQL数1据2库3开4发road')

结果:

这与我们预期的结果一致,证明这个自定义函数是可行的。