[每日一题] OCP1z0-047 :2013-07-14正则表达式(三)

2014-11-24 08:53:46 · 作者: · 浏览: 5
字。另一种表达式只允许 9 个连续的数字。竖线符号 (|) 将各个选项分开。
ALTER TABLE students
ADD CONSTRAINT stud_ssn_ck CHECK
(REGEXP_LIKE(ssn,
'^([[:digit:]]{3}-[[:digit:]]{2}-[[:digit:]]{4}|[[:digit:]]{9})$'))
由 ^ 和 $ 指示的开头或结尾的字符都是不可接受的。确保您的正则表达式没有分成多行或包含任何不必要的空格,除非您希望格式如此并相应地进行匹配。表 12 说明了该正则表达式示例的各个组成部分。
将正则表达式与现有的功能进行比较
正则表达式有几个优点优于常见的 LIKE 操作符和 INSTR、SUBSTR 及 REPLACE 函数的。这些传统的 SQL 函数不便于进行模式匹配。只有 LIKE 操作符通过使用 % 和 _ 字符匹配,但 LIKE 不支持表达式的重复、复杂的更替、字符范围、字符列表和 POSIX 字符类等等。此外,新的正则表达式函数允许检测重复出现的单词和模式交换。这里的例子为您提供了正则表达式领域的一个概览,以及您如何能够在您的应用程序中使用它们。
实实在在地丰富您的工具包
因为正则表达式有助于解决复杂的问题,所以它们是非常强大的。正则表达式的一些功能难于用传统的 SQL 函数来仿效。当您了解了这种稍显神秘的语言的基础构建程序块时,正则表达式将成为您的工具包的不可缺少的一部分(不仅在 SQL 环境下也在其它的编程语言环境下)。为了使您的各个模式正确,虽然尝试和错误有时是必须的,但正则表达式的简洁和强大是不容置疑的。
Alice Rischert (ar280@yahoo.com) 是哥伦比亚大学计算机技术与应用系的数据库应用 程序开发和设计方向的主席。她编写了 Oracle SQL 交互手册第 2 版(Prentice Hall,2002)和即将推出的 Oracle SQL 示例 (Prentice Hall,2003)。Rischert 拥有超过 15 年的经验在财富 100 强公司内担任 数据库设计师、DBA 和项目主管,并且她自从 Oracle version 5 起就一直使用 Oracle 产品。
表 1:定位元字符
元字符
说明
^
使表达式定位至一行的开头
$
使表达式定位至一行的末尾
表 2:量词或重复操作符
量词
说明
*
匹配 0 次或更多次
匹配 0 次或 1 次
+
匹配 1 次或更多次
{m}
正好匹配 m 次
{m,}
至少匹配 m 次
{m, n}
至少匹配 m 次但不超过 n 次
表 3:预定义的 POSIX 字符类
字符类
说明
[:alpha:]
字母字符
[:lower:]
小写字母字符
[:upper:]
大写字母字符
[:digit:]
数字
[:alnum:]
字母数字字符
[:space:]
空白字符(禁止打印),如回车符、换行符、竖直制表符和换页符
[:punct:]
标点字符
[:cntrl:]
控制字符(禁止打印)
[:print:]
可打印字符
表 4:表达式的替换匹配和分组
元字符
说明
|
替换
分隔替换选项,通常与分组操作符 () 一起使用
( )
分组
将子表达式分组为一个替换单元、量词单元或后向引用单元(参见"后向引用"部分)
[char]
字符列表
表示一个字符列表;一个字符列表中的大多数元字符(除字符类、^ 和 - 元字符之外)被理解为文字
表 5:REGEXP_LIKE 操作符
语法
说明
REGEXP_LIKE(source_string, pattern
[, match_parameter])
source_string 支持字符数据类型(CHAR、VARCHAR2、CLOB、NCHAR、NVARCHAR2 和 NCLOB,但不包括 LONG)。pattern 参数是正则表达式的另一个名称。match_parameter 允许可选的参数(如处理换行符、保留多行格式化以及提供对区分大小写的控制)。
表 6:REGEXP_INSTR 函数
语法
说明
REGEXP_INSTR(source_string, pattern
[, start_position
[, occurrence
[, return_option
[, match_parameter]]]])
该函数查找 pattern ,并返回该模式的第一个位置。您可以随意指定您想要开始搜索的 start_position。 occurrence 参数默认为 1,除非您指定您要查找接下来出现的一个模式。return_option 的默认值为 0,它返回该模式的起始位置;值为 1 则返回符合匹配条件的下一个字符的起始位置。
表 7: 5 位数字加 4 位邮政编码表达式的说明
语法
说明
必须匹配的空白
[:digit:]
POSIX 数字类
]
字符列表的结尾
{5}
字符列表正好重复出现 5 次
(
子表达式的开头
-
一个文字连字符,因为它不是一个字符列表内的范围元字符
[
字符列表的开头
[:digit:]
POSIX [:digit:]类
[
字符列表的开头
]
字符列表的结尾
{4}
字符列表正好重复出现 4 次
)
结束圆括号,结束子表达式
量词匹配分组的子表达式 0 或 1 次,从而使得 4 位代码可选
$
定位元字符,指示行尾
表 8:REGEXP_SUBSTR 函数
语法
说明
REGEXP_SUBSTR(source_string, pattern
[, position [, occurrence
[, match_parameter]]])
REGEXP_SUBSTR 函数返回匹配模式的子字符串。
表 9: REGEXP_REPLACE 函数
语法
说明
REGEXP_REPLACE(source_string, pattern
[, replace_string [, position
[,occurrence, [match_parameter]]]])
该函数用一个指定的 replace_string 来替换匹配的模式,从而允许复杂的"搜索并替换"操作。
表 10:后向引用元字符
元字符
说明
\digit
反斜线
紧跟着一个 1 到 9 之间的数字,反斜线匹配之前的用括号括起来的第 digit 个子表达式。
(注意:反斜线在正则表达式中有另一种意义,取决于上下文,它还可能表示 Escape 字符。
表 11:模式交换正则表达式的说明
正则表达式项目
说明
(
第一个子表达式的开头
.
匹配除换行符之外的任意单字符
*
重复操作符,匹配之前的 . 元字符 0 到 n 次
)
第一个子表达式的结尾;匹配结果在 \1
中获取(在这个例子中,结果为 Ellen。)
必须存在的空白
(
第二