正則表達式 (regular expression), 常簡寫為 regex, 用于在字符串中進行比較復雜的匹配

現(xiàn)有兩種類型的正則表達式 perl 和 POSIX, perl 類型 更規(guī)范,執(zhí)行效率越高, POSIX 類型常用于 Unix
php 提供了兩套正則表達式函數(shù)庫
preg_ 系列以 perl 為基礎(chǔ)
ereg_ 系列以 POSIX 為基礎(chǔ)
preg_ 系列更常用,ereg_ 將要被淘汰
ASCII碼中,除了下面要介紹的字符之外的,所有字符。基本字符與下面要介紹的各種特殊字符與模式結(jié)合使用,就形成了所謂的正則表達式。
圓括號中的基本字符在匹配時被看做一個整體。
| 正則 | 匹配 |
|---|---|
| (abc) | abc |
該整體會保存在內(nèi)存中,可作為整體獲取,例如 "/go(abc)g\\1le/" 可以匹配 goabcgabcle, \\1 對應了 abc。
這種方法可用于匹配不同格式的日期 "/2014(.*)06\1(13)/" 可匹配 2014/06/13 或 2014-06-13 , 但不可匹配 2014-06/13 。這里 \\1(13) 如不加括號會被認為內(nèi)存中的第 113 號。
也可以用模式修飾符 x 實現(xiàn) "/2014(.*)06\1 13/x",
與單元符號相反,原子表用于匹配其中的中任意一個原子。
| 正則 | 匹配 |
|---|---|
| [abc] | a 或 b 或 c |
原子表中 x-y 匹配 x 到 y 范圍內(nèi)的字符, 常見用法如下
| 正則 | 匹配 |
|---|---|
| [0-9] | 所有數(shù)字 |
| [a-z] | 所有小寫字母 |
| [A-z] | 所有大寫字母 |
| [a-zA-z] | 所有字母 |
需要注意的是 ^ 符號在原子表中表示排除,而在元字符中表示開頭
| 正則 | 匹配 |
|---|---|
| [^abc] | 除了abc外的字符 |
| [^0-9] | 所有 非 數(shù)字 |
轉(zhuǎn)義字符就是一些常用原子表表達式的簡寫
| 轉(zhuǎn)義字符 | 匹配 | 原子表表示 |
|---|---|---|
| \d | 所有數(shù)字 | [0-9] |
| \D | 除所有數(shù)字外 | [^0-9] |
| \w | 所有字母加數(shù)字加下劃線 | [a-zA-Z0-9_] |
| \W | 除字母數(shù)字下劃線之外的字符 | [^a-zA-Z0-9_] |
| \s | 匹配空白(Tab,空格,換頁,換行) | [\f\v\t\r\n] |
| \S | 匹配非空白 | [^\f\v\t\r\n] |
| 字符 | 匹配 |
|---|---|
| . | 匹配除換行符以外的任意字符 |
| * | 匹配前一個內(nèi)容的0次或1次或多次 |
| + | 匹配前一個內(nèi)容的1次或多次 |
| ? | 匹配0次或1次 |
| | | 邏輯符 “或” |
| ^ | 匹配字符串首部內(nèi)容,加在原子前, 例如 ^abc |
| $ | 匹配字符串尾部部內(nèi)容, 加在原子后, 例如 abc$ |
| \b | 通過邊界匹配單詞,邊界為空格或特殊符號, \bis\b 用于匹配 is 單詞 |
| \B | 通過邊界匹配單詞以外內(nèi)容 |
| {m} | 匹配前一個內(nèi)容的m次 |
| {m,} | 匹配前一個內(nèi)容的大于等于m次 |
| {m,n} | 匹配前一個內(nèi)容的m到n次 |
從高到底
()
* ? + {}
^ $ \b
|
基本字符
模式修飾符在正則之外使用,格式為 /正則/U , U 代表模式修飾符
| 修飾符 | 用法 |
|---|---|
| i | 匹配時不區(qū)分大小寫 (默認區(qū)分) |
| m | 匹配首內(nèi)容和尾內(nèi)容時采用多行識別(默認^和$匹配整個段落的開頭和結(jié)尾,加了m之后變?yōu)樾惺缀托形玻?/td> |
| s | 將回車轉(zhuǎn)義取消,這樣 .* 就可以匹配所有內(nèi)容 |
| x | 忽略正則表達式中的空白 |
| A | 強制從段落頭開始匹配 "/xxx/mA" 相當于沒有加 m |
| D | 強制從段落尾開始匹配 (此外,由于默認 $ 會從行尾的 \n 之前開始匹配,D還用來在尾部從 \n 開始) |
| U | 禁止貪婪匹配,匹配到第一個符合條件的部分就停止,常用于采集程序 |
| 用途 | 正則表達式 |
|---|---|
| 判斷email地址 | ^[a-zA-Z0-9_-.]+@[a-zA-Z0-9-]+.[a-zA-Z0-9-.]+$ |
| 判斷日期 | [0-9]{2-4}(.*)[0-9]{0,2}\\1[0-9]{0,2} |
| 非負整數(shù)(正整數(shù)+0) | ^[0-9]+$ |
| 正整數(shù) | ^[0-9]*[1-9]+[0-9]*$ |
| 非正整數(shù)(負整數(shù)+0) | ^(-[1-9]+|(0))$ |
| 負整數(shù) | ^-[0-9]+$ |
執(zhí)行一個正則表達式匹配,沒什么可多說的,例子如下
$subject = "標題: {title}<br>作者: {author}<br>內(nèi)容: {con}"; $pattern = ("/{(.*)}/U"); preg_match($pattern, $subject, $matches); print_r($matches);輸出
Array ( [0] => {title} [1] => title )這里只匹配了一個就停止了是因為我們加了模式修飾符 U
與 preg_match 的區(qū)別在于,preg_match_all 在第一個匹配找到后,從結(jié)束位置繼續(xù)進行搜索,使用相同的目標字符和正則表達式
$subject = "標題: {title}<br>作者: {author}<br>內(nèi)容: {con}"; $pattern = ("/{(.*)}/U"); preg_match_all($pattern, $subject, $matches); print_r($matches);輸出結(jié)果如下
Array
(
[0] => Array
(
[0] => {title}
[1] => {author}
[2] => {con}
)
[1] => Array
(
[0] => title
[1] => author
[2] => con
)
)用給定內(nèi)容替換正則表達式匹配的內(nèi)容,并返回修改后的字符串,以下是一個實現(xiàn)非常簡單的類 smarty 模板例子
$subject = "標題: {title}<br>作者: {author}<br>內(nèi)容: {con}"; $pattern = array("/{title}/", "/{author}/", "/{con}/"); $replacement = array("Myregex", "gipanda", "simplesmarty"); echo preg_replace($pattern, $replacement, $subject);輸出
標題: Myregex 作者: gipanda 內(nèi)容: simplesmarty
模式修正符 e 用于執(zhí)行 replacement 中的內(nèi)容
$subject = "test <font color=red>a</font> test"; $pattern = ("/(a)/e"); echo preg_replace($pattern, "md5('\\1')", $subject);輸出
test 0cc175b9c0f1b6a831c399e269772661 test
不加模式修正符 e 會輸出
test md5('a') testmd5() 沒有被當做函數(shù)執(zhí)行
按給定正則(一般式原子表)分割字符串
另外有需要云服務器可以了解下創(chuàng)新互聯(lián)cdcxhl.cn,海內(nèi)外云服務器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務器、裸金屬服務器、高防服務器、香港服務器、美國服務器、虛擬主機、免備案服務器”等云主機租用服務以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務可用性高、性價比高”等特點與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應用場景需求。
文章標題:正則表達式及php中的正則函數(shù)-創(chuàng)新互聯(lián)
文章分享:http://www.chinadenli.net/article4/ccchie.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站收錄、品牌網(wǎng)站設(shè)計、網(wǎng)站策劃、服務器托管、手機網(wǎng)站建設(shè)、網(wǎng)站建設(shè)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容