4正則的其他函數使用
//正則的其他函數使用: //preg_quote -- 轉義正則表達式字符 //preg_split -- 用正則表達式分割字符串 //preg_replace -- 執行正則表達式的搜索和替換 //1.preg_quote -- 轉義正則表達式字符 echo preg_quote("(abc){10}",""");//在每個增則表達式語法的字符前增加一個反斜杠 $s = "a{4}"; preg_match("/".preg_quote($s)."/","werta{4}yu",$a); var_dump($a); echo "
"; //2. preg_split -- 用正則表達式分割字符串 $s = "12,34:56;784;35,67:897:65"; $list = preg_split("/[,:;]/",$s); var_dump($list); echo "
"; //3. preg_replace執行正則表達式的搜索和替換 $s = "12,34:56;784;35,67:897:65"; //要求將上面的:,;都換成空格 echo preg_replace("/[,;:]/"," ",$s); $str = "
- aaaaa
- bbbbb
- ffffddd
- eeeee
"; echo $str; echo "
"; //echo preg_replace("/
5.子存儲(擴展)
//子存儲使用 $date="[2012-08-09],[2012,09-19],[2011/08,09],[2012/10/09],[2013,08,01]"; //將上面字串中合法的日期匹配出來 preg_match_all("/[[0-9]{4}([-,/])[0-9]{2}1[0-9]{2}]/",$date,$a); var_dump($a); echo "
"; $str = "
- aaaaa
- bbbbb
- ffffddd
- eeeee
五、附錄:常用正則表達式
^d+$ d 是代表0-9 $必須要以....結束 這是代表非負整數 正則表達式 平時做網站經常要用正則表達式,下面是一些講解和例子,僅供大家參考和修改使用: "^d+$" //非負整數(正整數 + 0) "^[0-9]*[1-9][0-9]*$" //正整數 "^((-d+)|(0+))$" //非正整數(負整數 + 0) "^-[0-9]*[1-9][0-9]*$" //負整數 "^-?d+$" //整數 "^d+(.d+)?$" //非負浮點數(正浮點數 + 0) "^(([0-9]+.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*.[0-9]+)|([0-9]*[1-9][0-9]*))$" //正浮點數 "^((-d+(.d+)?)|(0+(.0+)?))$" //非正浮點數(負浮點數 + 0) "^(-(([0-9]+.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*.[0-9]+)|([0-9]*[1-9][0-9]*)))$" //負浮點數 "^(-?d+)(.d+)?$" //浮點數 "^[A-Za-z]+$" //由26個英文字母組成的字符串 "^[A-Z]+$" //由26個英文字母的大寫組成的字符串 "^[a-z]+$" //由26個英文字母的小寫組成的字符串 "^[A-Za-z0-9]+$" //由數字和26個英文字母組成的字符串 "^w+$" //由數字、26個英文字母或者下劃線組成的字符串 "^[w-]+(.[w-]+)*@[w-]+(.[w-]+)+$" //email地址 "^[a-zA-z]+://(w+(-w+)*)(.(w+(-w+)*))*(?S*)?$" //url /^(d{2}|d{4})-((0([1-9]{1}))|(1[1|2]))-(([0-2]([1-9]{1}))|(3[0|1]))$/ // 年-月-日 /^((0([1-9]{1}))|(1[1|2]))/(([0-2]([1-9]{1}))|(3[0|1]))/(d{2}|d{4})$/ // 月/日/年 "^([w-.]+)@(([[0-9]{1,3}.[0-9]{1,3}.[0-9]{1,3}.)|(([w-]+.)+))([a-zA-Z]{2,4}|[0-9]{1,3})(]?)$" //Emil /^((+?[0-9]{2,4}-[0-9]{3,4}-)|([0-9]{3,4}-))?([0-9]{7,8})(-[0-9]+)?$/ //電話號碼 "^(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5])$" //IP地址 匹配中文字符的正則表達式: [u4e00-u9fa5] 匹配雙字節字符(包括漢字在內):[^x00-xff] 匹配空行的正則表達式: [s| ]* 匹配HTML標記的正則表達式:/<(.*)>.*1>|<(.*) />/ 匹配首尾空格的正則表達式:(^s*)|(s*$) 匹配Email地址的正則表達式:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)* 匹配網址URL的正則表達式:^[a-zA-z]+://([url=file://w+(-w+)*)(.(w+(-w+)*))*(?S*)?$]w+(-w+)*)(.(w+(-w+)*))*(?S*)?$[/url] 匹配帳號是否合法(字母開頭,允許5-16字節,允許字母數字下劃線):^[a-zA-Z][a-zA-Z0-9_]{4,15}$ 匹配國內電話號碼:(d{3}-|d{4}-)?(d{8}|d{7})? 匹配騰訊QQ號:^[1-9]*[1-9][0-9]*$ 元字符及其在正則表達式上下文中的行為: 將下一個字符標記為一個特殊字符、或一個原義字符、或一個后向引用、或一個八進制轉義符。 ^ 匹配輸入字符串的開始位置。如果設置了 RegExp 對象的Multiline 屬性,^ 也匹配 ’ ’ 或 ’ ’ 之后的位置。 $ 匹配輸入字符串的結束位置。如果設置了 RegExp 對象的Multiline 屬性,$ 也匹配 ’ ’ 或 ’ ’ 之前的位置。 * 匹配前面的子表達式零次或多次。 + 匹配前面的子表達式一次或多次。+ 等價于 {1,}。 ? 匹配前面的子表達式零次或一次。? 等價于 {0,1}。 {n} n 是一個非負整數,匹配確定的n 次。 {n,} n 是一個非負整數,至少匹配n 次。 {n,m} m 和 n 均為非負整數,其中n <= m。最少匹配 n 次且最多匹配 m 次。在逗號和兩個數之間不能有空格。 ? 當該字符緊跟在任何一個其他限制符 (*, +, ?, {n}, {n,}, {n,m}) 后面時,匹配模式是非貪婪的。非貪婪模式盡可能少的匹配所搜索的字符串,而默認 的貪婪模式則盡可能多的匹配所搜索的字符串。 . 匹配除 " " 之外的任何單個字符。要匹配包括 ’ ’ 在內的任何字符,請使用象 ’[. ]’ 的模式。 (pattern) 匹配pattern 并獲取這一匹配。 (?:pattern) 匹配pattern 但不獲取匹配結果,也就是說這是一個非獲取匹配,不進行存儲供以后使用。 (?=pattern) 正向預查,在任何匹配 pattern 的字符串開始處匹配查找字符串。這是一個非獲取匹配,也就是說,該匹配不需要獲取供以后使用。 (?!pattern) 負向預查,與(?=pattern)作用相反 x|y 匹配 x 或 y。 [xyz] 字符集合。 [^xyz] 負值字符集合。 [a-z] 字符范圍,匹配指定范圍內的任意字符。 [^a-z] 負值字符范圍,匹配任何不在指定范圍內的任意字符。 匹配一個單詞邊界,也就是指單詞和空格間的位置。 B 匹配非單詞邊界。 cx 匹配由x指明的控制字符。 d 匹配一個數字字符。等價于 [0-9]。 D 匹配一個非數字字符。等價于 [^0-9]。 f 匹配一個換頁符。等價于 x0c 和 cL。 匹配一個換行符。等價于 x0a 和 cJ。 匹配一個回車符。等價于 x0d 和 cM。 s 匹配任何空白字符,包括空格、制表符、換頁符等等。等價于[ f v]。 S 匹配任何非空白字符。等價于 [^ f v]。 匹配一個制表符。等價于 x09 和 cI。 v 匹配一個垂直制表符。等價于 x0b 和 cK。 w 匹配包括下劃線的任何單詞字符。等價于’[A-Za-z0-9_]’。 W 匹配任何非單詞字符。等價于 ’[^A-Za-z0-9_]’。 xn 匹配 n,其中 n 為十六進制轉義值。十六進制轉義值必須為確定的兩個數字長。 um 匹配 num,其中num是一個正整數。對所獲取的匹配的引用。 標識一個八進制轉義值或一個后向引用。如果 之前至少 n 個獲取的子表達式,則 n 為后向引用。否則,如果 n 為八進制數字 (0-7),則 n 為一個 八進制轉義值。 m 標識一個八進制轉義值或一個后向引用。如果 m 之前至少有is preceded by at least nm 個獲取得子表達式,則 nm 為后向引用。如果 m 之前至 少有 n 個獲取,則 n 為一個后跟文字 m 的后向引用。如果前面的條件都不滿足,若 n 和 m 均為八進制數字 (0-7),則 m 將匹配八進制轉義值 nm。 ml 如果 n 為八進制數字 (0-3),且 m 和 l 均為八進制數字 (0-7),則匹配八進制轉義值 nml。 un 匹配 n,其中 n 是一個用四個十六進制數字表示的Unicode字符。 匹配中文字符的正則表達式: [x{4e00}-x{9fa5}] 匹配雙字節字符(包括漢字在內):[^x00-xff] 匹配空行的正則表達式:n[s| ]*r 匹配HTML標記的正則表達式:/<(.*)>.*|<(.*) />/ 匹配首尾空格的正則表達式:(^s*)|(s*$) 匹配Email地址的正則表達式:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)* 匹配網址URL的正則表達式:[url=http://([w-]+.)+[w-]+(/[w]http://([w-]+.)+[w-]+(/[w[/url]- ./?%&=]*)? 利用正則表達式限制網頁表單里的文本框輸入內容: 用正則表達式限制只能輸入中文:onkeyup="value=value.replace(/[^u4E00-u9FA5]/g,"")" 用正則表達式限制只能輸入全角字符: 用正則表達式限制只能輸入數字:onkeyup="value=value.replace(/[^d]/g,"") "onbeforepaste="clipboardData.setData ("text",clipboardData.getData("text").replace(/[^d]/g,""))" 用正則表達式限制只能輸入數字和英文:onkeyup="value=value.replace(/[W]/g,"") "onbeforepaste="clipboardData.setData ("text",clipboardData.getData("text").replace(/[^d]/g,""))" =========常用正則式 匹配中文字符的正則表達式: [x{4e00}-x{9fa5}] 匹配雙字節字符(包括漢字在內):[^x00-xff] 匹配空行的正則表達式: [s| ]* 匹配HTML標記的正則表達式:/<(.*)>.*1>|<(.*) />/ 匹配首尾空格的正則表達式:(^s*)|(s*$) 匹配IP地址的正則表達式:/(d+).(d+).(d+).(d+)/g // 匹配Email地址的正則表達式:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)* 匹配網址URL的正則表達式:[url=http://(/[w-]+.)+[w-]+(/[w]http://(/[w-]+.)+[w-]+(/[w[/url]- ./?%&=]*)? sql語句:^(select|drop|delete|create|update|insert).*$ 1、非負整數:^d+$ 2、正整數:^[0-9]*[1-9][0-9]*$ 3、非正整數:^((-d+)|(0+))$ 4、負整數:^-[0-9]*[1-9][0-9]*$ 5、整數:^-?d+$ 6、非負浮點數:^d+(.d+)?$ 7、正浮點數:^((0-9)+.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*.[0-9]+)|([0-9]*[1-9][0-9]*))$ 8、非正浮點數:^((-d+.d+)?)|(0+(.0+)?))$ 9、負浮點數:^(-((正浮點數正則式)))$ 10、英文字符串:^[A-Za-z]+$ 11、英文大寫串:^[A-Z]+$ 12、英文小寫串:^[a-z]+$ 13、英文字符數字串:^[A-Za-z0-9]+$ 14、英數字加下劃線串:^w+$ 15、E-mail地址:^[w-]+(.[w-]+)*@[w-]+(.[w-]+)+$ 16、URL:^[a-zA-Z]+://(w+(-w+)*)(.(w+(-w+)*))*(?s*)?$ 或:^http://[A-Za-z0-9]+.[A-Za-z0-9]+[/=?%-&_~`@[]":+!]*([^<>""])*$ 17、郵政編碼:^[1-9]d{5}$ 18、中文:^[u0391-uFFE5]+$ 19、電話號碼:^(((d{2,3}))|(d{3}-))?((0d{2,3})|0d{2,3}-)?[1-9]d{6,7}(-d{1,4})?$ 20、手機號碼:^(((d{2,3}))|(d{3}-))?13d{9}$ 21、雙字節字符(包括漢字在內):^x00-xff 22、匹配首尾空格:(^s*)|(s*$)(像vbscript那樣的trim函數) 23、匹配HTML標記:<(.*)>.*1>|<(.*) /> 24、匹配空行: [s| ]* 25、提取信息中的網絡鏈接:(h|H)(r|R)(e|E)(f|F) *= *("|")?(w||/|.)+("|"| *|>)? 26、提取信息中的郵件地址:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)* 27、提取信息中的圖片鏈接:(s|S)(r|R)(c|C) *= *("|")?(w||/|.)+("|"| *|>)? 28、提取信息中的IP地址:(d+).(d+).(d+).(d+) 29、提取信息中的中國手機號碼:(86)*0*13d{9} 30、提取信息中的中國固定電話號碼:((d{3,4})|d{3,4}-|s)?d{8} 31、提取信息中的中國電話號碼(包括移動和固定電話):((d{3,4})|d{3,4}-|s)?d{7,14} 32、提取信息中的中國郵政編碼:[1-9]{1}(d+){5} 33、提取信息中的浮點數(即小數):(-?d*).?d+ 34、提取信息中的任何數字 :(-?d*)(.d+)? 35、IP:(d+).(d+).(d+).(d+) 36、電話區號:/^0d{2,3}$/ 37、騰訊QQ號:^[1-9]*[1-9][0-9]*$ 38、帳號(字母開頭,允許5-16字節,允許字母數字下劃線):^[a-zA-Z][a-zA-Z0-9_]{4,15}$ 39、中文、英文、數字及下劃線:^[u4e00-u9fa5_a-zA-Z0-9]+$