国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

JavaScript進階學習(一)—— 基于正則表達式的簡單js模板引擎實現

Magicer / 1201人閱讀

摘要:基本語法構造函數可創建一個正則表達式對象,用特定的模式匹配文本。要表示字符串,字面量形式不使用引號,而傳遞給構造函數的參數使用引號。當使用構造函數創造正則對象時,需要常規的字符轉義規則在前面加反斜杠。結果替換與正則表達式匹配的子串。

文章來源:小青年原創
發布時間:2016-06-26
關鍵詞:JavaScript,正則表達式,js模板引擎
轉載需標注本文原始地址: http://zhaomenghuan.github.io...

前言

這年頭MVC、MVVM框架泛濫,很多時候我們只是用了這些框架,有時候想深入去了解這些框架背后的原理實現時,閱讀源碼時發現無從下手,js基本功簡直渣渣,所以想利用業余時間還是要補補基礎。以前看JavaScript的一些書籍時總是把正則表達式這一章跳過了,遇到一些需要寫正則的時候然后都是各種copy,js要進階感覺還是要系統學習一下正則,雖然看起來像亂碼一樣的匹配規則,但是如果熟練使用會很有用,那么今天就先從正則開始吧!和大部分書籍一樣,本文前篇也會是講解基礎,本文的很多內容都是摘自網絡進行整理,有些內容需要各位自己進行實踐驗證。

正則表達式

正則表達式(英語:Regular Expression,在代碼中常簡寫為regex、regexp或RE)使用單個字符串來描述、匹配一系列符合某個句法規則的字符串搜索模式。搜索模式可用于文本搜索和文本替換。

基本語法

RegExp 構造函數可創建一個正則表達式對象,用特定的模式匹配文本。創建一個正則對象的兩種方法:字面量和構造函數。要表示字符串,字面量形式不使用引號,而傳遞給構造函數的參數使用引號。

字面量: /pattern/flags
構造函數: RegExp(pattern [, flags])

pattern 正則表達式文本

flags 該參數可以是下面單個值或者幾個值的任意組合:

g 全局匹配

i 忽略大小寫

gi或ig 全局匹配、忽略大小寫

m 多行查找,讓開始和結束字符(^ 和 $)工作在多行模式(也就是,^ 和 $ 可以匹配字符串中每一行的開始和結束(行是由 n 或 r 分割的),而不只是整個輸入字符串的最開始和最末尾處。

u Unicode。將模式視為Unicode碼位(code points)序列。

y sticky。使用隱式的^錨點把正則錨定在了lastIndex所指定的偏移位置處,具體可以看看這篇文章:JavaScript:正則表達式的/y標識 。

具體例子:

/ab+c/i;
new RegExp("ab+c", "i");
new RegExp(/ab+c/, "i");

當表達式被賦值時,字面量形式提供正則表達式的編譯(compilation)狀態,當正則表達式保持為常量時使用字面量。例如當你在循環中使用字面量構造一個正則表達式時,正則表達式不會在每一次迭代中都被重新編譯(recompiled)。

而正則表達式對象的構造函數,如 new RegExp("ab+c") 提供了正則表達式運行時編譯(runtime compilation)。如果你知道正則表達式模式將會改變,或者你事先不知道什么模式,而是從另一個來源獲取,如用戶輸入,這些情況都可以使用構造函數。

從ECMAScript 6開始,當第一個參數為正則表達式而第二個標志參數存在時,new RegExp(/ab+c/, "i")不再拋出TypeError (“當從其他正則表達式進行構造時不支持標志”)的異常,取而代之,將使用這些參數創建一個新的正則表達式。

當使用構造函數創造正則對象時,需要常規的字符轉義規則(在前面加反斜杠 )。比如,以下是等價的:

var re = new RegExp("w+");
var re = /w+/;
正則表達式中的特殊字符

字符類別(Character Classes)

字符集合(Character Sets)

邊界(Boundaries)

分組(grouping)與反向引用(back references)

數量詞(Quantifiers)

^$ —— 作用是分別指出一個字符串的開始和結束。

"^The":表示所有以"The"開始的字符串"There","The cat"等;

"of despair$":表示所以以"of despair"結尾的字符串;

"^abc$":表示開始和結尾都是"abc"的字符串——呵呵,只有"abc"自己了;

"notice":表示任何包含"notice"的字符串。

最后那個例子,如果你不使用兩個特殊字符,你就在表示要查找的串在被查找串的任意部分——你并不把它定位在某一個頂端。

*+?{} —— 表示一個或一序列字符重復出現的次數。

分別表示“沒有或更多”,“一次或更多”,“沒有或一次”和指定重復次數的范圍。{}必須指定范圍的下限,如:"{0,2}"而不是"{,2}"。*、+和?相當于{0,}、{1,}和{0,1}。

"ab*":表示一個字符串有一個a后面跟著零個或若干個b。("a", "ab", "abbb",……);

"ab+":表示一個字符串有一個a后面跟著至少一個b或者更多;

"ab?":表示一個字符串有一個a后面跟著零個或者一個b;

"a?b+$":表示在字符串的末尾有零個或一個a跟著一個或幾個b。

"ab{2}":表示一個字符串有一個a跟著2個b("abb");

"ab{2,}":表示一個字符串有一個a跟著至少2個b;

"ab{3,5}":表示一個字符串有一個a跟著3到5個b。

| —— 表示“或”操作

"hi|hello":表示一個字符串里有"hi"或者"hello";

"(b|cd)ef":表示"bef"或"cdef";

"(a|b)*c":表示一串"a""b"混合的字符串后面跟一個"c";

. —— 可以替代任何字符

"a.[0-9]":表示一個字符串有一個"a"后面跟著一個任意字符和一個數字;

"^.{3}$":表示有任意三個字符的字符串(長度為3個字符);

[] —— 表示某些字符允許在一個字符串中的某一特定位置出現

"[ab]":表示一個字符串有一個"a"或"b"(相當于"a|b");

"[a-d]":表示一個字符串包含小寫的"a"到"d"中的一個(相當于"a|b|c|d"或者"[abcd]");

"^[a-zA-Z]":表示一個以字母開頭的字符串;

"[0-9]%":表示一個百分號前有一位的數字;

",[a-zA-Z0-9]$":表示一個字符串以一個逗號后面跟著一個字母或數字結束。

可以在方括號里用"^"表示不希望出現的字符,"^"應在方括號里的第一位。(如:%[^a-zA-Z]%表示兩個百分號中不應該出現字母)。為了逐字表達,你必須在^.$()|*+?{這些字符前加上轉移字符""。在方括號中,不需要轉義字符。

RegExp對象的屬性
屬性 含義
$1-$9 如果它(們)存在,是匹配到的子串
$_ 參見input
$* 參見multiline
$& 參見lastMatch
$+ 參見lastParen
$` 參見leftContext
$""         參見rightContext
constructor    創建一個對象的一個特殊的函數原型
global       是否在整個串中匹配(bool型)
ignoreCase     匹配時是否忽略大小寫(bool型)
input        被匹配的串
lastIndex     最后一次匹配的索引
lastParen     最后一個括號括起來的子串
leftContext    最近一次匹配以左的子串
multiline     是否進行多行匹配(bool型)
prototype     允許附加屬性給對象
rightContext    最近一次匹配以右的子串
source       正則表達式模式
lastIndex     最后一次匹配的索引

詳情大家可以查看這里:MDN JavaScript 標準庫 RegExp屬性

RegExp對象的方法
方法 含義
compile    正則表達式比較
exec        執行查找
test        進行匹配
toSource     返回特定對象的定義(literal representing),其值可用來創建一個新的對象。重載Object.toSource方法得到的。
toString       返回特定對象的串。重載Object.toString方法得到的。
valueOf     返回特定對象的原始值。重載Object.valueOf方法得到

詳情大家可以查看這里:MDN JavaScript 標準庫 RegExp方法

不過在這里我們還是需要說明一下的是我們用得比較多的方法主要分為兩類:

RegExp 對象方法

RegExp.prototype.compile() ——編譯正則表達式

用法:regexObj.compile(pattern, flags)

功能說明:compile() 方法用于在腳本執行過程中編譯正則表達式,也可用于改變和重新編譯正則表達式。該方法可以編譯指定的正則表達式,編譯之后的正則表達式執行速度將會提高,如果正則表達式多次被調用,那么調用compile方法可以有效的提高代碼的執行速度,如果該正則表達式只能被使用一次,則不會有明顯的效果。

var str="Every man in the world! Every woman on earth!";
var patt=/man/g;
var str2=str.replace(patt,"person");
document.write(str2+"
"); patt=/(wo)?man/g; patt.compile(patt); str2=str.replace(patt,"person"); document.write(str2); 結果: Every person in the world! Every woperson on earth! Every person in the world! Every person on earth!

RegExp.prototype.exec() —— 檢索字符串中指定的值。返回找到的值,并確定其位置。

用法:regexObj.exec(str)

功能說明:exec() 方法如果成功匹配,exec 方法返回一個數組,并且更新正則表達式對象的屬性。返回的數組包括匹配的字符串作為第一個元素,緊接著一個元素對應一個成功匹配被捕獲的字符串的捕獲括號(capturing parenthesis)。(one item for each capturing parenthesis that matched containing the text that was captured.)如果匹配失敗,exec 方法將返回 null。

var str="Hello world,hello zhaomenghuan!";
// look for "Hello"或"hello"
var patt=/hello/gi;
while((result = patt.exec(str))!== null){
    document.write("result:" + result +"的位置為"+ result.index + "
"); } 結果: result:Hello的位置為0 result:hello的位置為12

RegExp.prototype.test() —— 檢索字符串中指定的值。返回 true 或 false。

用法:regexObj.test(str)

功能說明:test() 方法用于檢測一個字符串是否匹配某個模式,如果字符串中有匹配的值返回 true ,否則返回 false。

var result = /hello/.test("This is a hello world!");
document.write(result);
結果:
true
支持正則表達式的 String 對象的方法

search —— 檢索與正則表達式相匹配的值

用法:string.search(searchvalue)

searchvalue 必須。查找的字符串或者正則表達式。

功能說明:search()方法用于檢索字符串中指定的子字符串,或檢索與正則表達式相匹配的子字符串。如果沒有找到任何匹配的子串,則返回 -1。

var str="Mr. Blue has a blue house";
document.write(str.search(/blue/i));
結果:
4

match —— 找到一個或多個正則表達式的匹配。

用法:string.match(regexp)

regexp 必需。規定要匹配的模式的 RegExp 對象。如果該參數不是 RegExp 對象,則需要首先把它傳遞給 RegExp 構造函數,將其轉換為 RegExp 對象。返回值類型為Array。

功能說明:match() 方法可在字符串內檢索指定的值,或找到一個或多個正則表達式的匹配。match() 方法將檢索字符串 String Object,以找到一個或多個與 regexp 匹配的文本。這個方法的行為在很大程度上有賴于 regexp 是否具有標志 g。如果 regexp 沒有標志 g,那么 match() 方法就只能在 stringObject 中執行一次匹配。如果沒有找到任何匹配的文本, match() 將返回 null。否則,它將返回一個數組,其中存放了與它找到的匹配文本有關的信息。

var str = "The rain in SPAIN stays mainly in the plain"; 
var match=str.match(/ain/gi);
document.getElementById("demo").innerHTML=match;
結果:
ain,AIN,ain,ain

replace 替換與正則表達式匹配的子串。

用法:string.replace(searchvalue,newvalue)

searchvalue 必須。規定子字符串或要替換的模式的 RegExp 對象。
請注意,如果該值是一個字符串,則將它作為要檢索的直接量文本模式,而不是首先被轉換為 RegExp 對象。
newvalue 必需。一個字符串值。規定了替換文本或生成替換文本的函數。
返回值為String類型,一個新的字符串,是用 replacement 替換了 regexp 的第一次匹配或所有匹配之后得到的。

split 把字符串分割為字符串數組。

用法:string.split(separator,limit)

separator 可選。字符串或正則表達式,從該參數指定的地方分割 string Object。
limit 可選。該參數可指定返回的數組的最大長度。如果設置了該參數,返回的子串不會多于這個參數指定的數組。如果沒有設置該參數,整個字符串都會被分割,不考慮它的長度。
返回值為Array類型,一個字符串數組。該數組是通過在 separator 指定的邊界處將字符串 string Object 分割成子串創建的。返回的數組中的字串不包括 separator 自身。

var str="How are you doing today?";
var match = str.split(/ /);
document.write(match);
結果:
How,are,you,doing,today?
正則表達式的應用實例說明

校驗是否全由數字組成 —— /^[0-9]{1,20}$/

^ 表示打頭的字符要匹配緊跟^后面的規則
$ 表示打頭的字符要匹配緊靠$前面的規則
[ ] 中的內容是可選字符集
[0-9] 表示要求字符范圍在0-9之間
{1,20}表示數字字符串長度合法為1到20,即為[0-9]中的字符出現次數的范圍是1到20次。

/^ 和 $/成對使用應該是表示要求整個字符串完全匹配定義的規則,而不是只匹配字符串中的一個子串。

校驗登錄名:只能輸入5-20個以字母開頭、可帶數字、“_”、“.”的字串—— /^[a-zA-Z]{1}([a-zA-Z0-9]|[._]){4,19}$/

^[a-zA-Z]{1} 表示第一個字符要求是字母。
([a-zA-Z0-9]|[._]){4,19} 表示從第二位開始(因為它緊跟在上個表達式后面)的一個長度為4到9位的字符串,它要求是由大小寫字母、數字或者特殊字符集[._]組成。

校驗密碼:只能輸入6-20個字母、數字、下劃線——/^(w){6,20}$/

w:用于匹配字母,數字或下劃線字符

校驗普通電話、傳真號碼:可以“+”或數字開頭,可含有“-” 和 “ ”——/^[+]{0,1}(d){1,3}[ ]?([-]?((d)|[ ]){1,12})+$/

d:用于匹配從0到9的數字;
“?”元字符規定其前導對象必須在目標對象中連續出現零次或一次
可以匹配的字符串如:+123 -999 999 ; +123-999 999 ;123 999 999 ;+123 999999等

校驗URL——/^http[s]{0,1}://.+$/ 或 /^http[s]{0,1}://.{1,n}$/ (表示url串的長度為length(“https://”) + n )

/ :表示字符“/”。
. 表示所有字符的集
+ 等同于{1,},就是1到正無窮吧。

校驗純中文字符——/^[u4E00-u9FA5]+$/

[u4E00-u9FA5] :中文字符集的范圍

以上表達式均在下面的javascript中測試通過:



    
    


    
規則表達式 : (填寫/ /之間的表達式)

校驗字符串 :
js模板引擎實現原理

前面我們花了很長的篇幅講解正則表達式是為了大家看這部分是時候能夠有所理解,如果前面的內容一下子沒有看懂也沒有關系,大家可以先看看這部分的內容回過頭去查看剛剛的內容。

我們首先會想到寫一個模板,我們常見的是寫成這樣:

當然也可以使用標簽,而且這個也是現在的流行趨勢,擁抱模塊化,不過本文不是講這個標簽和模塊化,如果大家感興趣可以看看這兩篇文章:

HTML5