欧美一区二区三区老妇人-欧美做爰猛烈大尺度电-99久久夜色精品国产亚洲a-亚洲福利视频一区二区

JavaScript正則單行模式的示例分析-創(chuàng)新互聯(lián)

這篇文章將為大家詳細(xì)講解有關(guān)JavaScript正則單行模式的示例分析,小編覺得挺實(shí)用的,因此分享給大家做個(gè)參考,希望大家閱讀完這篇文章后可以有所收獲。

創(chuàng)新互聯(lián)建站專注于企業(yè)營銷型網(wǎng)站建設(shè)、網(wǎng)站重做改版、大英網(wǎng)站定制設(shè)計(jì)、自適應(yīng)品牌網(wǎng)站建設(shè)、H5開發(fā)商城網(wǎng)站定制開發(fā)、集團(tuán)公司官網(wǎng)建設(shè)、成都外貿(mào)網(wǎng)站建設(shè)公司、高端網(wǎng)站制作、響應(yīng)式網(wǎng)頁設(shè)計(jì)等建站業(yè)務(wù),價(jià)格優(yōu)惠性價(jià)比高,為大英等各大城市提供網(wǎng)站開發(fā)制作服務(wù)。

正則表達(dá)式最早是由 Ken Thompson 于 1970 年在他改進(jìn)過的 QED 編輯器里實(shí)現(xiàn)的,正則里最簡單的元字符 “.” 在當(dāng)時(shí)所匹配的就是除換行符外的任意字符:

"." is a regular expression which matches any character except <nl>.

上面這句話出自 QED 在 1970 年的官方文檔,這可能是史上第一份正則文檔。

為什么要這么規(guī)定?是因?yàn)?QED 是以行為單位來編輯文件的,而且行尾的換行符也算在這一行的內(nèi)容里。比如你想把一段代碼中所有的單行注釋刪掉,在 QED 里可以用下面這句命令:

1,$s#//.*##

如果 “.” 能匹配到換行符,那么換行符也會(huì)被刪除,會(huì)導(dǎo)致這些行和它的下一行合并,這通常都不是我們想要的結(jié)果,所以,“.” 在最初發(fā)明時(shí)被設(shè)計(jì)成了不能匹配換行符。雖然現(xiàn)在的操作系統(tǒng)上已經(jīng)沒有 QED 命令讓我們測試了,但我們還有 VIM,VIM 里的 “.” 也一樣不能匹配換行符,因?yàn)橥瑯拥脑颉?/p>

不像在 Node 中,讀取文件通常是一股腦讀完整個(gè)文件,Perl 繼承了眾多 Linux 命令按行讀取文件的傳統(tǒng),像這樣:

while (<>) {print $_}

_ 的末尾也有換行符,所以 Perl 也就很自然的繼承了 QED 的 “.” 不匹配換行符的規(guī)定。但 Perl 畢竟是門編程語言,而不是編輯器,它的正則要匹配的對(duì)象不單單會(huì)是單行文本,還可能是多行文本,因此在它的正則中,“.” 有跨行匹配的需求,因此 Perl 發(fā)明了正則的單行模式 /s,即讓 “.” 也能匹配換行符。

Perl 中用來打開單行模式的 /s 修飾符的官方描述是 “Treat the string as single line”,這個(gè) “single line” 要這么理解:“.” 在普通模式下只能匹配行內(nèi)字符,不能跨行;而在單行模式下,Perl 會(huì)假裝把多行字符串看成一行,把其中的換行符看做是行內(nèi)字符,所以 “.” 也就能匹配它們了。更形象點(diǎn)說,就是把下面的三行文本

1
2
3

看成 "1\n2\n3\n" 一行文本,單行模式就是這個(gè)意思。

但要命的是,因?yàn)橥瑯拥脑颍ㄗ址兞靠梢园嘈形谋荆琍erl 還發(fā)明了 /m 修飾符,即多行模式,官方描述是 “Treat the string as multiple lines”,這個(gè)模式 JavaScript 的正則里自古也有,這里這個(gè)“多行”的意思是說:^ 和 $ 元字符默認(rèn)不會(huì)匹配一個(gè)字符串中間的那些換行符前后的位置,即認(rèn)為字符串永遠(yuǎn)只有一行,打開多行模式后就能匹配了。

也就是說,單行模式和多行模式是針對(duì)不同的元字符的,剛接觸正則的人都會(huì)被“單行模式”和“多行模式”這兩個(gè)看似是相對(duì)應(yīng)的概念,實(shí)則毫無關(guān)聯(lián)的名詞給搞暈。

后來,Ruby 的作者可能覺得“單行模式”這個(gè)正則術(shù)語起的不好,特例獨(dú)行把讓 “.” 匹配換行符這一模式稱之為“多行模式”,即讓 .* 之類的正則能夠匹配多行了,所以也完全講得通,修飾符也用了 /m(Ruby 中默認(rèn)會(huì)開啟 Perl 中的“多行模式”,所以 /m 沒被占用),這真是雪上加霜,更亂了。

再后來,Python 作者可能也覺得應(yīng)該避免“單行模式”這個(gè)叫法,于是起了個(gè)新的名字 “dotall”,也就是讓 dot 能匹配所有字符的意思,很好的名字,再后來 Java 也使用了這個(gè)名字。

上面回顧了一下歷史,解釋了下單行模式的由來以及說明了下單行模式這個(gè)名字起得不好。V8 最近剛剛實(shí)現(xiàn)了一個(gè) stage 3 的 ES 提案 https://github.com/mathiasbynens/es-regexp-dotall-flag,這個(gè)提案為 JavaScript 的正則引入了 /s 修飾符和 dotAll 屬性,dotAll 屬性是學(xué)了 Python 和 Java,/s 修飾符是繼承了 Perl 的,這里也沒必要發(fā)明一個(gè)新的修飾符比如 /d,只會(huì)讓事情更復(fù)雜。/s 在 JavaScript 的具體效果是讓 “.” 能匹配以前不能匹配的四個(gè)行終止符:\n(換行)、\r(回車)、\u2028(行分隔符)、\u2029(段落分隔符):

/foo/s.dotAll // true
/^.{4}$/s.test("\n\r\u2028\u2029") // true

其實(shí)就是個(gè)很簡單的東西,但可能一些沒有接觸過 JavaScript 以外的正則的同學(xué)到時(shí)候?qū)W到這個(gè)新的模式后會(huì)產(chǎn)生困惑,這里再澄清一下:多行模式控制的是 ^ 和 $ 的表現(xiàn),單行模式控制的是 “.” 的表現(xiàn),兩者沒有直接關(guān)系。

然而當(dāng)初引入單行模式和多行模式這兩個(gè)易混淆概念的 Perl 語言,已經(jīng)在 Perl 6 中完全刪除了這兩個(gè)模式:“.” 號(hào)默認(rèn)就匹配換行符,\N 可以匹配換行符除外的任意字符;^ 和 $ 始終匹配字符串的首尾,而新引入了 ^^ 和 $$ 兩個(gè)元字符來匹配行的首尾。

過去我們常用的單行模式的替代品 [^] 或者 [\s\S] 也不是完全沒有用了,比如在一些使用 JavaScript 正則的編輯器里(VS Code、Atom),不太可能給你提供開啟單行模式的界面。不過說起編輯器里的正則功能,用 JavaScript 實(shí)現(xiàn)的編輯器的正則功能還是太弱了,比如不能在正則自身內(nèi)部開啟某些模式,比如要是在 Sublime(使用 Python 正則)里的話,在正則內(nèi)部使用 (?s) 就能開啟 dotall 模式,比如可以用 (?s)/\*.+?\*/ 匹配到所有的多行注釋。

關(guān)于“JavaScript正則單行模式的示例分析”這篇文章就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,使各位可以學(xué)到更多知識(shí),如果覺得文章不錯(cuò),請(qǐng)把它分享出去讓更多的人看到。

網(wǎng)站題目:JavaScript正則單行模式的示例分析-創(chuàng)新互聯(lián)
文章分享:http://www.chinadenli.net/article8/dodpop.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供電子商務(wù)網(wǎng)站導(dǎo)航面包屑導(dǎo)航品牌網(wǎng)站制作網(wǎng)站營銷做網(wǎng)站

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

外貿(mào)網(wǎng)站建設(shè)