www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當(dāng)前位置:首頁 > 公眾號(hào)精選 > 嵌入式微處理器
[導(dǎo)讀]正則表達(dá)式(Regular Expression,或者Regex),能干嘛?聽說很強(qiáng)悍,很多人用來查找字符串,或者替換某些字符串。實(shí)際上,正則表達(dá)式有四個(gè)功能: 匹配、替換、分割、檢驗(yàn)。

正則表達(dá)式(Regular Expression,或者Regex),能干嘛?聽說很強(qiáng)悍,很多人用來查找字符串,或者替換某些字符串。

實(shí)際上,正則表達(dá)式有四個(gè)功能:

  1. 匹配,即查找,例如,從雜亂的一堆文本里面,找到你想要的

  2. 替換,按某種規(guī)則替換內(nèi)容

  3. 分割,將文本內(nèi)容按某種規(guī)則分割開來

  4. 檢驗(yàn),檢驗(yàn)?zāi)澄谋臼欠穹弦?guī)則

如果沒玩過正則表達(dá)式,也看不出這四個(gè)功能到底能干嘛。

我剛學(xué)那陣,覺得這東西,玩點(diǎn)小兒科的東西還行,能干大事?

后來,越用越多,發(fā)現(xiàn)這貨在你遇到困境的時(shí)候可以力挽千鈞。

話說回來,這個(gè)東西能裝逼嗎?

1. 你女朋友喊你查她的號(hào)碼

你女朋友(假如你有)有一天跟你撒嬌,她給你一個(gè)txt文檔,里面存著一個(gè)她的號(hào)碼,讓你把她的號(hào)碼找出來。此時(shí),你不記得她的完整號(hào)碼了,如果找不出來,晚上就得跪CPU了。剎那間,你想到了,她的號(hào)碼有這樣的數(shù)字……771……55(親親你……嗯嗯)。于是你,快速用Notepad++打開含有一堆亂七八糟電話號(hào)碼的文本。查找輸入:1\d+771\d+55,然后回車,Bingo!不信,你試試:

?15672846712?
?13892738409 ? ? ? ? ? 021-82937465?
?13263748592 ? 18028374732?
?010-27384762?
?13877190955 022-2873625
?1324353738
?1621723839 38293923 48234934
?3123372390 1367282902 1356282920
?......

好吧,故事是虛構(gòu)的,也別幻想你女朋友真的讓你查號(hào)碼了。

簡單解釋一下,這里面的\d就是表示digital的意思即0-9都可以用\d來描述,而\d+就表示有多個(gè)數(shù)字。這個(gè)是正則表達(dá)式中非常簡單的應(yīng)用了。

2. 查找文件中某字符串內(nèi)容

模糊搜索到底怎么搞的,你有想過么?要不先來玩下這個(gè),好像有種“萬軍之中取人頭顱如探囊取物”感覺。

例如,你要查找AUTOSAR代碼中Os Timer相關(guān)的某些函數(shù),這些函數(shù)有些特征,帶有Os_Pit的字符,那么你可以用linux上的grep命令或者用vscode的正則表達(dá)式功能Os_\w+Pit\w+來查找。

上面這個(gè)\w就是匹配word的意思。其實(shí),原理跟上一個(gè)例子類似,原理很簡單。

實(shí)際上,“匹配或者查找”是正則表達(dá)式最基本的功能了。

3. 爬取和解析一些不可描述的內(nèi)容

正則表達(dá)式還能不能干點(diǎn)刺激的事情呢?

我有個(gè)朋友(別問我朋友是誰,有沒有他的聯(lián)系方式……)。他為了下載某些小視頻,硬生生地學(xué)會(huì)了爬蟲,然后,下載了一堆封面圖片和一些不可描述的文字描述,還有BT種子,我問他有多少,他說1TB的硬盤快滿了……

我問他是怎么做到的,他說他用了BeautifulSoup庫來爬的,傻瓜式的,很簡單,大有要傳授我這些秘技的樣子。他還按番號(hào)做了分類,每一類番號(hào),還生成一個(gè)markdown文本,其中用的最多的就是Regex,例如某類番號(hào)可以用ABC-\d+篩選出來。

搞完后,他“握草”了好幾次,驚嘆這個(gè)小小的島國,怎么可以拍這么多這些不可描述的小視頻,而且還……(此處省略255個(gè)字)

我很好奇,這個(gè)爬蟲這么好玩?我專門研究了下這個(gè)爬蟲神器BeautifulSoup,其中很多方法是支持正則表達(dá)式的,如re.compile('[a-z]+-[0-9]+',re.I).findall(str_temp)。用起來簡直是如虎添翼……

玩歸玩,正則表達(dá)式在我眼里應(yīng)該多干些正經(jīng)事的。

4. ?批量格式化處理

我有一堆16進(jìn)制數(shù),我想用到C代碼里面,例如將下面的內(nèi)容加上0x和逗號(hào),怎么搞?

?01234567
?89ABCDEF
?1011121314151617
?18191A1B1C1D1E1F
?2021222324252627
?28292A2B2C2D2E2F

作為一個(gè)很懶的程序員,我肯定不會(huì)一個(gè)個(gè)添加的。試試這個(gè):

查找目標(biāo): (\w+)[\s!\n]

替換為:0x\1,


(\w+)就是那一個(gè)個(gè)十六進(jìn)制數(shù),這個(gè)括號(hào)的作用,就先記錄一下,把它放一個(gè)分組里面,等下還要用。

[\s!\n]又是啥玩意?中括號(hào)的意思,就是匹配中括號(hào)里面任意一個(gè)內(nèi)容,\s就是空字符,包括空格、換行符、TAB等。\n就是換行啦,而!\n呢,非換行咯。整個(gè)意思就是,匹配任意不包含換行符的空字符。

下面,這個(gè)0x\1,中的\1就是上面查到的分組的內(nèi)容。

5. ?將數(shù)據(jù)格式化后復(fù)制到Excel

上面的例子有點(diǎn)啰嗦了,看個(gè)簡單的,有以下數(shù)據(jù),想將其中的0x和逗號(hào)去掉,并復(fù)制到Excel中。

?0x20, 0x21, ? 0x22, 0x23, ? 0x24, ? 0x25, 0x26, 0x27, 0x28, ? ??
?0x29, 0x2A, 0x2B, 0x2C, 0x2D, 0x2E, 0x2F,
?0x30, 0x31, 0x32, ? 0x33, 0x34, 0x35, 0x36, 0x37, ? 0x38, 0x39, ? 0x3A, 0x3B, ? 0x3C, 0x3D, 0x3E, 0x3F,
?0x40, ?

實(shí)際需要分兩步:

  1. 想將其中的0x和逗號(hào)去掉;

  2. 復(fù)制到Excel中(需要將多余的空格換成Tab字符,才能將多個(gè)數(shù)值分別填到不同單元格中)。

按照上面的例子,需要:

查找目標(biāo): 0x(\w+),\s+

替換為:\1\t

自己領(lǐng)悟一下,哈哈!雕蟲小技,還有沒有別的?

6. 代碼生成與格式化

現(xiàn)有播放器很多個(gè)命令,我想將其生成對(duì)應(yīng)的函數(shù),怎么辦?

命令:

?play
?pause
?stop
?prev
?next
?fastforward
?fastrewind
?……

函數(shù):

?BOOL player_play_cmd_func(void* p)
?{
??? ?
?}
?
?BOOL player_pause_cmd_func(void* p)
?{
??? ?
?}
?……

一個(gè)個(gè)手動(dòng)敲進(jìn)去?我這么懶,才不呢。

試試這個(gè):

查找目標(biāo): ^(\w+)$

替換為:BOOL player_\1_cmd_func\(void* p\)\n{\n\n}\n

好像都很簡單啊,有沒難一點(diǎn)的啊!

7. ?刪除不含某些信息的的內(nèi)容

匹配查找包含某些信息的內(nèi)容倒是容易,怎么匹配不包含的內(nèi)容啊?

例如,我想刪掉不是.mid后綴的內(nèi)容,怎么搞?

?2009/06/11 05:22 ? ? ? ? ? 24,253 flourish.mid
?2009/06/11 05:24 ? ? ? ? ? 118,060 ir_begin.wav
?2009/06/11 05:24 ? ? ? ? ? 126,252 ir_end.wav
?2009/06/11 05:24 ? ? ? ? ? 178,732 ir_inter.wav
?2009/06/11 05:22 ? ? ? ? ? 228,396 notify.wav
?2009/06/11 05:22 ? ? ? ? ? 40,075 onestop.mid
?2009/06/11 05:22 ? ? ? ? ? 111,788 recycle.wav
?2009/06/11 05:22 ? ? ? ? ? 88,236 ringout.wav
?2009/06/11 05:22 ? ? ? ? ? 22,097 town.mid

試試這個(gè):

查找目標(biāo):^((?!(2009.*\.mid$)).)*$

替換為:

看不懂?好好研究下!哈哈哈……

7. ?搭上腳本語言的快車

在Python、Ruby、Perl、JavaScript上用正則表達(dá)式,簡直會(huì)爽到飛起來……前提你要學(xué)會(huì)正則表達(dá)式各種語法。

這個(gè)就不裝逼了,以后慢慢玩。

-END-


來源 | 嵌入式軟件實(shí)戰(zhàn)派

作者 |?實(shí)戰(zhàn)派小師弟


|?整理文章為傳播相關(guān)技術(shù),版權(quán)歸原作者所有?|

|?如有侵權(quán),請(qǐng)聯(lián)系刪除?|


【1】超長干貨為你解析:從串口驅(qū)動(dòng)到Linux驅(qū)動(dòng)模型,嵌入式必會(huì)!

【2】超全!嵌入式必懂的CAN總線一文講通了

【3】干貨:嵌入式系統(tǒng)設(shè)計(jì)開發(fā)大全?。ㄈf字總結(jié))

【4】嵌入式系統(tǒng)求職回憶錄:廣嵌、邁瑞、華為、智光……

【5】嵌入式行業(yè)真的沒有前途嗎?



免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。文章僅代表作者個(gè)人觀點(diǎn),不代表本平臺(tái)立場,如有問題,請(qǐng)聯(lián)系我們,謝謝!

嵌入式ARM

掃描二維碼,關(guān)注更多精彩內(nèi)容

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
關(guān)閉
關(guān)閉