Python實(shí)現(xiàn)像awk一樣分割字符串
若你使用過 Shell 中的 awk 工具,會(huì)發(fā)現(xiàn)用它來分割字符串是非常方便的。特別是多個(gè)連續(xù)空格會(huì)被當(dāng)做一個(gè)處理。
[root@localhost ~]# cat demo.txt hello world [root@localhost ~]# [root@localhost ~]# awk ’{print$1,$2}’ demo.txt hello world
可是轉(zhuǎn)換到 Python 上面來呢?結(jié)果可能是這樣的。
>>> msg=’hello world’ >>> msg.split(’ ’) [’hello’, ’’, ’’, ’’, ’world’]
與我預(yù)想的結(jié)果不符,多個(gè)空格會(huì)被分割多次。
那有什么辦法可以達(dá)到 awk 一樣的效果呢?
有兩種方法。
第一種方法
不加參數(shù),這種只適用于將多個(gè)空格當(dāng)成一個(gè)空格處理,如果不是以空格為分隔符的場景,這種就不適用了。
>>> msg=’hello world’ >>> msg.split() [’hello’, ’world’]
第二種方法
使用 filter 來輔助,這種適用于所有的分隔符,下面以 - 為分隔符來舉例。
>>> msg=’hello----world’ >>> msg.split(’-’) [’hello’, ’’, ’’, ’’, ’world’] >>> >>> filter(None, msg.split(’-’)) [’hello’, ’world’]
是不是很神奇,filter 印象中第一個(gè)參數(shù)接收的是 函數(shù),這里直接傳 None 居然有奇效。
查看了注釋,原來是這個(gè)函數(shù)會(huì)適配 None 的情況,當(dāng)?shù)谝粋€(gè)參數(shù)是None的時(shí)候,返回第二個(gè)參數(shù)(可迭代對(duì)象)中非空的值,非常方便。
換用函數(shù)的寫法,可以這樣
>>> msg=’hello----world’ >>> msg.split(’-’) [’hello’, ’’, ’’, ’’, ’world’] >>> >>> filter(lambda item: True if item else False, msg.split(’-’)) [’hello’, ’world’]
以上就是本文的全部內(nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持好吧啦網(wǎng)。
相關(guān)文章:
1. XML在語音合成中的應(yīng)用2. HTTP協(xié)議常用的請(qǐng)求頭和響應(yīng)頭響應(yīng)詳解說明(學(xué)習(xí))3. 不要在HTML中濫用div4. ASP將數(shù)字轉(zhuǎn)中文數(shù)字(大寫金額)的函數(shù)5. .NET Framework各版本(.NET2.0 3.0 3.5 4.0)區(qū)別6. jscript與vbscript 操作XML元素屬性的代碼7. HTML5實(shí)戰(zhàn)與剖析之觸摸事件(touchstart、touchmove和touchend)8. php使用正則驗(yàn)證密碼字段的復(fù)雜強(qiáng)度原理詳細(xì)講解 原創(chuàng)9. ASP基礎(chǔ)入門第四篇(腳本變量、函數(shù)、過程和條件語句)10. XML入門的常見問題(三)
