国产成人精品久久免费动漫-国产成人精品天堂-国产成人精品区在线观看-国产成人精品日本-a级毛片无码免费真人-a级毛片毛片免费观看久潮喷

文章詳情頁

Python爬蟲如何爬取span和span中間的內容并分別存入字典里？

瀏覽：87日期：2022-07-15 16:32:54

問題描述

我想把房屋概況分別抓出來并分別作為獨立的列存儲進字典里，但是行內元素沒有辦法直接用for循環摳出來。這是我的代碼：

soup.select(’.house-info li’)[1].text.strip()

這是網頁html代碼：

<li><span class='info-tit'>房屋概況：</span>住宅<span class='splitline'>|</span>1室1廳1衛<span class='splitline'>|</span><span>46m2</span><span class='splitline'>|</span> (高層)/共18層<span class='splitline'>|</span>南北<span class='splitline'>|</span> 豪華裝修 </li>

問題解答

回答1：

其實還是很有簡單的，你看這個還是有規律的，規律在于有分隔符|，我寫了個DEMO

something = ’’’<li><span class='info-tit'>房屋概況：</span>住宅 <span class='splitline'>|</span>1室1廳1衛<span class='splitline'>|</span><span>46m2</span><span class='splitline'>|</span> (高層)/共18層<span class='splitline'>|</span>南北<span class='splitline'>|</span> 豪華裝修 </li>’’’;soup = BeautifulSoup(something, ’lxml’)plaintext = soup.select(’li’)[0].get_text().strip()

通過get_text()得到內在所有內容，然后去除空格。后面你就用split進行分割吧，后面的不寫了。如果有問題再交流。

回答2：我感覺這個html代碼寫錯了呢,標簽的內容文本在標簽外面

Python爬蟲如何爬取span和span中間的內容并分別存入字典里？

正確的標簽內容就兩個:

房屋概況：

46m2

回答3：

innerText

回答4：

你這種情況，我覺得用 for 循環加上正則表達式是最方便的，如果所有模版都是這樣固定的話

回答5：

用pyquery吧

from pyquery import PyQuery as Q

Q(text).find(’.house-info li’).text()

Python 編程

上一條：python文檔怎么查看？下一條：python class嵌套怎么訪問父類

相關文章：

1. android - NavigationView 的側滑菜單中如何保存新增項（通過程序添加）2. mysql服務無法啟動1067錯誤，誰知道正確的解決方法？3. php - 第三方支付平臺在很短時間內多次異步通知,訂單多次確認收款4. php7.3.4中怎么開啟pdo驅動5. jquery清除input type為password？6. 這段代碼既不提示錯誤也看不到結果，請老師明示錯在哪里，謝謝！7. tp5 不同控制器中的變量調用問題8. 老師我是一個沒有學過php語言的準畢業生我希望您能幫我一下9. ueditor上傳服務器提示后端配置項沒有正常加載，求助！！！！！10. 提示語法錯誤語法錯誤: unexpected ’abstract’ (T_ABSTRACT)

排行榜

					
					android - NavigationView 的側滑菜單中如何保存新增項（通過程序添加）
mysql服務無法啟動1067錯誤，誰知道正確的解決方法？
python - 如何解決queue中同一個參數被多個線程同時調用？
spring - java freemarker沒有@extends，@block這些指令？
python-mysqldb - 這樣結構的mysql表，如何快速update
前端 - 移動端 絕對定位 超出無法隱藏 導致body可以滾動
apache 報錯信息不是英文或中文
css - 重寫checkbox樣式 用到id  與label關聯實現 但是現在checkbox循環生成多項 就不能用id了 求解決辦法
node.js - node的child_process.spawn(...[, options])怎么寫多個options?
python - pyspider phantomjs內存泄漏和假死怎么解決呢？
javascript - react，獲取radio的值出錯
				

熱門標簽

主站蜘蛛池模板：日韩中文字幕视频 | aaa免费看| xxxwww黄色| 国产成人精品亚洲77美色 | 久久福利国产 | 久久精品国产精品亚洲毛片 | 一本久综合久久爱 | 日韩毛片在线播放 | 久久艹在线 | 男女猛烈无遮掩免费视频 | japanese日本舒服丰满 | 久久夜色精品国产噜噜亚洲a | 国产在线不卡视频 | 91高清免费国产自产 | 日韩美女在线视频 | 99久久99热久久精品免费看 | 亚洲久久在线观看 | 美女视频免费永久观看的 | 国产99视频精品免视看9 | 91四虎国自产在线播放线 | 精品久久久久久综合网 | 色播基地 | 日本一区视频在线观看 | 国产在线精品一区二区 | 寡妇一级a毛片免费播放 | 高清性色生活片久久久 | a久久99精品久久久久久不 | 欧美一级特黄刺激爽大片 | 好吊妞国产欧美日韩视频 | 亚洲欧美日韩中文字幕在线一区 | 日韩黄色免费观看 | 久久久精品免费热线观看 | 亚州色吧 | 国产一区二区三区免费观看 | 日本三级香港三级人妇 m | 黄色片三级网站 | 日本毛片在线观看 | 亚洲免费毛片 | 青青自拍视频一区二区三区 | 久久精品亚洲精品国产欧美 | 免费国产综合视频在线看 |