国产成人精品久久免费动漫-国产成人精品天堂-国产成人精品区在线观看-国产成人精品日本-a级毛片无码免费真人-a级毛片毛片免费观看久潮喷

您的位置:首頁技術文章
文章詳情頁

python - 爬蟲獲取網站數據,出現亂碼怎么解決。

瀏覽:110日期:2022-08-04 09:36:09

問題描述

#!/usr/bin/python# -*- coding: utf-8 -*-import urllib2import reimport HTMLParserclass WALLSTREET: def __init__(self, baseUrl):self.url = baseUrl def get_html_content(self):url = self.urlresponse = urllib2.urlopen(url)str = response.read()print strbaseUrl='https://wallstreetcn.com/live/global' #華爾街見文urlws = WALLSTREET(baseUrl)ws.get_html_content()

以上是代碼,寫的很簡單,但是print出來的是亂碼嘗試了 print str.decode(“utf-8“”)但是報錯UnicodeDecodeError: ’utf8’ codec can’t decode byte 0x8b in position 1: invalid start byte

問題解答

回答1:

str = response.read()這句有兩個問題:1、str是內置關鍵字必須更改為其他變量名2、查看網頁源代碼的編碼方式,如果為utf-8在read()后加.decode(’utf-8’),若為其他可以相應解碼

小建議這種小程序寫個函數會比用類來更加方便,無論是使用還是實現

回答2:

推測用的是sublime text?參考這個

回答3:

這兒應該是encode不是decode,而且你的變量名居然是跟內置關鍵字名字一樣

回答4:

應該是encode吧

標簽: Python 編程
主站蜘蛛池模板: 日韩毛片一级 | 亚洲天堂男人网 | 美国一级毛片片aa久久综合 | 中文字幕精品一区二区2021年 | 久久成年视频 | 国产成人亚洲日本精品 | 国产欧美一区二区日本加勒比 | 国产页| 亚洲性xo | 97在线视频免费观看费观看 | 国产欧美在线观看不卡一 | 又黄又爽视频好爽视频 | 国产91无套剧情在线播放 | 久久久国产99久久国产一 | jk制服福利在线播放 | 免费午夜扒丝袜www在线看 | 久久精品国产半推半就 | 亚洲欧美日本国产综合在线 | 宫女淫春3在线观 | 亚洲国产精品久久精品成人 | 99国产在线视频 | 欧美日韩在线播一区二区三区 | 麻豆理论片 | 99亚洲视频 | 一级毛片在线免费看 | 国产成年网站v片在线观看 国产成人aa在线视频 | caoporen在线视频入口 | 国产久草在线 | 国产高清一区 | 又黄又刺激下面流水的视频 | 日本三级午夜 | 欧美亚洲一区二区三区四 | 国产片久久 | 欧美黄网在线 | 亚洲一区二区精品 | 国产免费爽爽视频免费可以看 | 中文三 级 黄 色 片 | 国产一区二区三区毛片 | 国产成人综合日韩精品无 | 亚洲午夜网站 | 日本a级毛片视频播放 |