国产成人精品久久免费动漫-国产成人精品天堂-国产成人精品区在线观看-国产成人精品日本-a级毛片无码免费真人-a级毛片毛片免费观看久潮喷

您的位置:首頁技術(shù)文章
文章詳情頁

python - 爬蟲獲取網(wǎng)站數(shù)據(jù),出現(xiàn)亂碼怎么解決。

瀏覽:78日期:2022-08-04 09:36:09

問題描述

#!/usr/bin/python# -*- coding: utf-8 -*-import urllib2import reimport HTMLParserclass WALLSTREET: def __init__(self, baseUrl):self.url = baseUrl def get_html_content(self):url = self.urlresponse = urllib2.urlopen(url)str = response.read()print strbaseUrl='https://wallstreetcn.com/live/global' #華爾街見文urlws = WALLSTREET(baseUrl)ws.get_html_content()

以上是代碼,寫的很簡單,但是print出來的是亂碼嘗試了 print str.decode(“utf-8“”)但是報(bào)錯(cuò)UnicodeDecodeError: ’utf8’ codec can’t decode byte 0x8b in position 1: invalid start byte

問題解答

回答1:

str = response.read()這句有兩個(gè)問題:1、str是內(nèi)置關(guān)鍵字必須更改為其他變量名2、查看網(wǎng)頁源代碼的編碼方式,如果為utf-8在read()后加.decode(’utf-8’),若為其他可以相應(yīng)解碼

小建議這種小程序?qū)憘€(gè)函數(shù)會比用類來更加方便,無論是使用還是實(shí)現(xiàn)

回答2:

推測用的是sublime text?參考這個(gè)

回答3:

這兒應(yīng)該是encode不是decode,而且你的變量名居然是跟內(nèi)置關(guān)鍵字名字一樣

回答4:

應(yīng)該是encode吧

標(biāo)簽: Python 編程
主站蜘蛛池模板: 成人在线第一页 | 国产成人亚洲精品一区二区在线看 | 一个人看的日本www的免费视频 | 亚洲第一免费视频 | 高清一区二区在线观看 | 美女在线看永久免费网址 | 欧美日韩一区二区三区视频 | 欧美日韩一区二区三区在线观看 | 欧美一级成人免费大片 | 色播亚洲精品网站 亚洲第一 | 亚洲综合一二三区 | 国产中的精品一区的 | 国产精品麻豆一区二区三区v视界 | 中文国产成人精品久久无广告 | 成人影院免费观看 | 成人在线视频免费看 | 成人欧美视频在线看免费 | 中文字幕在线视频在线看 | 久久成人18免费网站 | 亚洲国产在 | 日韩特级黄色片 | 久久福利青草精品资源站免费 | 亚洲香蕉久久一区二区 | 国产亚洲精品高清在线 | 免费永久在线观看黄网 | 亚洲成年人专区 | 99在线免费观看 | 欧美日韩亚洲另类 | 日韩成人小视频 | 激情宗合网 | 综合558欧美成人永久网站 | 国产精品久久久久激情影院 | 中国成人免费视频 | 日本国产免费一区不卡在线 | 全国男人的天堂网 | 女人成午夜大片7777在线 | 特级淫片国产免费高清视频 | 神马午夜-午夜片 | 国产精品免费大片一区二区 | 黄色毛片视频在线观看 | www.亚洲黄色 |