国产成人精品久久免费动漫-国产成人精品天堂-国产成人精品区在线观看-国产成人精品日本-a级毛片无码免费真人-a级毛片毛片免费观看久潮喷

您的位置:首頁技術文章
文章詳情頁

python - 用urllib抓取網頁上的下載鏈接,目標文件是xls形式,但發現抓下來的xls是空表,里面只有一句報錯信息,求幫助。

瀏覽:183日期:2022-07-24 08:56:37

問題描述

想用urllib抓取上交所股票列表的xls下載鏈接,如下圖紅色小框:

python - 用urllib抓取網頁上的下載鏈接,目標文件是xls形式,但發現抓下來的xls是空表,里面只有一句報錯信息,求幫助。

發現抓下來的xls只有報錯信息:

python - 用urllib抓取網頁上的下載鏈接,目標文件是xls形式,但發現抓下來的xls是空表,里面只有一句報錯信息,求幫助。

請問要怎樣才能把有內容的xls抓下來?

代碼如下

from urllib import requestfrom datetime import datetime# -*- coding:utf-8 -*-url = ’http://query.sse.com.cn/security/stock/downloadStockListFile.do?’ ’csrcCode=&stockCode=&areaName=&stockType=1’myheaders = [(’User - Agent’, ’Mozilla/5.0 (Windows; U; Windows NT 5.2) AppleWebKit/525.13’ ’ (KHTML, like Gecko) Version/3.1 Safari/525.13’),]opener = request.build_opener()opener.addheaders = myheadersrequest.install_opener(opener)local = '/Users/Mty/Downloads/data/' + str(datetime.now().date()) + ' .xls'request.urlretrieve(url, local)

問題解答

回答1:

可以在標紅線的url上看到返回的公司信息,剩下的就是模擬瀏覽器請求這個url了,request header中的refer一定不能省略,不然會報403

記住要模擬 refer 這一項的值。

http://blog.csdn.net/ssshen14...這個是已有的解決方案

回答2:

查看cookie,referer

標簽: Python 編程
主站蜘蛛池模板: 国产亚洲三级 | 日韩一级欧美一级一级国产 | 色综合在 | 欧美一二三区视频 | 台湾三级香港三级在线理论 | 99re久久精品国产首页2020 | 久久免费黄色 | 国产成人精品福利网站在线观看 | 久久久久久一品道精品免费看 | 牲欧美 | 性理论片 | 视频一区视频二区在线观看 | 在线观看成年视频 | 无码孕妇孕交在线观看 | 久久综合中文字幕一区二区 | 5x性区m免费毛片视频看看 | 日韩精品无码一区二区三区 | 男人女人做性全程视视频 | 亚洲一区二区三区高清视频 | 日韩 欧美 中文 亚洲 高清 在线 | 精品国产免费一区二区三区五区 | 国产午夜永久福利视频在线观看 | 精品无人区一区二区三区a 精品午夜国产在线观看不卡 | 亚洲在线一区二区三区 | 国产欧美一区二区三区沐欲 | 抱着cao才爽免费观看 | 日本国产在线视频 | 99视频在线播放 | 国产一区亚洲二区三区 | 热99re久久精品香蕉 | 婷婷亚洲久悠悠色在线播放 | 日韩国产在线 | 91av福利| 免费高清特黄a 大片 | 最刺激黄a大片免费网站 | 欧美3p精品三区 | 久久综合伊人77777 | 精品国产日韩亚洲一区在线 | 日本黄页网站免费大全 | 久久国产精品久久国产精品 | 一级黄色毛片免费看 |