国产成人精品久久免费动漫-国产成人精品天堂-国产成人精品区在线观看-国产成人精品日本-a级毛片无码免费真人-a级毛片毛片免费观看久潮喷

您的位置:首頁技術文章
文章詳情頁

python - 用urllib抓取網頁上的下載鏈接,目標文件是xls形式,但發現抓下來的xls是空表,里面只有一句報錯信息,求幫助。

瀏覽:183日期:2022-07-24 08:56:37

問題描述

想用urllib抓取上交所股票列表的xls下載鏈接,如下圖紅色小框:

python - 用urllib抓取網頁上的下載鏈接,目標文件是xls形式,但發現抓下來的xls是空表,里面只有一句報錯信息,求幫助。

發現抓下來的xls只有報錯信息:

python - 用urllib抓取網頁上的下載鏈接,目標文件是xls形式,但發現抓下來的xls是空表,里面只有一句報錯信息,求幫助。

請問要怎樣才能把有內容的xls抓下來?

代碼如下

from urllib import requestfrom datetime import datetime# -*- coding:utf-8 -*-url = ’http://query.sse.com.cn/security/stock/downloadStockListFile.do?’ ’csrcCode=&stockCode=&areaName=&stockType=1’myheaders = [(’User - Agent’, ’Mozilla/5.0 (Windows; U; Windows NT 5.2) AppleWebKit/525.13’ ’ (KHTML, like Gecko) Version/3.1 Safari/525.13’),]opener = request.build_opener()opener.addheaders = myheadersrequest.install_opener(opener)local = '/Users/Mty/Downloads/data/' + str(datetime.now().date()) + ' .xls'request.urlretrieve(url, local)

問題解答

回答1:

可以在標紅線的url上看到返回的公司信息,剩下的就是模擬瀏覽器請求這個url了,request header中的refer一定不能省略,不然會報403

記住要模擬 refer 這一項的值。

http://blog.csdn.net/ssshen14...這個是已有的解決方案

回答2:

查看cookie,referer

標簽: Python 編程
主站蜘蛛池模板: 亚洲第一视频网站 | 男女福利 | 久草手机在线播放 | 成人性免费视频 | 国产亚洲一区呦系列 | 欧美一级免费看 | 久草在线新视觉 | 精品久久网 | 久9视频这里只有精品 | 在线看免费观看韩国特黄一级 | 一本色道久久综合亚洲精品 | 成人18网站 | 日本午夜三级 | 成人国产精品免费软件 | 久久久久久久综合色一本 | 久久视频精品36线视频在线观看 | 欧美高清日本三级人妇 | 国产青草 | 欧美一级在线 | 欧美日韩成人在线视频 | 欧美一区二区aa大片 | 蘑菇午夜三级 | 美女操男人 | 免费高清毛片在线播放视频 | 欧美在线观看一区二区三区 | 色爽爽爽爽爽爽爽爽 | 天天看a| 国产真实女人一级毛片 | 久久国产三级 | 一级在线免费视频 | 成人性动漫高清免费观看网址 | 日韩黄在线观看免费视频 | 久久精品免看国产成 | 国产无卡一级毛片aaa | 自拍 第一页| 天堂视频在线免费观看 | 99久久免费精品国产免费高清 | 久久91综合国产91久久精品 | 涩涩国产精品福利在线观看 | 国产99久久精品 | 亚洲国产第一区二区香蕉日日 |