Python爬蟲(chóng)實(shí)現(xiàn)百度翻譯功能過(guò)程詳解
首先,需要簡(jiǎn)單的了解一下爬蟲(chóng),盡可能簡(jiǎn)單快速的上手,其次,需要了解的是百度的API的接口,搞定這個(gè)之后,最后,按照官方給出的demo,然后寫自己的一個(gè)小程序
打開(kāi)瀏覽器 F12 打開(kāi)百度翻譯網(wǎng)頁(yè)源代碼:
我們可以輕松的找到百度翻譯的請(qǐng)求接口為:http://fanyi.baidu.com/sug
然后我們可以從方法為POST的請(qǐng)求中找到參數(shù)為:kw:job(job是輸入翻譯的內(nèi)容)
下面是代碼部分:
from urllib import request,parseimport jsondef translate(content): url = 'http://fanyi.baidu.com/sug' data = parse.urlencode({'kw':content}) # 將參數(shù)進(jìn)行轉(zhuǎn)碼 headers = { ’User-Agent’: ’Opera/9.80 (Android 2.3.4; Linux; Opera Mobi/build-1107180945; U; en-GB) Presto/2.8.149 Version/11.10’ } req = request.Request(url,data=bytes(data,encoding='utf-8'),headers=headers) r = request.urlopen(req) # print(r.code) 查看返回的狀態(tài)碼 html = r.read().decode(’utf-8’) # json格式化 html = json.loads(html) # print(html) for k in html['data']: print(k['k'],k['v'])if __name__ == ’__main__’: content = input('請(qǐng)輸入您要翻譯的內(nèi)容:') translate(content)
結(jié)果如下
以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持好吧啦網(wǎng)。
相關(guān)文章:
1. XML入門的常見(jiàn)問(wèn)題(三)2. HTTP協(xié)議常用的請(qǐng)求頭和響應(yīng)頭響應(yīng)詳解說(shuō)明(學(xué)習(xí))3. ASP將數(shù)字轉(zhuǎn)中文數(shù)字(大寫金額)的函數(shù)4. jscript與vbscript 操作XML元素屬性的代碼5. .NET Framework各版本(.NET2.0 3.0 3.5 4.0)區(qū)別6. XML在語(yǔ)音合成中的應(yīng)用7. 不要在HTML中濫用div8. php使用正則驗(yàn)證密碼字段的復(fù)雜強(qiáng)度原理詳細(xì)講解 原創(chuàng)9. ASP基礎(chǔ)入門第四篇(腳本變量、函數(shù)、過(guò)程和條件語(yǔ)句)10. HTML5實(shí)戰(zhàn)與剖析之觸摸事件(touchstart、touchmove和touchend)
