如何在Win10系統(tǒng)使用Python3連接Hive
由于數(shù)據(jù)存放在大數(shù)據(jù)平臺的Hive數(shù)據(jù)倉庫中,我需要在Win10系統(tǒng)上利用Python3連接Hive,然后讀取數(shù)據(jù),進行探索、分析和挖掘工作。
我通過網(wǎng)上查找資料和實際測試,把Win10系統(tǒng)Python3成功連接Hive配置總結(jié)如下。
第一步:安裝依賴庫
pip install bitarraypip install bit_arraypip install thriftpip install thriftpypip install pure_saslpip install --no-deps thrift-sasl==0.2.1
提示:若是無法安裝,也可以點擊如下網(wǎng)址,
https://www.lfd.uci.edu/~gohlke/pythonlibs/
選擇合適庫的whl下載,然后進行本地化安裝。
第二步:安裝impyla庫
我采用本地化安裝方式,先下載impyla庫的whl,如下圖:
再安裝
pip install E:/Python_Library/impyla-0.16.2-py2.py3-none-any.whl
提示:上面的絕對路徑根據(jù)你自己的情況而定
第三步:測試impyla庫是否可以使用
from impala.dbapi import connect #用來連接Hive的函數(shù)from impala.util import as_pandas #用來把數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)換為pandas
若是運行通過,表示利用impala連接Hive配置成功。
簡單示例:
從Hive的一張表讀取100條記錄,放到pandas的DataFrame里面。
參考代碼:
from impala.dbapi import connect #用來連接Hive的函數(shù)from impala.util import as_pandas #用來把數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)換為pandasconn = connect(host=’my.host.com’, port=21050)cursor = conn.cursor()cursor.execute(’SELECT * FROM mytable LIMIT 100’)df = as_pandas(cursor)cursor.close()
參考資料
https://github.com/cloudera/impyla
以上就是如何在Win10系統(tǒng)使用Python3連接Hive的詳細內(nèi)容,更多關(guān)于Python3連接Hive的資料請關(guān)注好吧啦網(wǎng)其它相關(guān)文章!
相關(guān)文章:
1. Win10電腦屏幕亮度被鎖定了怎么解決?2. 怎么在Windows10中為應(yīng)用程序設(shè)置CPU進程優(yōu)先級Windows?3. Win10系統(tǒng)不能新建文件夾該怎么解決?4. Win10組策略如何打開?5. CentOS安裝銳速serverspeeder教程6. Linux Mint系統(tǒng)怎么卸載程序? Linux卸載不需要應(yīng)用的技巧7. Win10系統(tǒng)筆記本電腦卡住不動怎么辦?Win10電腦桌面卡死了怎么解決?8. Win10搜索欄如何關(guān)閉?9. Win10 dnf圖表系統(tǒng)組建失敗怎么修復(fù)?10. centos7怎么關(guān)閉ipv6僅使用ipv4?
