国产成人精品久久免费动漫-国产成人精品天堂-国产成人精品区在线观看-国产成人精品日本-a级毛片无码免费真人-a级毛片毛片免费观看久潮喷

您的位置:首頁技術文章
文章詳情頁

使用python客戶端訪問impala的操作方式

瀏覽:78日期:2022-07-31 18:16:25

因需要將impala僅僅作為數據源使用,而python有較好的數據分析函數,所以需要使用python客戶端來獲取impala中的表數據,這里的測試環境是:

操作系統:win7 (linux下也可行)

python 2.7

大數據環境:centos6.6

CDH版本:CDH5.4.1

impala 2.1.2 port:21050

1、安裝Python package

pip install impyla

2、python客戶端與impala交互

2.1 連接impala

>>> from impala.dbapi import connect>>> conn = connect(host=’my.impala.host’, port=21050)>>> cur = conn.cursor()

注意:這里要確保端口設置為HS2服務,而不是Beeswax服務。在Cloudera的管理集群中,HS2的默認端口是21050。 (Beeswax默認端口21000)

2.2 對impala執行SQL查詢

>>> cur.execute(’SHOW TABLES’)>>> cur.fetchall()[(’defect_code_dim’,), (’gxzl_ca_materialinfo’,), (’gxzl_cg_materialinfo’,), (’gxzl_defect2’,), (’gxzl_defects’,), (’gxzl_defects_hd’,), (’gxzl_fx_class’,), (’gxzl_fx_leftmidright’,), (’gxzl_fx_topandbot’,), (’gxzl_jiejing_2cc_slab’,), (’gxzl_kgx_drw’,), (’gxzl_kgx_drw_tmp’,), (’gxzl_rz_materialinfo’,), (’gxzl_sdbase_defects’,), (’gxzl_test’,), (’new_table’,), (’ouye_transactionlog’,), (’ouye_userinfo’,), (’simple_test’,), (’t0’,), (’t_100m_hdfs’,), (’t_100m_test’,), (’t_10m_hdfs’,), (’target1’,), (’target2’,), (’target3’,), (’test’,), (’tianchi_mobile_recommend_train_full’,), (’tianchi_mobile_recommend_train_item’,), (’tianchi_mobile_recommend_train_user’,), (’tianchi_mobile_recommend_train_useritem’,)]>>> cur.execute(’SELECT * FROM test’)>>> cur.description[(’id’, ’DOUBLE’, None, None, None, None, None), (’name’, ’STRING’, None, None, None, None, None), (’value’, ’STRING’, None, None, None, None, None)]>>> cur.fetchall()[(1.0, ’tom’, ’f’), (2.0, ’jerry’, ’t’)]>>>

注意:從服務器上獲取數據會刪除緩存,所以第二個.fetchall()返回一個空列表。

>>> cur.fetchall()[(1.0, ’tom’, ’f’), (2.0, ’jerry’, ’t’)]>>> cur.fetchall()[]>>>

2.3 遍歷查詢結果

>>> cur.execute(’SELECT * FROM test’)>>> for row in cur: print row[1] == 1.0FalseFalse

注:python的角標是以0開始。以上仍是以緩存方式來獲取數據。

如果你的數據集較小可以使用這種方式;如果你需要存儲大量的數據集,你可以用CREATE TABLE AS SELECT語句把它寫入HDFS。

2.4 將查詢結果轉化為python中的pandas DataFrames

除了遍歷結果以外,還可以把結果轉化成pandas的數據框對象,以便進行數據分析:

>>> from impala.dbapi import connect>>> conn = connect(host=’my.impala.host’, port=21050)>>> cur = conn.cursor()>>> from impala.util import as_pandas>>> cur.execute(’SELECT * FROM test’)>>> df = as_pandas(cur)>>> type(df)<class ’pandas.core.frame.DataFrame’>>>> df id name value0 1 tom f1 2 jerry t>>>

注:前提是python中安裝了pandas,使用pip install pandas在線安裝,安裝過程中可能會提示:Microsoft Visual C++ 9.0 is required (Unable to find vcvarsall.bat). Get it from http://aka.ms/vcpython27

只要按照提示說的的去下載一個VC就可以了。這樣就安裝好了pandas。

以上這篇使用python客戶端訪問impala的操作方式就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持好吧啦網。

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 欧美成人免费xxx大片 | 麻豆19禁国产青草精品 | 亚洲精品一区二区三区四区 | 亚洲gogo人体大胆西西安徽 | 欧美成人观看免费完全 | 狠狠色丁香九九婷婷综合五月 | av在线亚洲男人的天堂 | 国产在线精品一区二区高清不卡 | 日本成a人片在线观看网址 日本成年人视频网站 | 正在播放国产精品放孕妇 | 日本免费久久 | 国产不卡在线观看视频 | 一级做a爱 | 久久亚洲国产的中文 | 亚洲视频手机在线 | 一区二区在线看 | 国产欧美日韩一区二区三区 | 国产日韩精品一区二区在线观看 | 在线看片日本 | 久久久久久久91精品免费观看 | 特级毛片全部免费播放a一级 | 国产欧美精品综合一区 | 欧美成人吃奶高清视频 | 亚洲成人黄色网址 | 日韩中文字幕免费观看 | 亚洲视频在线免费观看 | 久久久久国产午夜 | 美女黄色影院 | 成年女人毛片免费视频永久vip | 伊人波多野结衣 | 一区欧美| 久久成人国产精品免费 | 久草在线视频网 | 九九九九在线视频播放 | 国产99网站 | 一个人的视频日本免费 | 亚洲一区二区三区一品精 | 国产精品综合一区二区三区 | 女人张开腿让男人 | 日本黄色大片在线播放视频免费观看 | 亚洲精品综合一二三区在线 |