国产成人精品久久免费动漫-国产成人精品天堂-国产成人精品区在线观看-国产成人精品日本-a级毛片无码免费真人-a级毛片毛片免费观看久潮喷

您的位置:首頁技術文章
文章詳情頁

hive從mysql導入數據量變多的解決方案

瀏覽:4日期:2023-10-07 10:55:28

原始導數命令:

bin/sqoop import -connect jdbc:mysql://192.168.169.128:3306/yubei -username root -password 123456 -table yl_city_mgr_evt_info --split-by rec_id -m 4 --fields-terminated-by 't' --lines-terminated-by 'n' --hive-import --hive-overwrite -create-hive-table -delete-target-dir -hive-database default -hive-table yl_city_mgr_evt_info

原因分析:可能是mysql中字段里面有’n’等分隔符,導入hive時默認以’n’作換行符,導致hive中的記錄數變多。

解決方法:

導入數據時加上--hive-drop-import-delims選項,會刪除字段中的n,r,01。

最終導數命令:

bin/sqoop import -connect jdbc:mysql://192.168.169.128:3306/yubei -username root -password 123456 -table yl_city_mgr_evt_info --split-by rec_id -m 4 --hive-drop-import-delims --fields-terminated-by 't' --lines-terminated-by 'n' --hive-import --hive-overwrite -create-hive-table -delete-target-dir -hive-database default -hive-table yl_city_mgr_evt_info

參考官方文檔:https://sqoop.apache.org/docs/1.4.7/SqoopUserGuide.html

補充:Sqoop導入MySQL數據到Hive遇到的坑

1.sqoop導入到HDFS

1.1執行sqoop job,會自動更新last value

# sqoop 增量導入腳本bin/sqoop job --create sqoop_hdfs_test02 -- import --connect jdbc:mysql://localhost:3306/pactera_test --username root --password 123456 --table student --target-dir /user/sqoop/test002/ --fields-terminated-by 't' --check-column last_modified --incremental lastmodified --last-value '2018-12-12 00:03:00' --append

說明:--append 參數是必須的,要不然第二次運行job 會報錯,如下:

hive從mysql導入數據量變多的解決方案

至此,sqoop job 已建設完畢!

2.Hive創建表,并讀取sqoop導入的數據

create external table if not exists student_hive (SId int,Sname string ,Sage string,Ssex string , last_modified Timestamp) row format delimited fields terminated by ’t’ location ’hdfs://node01:8020/user/sqoop/test002/’;

注意:此處hive中時間的格式為timestamp,設置為date DB數據無法正常加載。

第一次全量加載,整條路線完全OK,hive表可以查詢到數據。

-----------------------重點分割線-----------------------

* sqoop lastmodified格式的增量加載,會將last-value 保存為job執行的系統時間,若測試數據庫的check-column 小于當前系統時間(即上一個job的last-value),則數據將不被加載。

hive從mysql導入數據量變多的解決方案

如SId=6 就沒有被加載,遂改為今日時間(2018-12-26 17:05)進行數據測試,數據成功被加載!喲呵??!

總結:

使用lastmodified格式,進行sqoop增量導入時,

1.注意--append的使用;

2.last-value為job運行的系統時間,在數據測試時,要保證數據的準確,數據的自增長。

3.一切皆有定數,查看資料,準確定位自己系統遇到的問題

以上為個人經驗,希望能給大家一個參考,也希望大家多多支持好吧啦網。如有錯誤或未考慮完全的地方,望不吝賜教。

標簽: MySQL 數據庫
相關文章:
主站蜘蛛池模板: 色偷偷在线刺激免费视频 | 国产成人免费高清视频网址 | a级毛片毛片免费很很综合 a级毛片免费 | 免费真实播放国产乱子伦 | 国产精品手机视频一区二区 | 国产一区二区影院 | 亚洲午夜色 | 亚洲美女精品视频 | 美女作爱网站 | 国产亚洲精品一区二区 | 欧美成人香蕉网在线观看 | 日韩成人精品日本亚洲 | 一级看片免费视频囗交 | 精品国产午夜久久久久九九 | 精品国产区一区二区三区在线观看 | 亚洲国产成人在线 | 日韩免费一区二区三区在线 | 国内精品不卡一区二区三区 | 99久久香蕉国产线看观香 | 精品久久久久久乐 | 各种偷拍盗摄视频在线观看 | 永久免费不卡在线观看黄网站 | 手机看片国产精品 | 亚洲高清自拍 | 精品国产高清久久久久久小说 | 欧美一级日韩在线观看 | 国产成人精品久久亚洲高清不卡 | 在线播放国产真实女同事 | 亚洲一区二区三区免费看 | 一本大道香蕉大vr在线吗视频 | 一区二区三区四区在线 | 色偷偷88欧美精品久久久 | 成人在线免费视频 | 日韩一级在线 | 国产精品久久久久毛片真精品 | 黄色三级日韩 | 精品久久久久中文字幕日本 | 男人都懂的网址在线看片 | 国产日本欧美在线观看 | 一级免费看片 | 精品国产精品国产 |