sqoop從mysql導入hdfs_sqoop 從mysql導入數據到hdfs、hive

1.上傳sqoop安裝包 2.安裝和配置 在添加sqoop到環境變量 將數據庫連接驅動拷貝到$SQOOP_HOME/lib里 3.使用 第一類:數據庫中的數據導入到HDFS上 sqoop import --connect jdbc:mysql://hadoop07:3306/test --username root --password 123 ?--table user_info--columns 'id, account, income, expenses' 指定輸出路徑、指定數據分隔符 sqoop import --connect jdbc:mysql://192.168.19.116:3306/test --username root --password 123 ?--table user_info--target-dir '/sqoop/td' --fields-terminated-by '\t' 指定Map數量 -m? sqoop import --connect jdbc:mysql://192.168.19.116:3306/test --username root --password 123 ?--table user_info--target-dir '/sqoop/td1' --fields-terminated-by '\t' -m 2 增加where條件, 注意:條件必須用引號引起來 sqoop import --connect jdbc:mysql://192.168.19.116:3306/test --username root --password 123 ?--table user_info--where 'id>3' --target-dir '/sqoop/td2'? 增加query語句(使用 \ 將語句換行) sqoop import --connect jdbc:mysql://192.168.19.116:3306/test --username root --password 123 \ --query 'SELECT * FROM trade_detail where id > 2 AND $CONDITIONS' --split-by user_info.id --target-dir '/sqoop/td3' 注意:如果使用--query這個命令的時候,需要注意的是where后面的參數,AND $CONDITIONS這個參數必須加上 而且存在單引號與雙引號的區別,如果--query后面使用的是雙引號,那么需要在$CONDITIONS前加上\即\$CONDITIONS 如果設置map數量為1個時即-m 1,不用加上--split-by ${tablename.column},否則需要加上 第二類:將HDFS上的數據導出到數據庫中(不要忘記指定分隔符) sqoop export --connect jdbc:mysql://192.168.19.116:3306/test --username root --password 123 --export-dir '/td3' --table td_bak -m 1 --fields-terminated-by ',' 4.配置mysql遠程連接 GRANT ALL PRIVILEGES ON itcast.* TO 'root'@'192.168.19.116' IDENTIFIED BY '123' WITH GRANT OPTION; FLUSH PRIVILEGES;? GRANT ALL PRIVILEGES ON *.* TO 'root'@'%' IDENTIFIED BY '123' WITH GRANT OPTION; FLUSH PRIVILEGES 5.sqoop 導入到hive? ? 在hive當中創建兩張表 ? create table teacher_info (id bigint, account string, income double, expenses double, time string) row format delimited fields terminated by '\t'; ? create table user_info (id bigint, name ?string, age int) row format delimited fields terminated by '\t'; ?? ? 將mysq當中的數據直接導入到hive當中 ? sqoop import --connect jdbc:mysql://192.168.19.116:3306/test --username root --password 123 --table teacher_info --hive-import --hive-overwrite --hive-table teacher_info --fields-terminated-by '\t' ? sqoop import --connect jdbc:mysql://192.168.19.116:3306/test --username root --password 123 --table user_info --hive-import --hive-overwrite --hive-table user_info --fields-terminated-by '\t' ?? 6.報錯情況: ? a.可能是連接驅動版本不符合,更新相對應得版本 ? b.報連接不多historyserver 10020 端口 ? ? ? ?HistoryServer需要配置: yarn-site.xml ? ? ? mapred.job.history.server.embedded ? ? true ? ? ? ?mapreduce.jobhistory.address ? ?historyserver:10020 ? ? ?啟動historyserver:sbin/mr-jobhistory-daemon.sh start historyserver? ? ? 校驗是否啟動成功:jps 看到:JobHistoryServer 進程

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/530564.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/530564.shtml
英文地址,請注明出處:http://en.pswp.cn/news/530564.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

安卓mysql插入數據_【11-25求助】關于Android 的SQLite數據庫插入數據報錯問題

該樓層疑似違規已被系統折疊 隱藏此樓查看此樓運行程序,不知道為何點插入數據按鈕會報錯,請萬能的吧友幫我看看,謝謝,不廢話,直接上代碼MainActivity.javapackage com.example.activity16;import android.support.v7.a…

安裝python擴展庫時只能使用pip_安裝 Python 擴展庫時只能使用 pip 工具在線安裝,如果安裝不成功就沒有別的辦法了。_學小易找答案...

【單選題】關于Python中的復數,下列說法錯誤的是_________________。【填空題】在Python程序中,導入sys模塊后,可以通過列表________________訪問命令行參數。_________________表示Python腳本名;____________________表示第一個參數。【簡答題】嘗試用顏色 表達 冷暖 感覺 !【…

opencv java_opencv的Java開發環境配置(IntelliJ idea)

1、首先我們先到官網下載opencv的包,在官網下載到的是一個可運行文件,其實就是一個解壓程序,運行后會把opencv的相關文件解壓到填寫的路徑。2、 在編輯環境變量窗口,點擊新建,然后將opencv文件夾里的bin路徑復制進去&a…

java session 永不過期_Java Web Application使Session永不失效(利用cookie隱藏登錄)

在做 Web Application 時,因為 Web Project 有 session 自動失效的問題,所以如何讓用戶登錄一次系統就能長時間運行三個月,就是個問題。后來,看到 session 失效的攔截器代碼,就猜想能否通過攔截器來實現。查資料發現可…

java is-a_java中 is - a和 has - a的區別

Java中is-a和has-a的區別1.“is-a”是繼承的關系,比如人是動物,人和動物是繼承的關系;2.“has-a”是聚合的關系,比如人有眼睛,人和眼睛是聚合的關系;也可以理解為 is-a 是“繼承”但has-a是“接口”關系。是“相互依賴”的關系,同時它們的生命周期都是一樣的。我們以…

支付寶支付對賬單java_[Java]解析支付寶對賬單csv

配置相關公鑰和私鑰這些需要在支付寶的賬戶中心配置image.png這些內容在支付寶平臺上都有教程,因為下載對賬單這個功能比較簡單,不需要入聚石塔下載對賬單https://docs.open.alipay.com/20180417160701241302/fd3qt1官方文檔寫的很清楚,而且能直接用,將配置好的公鑰私鑰APPID等…

cmd編譯java文件中文亂碼_亂碼 HelloWorld 世界你好 cmd 執行輸出的中文java 顯示亂碼 解決 另附 win無法執行編譯運行javac java編譯文件的解決方案...

【博客園cnblogs筆者m-yb原創,轉載請加本文博客鏈接,筆者公眾號aandb7 愛碼一生,QQ群927113708, github: https://github.com/mayangbo666】這是一篇java入門:java是眾多編程語言之一, 就是開發的工具技術, 沒什么特別, 是應用廣, 嚴謹的語言…

java linux獲取實時cpu_用java取得linux系統cpu、內存的實時信息(參考別人代碼)...

/**   * cat /proc/cpuinfo - cpu (i.e. vendor, mhz, flags like mmx) * cat /proc/interrupts - 中斷   * cat /proc/ioports - 設備io端口   * cat /proc/meminfo - 內存信息(i.e. mem used, free, swap size)   * cat /proc/partitions - …

自我學習--關于如何設計光耦電路

本人在項目中多次設計光耦電路,目前電路在項目中運行比較平穩,所以總結一下自己的設計經驗,與大家交流一下,如有錯誤還希望大家指出改正,謝謝(V:Smt15921588263;愿與大家多交流&…

java 讀取 xmltype_java操作XMLType的幾種方法

XMLType是oracle數據庫特有的數據類型可以用來存儲一段xml,通過java(本文使用jdbc)插入XMLType根據sql中參數的類型通常有以下3種方法:本文使用的數據庫為oracle10.2.1一、String,客戶端只需傳遞一個字符串參數,創建xmltype的任務完全交給數據庫,此方法數據庫的壓力最大String …

java運算符優先級舉例_列舉出java運算符的優先級

展開全部優先級 操作符 含義 關聯性32313133353236313431303231363533e59b9ee7ad9431333337613833 用法----------------------------------------------------------------1 [ ] 數組下標 左 array_name[expr]. 成員選擇 左 o…

java websocket ie8_websocket兼容IE8

最近由于項目需要做實時聊天功能,選擇了html5的websocket方案(事實上node.jssocket.io兼容性更好,個人覺得這個方案更加完美),websocket實現實時聊天的demo網上很多,但是兼容IE8的資料卻很少,這塊折騰了很久。websoket…

java newfile() bug_java初學者小白?遇到BUG就慌了?有關java異常的十大問題詳解!...

1.已檢查與未檢查簡而言之,必須在方法中顯式捕獲已檢查的異常,或在方法的throws子句中聲明該異常。未檢查的異常是由無法解決的問題引起的,例如被零除,空指針等。檢查的異常特別重要,因為您希望使用API的其他開發人員知…

java 日期操作工具類_java8操作日期的工具類

java8操作日期的工具類一、方法概覽該包的API提供了大量相關的方法,這些方法一般有一致的方法前綴:of:靜態工廠方法。parse:靜態工廠方法,關注于解析。get:獲取某些東西的值。is:檢查某些東西的…

mysql攔截器實現crud_Mybatis自定義SQL攔截器

本博客介紹的是繼承Mybatis提供的Interface接口,自定義攔截器,然后將項目中的sql攔截一下,打印到控制臺。先自定義一個攔截器package com.muses.taoshop.common.core.database.config;import org.apache.commons.lang3.StringUtils;import or…

python 桌面提醒_使用Python獲取桌面通知

開發一款可提醒您諸如警報或待辦事項清單等計劃的應用程序真是太好了。在本文中,我將引導您逐步編寫如何使用Python獲取桌面通知的程序。桌面通知應用程序如何工作?您今天將要學習開發的桌面通知應用程序的主要目的是不斷提醒我們我們一天中需要完成的不…

java線程同步的實現_【Java多線程系列三】實現線程同步的方法

packagecom.concurrent.test;importjava.util.Stack;importjava.util.concurrent.ArrayBlockingQueue;importjava.util.concurrent.BlockingQueue;importjava.util.concurrent.locks.Condition;importjava.util.concurrent.locks.ReentrantLock;/*** Description: 三種方法實現…

python建立py文件夾過程_Pycharm創建python文件自動添加日期作者等信息(步驟詳解)...

百度AI接口的調用方法不必多介紹。官網地址 人流量統計新建AipBodyAnalysisfrom aip import AipBodyAnalysis""" 你的 APPID AK SK """APP_ID 你的 App IDAPI_KEY 你2021-02-03 14:24:01本文主要介紹了在python3.9下如何安裝scrapy的方法&…

python父親節祝福_父親節祝福語精選簡短 父親節祝福語簡短獨特

1.您的堅忍不拔和錚錚硬骨是我的榜樣,我從您那兒汲取到奮發的力量,走過挫折,邁向成功,爸爸,您是我永遠的榜樣,我愛您!祝您節日快樂!2.您的懷抱,是我的小天地;…

redis java應用_redis在JAVA的簡單應用

reids是一個高性能的key-value數據庫。它存儲的value支持各種類型的數據,如String,List,set,hash類型。在此基礎上,各種不同方式的排序。本文不具體爭對redis數據庫的各種命令,而是在Java實現簡單的調用。1. //初始化R…