1.上傳sqoop安裝包 2.安裝和配置 在添加sqoop到環境變量 將數據庫連接驅動拷貝到$SQOOP_HOME/lib里 3.使用 第一類:數據庫中的數據導入到HDFS上 sqoop import --connect jdbc:mysql://hadoop07:3306/test --username root --password 123 ?--table user_info--columns 'id, account, income, expenses' 指定輸出路徑、指定數據分隔符 sqoop import --connect jdbc:mysql://192.168.19.116:3306/test --username root --password 123 ?--table user_info--target-dir '/sqoop/td' --fields-terminated-by '\t' 指定Map數量 -m? sqoop import --connect jdbc:mysql://192.168.19.116:3306/test --username root --password 123 ?--table user_info--target-dir '/sqoop/td1' --fields-terminated-by '\t' -m 2 增加where條件, 注意:條件必須用引號引起來 sqoop import --connect jdbc:mysql://192.168.19.116:3306/test --username root --password 123 ?--table user_info--where 'id>3' --target-dir '/sqoop/td2'? 增加query語句(使用 \ 將語句換行) sqoop import --connect jdbc:mysql://192.168.19.116:3306/test --username root --password 123 \ --query 'SELECT * FROM trade_detail where id > 2 AND $CONDITIONS' --split-by user_info.id --target-dir '/sqoop/td3' 注意:如果使用--query這個命令的時候,需要注意的是where后面的參數,AND $CONDITIONS這個參數必須加上 而且存在單引號與雙引號的區別,如果--query后面使用的是雙引號,那么需要在$CONDITIONS前加上\即\$CONDITIONS 如果設置map數量為1個時即-m 1,不用加上--split-by ${tablename.column},否則需要加上 第二類:將HDFS上的數據導出到數據庫中(不要忘記指定分隔符) sqoop export --connect jdbc:mysql://192.168.19.116:3306/test --username root --password 123 --export-dir '/td3' --table td_bak -m 1 --fields-terminated-by ',' 4.配置mysql遠程連接 GRANT ALL PRIVILEGES ON itcast.* TO 'root'@'192.168.19.116' IDENTIFIED BY '123' WITH GRANT OPTION; FLUSH PRIVILEGES;? GRANT ALL PRIVILEGES ON *.* TO 'root'@'%' IDENTIFIED BY '123' WITH GRANT OPTION; FLUSH PRIVILEGES 5.sqoop 導入到hive? ? 在hive當中創建兩張表 ? create table teacher_info (id bigint, account string, income double, expenses double, time string) row format delimited fields terminated by '\t'; ? create table user_info (id bigint, name ?string, age int) row format delimited fields terminated by '\t'; ?? ? 將mysq當中的數據直接導入到hive當中 ? sqoop import --connect jdbc:mysql://192.168.19.116:3306/test --username root --password 123 --table teacher_info --hive-import --hive-overwrite --hive-table teacher_info --fields-terminated-by '\t' ? sqoop import --connect jdbc:mysql://192.168.19.116:3306/test --username root --password 123 --table user_info --hive-import --hive-overwrite --hive-table user_info --fields-terminated-by '\t' ?? 6.報錯情況: ? a.可能是連接驅動版本不符合,更新相對應得版本 ? b.報連接不多historyserver 10020 端口 ? ? ? ?HistoryServer需要配置: yarn-site.xml ? ? ? mapred.job.history.server.embedded ? ? true ? ? ? ?mapreduce.jobhistory.address ? ?historyserver:10020 ? ? ?啟動historyserver:sbin/mr-jobhistory-daemon.sh start historyserver? ? ? 校驗是否啟動成功:jps 看到:JobHistoryServer 進程