大家好,我是不温卜火,是一名计算机学院大数据专业大二的学生,昵称来源于成语— 此篇为大家带来的是Sqoop数据导入与导出。 在Sqoop中,“导入”概念指:从非大数据集群(RDBMS)向大数据集群(HDFS,HIVE,HBASE)中传输数据,叫做:导入,即使用import关键字。 运行成功: 提示: 提示: 提示:该过程分为两步,第一步将数据导入到HDFS,第二步将导入到HDFS的数据迁移到Hive仓库,第一步默认的临时目录是/user/bigdata/表名 提示:sqoop1.4.6只支持HBase1.0.1之前的版本的自动创建HBase表的功能 在Sqoop中,“导出”概念指:从大数据集群(HDFS,HIVE,HBASE)向非大数据集群(RDBMS)中传输数据,叫做:导出,即使用export关键字。 提示:Mysql中如果表不存在,不会自动创建 使用opt格式的文件打包sqoop命令,然后执行 好书不厌读百回,熟读课思子自知。而我想要成为全场最靓的仔,就必须坚持通过学习来获取更多知识,用知识改变命运,用博客见证成长,用行动证明我在努力。
不温不火
,本意是希望自己性情温和
。作为一名互联网行业的小白,博主写博客一方面是为了记录自己的学习过程,另一方面是总结自己所犯的错误希望能够帮助到很多和自己一样处于起步阶段的萌新。但由于水平有限,博客中难免会有一些错误出现,有纰漏之处恳请各位大佬不吝赐教!暂时只有csdn这一个平台,博客主页:https://buwenbuhuo.blog.csdn.net/
一. 导入数据
1. RDBMS到HDFS
[bigdata@hadoop002 sqoop]$ mysql -uroot -p199712
// 创建脚本 [bigdata@hadoop002 datas]$ vim company.sql create database company; use company; create table staff(id int(4) primary key not null auto_increment, name varchar(255), sex varchar(255)); insert into staff(name, sex) values('Thomas', 'Male'); insert into staff(name, sex) values('Catalina', 'FeMale'); insert into staff(name, sex) values('Thomas', 'Male'); insert into staff(name, sex) values('Catalina', 'FeMale'); insert into staff(name, sex) values('Thomas', 'Male'); insert into staff(name, sex) values('Catalina', 'FeMale'); insert into staff(name, sex) values('Thomas', 'Male'); insert into staff(name, sex) values('Catalina', 'FeMale'); insert into staff(name, sex) values('Thomas', 'Male'); insert into staff(name, sex) values('Catalina', 'FeMale'); insert into staff(name, sex) values('Thomas', 'Male'); insert into staff(name, sex) values('Catalina', 'FeMale'); insert into staff(name, sex) values('Thomas', 'Male'); insert into staff(name, sex) values('Catalina', 'FeMale'); insert into staff(name, sex) values('Thomas', 'Male'); insert into staff(name, sex) values('Catalina', 'FeMale'); insert into staff(name, sex) values('Thomas', 'Male'); insert into staff(name, sex) values('Catalina', 'FeMale'); insert into staff(name, sex) values('Thomas', 'Male'); insert into staff(name, sex) values('Catalina', 'FeMale'); insert into staff(name, sex) values('Thomas', 'Male'); insert into staff(name, sex) values('Catalina', 'FeMale'); insert into staff(name, sex) values('Thomas', 'Male'); insert into staff(name, sex) values('Catalina', 'FeMale'); insert into staff(name, sex) values('Thomas', 'Male'); insert into staff(name, sex) values('Catalina', 'FeMale'); insert into staff(name, sex) values('Thomas', 'Male'); insert into staff(name, sex) values('Catalina', 'FeMale'); insert into staff(name, sex) values('Thomas', 'Male'); insert into staff(name, sex) values('Catalina', 'FeMale'); insert into staff(name, sex) values('Thomas', 'Male'); insert into staff(name, sex) values('Catalina', 'FeMale'); // 批量执行脚本 mysql> source /opt/module/datas/company.sql
// 查看是否成功 mysql> use company; mysql> select * from staff;
[bigdata@hadoop002 datas]$ start-dfs.sh [bigdata@hadoop003 module]$ start-yarn.sh [bigdata@hadoop002 zookeeper-3.4.10]$ bin/start-allzk.sh [bigdata@hadoop002 hbase]$ bin/start-hbase.sh // 要起的服务和下图一样
// (1)全表导入 [bigdata@hadoop002 sqoop]$ bin/sqoop import --connect jdbc:mysql://hadoop002:3306/company --username root --password 199712 --table staff --target-dir company --delete-target-dir --num-mappers 2 --split-by id --fields-terminated-by "t"
在web端查看
// (2)查询导入sqoop_query [bigdata@hadoop002 sqoop]$ bin/sqoop import --connect jdbc:mysql://hadoop002:3306/company --username root --password 199712 --target-dir company --delete-target-dir --num-mappers 2 --split-by id --fields-terminated-by "t" --query 'select * from staff where $CONDITIONS'
must contain '$CONDITIONS' in WHERE clause
.
如果query后使用的是双引号,则$CONDITIONS前必须加转移符,防止shell识别为自己的变量。
//(3)部分导入 [bigdata@hadoop002 sqoop]$ bin/sqoop import --connect jdbc:mysql://hadoop002:3306/company --username root --password 199712 --table staff --columns id,name --where 'id>=10 and id<=20' --target-dir company --delete-target-dir --num-mappers 2 --split-by id --fields-terminated-by "t"
columns中如果涉及到多列,用逗号分隔,分隔时不要添加空格
查看web端并下载查看内容:
//(4)使用sqoop关键字筛选查询导入数据 [bigdata@hadoop002 sqoop]$ bin/sqoop import --connect jdbc:mysql://hadoop002:3306/company --username root --password 199712 --target-dir company --delete-target-dir --num-mappers 2 --fields-terminated-by "t" --table staff --where "id=1"
2. RDBMS到Hive
$ bin/sqoop import --connect jdbc:mysql://hadoop002:3306/company --username root --password 199712 --hive-import --hive-overwrite --hive-table staff_hive --target-dir company --delete-target-dir --num-mappers 2 --split-by id --fields-terminated-by "t" --query 'select * from staff where $CONDITIONS'
如果运行成功结果如图:
启动hive并查看是否成功[bigdata@hadoop002 module]$ cd hive/ [bigdata@hadoop002 hive]$ bin/hive hive> show tables; // 查看数据 hive> select * from staff_hive;
3. RDBMS到Hbase
$ bin/sqoop import --connect jdbc:mysql://hadoop002:3306/company --username root --password 199712 --hbase-table staff_hbase --hbase-row-key "id" --column-family "info" --target-dir company --delete-target-dir --num-mappers 2 --split-by id --fields-terminated-by "t" --query 'select * from staff where $CONDITIONS'
解决方案:手动创建HBase表
hbase> create 'staff_hbase','info'
hbase(main):001:0> scan 'staff_hbase'
二. 导出数据
HIVE/HDFS到RDBMS
[bigdata@hadoop002 hbase]$ mysql -uroot -p199712 mysql> use company; mysql> show tables; // 存在数据先把数据清空 mysql> truncate table staff;
$ bin/sqoop export --connect jdbc:mysql://hadoop002:3306/company --username root --password 199712 --table staff --num-mappers 2 --export-dir /user/hive/warehouse/staff_hive --input-fields-terminated-by "t"
在Mysql中查看
三. 脚本打包
[bigdata@hadoop002 sqoop]$ vim opt.txt
--connect jdbc:mysql://hadoop002:3306/company --username root --password 199712
[bigdata@hadoop002 sqoop]$ bin/sqoop list-databases --options-file opt.txt
本次的就到这里了,
如果我的博客对你有帮助、如果你喜欢我的博客内容,请“” “评论”“”
一键三连哦!听说的人运气不会太差,每一天都会元气满满呦!如果实在要白嫖的话,那祝你开心每一天,欢迎常来我博客看看。
码字不易,大家的支持就是我坚持下去的动力。后不要忘了关注
我哦!
本网页所有视频内容由 imoviebox边看边下-网页视频下载, iurlBox网页地址收藏管理器 下载并得到。
ImovieBox网页视频下载器 下载地址: ImovieBox网页视频下载器-最新版本下载
本文章由: imapbox邮箱云存储,邮箱网盘,ImageBox 图片批量下载器,网页图片批量下载专家,网页图片批量下载器,获取到文章图片,imoviebox网页视频批量下载器,下载视频内容,为您提供.
阅读和此文章类似的: 全球云计算