启动hive之前应该先启动HDFS和Yarn。
  start-dfs.sh
  start-yarn.sh
两种启动方式
第一种:直接命令行输入

hive
 第二种:

先启动服务端:hiveserver2

 再启动客户端:beeline -u jdbc:hive2://master:10000 -n root

 

创建数据库(数据库名=haha)
create database haha;

查看库的信息:
desc database haha;

切换数据库:
use haha;

删除数据库:
drop database haha;

如果库中有表,需要强制删除:
drop database haha cascade;

查看hive中有哪些库:
show database;

hive中对表的操作: 

内部表(t1)
创建内部表的时候,不用指定位置,会在默认的位置下,生成一个表目录。
create table t1(
id int,
name string,
city string
)
//将数据用,来进行分割
row format delimited
fields terminated by ",";

将本地数据加载到表中,是将本地文件发送表目录。
load data local inpath '本地文件表目录位置' into table t1;

将集群上的数据加载到表中,是将文件移动到表目录。
load data inpath '数据所在表目录位置' into table t1;

外部表(t2)
创建外部表的时候,需要指定表目录的位置。
create external table t2(
id int,
name string

)
row format delimited
fields terminated by ","
location '/t2';

load data local inpath '自己指定的表目录位置' into table t2;

 

技术
今日推荐
下载桌面版
GitHub
百度网盘(提取码:draw)
Gitee
云服务器优惠
阿里云优惠券
腾讯云优惠券
华为云优惠券
站点信息
问题反馈
邮箱:[email protected]
QQ群:766591547
关注微信