启动hive之前应该先启动HDFS和Yarn。
start-dfs.sh
start-yarn.sh
两种启动方式
第一种:直接命令行输入
hive
第二种:
先启动服务端:hiveserver2
再启动客户端:beeline -u jdbc:hive2://master:10000 -n root
创建数据库(数据库名=haha)
create database haha;
查看库的信息:
desc database haha;
切换数据库:
use haha;
删除数据库:
drop database haha;
如果库中有表,需要强制删除:
drop database haha cascade;
查看hive中有哪些库:
show database;
hive中对表的操作:
内部表(t1)
创建内部表的时候,不用指定位置,会在默认的位置下,生成一个表目录。
create table t1(
id int,
name string,
city string
)
//将数据用,来进行分割
row format delimited
fields terminated by ",";
将本地数据加载到表中,是将本地文件发送表目录。
load data local inpath '本地文件表目录位置' into table t1;
将集群上的数据加载到表中,是将文件移动到表目录。
load data inpath '数据所在表目录位置' into table t1;
外部表(t2)
创建外部表的时候,需要指定表目录的位置。
create external table t2(
id int,
name string
)
row format delimited
fields terminated by ","
location '/t2';
load data local inpath '自己指定的表目录位置' into table t2;