服务器之家:专注于VPS、云服务器配置技术及软件下载分享
分类导航

Mysql|Sql Server|Oracle|Redis|MongoDB|PostgreSQL|Sqlite|DB2|mariadb|Access|数据库技术|

服务器之家 - 数据库 - Mysql - MySQL分区表和分桶表的操作详解

MySQL分区表和分桶表的操作详解

2023-05-12 14:51菠萝橡皮刀 Mysql

这篇文章主要介绍了MySQL分区表和分桶表的操作,分区表和分桶表都是数据库中的表,用于对数据进行分区或分桶存储,以提高数据库的性能和查询效率,需要详细了解可以参考下文

1.创建分区表

?
1
2
3
4
5
6
7
create table dept_partition(
    deptno int,
    dname string,
    loc int
)
partitioned by (dt string)  // 分区字段(date)
row format delimited fields terminated by '\t';

2.增删改查操作

2.1 插入数据

1)导入本地数据

?
1
2
3
4
-- 创建一个名字为dt='2022-06-14'的文件夹,在其中导入数据
load data local inpath '/opt/module/hive/datas/dept.txt'
into table dept_partition
partition(dt='2022-06-14');

分区表就是先创建文件夹,然后在文件夹中写入数据

换句话说,分区表就是将一张大表分成若干个文件夹进行管理

2)插入数据

?
1
2
insert overwrite table dept_partition partition(dt='2022-06-17')
select deptno, dname, loc from dept;
?
1
2
insert overwrite table dept_partition
select deptno, dname, loc, '2022-06-18' from dept;

2.2 操作数据

1)查看分区数

?
1
show partitions dept_partition;

2)查询指定分区

?
1
select * from dept_partition where dt='2022-06-14';

3)增加/删除分区

?
1
2
alter table dept_partition add partition(dt='2022-06-19');
alter table dept_partition drop partition(dt='2022-06-19');

ps.也可以直接在liunx端输入命令增加分区

-- 将18号分区复制一份,命名为13号分区
hadoop fs -cp /user/hive/warehouse/dept_partition/dt=2022-06-18 
/user/hive/warehouse/dept_partition/dt=2022-06-13

ps..如果直接在网页端新建文件夹,终端不会显示新建的分区,必须修复

?
1
msck repair table dept_partition;

3. 二级分区表

就是大文件夹套小文件夹

3.1 创建分区表

?
1
2
3
4
5
6
7
create table dept_partition2(
    deptno int,
    dname string,
    loc int
)
partitioned by (month string, day string)  // month为父目录,day为子目录
row format delimited fields terminated by '\t';

3.2 插入数据

?
1
2
load data local inpath '/opt/module/hive/datas/dept.txt'
into table dept_partition2 partition(month='2022-06', day='15');
?
1
2
insert into dept_partition2 partition(month='2022-06',day='15')
select deptno, dname, loc from dept;

4.动态分区

普通数据无法直接转化为分区表,只能先新建新的分区表,再将旧数据插入这个新的分区表

1)创建分区表

?
1
2
3
4
5
6
7
create table emp_par(
    empno int,
    ename string,
    job string,
    salary decimal(16,2)
) partitioned by (deptno int)
row format delimited fields terminated by '\t';

2)然后将数据插入这张分区表

方式一:一个分区一个分区的插入

?
1
2
insert into emp_par partition(deptno=10)
select empno,ename,job,sal from emp where deptno=10;  //然后是11,12...

方式二:动态分区一次搞定

?
1
2
insert overwrite table emp_par   // 不用指定分区
select empno,ename,job,sal,deptno from emp;  //直接把deptno写到这里

5.分桶表

核心语句:

?
1
clustered by (a) sorted by (b) into 4 buckets //按照a分了4个桶,桶内按照b排序

5.1 新建分桶表

?
1
2
3
4
5
6
create table stu_buck(
    id int,
    name string
)
clustered by (id) sorted by (id) into 4 buckets  //根据id的hash值按4取模
row format delimited fields terminated by '\t';

查看

?
1
select * from stu_buk

MySQL分区表和分桶表的操作详解

可以发现分成了四个区

ps.分桶的意义:在取数的时候可以直接数据定位所在的桶,然后方便遍历,查询更高效

5.2 插入数据

?
1
load data inpath '/datas/student.txt' into table stu_buck;

ps.不能用本地模式,必须用hdfs模式

?
1
2
insert overwrite table stu_buck
select id,name from stu_ex;

5.3 既分区有分桶

?
1
2
3
4
5
6
7
create table stu_par_buck(
    id int,
    name string
)
partitioned by (dt string)  // 先创建文件夹
clustered by (id) sorted by (id desc) into 4 buckets  //然后内部分桶
row format delimited fields terminated by '\t';

插入数据:

与普通的一样

?
1
2
insert into stu_par_buck
select id, name, '2022-06-14' from stu_ex;

6 分区与分桶的区别

主键适合拿来分桶,而普通的列适合拿来分区(一般为日期)

分桶是文件,分区是文件夹

到此这篇关于MySQL分区表和分桶表的操作详解的文章就介绍到这了,更多相关MySQL分区表和分桶表内容请搜索服务器之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持服务器之家!

原文链接:https://blog.csdn.net/m0_58420188/article/details/130577263

延伸 · 阅读

精彩推荐
  • MysqlMac 安装 mysqlclient过程解析

    Mac 安装 mysqlclient过程解析

    这篇文章主要介绍了Mac 安装 mysqlclient过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下...

    希希里之海3642020-11-30
  • MysqlMySQL中explain使用快速查询手册

    MySQL中explain使用快速查询手册

    我们会开慢查询去记录一些执行时间比较久的SQL语句,找出这些SQL语句并不意味着完事了,会用到explain这个命令来查看一个这些SQL语句的执行计划,查看该SQ...

    AntBlack11142022-11-25
  • Mysqlmysql 5.7.18 zip版安装使用教程

    mysql 5.7.18 zip版安装使用教程

    这篇文章主要为大家详细介绍了mysql 5.7.18 zip版安装使用教程,具有一定的参考价值,感兴趣的小伙伴们可以参考一下...

    jwensh2182020-10-05
  • MysqlMySQL中连接查询和子查询的问题

    MySQL中连接查询和子查询的问题

    这篇文章主要介绍了MySQL中连接查询和子查询的问题,本文通过实例图文相结合给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要...

    pure341712412021-09-28
  • MysqlMySQL 回表,覆盖索引,索引下推

    MySQL 回表,覆盖索引,索引下推

    这篇文章主要介绍了MySQL 回表,覆盖索引,索引下推,就是我们需要查询的数据都在二级索引树中,直接返回这种情况就叫做覆盖索引...

    向着百万年薪努力的小10632022-07-11
  • Mysqlmysql 5.7.18 Archive压缩版安装教程

    mysql 5.7.18 Archive压缩版安装教程

    这篇文章主要为大家详细介绍了mysql 5.7.18 Archive压缩版安装教程,具有一定的参考价值,感兴趣的小伙伴们可以参考一下...

    heting7174522020-09-06
  • Mysql深入了解MySQL中的慢查询日志

    深入了解MySQL中的慢查询日志

    什么是MySQL慢查询呢?其实就是查询的SQL语句耗费较长的时间。具体耗费多久算慢查询呢?这其实因人而异,有些公司慢查询的阈值是100ms,有些的阈值可能...

    跟着飞哥学编程3472023-03-19
  • MysqlMySQL批量SQL插入性能优化详解

    MySQL批量SQL插入性能优化详解

    这篇文章主要为大家详细介绍了MySQL批量SQL插入性能优化,具有一定的参考价值,感兴趣的小伙伴们可以参考一下 ...

    服务器之家3572020-08-05