RError.com

RError.com Logo RError.com Logo

RError.com Navigation

  • 主页

Mobile menu

Close
  • 主页
  • 系统&网络
    • 热门问题
    • 最新问题
    • 标签
  • Ubuntu
    • 热门问题
    • 最新问题
    • 标签
  • 帮助
主页 / 问题 / 1543229
Accepted
teran
teran
Asked:2023-09-30 00:34:12 +0000 UTC2023-09-30 00:34:12 +0000 UTC 2023-09-30 00:34:12 +0000 UTC

MySQL 表大小(物理)

  • 772

同志们,出现了一个有趣的问题,也许有人能告诉我答案。

背景:有一个大小合适的表,大部分数据被一个 JSON 列占据。我需要以某种方式收紧空间,所以我正在做一些“研究”。

在本地扩展了约 130 万行的表片段。我们有如下表结构(InnoDB,row_format=DYNAMIC):

a BIGINT,
b BIGINT,
c TINYINT,
d JSON NULL,
PRIMARY KEY (a,b,c) 

这会占用5.8 GB磁盘空间(所有 JSON 字段均非空)。

  • 如果我们加起来,JSON_STORAGE_SIZE(d)我们得到~3.5GB。
  • 我们还可以假设所需的容量约为a,b,c = (8+8+1)*1300000/1024/1024 20MB

“理论”和实际大小之间2GB 的差异看起来还不错。

为了实验我做了两个表:

  • (a,b,c)没有 json 列的同一张表。大小48MB
  • (i,d),其中 i - INT AUTO_INCREMENT(即将密钥简化为整数) - 大小4.8 GB。

这里,这两个表的总大小比原始表小1 GB(尽管实际上INT向数据中添加了一列)。

谁能解释一下造成这种体积差异的原因是什么?

PS:如果你有兴趣,它row_format=compressed比原来的 5.8 -> 2.4

PS2:仅创建表。即数据已创建并上传。没有进行任何删除/更新

我有一种感觉,答案将包括有关集群、页面等的内容。但在物理存储机制方面不强。

mysql
  • 1 1 个回答
  • 71 Views

1 个回答

  • Voted
  1. Best Answer
    Mike
    2023-09-30T19:21:14Z2023-09-30T19:21:14Z

    MySQL 不具备物理存储功能,不会因不同列类型的组合而导致数据量显着增大。任何大小差异只能由表中剩余的未使用空间引起。当您删除记录或将记录移动到新位置时,仍保留可用空间。

    InnoDB 格式涉及通过主键对表进行聚类。术语“集群”隐藏了索引树节点中所有数据的存储。存储时,为主键建立索引,并将数据排序到其中。具有相似主键值的记录物理上位于相同的页面上。

    将数据加载到表中时,如果新记录以随机顺序(相对于主键)到达,MySQL 需要将现有记录移动到新位置,以便在按键靠近它们的记录旁边插入新记录。此外,需要更频繁地平衡树。为了减少插入过程中记录的移动,MySQL 为将来的数据预留了页空间。当以随机顺序插入时,块中会留下更多保留区域。所有这些都会导致表中有大量未使用的空间。

    在问题描述的情况下,表大小的差异不是由明显更有用的数据引起的,而是由插入数据的条件不同引起的。在一种情况下,数据相对于主键的到达是混乱的;在另一种情况下,主键基于自动增量并且单调增长。这导致第一种情况下的数据移动过多,而第二种情况下的数据移动量要少得多。

    • 1

相关问题

  • MySQL - 将一列中单元格的每个值与另一列中的值匹配,并将其替换为相邻列中的值

  • 帮助编写 MySQL 查询

  • SELECT 只增加 MYSQL 值

  • 创建 MySQL 表时的字段

  • 如何连接到远程mysql数据库?

  • MySQL单元格中的随机值

Sidebar

Stats

  • 问题 10021
  • Answers 30001
  • 最佳答案 8000
  • 用户 6900
  • 常问
  • 回答
  • Marko Smith

    我看不懂措辞

    • 1 个回答
  • Marko Smith

    请求的模块“del”不提供名为“default”的导出

    • 3 个回答
  • Marko Smith

    "!+tab" 在 HTML 的 vs 代码中不起作用

    • 5 个回答
  • Marko Smith

    我正在尝试解决“猜词”的问题。Python

    • 2 个回答
  • Marko Smith

    可以使用哪些命令将当前指针移动到指定的提交而不更改工作目录中的文件?

    • 1 个回答
  • Marko Smith

    Python解析野莓

    • 1 个回答
  • Marko Smith

    问题:“警告:检查最新版本的 pip 时出错。”

    • 2 个回答
  • Marko Smith

    帮助编写一个用值填充变量的循环。解决这个问题

    • 2 个回答
  • Marko Smith

    尽管依赖数组为空,但在渲染上调用了 2 次 useEffect

    • 2 个回答
  • Marko Smith

    数据不通过 Telegram.WebApp.sendData 发送

    • 1 个回答
  • Martin Hope
    Alexandr_TT 2020年新年大赛! 2020-12-20 18:20:21 +0000 UTC
  • Martin Hope
    Alexandr_TT 圣诞树动画 2020-12-23 00:38:08 +0000 UTC
  • Martin Hope
    Air 究竟是什么标识了网站访问者? 2020-11-03 15:49:20 +0000 UTC
  • Martin Hope
    Qwertiy 号码显示 9223372036854775807 2020-07-11 18:16:49 +0000 UTC
  • Martin Hope
    user216109 如何为黑客设下陷阱,或充分击退攻击? 2020-05-10 02:22:52 +0000 UTC
  • Martin Hope
    Qwertiy 并变成3个无穷大 2020-11-06 07:15:57 +0000 UTC
  • Martin Hope
    koks_rs 什么是样板代码? 2020-10-27 15:43:19 +0000 UTC
  • Martin Hope
    Sirop4ik 向 git 提交发布的正确方法是什么? 2020-10-05 00:02:00 +0000 UTC
  • Martin Hope
    faoxis 为什么在这么多示例中函数都称为 foo? 2020-08-15 04:42:49 +0000 UTC
  • Martin Hope
    Pavel Mayorov 如何从事件或回调函数中返回值?或者至少等他们完成。 2020-08-11 16:49:28 +0000 UTC

热门标签

javascript python java php c# c++ html android jquery mysql

Explore

  • 主页
  • 问题
    • 热门问题
    • 最新问题
  • 标签
  • 帮助

Footer

RError.com

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

帮助

© 2023 RError.com All Rights Reserve   沪ICP备12040472号-5