algorithm hash hashing tree

Hash-13-聊一聊哈希数据结构之 Merkle Tree（默克尔树）

Posted by houbb on May 30, 2018

拓展阅读

一致性 hash 算法

java hash 实现

hash 冲突处理

bloom filter 使用最佳实践，让你少采坑！

todo

工具包包的封装+文档

资源可视化

前后端===》项目

弱点解决===》场景解决方案/技术咨询

chat

详细介绍一下 BloomFliter

好的！我来给你详细介绍一下 Merkle Tree（默克尔树），尽量讲得清晰易懂。

什么是 Merkle Tree？

Merkle Tree，也叫哈希树，是一种二叉树结构，它的每个叶子节点存储的是数据块的哈希值（比如一段文件内容的哈希），每个非叶子节点存储的是它的两个子节点哈希值的哈希。

简单来说，Merkle Tree 就是通过不断把数据块哈希值两两合并并哈希，最终构建成一棵树，树顶节点（根节点）的哈希值能代表整个数据集的完整性。

Merkle Tree 的结构特点

叶子节点：存放数据块的哈希值
非叶子节点：存放左右子节点哈希值拼接后的哈希值
根节点（Merkle Root）：整棵树的顶端节点，唯一代表整批数据的摘要

Merkle Tree 的构建过程举例

假设有 4 个数据块 D1，D2，D3，D4：

对每个数据块做哈希，得到 H1=Hash(D1), H2=Hash(D2), H3=Hash(D3), H4=Hash(D4)
两两合并哈希：
- H12 = Hash(H1 + H2)
- H34 = Hash(H3 + H4)
根节点哈希 = Hash(H12 + H34)

最终根节点哈希值就是这 4 个数据的摘要。

为什么要用 Merkle Tree？

数据完整性验证：只要根哈希不变，说明数据没有被篡改
高效验证子数据：验证某个数据块是否包含在整批数据里，只需要验证从该叶子节点到根节点路径上的哈希值，不用校验全部数据
节省传输和存储成本：只传递必要的哈希路径数据，不用传输完整数据

Merkle Tree 的应用场景

区块链 比如比特币，每个区块的交易列表通过 Merkle Tree 构建，根哈希保存在区块头里。这样可以快速验证某笔交易是否存在区块中。
分布式存储系统 用来校验文件数据块完整性，比如 IPFS
版本控制系统 比如 Git，内部使用类似哈希树的机制管理文件快照
P2P 网络文件校验 比如 BitTorrent 使用 Merkle Tree 验证下载文件的每个部分

Merkle Tree 的验证流程

假设你想验证数据块 D3 是否属于某个 Merkle Root：

你有 D3 和哈希路径信息：H4, H12
你先计算 H3=Hash(D3)
计算 H34=Hash(H3+H4)
计算根哈希 = Hash(H12 + H34)
如果计算结果与已有 Merkle Root 相同，验证通过

这样，你只需要传输少量的哈希值，验证过程就完成了。

Merkle Tree 的优缺点

优点：

支持快速完整性校验
数据验证时无需访问所有数据，节省资源
可并行计算哈希，效率高

缺点：

需要维护额外的哈希节点
构造和更新时有一定开销（但通常很小）

总结

Merkle Tree 是通过层层哈希合并，最终形成一个代表全部数据的“哈希摘要”的二叉树结构。

它非常适合在分布式系统中保证数据的完整性和验证效率，是区块链和分布式存储的核心基础技术。

拓展阅读
todo
chat
详细介绍一下 BloomFliter

更多学习

个人 Github

个人公众号

更多实时资讯，前沿技术，生活趣事。尽在【老马啸西风】

交流社群：交流群信息