您当前所在位置：首页攻略cmu15545笔记-Join算法（Join Algorithms）

cmu15545笔记-Join算法（Join Algorithms）

更新：2024-11-16 10:14:08编辑：游戏资讯归类：攻略

Overview

输出形式：早物化与晚物化（OLAP一般都是晚物化）

代价分析：一般用IO次数计算（最终结果可能落盘，也可能不落盘，所以我们只计算输出结果之前的IO次数）。

Join 左边称为外表（Outer Table），右边称为内表（Inner Join），外表一般是小表。

Nested Loop Join

Naïve

前提：缓冲区大小为3，一个外表输入，一个内表输入，一个输出。

基本思想：双重循环，对每一个元组（Tuple）进行配对，读取S表m次。

Cost： \(M+(m*N)\)

Block

前提：缓冲区大小为3，一个外表输入，一个内表输入，一个输出。

基本思想：双重循环，对每一个块（Block，同页Page）内进行配对，所以读取S表M次。

Cost： \(M+(M*N)\)

如果缓冲区容量为B，即可以容纳B个块（页），B-2个块用于外表输入，一个块用于内表输入，一个块用于输出。

Cost： \(M+(⌈M/(B-2)⌉*N)\)

Index

前提：缓冲区大小为3，一个外表输入，一个内表输入，一个输出。

基本思想：如果外部表有索引，那么内层循环无需遍历，查询索引即可。

Cost： \(M+(m*C)\)

Sort-Merge Join

基本思想：排序后的序列更容易找到匹配项。

分为两个步骤：

排序：用任意排序方式，将R和S排序。
合并：移动两个指针寻找匹配项，过程中可能需要回退指针。

这两个步骤和上一节提到的外部归并排序思想相同，但不是同一个东西。

SortCost(R)： \(2M*(1 + ⌈ log_{B-1} ⌈M / B⌉ ⌉)\)

SortCost(S)： \(2N*(1 + ⌈ log_{B-1} ⌈N / B⌉ ⌉)\)

MergeCost： \(M+N\)

Total Cost：Sort + Merge

当R中存的是相同元素，且S中也是时，指针需要一直回退，Sort-Merge Join退化为Nest Loop Join。

Hash Join

Simple Hash Join

基本思想：匹配项会被映射到同一个哈希桶。

分为两步骤：

构建哈希表：对R表采用哈希函数 \(h_1\) 进行哈希，得到哈希表，包含不同的哈希桶（可以采用不同的哈希表，但是链式哈希最符合需求）。
探测：把S表元组用哈希函数 \(h_1\) 进行哈希，得到对应的哈希桶位置，然后在哈希桶中寻找匹配项。

优化措施：布隆过滤器。

创建哈希表时顺带构建布隆过滤器，探测阶段先走布隆过滤器再走哈希桶。

存在的问题i：该算法需要保证哈希表能存在内存中，如果哈希表太大导致无法存到内存中，需要不断地换入换出，影响效率。但不幸的是，大部分情况下，我们都不能保证内存能完全存下哈希表。

Partition Hash Join

基本思想：把两个表分别用同一个哈希函数哈希，相同哈希桶之间进行配对，如果哈希桶都存不下，就再哈希一次，直到能存下为止。

读取对应的哈希桶到内存中配对即可。

Partition Cost： \(2(M+N)\) 【读取数据+哈希桶落盘（哈希空间复杂度为 \(O(n)\) ）】

Probe Cost： \(M+N\)

Total Cost： \(3(M+N)\)

总结

Algorithm	IO Cost	Example
Naïve Nested Loop Join	M + (m * N)	1.3 hours
Block Nested Loop Join	M + (⌈M / (B-2)⌉ * N)	0.55 seconds
Index Nested Loop Join	M + (m * C)	Variable
Sort-Merge Join	M + N + sort cost	0.75 seconds
Hash Join	3 * (M + N)	0.45 seconds

结论：选择Partition Hash Join，出现下述情况时使用Sort-Merge Join：

数据偏斜严重：Hash Join退化为Sort-Merge Join
数据本身需要被排序：此时Sort-Merge Join只需要额外付出 \(M+N\) 即可实现Join

一般数据库中，Hash Join和Sort-Merge Join都会实现。

以上就是电脑114游戏给大家带来的关于cmu15545笔记-Join算法（Join Algorithms）全部内容，更多攻略请关注电脑114游戏。

期待！3D大神晒《黑神话：悟空》亢金星君未渲染模型天堂W 骷髅服

好玩游戏

气球塔防6 2025正版

气球塔防62025正版又名猴子塔防6，是气球塔防6的正式版。这款游戏是一款经典的战略塔防游戏，采用全新的3D引擎，打造精致细腻的游戏场景。其美术风格也是清新可爱，结合漫画式的图形和动感的游戏音效，相信能给你带来独一无二的游戏体验。《气球塔防6》游戏2024最新版作为一款基于前作的创新型益智塔防手游，依然遵循经典的操作方式。玩家只需要合理放置各种类型的猴子，保卫家园不受入侵，轻松击败所有怪物即可获胜。虽然整个过程很简单，但是很考验玩家的聪明和智慧。不同的关卡都有特殊的任务和技能等着玩家去一一探索。
牧羊人之心 2025正版

牧羊人之心2025正版是一款全新的怪物少女养成游戏。在游戏中，主角将变身为卡卢蒂亚大陆上的见习训练师帕克。为了成为首席驯兽师，他和同伴尼娜和MIO踏上了冒险之旅。遇到各种角色和怪物，经历丰富刺激的冒险故事，揭开意想不到的隐藏任务，甚至意外陷入一场大规模的阴谋。在战斗中，与同伴一起成长，向着成为最强大的训练者的目标前进。如果一个训练者想要拥有自己的怪物，就需要通过孵化怪物蛋来培养它们。然后训练者可以通过不断与怪物互动来提升自己的好感度。经过精心培育，驯兽师可以收获一只属于自己的独一无二的怪兽。来培养你自己的怪物吧，让我们一起踏上这次冒险之旅吧!
丢丢影院

丢丢影院这里有许多好看的精彩影源给到各位，超多不同类型的追剧神器和其他的最新影视剧集都会第一时间在这里为你们一键更新，对于许多用户朋友们来说，想看的所有影视内容这里都是有的
彩虹橙0.1折版

彩虹橙0.1折版是一款由经典单机彩虹岛改编而来的角色扮演手游，熟悉的BGM，熟悉的地图，让玩家在手机上重新开启彩虹世界的大冒险！玩家将以贝罗斯为起点，行至世界的中心艾丽娅斯，再到满满中国风的上京，除了挑战昔日强大的怪物首领，还可以重温昔日回忆。
面包店超市模拟器

多特游戏为你提供面包店超市模拟器下载。面包店超市模拟器是一款经营模拟游戏，引人入胜的3D收银员工作模拟游戏，让您扮演面包店店长，参与紧张刺激的超市经营挑战。在面包店超市模拟器中，您将身临其境地扮演一位杂货店和面包店的店主，体验经营这一业务带来的种种激情与挑战。

精彩合集

↑

cmu15545笔记-Join算法（Join Algorithms）

Overview

Nested Loop Join

Naïve

Block

Index

Sort-Merge Join

Hash Join

Simple Hash Join

Partition Hash Join

总结

相关内容