数据关联与回写的解决方案

更新：2024-06-12 19:18:24编辑：游戏资讯归类：攻略

最近项目上有一个需求，需要将两张表(A表和B表)的数据进行关联并回写入其中一张表(A表)，两张表都是分区表，但是关联条件不包括分区字段。

最朴素的想法，直接关联执行，全表关联，一条SQL搞定全部逻辑。想法越简单，执行越困难。由于数据量大，服务器规模较小，尽管各台服务器内存和CPU配置都很高，关联会将数据读取到内存，内存根本放不下，而且集群配置了workload group，可使用内存更小了，方案一不可行。

可以在关联时增加分区字段对任务进行拆解，这样可以实现，但是会形成笛卡尔积，历史数据量巨大，分区较多(A表和B表都是1年)，缺点也很明显。

执行耗时长
执行语句太多，操作不便
如果按照单分区关联，A表的每一个分区将会扫描B表全表

经过评估上述方案二不可行。

通过外部计算和存储来实现，可选的有Hive、Spark、Flink。三种方案都是可行的，但是从操作复杂度来看使用spark-sql直接读取Doris进行关联并写回Doris，除DDL外，只需要一条SQL即可搞定。

下载预编译的spark和spark-doris-connector

spark-3.4.3-bin-hadoop3.tgz
spark-doris-connector-3.4_2.12-1.3.2.jar

部署
启动spark-sql
创建映射表
DML语句

处理过程很简单，但是实际也是遇到了很多问题

DML语句中不能使用分区字段进行过滤，因为Doris 2.0版本在提供的获取执行计划的API中对于引号的处理存在问题，如果传递的是"2024-06-12"，则会得到数值2006，该数值无法转换为日期，如果传递"20240612"也无法得到Date("20240612")。理论上，如果调整此处的写法增加嵌套的引号配合转义字符也能实现功能，Java程序员都懂的，有兴趣可以自行验证。
数据动态变化，由于这两张表的数据都在不断变化，如果读取文件耗时较久，将可能出现tablet对应版本不存在的异常。我的做法是另建表，将数据写入新表，然后再执行关联。

spark executor 内存和并行度设置，这个需要不断调整，我也是尝试了多次，才得到这个可以运行的结果。并行度设置太高了，将会对Doris形成较大的网络和IO冲击，一定要慎重。并行度低了，内存就要高一点，不然数据都已经从Doris读取出来了，关联的时候会内存溢出。
读取Doris的速率还是很快的，而且spark在读取doris前获取了执行计划，对数据进行了行和列的裁剪，不会将整表数据都读出来。
耗时，耗时主要在数据读取和数据写入，数据读取是直接访问BE读取tablet，数据写入不是文件级别的，所以写入效率并不高。

以上就是电脑114游戏给大家带来的关于数据关联与回写的解决方案全部内容，更多攻略请关注电脑114游戏。

《崩坏星穹铁道》流萤抽取及培养建议流萤装备怎么搭配海洋奏歌gm版 v1.1.71 安卓版

好玩游戏

模拟农场23 官网版

模拟农场23官网版下载是一款模拟经营类的手机游戏。玩家在游戏中拥有高度的自由度，可以自由地为自己的农场播种。玩家可以在游戏中逐渐解锁许多不同的种子，从而为自己的农场赚取更多收入。游戏还提供了话题交换、动态分享等多种互动方式，玩家可以非常方便地与其他玩家进行互动和交流。
苍雾残响官方正版

苍雾残响是一款全新画风的二次元机甲⨉大尺度美少女战旗游戏，游戏以经典日式动漫风打造，搭配精致细腻的场景立绘，整体看起来非常舒适。在游戏中，不仅有各式各样独具特色的巨人美少女，就连可爱的萝莉也将幻化成放大版，带给玩家前所未有的视觉冲击。而且还精心打造了美少女配音，全语言式演绎剧情，更有海量场景动漫展现，带给玩家电影般沉浸式体验。
勇敢的心汉化版

《勇敢的心》汉化版是一款集动作、解密、冒险于一体的横版2D冒险解密游戏。这个游戏已经本地化，是最新版本。不仅所有的游戏内容和关卡都已解锁，而且游戏还进行了本地化以支持中文。同时，这款游戏的背景就是以几个参加过第一次世界大战的“小人物”为视角，讲述战争时代的各种感人故事。在游戏中，玩家将控制多个不同的角色，自由探索第一次世界大战的战场，完成各种解谜任务。通过这一系列的谜题线索，也将推动游戏故事的整体发展，深刻表达战争的残酷和反战思想。
戴夫大战僵尸重制版

戴夫大战僵尸重制版下载安装是一款富有创意和挑战性的僵尸射击游戏。《戴夫大战僵尸重制版》在保留原作经典元素的同时，还增加了新的射击游戏和装备系统，为玩家带来了更加丰富的游戏体验。游戏设置相当丰富，我们将与主角戴夫进行一场激动人心的丧尸大战。如果你喜欢射击游戏和僵尸主题，那么这款游戏绝对值得一试。
手机电子琴 2024最新版

手机电子琴2024最新版是一款模拟各种电子键盘弹奏过程的学习辅助工具。它包括乐谱、课程信息和一个免费的练习室。用户可以根据自己的实际水平和打球水平选择相应的球场，创造逼真的模拟效果。有许多不同风格的音乐可供在线收听和反复练习，以提高他们的演奏技巧。喜欢弹琴的朋友可以下载这个app！

精彩合集

↑

数据关联与回写的解决方案

相关内容