基本信息
文件名称:第八章ApacheDoris生态扩展及优化.pdf
文件大小:1.39 MB
总页数:50 页
更新时间:2025-09-16
总字数:约6.21万字
文档摘要

8第八章ApacheDoris生态扩展及优化

8.1SparkDorisConnector

SparkDorisConnector可以支持通过Spark读取Doris中存储的数据,也支持通过Spark写入数

据到Doris。

支持从Doris中读取数据

支持SparkDataFrame批量/流式写入Doris

可以将Doris表映射为DataFrame或者RDD,推荐使用DataFrame。

支持在Doris端完成数据过滤,减少数据传输量。

特别注意:在测试过程中发现SparkStructuredStreamin