基本信息
文件名称:kettle的并行,集群和分区.docx
文件大小:3.23 MB
总页数:27 页
更新时间:2024-07-17
总字数:约1.62万字
文档摘要

kettle的并行,集群和分区

January4th,2023byahuooLeaveareply?

当你有很多数据要处理的时候,能够有效地使用全部的计算资源是格外重要的。不管是台个人电脑,还是有数百台效劳器,你都想让Kettle能尽可能的使用全部可用的计算资源,并在可承受的时间范围内猎取执行结果。

在这一章节,我们将解开kettle的转换和作业在垂直扩展和水平扩展方面的隐秘。垂直扩展是尽可能的使用单台效劳器上的多CPU核。水平扩展是使用多台机器资源,使他们并行计算。这两种方法都是ETL子系统的一局部〔#31,并行/流水线系统〕。

章节的第一局部先谈谈转换