欢迎光临
我们一直在努力

标签:spark

Spark 内存管理机制深度解析与调优实战-汤不热吧
spark

Spark 内存管理机制深度解析与调优实战

andy阅读(24)

前言:为什么Spark内存管理至关重要 Apache Spark 作为大数据处理领域的事实标准框架,其核心优势之一就是基于内存的计算模型。相比 Hadoop MapReduce 的磁盘迭代模式,Spark 能够将中间结果保存在内存中,大幅提...

编程语言

spark写数据到hive遇到的问题

andy阅读(364)评论(0)

作为站长或运维人员,在使用公有云或自建 VPS 上的大数据环境时,经常需要通过 Spark 进行 ETL 任务,并将结果写入 Hive 数据仓库。这一过程中,最常见的两大障碍是 Metastore 权限连接问题和数据路径冲突。 本文将聚焦如...

spark中如何禁用和开启snappy压缩-汤不热吧
spark

spark中如何禁用和开启snappy压缩

andy阅读(5990)评论(0)

spark中如何禁用和开启snappy压缩 spark的作用中如果需要从hdfs中读写较大的结果,最好开启snappy压缩,已取得较好的性能。 开启或者禁用snappy压缩的方法 初始化sparkConf配置 123var conf = n...