欢迎光临
我们一直在努力

人工智能和大数据

详解vLLM推理引擎架构:PagedAttention原理与LLM高效部署实践-汤不热吧

详解vLLM推理引擎架构:PagedAttention原理与LLM高效部署实践

andy阅读(9)

引言:大模型推理的瓶颈与vLLM的诞生 随着大语言模型(LLM)参数规模从数十亿飙升到数千亿,推理部署成为制约落地的核心瓶颈。传统的推理框架(如 Hugging Face Transformers 的 naive 实现)在推理时面临两大痛点...

Spark 内存管理机制深度解析与调优实战-汤不热吧

Spark 内存管理机制深度解析与调优实战

andy阅读(22)

前言:为什么Spark内存管理至关重要 Apache Spark 作为大数据处理领域的事实标准框架,其核心优势之一就是基于内存的计算模型。相比 Hadoop MapReduce 的磁盘迭代模式,Spark 能够将中间结果保存在内存中,大幅提...

机器学习特征工程实战指南:提升模型性能的核心技术-汤不热吧

机器学习特征工程实战指南:提升模型性能的核心技术

andy阅读(23)

引言:为什么特征工程是机器学习的核心 在机器学习领域,有一个广为流传的观点:”数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限。”这句话深刻揭示了特征工程在机器学习项目中的核心地位。无论多么先进的深度学习...

TensorFlow 2.x 模型量化与部署实战:从训练后量化到TFLite优化-汤不热吧

TensorFlow 2.x 模型量化与部署实战:从训练后量化到TFLite优化

andy阅读(25)

引言:为什么需要模型量化 在深度学习模型从研发走向生产的过程中,模型量化(Model Quantization)是一个绕不开的关键环节。随着Transformer、LLM等大模型规模的不断增长,模型的存储体积、推理速度和能耗成为制约落地的核...