标签：模态

怎样优化座舱内多模态大模型的 KV Cache：解决长对话场景下的显存占用溢出难题

2026-02-01andy阅读(89)评论(0)

在汽车智能座舱环境中，部署多模态大模型（如处理语音、视觉和文本的VLM/LLM）是提升用户体验的关键。然而，座舱系统通常对硬件资源（尤其是GPU/NPU的显存）具有严格的限制。当用户进行长时间的连续对话时，大模型用于存储历史信息的KV Ca...

2025-12-30andy阅读(272)评论(0)

多模态大语言模型（LMMs），如GPT-4V和Claude 3等，正在成为AI应用的新前沿。它们通过集成的视觉编码器（Vision Encoder）处理图像输入，并将视觉信息转化为语言模型可以理解的嵌入（Embeddings）。然而，这种跨...