怎样利用单卡 4-bit 量化技术在车载芯片上跑通 7B 规模的座舱智能管家模型
在汽车电子和智能座舱领域,集成大型语言模型(LLM)以提供自然语言交互的智能管家服务是趋势。然而,车载芯片(如高通SA8155或英伟达Orin等)虽然算力强大,但在内存(RAM/VRAM)方面相对桌面级或服务器级GPU资源有限。一个7B参数...
在汽车电子和智能座舱领域,集成大型语言模型(LLM)以提供自然语言交互的智能管家服务是趋势。然而,车载芯片(如高通SA8155或英伟达Orin等)虽然算力强大,但在内存(RAM/VRAM)方面相对桌面级或服务器级GPU资源有限。一个7B参数...