如何为金融业AI模型的巴塞尔协议和监管技术要求提供技术支持?
金融行业的AI模型,尤其是用于信贷风险评估、市场风险量化和欺诈检测的模型,必须满足严苛的监管要求,例如巴塞尔协议(Basel Accords)关于模型风险管理的要求,以及美联储的SR 11-7指引。这些规定核心要求是模型的可追溯性、可解释性...
金融行业的AI模型,尤其是用于信贷风险评估、市场风险量化和欺诈检测的模型,必须满足严苛的监管要求,例如巴塞尔协议(Basel Accords)关于模型风险管理的要求,以及美联储的SR 11-7指引。这些规定核心要求是模型的可追溯性、可解释性...
随着大模型的体积不断增长,如何在资源受限的端侧设备上高效运行这些模型成为了关键挑战。Apple M系列芯片,特别是最新的M3系列,通过其独特的统一内存架构(Unified Memory Architecture, UMA),为端侧大模型推理...
混合专家模型(Mixture-of-Experts, MoE)通过稀疏激活实现模型扩展,显著提升了参数量和训练效率。然而,其核心组件——路由器(Router)——在将输入Token分配给不同专家(Expert)时,带来了两大基础设施挑战:专...
引言:为什么需要向量搜索? 传统的 Elasticsearch 搜索基于倒排索引,通过关键词匹配(BM25算法)来计算相关性。但在处理“语义”或“意图”时,这种方法往往力不从心。例如,搜索“大型犬”,但文档中只提到了“藏獒”。基于向量的语义...
在使用 TensorFlow (TF) 进行深度学习开发时,尤其是涉及到 GPU 资源管理时,许多开发者会遇到一个令人头疼的问题:TensorFlow 默认会在初始化时,预先分配几乎所有可用的 GPU 显存,即使模型非常小。这导致了显存资源...
存算一体架构(CIM):AI算力下一阶段的性能飞跃还是工程挑战? 随着AI模型(尤其是大语言模型和Transformer架构)的规模爆炸式增长,对算力的需求也急剧上升。然而,传统的冯·诺依曼(Von Neumann)架构正在成为限制AI加速...
引言:ISO 26262对AI部署的挑战 自动驾驶系统的核心软件——感知、决策、控制模型——通常要求达到最高的汽车安全完整性等级(ASIL D)。ISO 26262标准要求硬件和软件的开发生命周期必须具备严格的可追溯性(Traceabili...
在推荐系统的召回层,我们需要快速地从海量物料中找出与用户画像或查询物品最相似的K个结果。但仅仅依赖向量相似度往往不够,我们还需要结合业务需求进行过滤,例如只召回特定品类、特定库存状态的商品。由于 Faiss 自身不提供复杂的SQL式元数据过...
在TensorFlow 2.x时代,我们广泛使用@tf.function来将Python函数编译成高效的TensorFlow计算图(Graph)。然而,当我们在这些被编译的函数内部尝试使用标准的Python print()函数来查看张量数值...
在高性能计算领域,特别是深度学习推理和训练中,最大限度地利用硬件(如GPU或TPU)的计算能力至关重要。TensorFlow通过集成XLA(Accelerated Linear Algebra,加速线性代数)编译器来实现这一目标。然而,全局...