标签：llm

从传统RAG到Agentic RAG：智能代理检索增强生成系统架构设计与生产部署实战

2026-07-22andy阅读(7)

从传统RAG到Agentic RAG：智能代理检索增强生成系统架构设计与生产部署实战 2024年以来，检索增强生成（Retrieval-Augmented Generation, RAG）技术经历了从朴素架构到智能代理化的重要演进。传统的&...

2026-07-18andy阅读(29)

Cloudflare Workers AI 免费推理服务：无需 GPU 即可运行顶级 AI 模型在 AI 浪潮席卷全球的今天，开发者对 GPU 算力的渴求从未如此强烈。训练模型需要 GPU，微调需要 GPU，推理同样需要 GPU——而后者...

2026-07-18andy阅读(29)

课程概览：为什么选择Microsoft Generative AI for Beginners？在2026年的今天，生成式AI已经渗透到软件开发、内容创作、数据分析等各个领域。然而，对于初学者来说，如何系统性地学习生成式AI仍然是一个难题...

2026-07-17andy阅读(37)

在大模型应用落地的过程中，微调（Fine-tuning）是让通用模型适配特定业务场景的核心手段。然而，许多团队在微调时投入大量精力调参、选模型架构，却忽视了最关键的一环——数据。业界有句广为流传的话：”Data is the h...

2026-07-12andy阅读(379)评论(0)

如何利用 Apple AMX 指令集实现 4-bit 量化 LLM 的端侧加速随着端侧大语言模型（LLM）的普及，如何在 iPhone 或 Mac 上实现毫秒级的响应速度成为了开发者面临的巨大挑战。Apple 的 A 系列及 M 系列芯片...

2026-07-12andy阅读(47)

检索增强生成（Retrieval-Augmented Generation, RAG）已成为大语言模型落地企业应用的主流架构。然而，许多团队在搭建完基础RAG原型后，发现检索结果不准确、回答质量不稳定、用户体验欠佳等问题。本文将聚焦RAG系...

2026-07-05andy阅读(78)

前言随着2026年上半年大语言模型（LLM）推理成本的断崖式下降，个人开发者和小团队自部署AI模型已从”极客玩具”变成了”实用工具”。过去需要A100集群才能运行的模型，如今在RTX 409...

2026-07-02andy阅读(75)

ChromaDB 向量数据库从入门到实战：构建高效 RAG 应用的完整指南在大型语言模型（LLM）应用爆发的今天，检索增强生成（Retrieval-Augmented Generation, RAG）已成为构建知识密集型 AI 应用的核心...

2026-07-01andy阅读(79)

什么是 MCP 协议？为什么它正在改变 AI 应用开发格局？ 2024年底，Anthropic 发布了 Model Context Protocol (MCP)——一个开放标准协议，旨在为大型语言模型（LLM）提供统一、安全、标准化的外部工...

2026-06-29andy阅读(96)

引言：从Demo到生产的鸿沟 2025到2026年，AI Agent从一个实验室概念迅速演变为企业级基础设施的核心组件。当无数技术团队兴奋地跑通了第一个”自动写邮件”的Demo后，等待他们的却是生产环境中的一连串&#...