andy的文章

第39页

LLM推理优化实战：从KV-Cache到Continuous Batching的技术演进与代码实现

2026-06-22andy阅读(101)

引言：为什么LLM推理优化如此重要？随着大语言模型（LLM）的广泛应用，从ChatGPT到开源模型的遍地开花，LLM的推理效率已成为制约AI落地的关键瓶颈。训练好一个模型只是第一步，如何让它在生产环境中以低成本、低延迟运行，才是真正的挑战...

2026-06-22andy阅读(138)

PHP 异步编程实战：从 Swoole 到 Fiber 的演进与最佳实践长期以来，PHP 被开发者诟病为”同步阻塞”的语言——每个请求从开始到结束，进程被完整占用，无法并发处理 I/O 操作。但这一局面在过去几年发...

2026-06-22andy阅读(133)

引言：为什么现在要学Chrome插件开发？ Chrome浏览器插件（Chrome Extensions）是提升浏览器功能、定制Web体验的利器。2024年Google全面强制迁移至Manifest V3，废弃了MV2的background ...

2026-06-22andy阅读(101)

为什么需要Google Breakpad？在C/C++应用程序的开发过程中，程序崩溃（Crash）是最令开发者头疼的问题之一。与Java、Python等拥有完善异常栈信息的语言不同，C/C++程序在崩溃后往往只留下一个神秘的core du...

2026-06-22andy阅读(123)

2026年已经过半，汤不热吧（tbr8.org）在技术内容创作和社区建设方面取得了显著进展。本文将回顾上半年的重点成果，分享社区数据，并公布下半年的内容规划和功能升级计划。上半年内容成果回顾 2026年上半年，汤不热吧持续聚焦于人工智能、...

2026-06-22andy阅读(115)

在日常的MySQL数据库运维和开发中，慢查询是最常见的性能瓶颈之一。一条没有优化的SQL语句可能在数据量小时表现良好，但随着数据增长到百万甚至千万级别，查询耗时可能从毫秒级飙升到秒级甚至分钟级。本文将从EXPLAIN执行计划的深度解读入手，...

2026-06-21andy阅读(107)

在现代C++开发中，内存管理始终是核心话题之一。从早期的手动malloc/free到C++11引入的智能指针体系，再到C++20的内存资源（std::pmr），语言层面的内存管理能力不断进化。本文将深入探讨C++内存管理的最佳实践，涵盖RA...

2026-06-21andy阅读(151)

引言：为什么每个JavaScript开发者都需要理解事件循环？在日常开发中，你是否遇到过这样的困惑：为什么 1setTimeout 的延迟时间不精确？为什么 1Promise 的回调总比 1setTimeout 先执行？为什么一段看似简单...

2026-06-21andy阅读(146)

Scala 3（代号 Dotty）是 Scala 语言自诞生以来最重大的一次升级，于 2021 年正式发布稳定版。它在语言设计、类型系统、语法简化等方面做出了革命性的改进，同时保持了与 Scala 2 的高度二进制兼容性。本文将深入解析 S...

2026-06-21andy阅读(115)

在分布式系统中，多个服务实例同时访问共享资源时，传统的单机锁机制（如Java的synchronized、Python的threading.Lock）已经无法满足需求。Redis凭借其高性能和丰富的数据结构，成为实现分布式锁的首选方案。然而，...