年度归档: 2025 年

302 篇文章

通过 Nginx 进行 LLM 负载均衡
本文讨论的源代码发布在此存储库中 互联网上有很多例子可以让您在没有工具的情况下将 ChatGPT 3.5 连接到电报机器人。但是,当涉及大量用户时,没有跨多个进程进行负载均衡的示例:Internet 上的所有教程都运行具有单个副本的单体式 https://github.com/telegraf/telegraf/issues/423 另外,在使用 …
Python 中的并行计算、并发和异步编程:初学者概述
单线程 Python 应用程序在性能上受到限制:它们按顺序执行任务,并且不利用多核处理器。此外,此类程序无法同时处理许多作,尤其是在涉及 I/O 任务(例如网络请求或读取文件)时。 通过在代码中实施并行计算、并发或异步编程,可以显著提高性能。为此,Python 提供了多处理、线程和 asyncio 等工具。 多处理、线程和 Asyncio:有什么区…
比较本地和通过 API 生成 LLM 的速度
在 Habr 上,感觉就像一个组在本地使用 LLM,另一个组通过外部 API 使用 LLM。 而第三个还没决定,她时不时地会有以下问题: 如果我在 CPU 而不是 GPU 上运行 LLM 会发生什么情况?速度会下降很多吗? 它如何取决于模型的大小? 而且原来的 DeepSeek 非常大 - 如果它不适合 RAM,你能从磁盘中抽出它吗? 总的来说,我…
在 windows 下使用 pnpm 时出现的问题
总是在安装全局包时出现下面这个错误  ERR_PNPM_VIRTUAL_STORE_DIR_MAX_LENGTH_DIFF  This modules directory was created using a different virtual-store-dir-max-length value. Run "pnpm install&…
油猴扩展的问题
油猴脚本扩展经常莫名其妙的崩溃,而修复后所有的脚本就丢失了,得时时备份。这样还是不够方便,直接在开发仓库里开发,然后通过引用脚本的方式来使用。、 https://github.com/cvzi/rollup-userscript-template 直接使用这个模版。 油猴脚本可以分为页面脚本和沙盒脚本,一旦引用了 GM 开头的脚本,就意味着在沙盒运…
wxt 开发 chrome 扩展的问题
wxt 提供了 chrome 扩展开发的包装和热更新。另外默认的初始化项目是 popup 项目,并没有直接创建 side panel 项目的方式。但是可以直接改 popup 目录为 sidepanel,这样可以直接编译输出为 sidepanel。但是还有问题 pnpm dev 模式 sidepanel 就不支持 content script,而 p…
WordPress REST API implementation examples | Hoverify
WordPress REST API 将 WordPress 转变为构建自定义 Web 解决方案的强大平台。以下是您需要了解的内容: 2016 年添加到 WordPress 核心 允许 WordPress 使用 JSON 与其他应用程序通信 提供以编程方式访问 WordPress 数据的标准方法 无需 PHP 或 WordPress 后端即可处理文…
10 Web Development Tricks That Will Make Your Life Easier in 2025 | Hoverify
Web 开发可能具有挑战性,但正确的工具和技术可以节省时间、减少错误并提高生产力。以下是简化工作流程的 10 个实用技巧: Hoverify:一个浏览器扩展,结合了实时检查、颜色选择器和响应式测试等工具,每年 30 美元。 VS Code 扩展:使用 Prettier 等工具进行一致的代码格式化,使用 Live Server 进行即时浏览器更新。 …
Unlock Zero-Cost Local AI Automation with n8n, Docker and mCP
自动化感觉像是一个令人生畏的流行词,通常与昂贵的工具、陡峭的学习曲线和无休止的配置联系在一起。但是,如果您可以简化工作流程,利用 AI 的强大功能,并且无需花费一分钱即可完成这一切,那会怎样?无论您是对更智能的系统感到好奇的技术爱好者,还是只想简化重复性任务的人,Zero2Launch 的本指南都能满足您的需求。通过结合开源自动化工具 n8n、Do…