🔥

月球基地

探索无限,从月球基地开始🐶

Categories

5 个页面

大模型

本地大模型部署方案探究：Ollama 与 Docker Model Runner 的实践对比与选择

深度优化LLM推理性能：从量化到投机解码

大型语言模型（LLM）微调技术：提升模型性能与应用的关键

大模型推理优化：加速 LLM 部署的关键技术

边缘设备上 LLM 推理的优化实践与挑战