中国开发者必看！Self-LLM开源大模型实战教程：从环境配置到LoRA微调全攻略

💡 站外导读：随着大模型技术开源浪潮席卷全球，中国开发者面临‘模型多、上手难、部署复杂’的痛点。Datawhale推出的Self-LLM项目，正是为国内初学者量身打造的‘开源大模型食用指南’，旨在打通从环境配置、模型部署到微调优化的全流程，降低技术门槛，助力开发者快速将前沿开源模型转化为实际应用能力。

self-llm是什么

self-llm （开源大模型食用指南）是Datawhale专为国内初学者打造的开源大模型教程，基于Linux平台，提供从环境配置到模型部署、微调的全流程指导，涵盖LLaMA、ChatGLM等主流模型。项目能简化开源大模型的使用流程，帮助学生和研究者快速上手。教程提供多种模型的详细教程、微调方法（如LoRA、ptuning）及应用案例，适合不同层次的学习者。项目鼓励社区参与，共同完善内容，推动开源大模型的普及和应用。

阅读目录

self-llm是什么
self-llm的主要功能
self-llm支持的模型
self-llm的项目地址
self-llm的应用场景

📝 站长洞察 (Editor’s Insight)

开源大模型食用指南self-llm

self-llm的主要功能

环境配置指导：提供基于Linux平台的开源大模型环境配置指南，帮助用户搭建适合不同模型运行的基础环境。
模型部署教程：涵盖国内外主流开源大模型（如LLaMA、ChatGLM、InternLM等）的本地部署方法，包括命令行调用、在线Demo部署等。
微调方法指导：提供全量微调、LoRA微调、ptuning等高效微调方法的详细教程，帮助用户根据需求对模型进行定制化优化。
应用开发指导：结合LangChain等框架，指导用户如何将开源大模型集成到实际应用中，打造领域特色的私域模型。
社区共创与支持：鼓励用户提交问题（issue）或贡献代码（PR），共同完善教程内容，形成开源社区的协作与支持体系。

self-llm支持的模型

GLM-4.1-Thinking
- GLM-4.1V-Thinking vLLM 部署调用
- GLM-4.1V-Thinking Gradio 部署
- GLM-4.1V-Thinking LoRA 微调及 SwanLab 可视化记录
- GLM-4.1V-Thinking Docker 镜像
GLM-4.5-Air
- GLM-4.5-Air vLLM 部署调用
- GLM-4.5-Air EvalScope 智商情商评测
- GLM-4.5-Air LoRA 微调
- GLM-4.5-Air Ucloud Docker 镜像
ERNIE-4.5
- ERNIE-4.5-0.3B-PT LoRA 微调及 SwanLab 可视化记录
- ERNIE-4.5-0.3B-PT LoRA Docker 镜像
Hunyuan-A13B-Instruct
- Hunyuan-A13B-Instruct 模型架构解析
- Hunyuan-A13B-Instruct SGLang 部署调用
- Hunyuan-A13B-Instruct LoRA SwanLab 可视化微调
- Hunyuan-A13B-Instruct LoRA Docker 镜像
Qwen3
- Qwen3 模型结构解析
- Qwen3-8B vllm 部署调用
- Qwen3-8B Windows LMStudio 部署调用
- Qwen3-8B Evalscope 智商情商评测
- Qwen3-8B LoRA 微调及 SwanLab 可视化记录
- Qwen3-30B-A3B 微调及 SwanLab 可视化记录
- Qwen3 Think 解密
- Qwen3-8B Docker 镜像
- Qwen3-0.6B 的小模型用途
- Qwen3-1.7B 医学推理式对话微调及 SwanLab 可视化记录
- Qwen3-8B GRPO 微调及 SwanLab 可视化
Kimi-VL-A3B
- Kimi-VL-A3B 技术报告解读
- Kimi-VL-A3B-Thinking WebDemo 部署（网页对话助手）
Llama4
- Llama4 对话助手
- SpatialLM
- SpatialLM 3D点云理解与目标检测模型部署
- Hunyuan3D-2
- Hunyuan3D-2 系列模型部署
- Hunyuan3D-2 系列模型代码调用
- Hunyuan3D-2 系列模型 Gradio 部署
- Hunyuan3D-2 系列模型 API Server
- Hunyuan3D-2 Docker 镜像
Gemma3
- Gemma-3-4b-it FastApi 部署调用
- Gemma-3-4b-it ollama + open-webui 部署
- Gemma-3-4b-it Evalscope 智商情商评测
- Gemma-3-4b-it LoRA 微调
- Gemma-3-4b-it Docker 镜像
- Gemma-3-4b-it GRPO 微调及 SwanLab 可视化
DeepSeek-R1-Distill
- DeepSeek-R1-Distill-Qwen-7B FastApi 部署调用
- DeepSeek-R1-Distill-Qwen-7B Langchain 接入
- DeepSeek-R1-Distill-Qwen-7B WebDemo 部署
- DeepSeek-R1-Distill-Qwen-7B vLLM 部署调用
- DeepSeek-R1-0528-Qwen3-8B-GRPO 及 SwanLab 可视化
MiniCPM-o-2_6
- MiniCPM-o-2.6 FastApi 部署调用
- MiniCPM-o-2.6 WebDemo 部署
- MiniCPM-o-2.6 多模态语音能力
- MiniCPM-o-2.6 可视化 LaTeX_OCR LoRA 微调
InternLM3
- InternLM3-8b-instruct FastApi 部署调用
- InternLM3-8b-instruct Langchain 接入
- InternLM3-8b-instruct WebDemo 部署
- InternLM3-8b-instruct LoRA 微调
- InternLM3-8b-instruct o1-like 推理链实现
phi4
- phi4 FastApi 部署调用
- phi4 Langchain 接入
- phi4 WebDemo 部署
- phi4 LoRA 微调
- phi4 LoRA 微调 NER任务 SwanLab 可视化记录版
- phi4 GRPO 微调及 SwanLab 可视化
Qwen2.5-Coder
- Qwen2.5-Coder-7B-Instruct FastApi 部署调用
- Qwen2.5-Coder-7B-Instruct Langchain 接入
- Qwen2.5-Coder-7B-Instruct WebDemo 部署
- Qwen2.5-Coder-7B-Instruct vLLM 部署
- Qwen2.5-Coder-7B-Instruct LoRA 微调
- Qwen2.5-Coder-7B-Instruct LoRA 微调 SwanLab 可视化记录版
Qwen2-vl
- Qwen2-vl-2B FastApi 部署调用
- Qwen2-vl-2B WebDemo 部署
- Qwen2-vl-2B vLLM 部署
- Qwen2-vl-2B LoRA 微调
- Qwen2-vl-2B LoRA 微调 SwanLab 可视化记录版
- Qwen2-vl-2B LoRA 微调案例 – LaTeXOCR
Qwen2.5
- Qwen2.5-7B-Instruct FastApi 部署调用
- Qwen2.5-7B-Instruct Langchain 接入
- Qwen2.5-7B-Instruct vLLM 部署调用
- Qwen2.5-7B-Instruct WebDemo 部署
- Qwen2.5-7B-Instruct LoRA 微调
- Qwen2.5-7B-Instruct o1-like 推理链实现
- Qwen2.5-7B-Instruct LoRA 微调 SwanLab 可视化记录版
Apple OpenELM
- OpenELM-3B-Instruct FastApi 部署调用
- OpenELM-3B-Instruct LoRA 微调
Llama3_1-8B-Instruct
- Llama3_1-8B-Instruct FastApi 部署调用
- Llama3_1-8B-Instruct Langchain 接入
- Llama3_1-8B-Instruct WebDemo 部署
- Llama3_1-8B-Instruct LoRA 微调
- 动手转换 GGUF 模型并使用 Ollama 本地部署
Gemma-2-9b-it
- Gemma-2-9b-it FastApi 部署调用
- Gemma-2-9b-it Langchain 接入
- Gemma-2-9b-it WebDemo 部署
- Gemma-2-9b-it Peft LoRA 微调
Yuan2.0
- Yuan2.0-2B FastApi 部署调用
- Yuan2.0-2B Langchain 接入
- Yuan2.0-2B WebDemo 部署
- Yuan2.0-2B vLLM 部署调用
- Yuan2.0-2B LoRA 微调
Yuan2.0-M32
- Yuan2.0-M32 FastApi 部署调用
- Yuan2.0-M32 Langchain 接入
- Yuan2.0-M32 WebDemo 部署
DeepSeek-Coder-V2
- DeepSeek-Coder-V2-Lite-Instruct FastApi 部署调用
- DeepSeek-Coder-V2-L

self-llm的项目地址

GitHub仓库：https://github.com/datawhalechina/self-llm

self-llm的应用场景

教育与学习：为初学者提供从环境配置到模型微调的全流程指导，助力学生和开发者快速掌握开源大模型的使用方法。
企业应用开发：帮助企业根据自身业务需求对开源大模型进行定制化微调，开发智能客服、知识管理等专属应用。
个人项目开发：支持个人开发者利用开源大模型开发智能写作助手、个人智能助手等项目，提升个人生产力。
研究与创新：为研究人员提供实验平台，支持对开源大模型的架构优化、训练方法改进等研究工作。

📝 站长洞察 (Editor’s Insight)

Self-LLM项目的价值远不止于一份技术教程，它折射出中国开源生态的深层趋势：工具链与开发者教育正成为大模型落地的关键瓶颈。当Qwen3、GLM-4等国产模型迅速追赶时，如何让数百万开发者高效使用这些模型，形成应用创新，才是产业真正的‘最后一公里’。该项目聚焦LoRA、vLLM等轻量化部署与微调技术，恰是瞄准了中小企业与研究者的算力与成本痛点。未来，围绕国产大模型的开发者工具、评测体系与社区协作，或将催生下一个千亿级的AIGC服务市场。

中国开发者必看！Self-LLM开源大模型实战教程：从环境配置到LoRA微调全攻略

self-llm是什么

self-llm的主要功能

self-llm支持的模型

self-llm的项目地址

self-llm的应用场景

📝 站长洞察 (Editor’s Insight)

发表评价取消回复

最近更新

OmniParse – AI数据解析平台，提取和解析任何非结构化数据

Promptim – AI提示优化库，自动迭代优化、生成最佳配置

TinyTroupe – 微软推出的多智能体角色模拟库

Thinking Claude – 17岁高中生推出的神级Prompt工具，AI 思维更接近人类

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

Support

self-llm是什么

self-llm的主要功能

self-llm支持的模型

self-llm的项目地址

self-llm的应用场景

📝 站长洞察 (Editor’s Insight)

发表评价 取消回复

最近更新

相关推荐

发表评价取消回复