Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 中国开发者必看!Self-LLM开源大模型实战教程:从环境配置到LoRA微调全攻略
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > 中国开发者必看!Self-LLM开源大模型实战教程:从环境配置到LoRA微调全攻略
AI 工具

中国开发者必看!Self-LLM开源大模型实战教程:从环境配置到LoRA微调全攻略

站外新闻
最近更新: 2026年6月7日 下午8:21
ChatGLM Datawhale LLM教程 开源大模型 模型微调
SHARE

💡 站外导读:随着大模型技术开源浪潮席卷全球,中国开发者面临‘模型多、上手难、部署复杂’的痛点。Datawhale推出的Self-LLM项目,正是为国内初学者量身打造的‘开源大模型食用指南’,旨在打通从环境配置、模型部署到微调优化的全流程,降低技术门槛,助力开发者快速将前沿开源模型转化为实际应用能力。

self-llm是什么

self-llm (开源大模型食用指南)是Datawhale专为国内初学者打造的开源大模型教程,基于Linux平台,提供从环境配置到模型部署、微调的全流程指导,涵盖LLaMA、ChatGLM等主流模型。项目能简化开源大模型的使用流程,帮助学生和研究者快速上手。教程提供多种模型的详细教程、微调方法(如LoRA、ptuning)及应用案例,适合不同层次的学习者。项目鼓励社区参与,共同完善内容,推动开源大模型的普及和应用。

阅读目录
  • self-llm是什么
  • self-llm的主要功能
  • self-llm支持的模型
  • self-llm的项目地址
  • self-llm的应用场景
      • 📝 站长洞察 (Editor’s Insight)

开源大模型食用指南self-llm

self-llm的主要功能

  • 环境配置指导:提供基于Linux平台的开源大模型环境配置指南,帮助用户搭建适合不同模型运行的基础环境。
  • 模型部署教程:涵盖国内外主流开源大模型(如LLaMA、ChatGLM、InternLM等)的本地部署方法,包括命令行调用、在线Demo部署等。
  • 微调方法指导:提供全量微调、LoRA微调、ptuning等高效微调方法的详细教程,帮助用户根据需求对模型进行定制化优化。
  • 应用开发指导:结合LangChain等框架,指导用户如何将开源大模型集成到实际应用中,打造领域特色的私域模型。
  • 社区共创与支持:鼓励用户提交问题(issue)或贡献代码(PR),共同完善教程内容,形成开源社区的协作与支持体系。

self-llm支持的模型

  • GLM-4.1-Thinking
    • GLM-4.1V-Thinking vLLM 部署调用
    • GLM-4.1V-Thinking Gradio 部署
    • GLM-4.1V-Thinking LoRA 微调及 SwanLab 可视化记录
    • GLM-4.1V-Thinking Docker 镜像
  • GLM-4.5-Air
    • GLM-4.5-Air vLLM 部署调用
    • GLM-4.5-Air EvalScope 智商情商评测
    • GLM-4.5-Air LoRA 微调
    • GLM-4.5-Air Ucloud Docker 镜像
  • ERNIE-4.5
    • ERNIE-4.5-0.3B-PT LoRA 微调及 SwanLab 可视化记录
    • ERNIE-4.5-0.3B-PT LoRA Docker 镜像
  • Hunyuan-A13B-Instruct
    • Hunyuan-A13B-Instruct 模型架构解析
    • Hunyuan-A13B-Instruct SGLang 部署调用
    • Hunyuan-A13B-Instruct LoRA SwanLab 可视化微调
    • Hunyuan-A13B-Instruct LoRA Docker 镜像
  • Qwen3
    • Qwen3 模型结构解析
    • Qwen3-8B vllm 部署调用
    • Qwen3-8B Windows LMStudio 部署调用
    • Qwen3-8B Evalscope 智商情商评测
    • Qwen3-8B LoRA 微调及 SwanLab 可视化记录
    • Qwen3-30B-A3B 微调及 SwanLab 可视化记录
    • Qwen3 Think 解密
    • Qwen3-8B Docker 镜像
    • Qwen3-0.6B 的小模型用途
    • Qwen3-1.7B 医学推理式对话微调及 SwanLab 可视化记录
    • Qwen3-8B GRPO 微调及 SwanLab 可视化
  • Kimi-VL-A3B
    • Kimi-VL-A3B 技术报告解读
    • Kimi-VL-A3B-Thinking WebDemo 部署(网页对话助手)
  • Llama4
    • Llama4 对话助手
    • SpatialLM
    • SpatialLM 3D点云理解与目标检测模型部署
    • Hunyuan3D-2
    • Hunyuan3D-2 系列模型部署
    • Hunyuan3D-2 系列模型代码调用
    • Hunyuan3D-2 系列模型 Gradio 部署
    • Hunyuan3D-2 系列模型 API Server
    • Hunyuan3D-2 Docker 镜像
  • Gemma3
    • Gemma-3-4b-it FastApi 部署调用
    • Gemma-3-4b-it ollama + open-webui 部署
    • Gemma-3-4b-it Evalscope 智商情商评测
    • Gemma-3-4b-it LoRA 微调
    • Gemma-3-4b-it Docker 镜像
    • Gemma-3-4b-it GRPO 微调及 SwanLab 可视化
  • DeepSeek-R1-Distill
    • DeepSeek-R1-Distill-Qwen-7B FastApi 部署调用
    • DeepSeek-R1-Distill-Qwen-7B Langchain 接入
    • DeepSeek-R1-Distill-Qwen-7B WebDemo 部署
    • DeepSeek-R1-Distill-Qwen-7B vLLM 部署调用
    • DeepSeek-R1-0528-Qwen3-8B-GRPO 及 SwanLab 可视化
  • MiniCPM-o-2_6
    • MiniCPM-o-2.6 FastApi 部署调用
    • MiniCPM-o-2.6 WebDemo 部署
    • MiniCPM-o-2.6 多模态语音能力
    • MiniCPM-o-2.6 可视化 LaTeX_OCR LoRA 微调
  • InternLM3
    • InternLM3-8b-instruct FastApi 部署调用
    • InternLM3-8b-instruct Langchain 接入
    • InternLM3-8b-instruct WebDemo 部署
    • InternLM3-8b-instruct LoRA 微调
    • InternLM3-8b-instruct o1-like 推理链实现
  • phi4
    • phi4 FastApi 部署调用
    • phi4 Langchain 接入
    • phi4 WebDemo 部署
    • phi4 LoRA 微调
    • phi4 LoRA 微调 NER任务 SwanLab 可视化记录版
    • phi4 GRPO 微调及 SwanLab 可视化
  • Qwen2.5-Coder
    • Qwen2.5-Coder-7B-Instruct FastApi 部署调用
    • Qwen2.5-Coder-7B-Instruct Langchain 接入
    • Qwen2.5-Coder-7B-Instruct WebDemo 部署
    • Qwen2.5-Coder-7B-Instruct vLLM 部署
    • Qwen2.5-Coder-7B-Instruct LoRA 微调
    • Qwen2.5-Coder-7B-Instruct LoRA 微调 SwanLab 可视化记录版
  • Qwen2-vl
    • Qwen2-vl-2B FastApi 部署调用
    • Qwen2-vl-2B WebDemo 部署
    • Qwen2-vl-2B vLLM 部署
    • Qwen2-vl-2B LoRA 微调
    • Qwen2-vl-2B LoRA 微调 SwanLab 可视化记录版
    • Qwen2-vl-2B LoRA 微调案例 – LaTeXOCR
  • Qwen2.5
    • Qwen2.5-7B-Instruct FastApi 部署调用
    • Qwen2.5-7B-Instruct Langchain 接入
    • Qwen2.5-7B-Instruct vLLM 部署调用
    • Qwen2.5-7B-Instruct WebDemo 部署
    • Qwen2.5-7B-Instruct LoRA 微调
    • Qwen2.5-7B-Instruct o1-like 推理链实现
    • Qwen2.5-7B-Instruct LoRA 微调 SwanLab 可视化记录版
  • Apple OpenELM
    • OpenELM-3B-Instruct FastApi 部署调用
    • OpenELM-3B-Instruct LoRA 微调
  • Llama3_1-8B-Instruct
    • Llama3_1-8B-Instruct FastApi 部署调用
    • Llama3_1-8B-Instruct Langchain 接入
    • Llama3_1-8B-Instruct WebDemo 部署
    • Llama3_1-8B-Instruct LoRA 微调
    • 动手转换 GGUF 模型并使用 Ollama 本地部署
  • Gemma-2-9b-it
    • Gemma-2-9b-it FastApi 部署调用
    • Gemma-2-9b-it Langchain 接入
    • Gemma-2-9b-it WebDemo 部署
    • Gemma-2-9b-it Peft LoRA 微调
  • Yuan2.0
    • Yuan2.0-2B FastApi 部署调用
    • Yuan2.0-2B Langchain 接入
    • Yuan2.0-2B WebDemo 部署
    • Yuan2.0-2B vLLM 部署调用
    • Yuan2.0-2B LoRA 微调
  • Yuan2.0-M32
    • Yuan2.0-M32 FastApi 部署调用
    • Yuan2.0-M32 Langchain 接入
    • Yuan2.0-M32 WebDemo 部署
  • DeepSeek-Coder-V2
    • DeepSeek-Coder-V2-Lite-Instruct FastApi 部署调用
    • DeepSeek-Coder-V2-L

self-llm的项目地址

  • GitHub仓库:https://github.com/datawhalechina/self-llm

self-llm的应用场景

  • 教育与学习:为初学者提供从环境配置到模型微调的全流程指导,助力学生和开发者快速掌握开源大模型的使用方法。
  • 企业应用开发:帮助企业根据自身业务需求对开源大模型进行定制化微调,开发智能客服、知识管理等专属应用。
  • 个人项目开发:支持个人开发者利用开源大模型开发智能写作助手、个人智能助手等项目,提升个人生产力。
  • 研究与创新:为研究人员提供实验平台,支持对开源大模型的架构优化、训练方法改进等研究工作。

📝 站长洞察 (Editor’s Insight)

Self-LLM项目的价值远不止于一份技术教程,它折射出中国开源生态的深层趋势:工具链与开发者教育正成为大模型落地的关键瓶颈。当Qwen3、GLM-4等国产模型迅速追赶时,如何让数百万开发者高效使用这些模型,形成应用创新,才是产业真正的‘最后一公里’。该项目聚焦LoRA、vLLM等轻量化部署与微调技术,恰是瞄准了中小企业与研究者的算力与成本痛点。未来,围绕国产大模型的开发者工具、评测体系与社区协作,或将催生下一个千亿级的AIGC服务市场。

GPT-5.1-Codex-Max:突破百万Token上下文,OpenAI发布重构级AI编程模型
警报:微软Copilot惊现‘幽灵周报’漏洞!AI助手竟成企业数据‘内鬼’
字节跳动重磅发布 Doubao-Seed-Code:256K长上下文+视觉理解,AI编程模型成本直降国内最低
Browse AI
微软开源VibeVoice:实时流式TTS新突破,5亿参数实现90分钟多说话者对话音频生成
TAGGED:ChatGLMDatawhaleLLM教程开源大模型模型微调
分享
Email 复制链接 打印
Share
上一篇 《2024 AI Agent开发终极指南》:e2b-dev 万星仓库精选,从 AutoGPT 到 RAG 的开源工具全景图
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

《2024 AI Agent开发终极指南》:e2b-dev 万星仓库精选,从 AutoGPT 到 RAG 的开源工具全景图
AI 工具
Glass:免费开源AI桌面助手,实时捕捉屏幕与音频,重塑会议记录与知识管理效率
AI 工具 AIGC 资讯
WrenAI:开源商业智能AI Agent,用自然语言生成SQL,无需代码轻松分析数据
AI 工具
KittenTTS:仅25MB的开源TTS模型,CPU实时推理,离线语音时代来临
AI 工具 AIGC 资讯

相关推荐

AI 工具AIGC 资讯

IBM开源Granite-4.0-1b-speech:10亿参数多语言语音模型,六语种识别+双向翻译,边缘部署效率惊人

站外新闻
IBM开源 多语言识别 语音模型 语音翻译 边缘部署
AI 工具

Yaara AI

remaker
AI 工具

字节火山引擎veCLI重磅发布:命令行AI工具深度集成豆包大模型,代码生成效率飙升

站外新闻
veCLI 代码生成 命令行AI工具 火山引擎 豆包大模型
AI 工具AIGC 资讯

小红书开源FireRed-Image-Edit:SOTA级图像编辑模型,文本引导编辑、老照片修复、虚拟试穿一步到位

站外新闻
AIGC 图像编辑 小红书 开源模型 扩散模型
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI模型 AI绘画 AI编程 AI编程助手 AI编程模型 AI视频生成 AI音乐生成 Anthropic chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax Mistral AI MoE架构 openai prompt RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大模型推理 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 清华大学 知识管理 科大讯飞 端侧AI 端侧部署 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 边缘计算 通义千问 阶跃星辰 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.