新闻中心
self-llm— 专为中国开发者推出的开源大模型教程
self-llm是什么
self-llm (开源大模型食用指南)是datawhale专为国内初学者打造的开源大模型教程,基于linux平台,提供从环境配置到模型部署、微调的全流程指导,涵盖llama、chatglm等主流模型。项目能简化开源大模型的使用流程,帮助学生和研究者快速上手。教程提供多种模型的详细教程、微调方法(如lora、ptuning)及应用案例,适合不同层次的学习者。项目鼓励社区参与,共同完善内容,推动开源大模型的普及和应用。
GoEnhance
全能AI视频制作平台:通过GoEnhance AI让视频创作变得比以往任何时候都更简单。
347
查看详情
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

self-llm的主要功能
- 环境配置指导:提供基于Linux平台的开源大模型环境配置指南,帮助用户搭建适合不同模型运行的基础环境。
- 模型部署教程:涵盖国内外主流开源大模型(如LLaMA、ChatGLM、InternLM等)的本地部署方法,包括命令行调用、在线Demo部署等。
- 微调方法指导:提供全量微调、LoRA微调、ptuning等高效微调方法的详细教程,帮助用户根据需求对模型进行定制化优化。
- 应用开发指导:结合LangChain等框架,指导用户如何将开源大模型集成到实际应用中,打造领域特色的私域模型。
- 社区共创与支持:鼓励用户提交问题(issue)或贡献代码(PR),共同完善教程内容,形成开源社区的协作与支持体系。
self-llm支持的模型
-
GLM-4.1-Thinking
- GLM-4.1V-Thinking vLLM 部署调用
- GLM-4.1V-Thinking Gradio 部署
- GLM-4.1V-Thinking LoRA 微调及 SwanLab 可视化记录
- GLM-4.1V-Thinking Docker 镜像
-
GLM-4.5-Air
- GLM-4.5-Air vLLM 部署调用
- GLM-4.5-Air EvalScope 智商情商评测
- GLM-4.5-Air LoRA 微调
- GLM-4.5-Air Ucloud Docker 镜像
-
ERNIE-4.5
- ERNIE-4.5-0.3B-PT LoRA 微调及 SwanLab 可视化记录
- ERNIE-4.5-0.3B-PT LoRA Docker 镜像
-
Hunyuan-A13B-Instruct
- Hunyuan-A13B-Instruct 模型架构解析
- Hunyuan-A13B-Instruct SGLang 部署调用
- Hunyuan-A13B-Instruct LoRA SwanLab 可视化微调
- Hunyuan-A13B-Instruct LoRA Docker 镜像
-
Qwen3
- Qwen3 模型结构解析
- Qwen3-8B vllm 部署调用
- Qwen3-8B Windows LMStudio 部署调用
- Qwen3-8B Evalscope 智商情商评测
- Qwen3-8B LoRA 微调及 SwanLab 可视化记录
- Qwen3-30B-A3B 微调及 SwanLab 可视化记录
- Qwen3 Think 解密
- Qwen3-8B Docker 镜像
- Qwen3-0.6B 的小模型用途
- Qwen3-1.7B 医学推理式对话微调及 SwanLab 可视化记录
- Qwen3-8B GRPO 微调及 SwanLab 可视化
-
Kimi-VL-A3B
- Kimi-VL-A3B 技术报告解读
- Kimi-VL-A3B-Thinking WebDemo 部署(网页对话助手)
-
Llama4
- Llama4 对话助手
- SpatialLM
- SpatialLM 3D点云理解与目标检测模型部署
- Hunyuan3D-2
- Hunyuan3D-2 系列模型部署
- Hunyuan3D-2 系列模型代码调用
- Hunyuan3D-2 系列模型 Gradio 部署
- Hunyuan3D-2 系列模型 API Server
- Hunyuan3D-2 Docker 镜像
-
Gemma3
- Gemma-3-4b-it FastApi 部署调用
- Gemma-3-4b-it ollama + open-webui 部署
- Gemma-3-4b-it Evalscope 智商情商评测
- Gemma-3-4b-it LoRA 微调
- Gemma-3-4b-it Docker 镜像
- Gemma-3-4b-it GRPO 微调及 SwanLab 可视化
-
DeepSeek-R1-Distill
- DeepSeek-R1-Distill-Qwen-7B FastApi 部署调用
- DeepSeek-R1-Distill-Qwen-7B Langchain 接入
- DeepSeek-R1-Distill-Qwen-7B WebDemo 部署
- DeepSeek-R1-Distill-Qwen-7B vLLM 部署调用
- DeepSeek-R1-0528-Qwen3-8B-GRPO 及 SwanLab 可视化
-
MiniCPM-o-2_6
- MiniCPM-o-2.6 FastApi 部署调用
- MiniCPM-o-2.6 WebDemo 部署
- MiniCPM-o-2.6 多模态语音能力
- MiniCPM-o-2.6 可视化 LaTeX_OCR LoRA 微调
-
InternLM3
- InternLM3-8b-instruct FastApi 部署调用
- InternLM3-8b-instruct Langchain 接入
- InternLM3-8b-instruct WebDemo 部署
- InternLM3-8b-instruct LoRA 微调
- InternLM3-8b-instruct o1-like 推理链实现
-
phi4
- phi4 FastApi 部署调用
- phi4 Langchain 接入
- phi4 WebDemo 部署
- phi4 LoRA 微调
- phi4 LoRA 微调 NER任务 SwanLab 可视化记录版
- phi4 GRPO 微调及 SwanLab 可视化
-
Qwen2.5-Coder
- Qwen2.5-Coder-7B-Instruct FastApi 部署调用
- Qwen2.5-Coder-7B-Instruct Langchain 接入
- Qwen2.5-Coder-7B-Instruct WebDemo 部署
- Qwen2.5-Coder-7B-Instruct vLLM 部署
- Qwen2.5-Coder-7B-Instruct LoRA 微调
- Qwen2.5-Coder-7B-Instruct LoRA 微调 SwanLab 可视化记录版
-
Qwen2-vl
- Qwen2-vl-2B FastApi 部署调用
- Qwen2-vl-2B WebDemo 部署
- Qwen2-vl-2B vLLM 部署
- Qwen2-vl-2B LoRA 微调
- Qwen2-vl-2B LoRA 微调 SwanLab 可视化记录版
- Qwen2-vl-2B LoRA 微调案例 – LaTeXOCR
-
Qwen2.5
- Qwen2.5-7B-Instruct FastApi 部署调用
- Qwen2.5-7B-Instruct Langchain 接入
- Qwen2.5-7B-Instruct vLLM 部署调用
- Qwen2.5-7B-Instruct WebDemo 部署
- Qwen2.5-7B-Instruct LoRA 微调
- Qwen2.5-7B-Instruct o1-like 推理链实现
- Qwen2.5-7B-Instruct LoRA 微调 SwanLab 可视化记录版
-
Apple OpenELM
- OpenELM-3B-Instruct FastApi 部署调用
- OpenELM-3B-Instruct LoRA 微调
-
Llama3_1-8B-Instruct
- Llama3_1-8B-Instruct FastApi 部署调用
- Llama3_1-8B-Instruct Langchain 接入
- Llama3_1-8B-Instruct WebDemo 部署
- Llama3_1-8B-Instruct LoRA 微调
- 动手转换 GGUF 模型并使用 Ollama 本地部署
-
Gemma-2-9b-it
- Gemma-2-9b-it FastApi 部署调用
- Gemma-2-9b-it Langchain 接入
- Gemma-2-9b-it WebDemo 部署
- Gemma-2-9b-it Peft LoRA 微调
-
Yuan2.0
- Yuan2.0-2B FastApi 部署调用
- Yuan2.0-2B Langchain 接入
- Yuan2.0-2B WebDemo 部署
- Yuan2.0-2B vLLM 部署调用
- Yuan2.0-2B LoRA 微调
-
Yuan2.0-M32
- Yuan2.0-M32 FastApi 部署调用
- Yuan2.0-M32 Langchain 接入
- Yuan2.0-M32 WebDemo 部署
-
DeepSeek-Coder-V2
- DeepSeek-Coder-V2-Lite-Instruct FastApi 部署调用
- DeepSeek-Coder-V2-L
self-llm的项目地址
- GitHub仓库:http://github.com/datawhalechina/self-llm
self-llm的应用场景
- 教育与学习:为初学者提供从环境配置到模型微调的全流程指导,助力学生和开发者快速掌握开源大模型的使用方法。
- 企业应用开发:帮助企业根据自身业务需求对开源大模型进行定制化微调,开发智能客服、知识管理等专属应用。
- 个人项目开发:支持个人开发者利用开源大模型开发智能写作助手、个人智能助手等项目,提升个人生产力。
- 研究与创新:为研究人员提供实验平台,支持对开源大模型的架构优化、训练方法改进等研究工作。
以上就是self-llm— 专为中国开发者推出的开源大模型教程的详细内容,更多请关注其它相关文章!
# git
# 客服
# 机中
# 操作指南
# 命令行
# 中国
# 离线
# 专为
# 镜像
# 开源
# langchain
# qwen
# 本地部署
# deepseek
# ai
# windows
# docker
# linux
# lla
# 峨眉山企业网站优化
# 简阳seo优化推广软件
# 智能网站优化售后
# 万州网站专业建设价格
# 泾县科技协会网站建设
# 一般营销推广费用占比
# 六盘水短视频营销推广
# 福州市场营销推广招聘
# 舟山专业网站建设品牌
# seo能用在哪方面
# 相关文章
相关栏目:
【
行业资讯67740 】
【
技术百科0 】
【
网络运营39195 】
相关推荐:
市盈率百分位roe是什么意思
如何设置sql命令
element ui的好处
make命令如何使用
充电器上的power是什么意思
ao3镜像网站永久地址入口
如何用固态硬盘做缓存
linux如何使用db2命令
单片机显存怎么设置最佳
drawing是什么意思
苹果手机16新款颜色有哪些
如何用命令查看本机的操作系统
单片机怎么进行排序操作
学typescript需要什么基础么
单片机是怎么复位的
折叠屏手机为什么这么小
没网环境如何安装typescript
360桌面壁纸怎么弄掉
vivo手机爱奇艺怎么投屏到电视操作步骤
税负是什么意思
为什么学typescript
如何在命令行执行一个jar
如何看固态硬盘型号
哪些编程软件需要typescript
typescript要用什么工具
苹果16适合哪些机升级
cron表达式在线工具有哪些
哪个牌子的折叠屏手机好
市盈率和市净率是什么意思
linux如何用命令修改ip
如何安装m.2固态硬盘
单身聊天app有哪些软件 2025最靠谱的单身交友软件推荐
安全的ao3镜像网站链接入口
如何查询固态硬盘寿命
阿里云手机云盘怎么用_阿里云盘苹果手机怎么用教程
台达变频器power灯是什么意思
春运抢票何时开始抢票的
driver是什么意思
夸克转存中是什么意思
如何用dos命令启动u盘
折叠屏有哪些手机
单片机的速度怎么求
360n7lite怎么设置动态壁纸
12306放票时间规律(2025)
营收和gmv区别_营收和gmv有什么区别
个人征信不好如何恢复 个人征信不良的全面修复指南
市盈率pe是什么意思
夸克是什么空间单位
如何使用net命令
linux环境中如何使用ping命令


2025-08-11
浏览次数:次
返回列表