戴尔T3680部署工作站虚拟化

1、修改Local-LVM 为 文件系统。执行 KB0029 的情况一的脚本。

2、执行在线升级,pveupdate.sh

3、如果是 A5000、A6000,需要修改显示模式为 1,禁止图像输出。

4、安装vGPU驱动。 如果 GPU启动有问题,需要修改 bios 设置。

gpu01.sh gpu02.sh gpu03.sh

5、设置脚本,自动启用 sr-iov。

6、pve中增加 显卡的 VF 到 resource mapping

7、部署DoraCloud

8、下载模板。

9、设置模板密码 ,安装 nvidia driver

1 项目背景与目标

1.1 项目背景

戴尔Precision T3680是一款性能卓越的塔式工作站,具备强大的计算能力和出色的扩展性,非常适合作为虚拟工作站的宿主机器。传统设计工作站模式通常是一人一机,硬件资源无法充分利用,且数据分散存在安全风险。通过将戴尔T3680工作站与DoraCloud桌面虚拟化软件相结合,可以构建高效的多人共享虚拟工作站环境,让多个设计师同时流畅运行专业设计软件。

1.2 项目目标

客户需要多个工程师共享工作站,运行如下软件:

  • caxa 2020
  • solidwork 2020
  • cad2018
  • inventor 2019

本项目旨在通过部署DoraCloud桌面虚拟化系统,实现以下核心目标:

  • 资源共享:单台T3680工作站支持3-12个设计用户同时使用,大幅降低硬件采购成本(预计可降低40%硬件投入)。
  • 信息安全:实现数据集中保存和管理,通过精细的外设管控和网络隔离,有效防止设计图纸和数据外泄。
  • 远程协作:支持设计师通过网络随时随地进行设计工作,在保障安全的前提下提高工作效率。

1.3 方案优势

  • 成本优化:单台T3680支持多用户共享,显著减少初期硬件投资和后期维护成本。
  • 弹性扩展:新增用户时可动态调整vGPU/内存分配,灵活适应团队变化。
  • 场景覆盖广:适配AI训练(CUDA)、工业设计(DirectX/OpenGL)、远程办公等多种场景。
  • 集中管理:模板化快速部署/还原桌面,避免用户误操作导致系统故障,减少IT维护工作量。

2 系统架构与硬件配置

2.1 系统架构概述

DoraCloud采用一体化设计理念,把桌面虚拟化所需的组件打包在一个虚拟机镜像中,极大简化了虚拟桌面部署的难度。系统架构主要包含三个层次:

  • 虚拟化底层:基于Proxmox VE或Hyper-V等虚拟化平台,负责硬件资源的抽象和调度。
  • 管理控制层:DoraCloud管理系统,负责桌面虚拟机的创建、分配和生命周期管理。
  • 访问层:支持多种客户端接入方式,包括专用客户端、Web浏览器和瘦终端。

2.2 戴尔T3680硬件配置要求

2.2.1 基础配置

为确保多用户同时使用专业设计软件的流畅体验,推荐以下硬件配置:

组件 规格要求 说明
CPU Intel i7-14700K(20核28线程) 支持硬件虚拟化,多核心为同时运行多个虚拟桌面提供基础
内存 128GB DDR4/DDR5 ECC 按用户数分配,如6用户×20GB,需预留部分给宿主系统
存储 1.92TB NVMe SSD(系统盘+桌面镜像)+ 可选SATA SSD存储池(用户数据盘) 模板存储于NVMe盘减少启动延迟,用户数据放在SATA SSD
GPU NVIDIA RTX A5000(24GB显存) 需通过NVIDIA vWS认证,以保证良好的vGPU兼容性
网卡 千兆

2.2.2 vGPU分配策略

根据用户数和应用需求,可灵活选择以下vGPU分配方案:

用户数 单用户内存 单用户显存 适用场景
3 40GB 8GB 高负载3D设计
4 30GB 6GB 中高端CAD设计
6 20GB 4GB 中端CAD/渲染
8 15GB 3GB 轻度设计
12 10GB 2GB 轻量办公

本项目分配10个桌面,人均2G显存,10G内存。

2.3 兼容性说明

戴尔T3680工作站已通过NVIDIA vWS兼容性认证,部署Proxmox VE和DoraCloud可以实现工作站虚拟化,满足多个用户设计需求,能够顺畅运行SolidWorks、NX/UG等大型CAD软件。

3 软件安装与配置

3.1 底层虚拟化平台安装

3.1.1 虚拟化平台选择

  • Proxmox VE 8.4(推荐):开源高效,兼容NVIDIA vGPU,社区支持活跃。
  • Windows Server 2022/2025:支持GPU-P分区技术,需搭配Hyper-V使用。

3.1.2 BIOS关键设置

在开始部署前,务必进入BIOS进行以下关键设置:

  • 启用Intel Virtual Technology(虚拟化技术)
  • 启用SR-IOV
  • 启用Intel VT-d

3.1.3 Proxmox VE安装步骤

  1. 从官方镜像源下载Proxmox VE 8.4 ISO,制作启动盘并安装到T3680工作站。
  2. 完成基础系统安装后,执行以下关键命令配置NVIDIA vGPU支持:
    # 升级Proxmox VE,执行后重启动
    curl -o- http://www1.deskpool.com:9000/software/pveupdate.sh | bash
    
    # 完成Proxmox VE的依赖和配置,执行后重启动
    curl -o- http://www1.deskpool.com:9000/software/gpu01.sh | bash
    curl -o- http://www1.deskpool.com:9000/software/gpu02.sh | bash
    
    # 安装 Nvidia vGPU Driver
    curl -o- http://www1.deskpool.com:9000/software/gpu03.sh | bash
    
  3. 验证vGPU驱动状态,执行nvidia-smi命令应正确显示GPU信息。

3.2 DoraCloud系统部署

3.2.1 一键安装DoraCloud

在Proxmox VE环境的Shell中执行以下命令:

cd /var/lib/vz/dump; wget -qO- https://dl.doracloud.cn/dpinstall.pl | perl

安装完成后,系统会显示DoraCloud管理系统的IP地址,该地址为DHCP动态分配。

3.2.2 初始访问配置

  1. 使用浏览器访问https://<DoraCloud_IP>(将<DoraCloud_IP>替换为实际的IP地址)。
  2. 使用初始账号登录:用户名admin,密码DoraCloud
  3. 首次登录后,系统会引导进入初始化配置向导。

3.3 DoraCloud初始化配置

3.3.1 配置虚拟化连接

  • 选择主机类型为Proxmox,输入Proxmox服务器的IP地址、用户名和密码。
  • 系统会自动检测所在服务器的配置,并与之建立连接。

3.3.2 配置资源池

  • 桌面存储池:选择SSD存储,用于存放虚拟机系统盘。
  • 镜像存储池:同样选择SSD存储,用于存放桌面模板。
  • 数据盘存储池:可选配置,如需使用数据盘功能,可指定较大容量的存储空间。
  • 网络资源池:选择DoraCloud默认所在的网络。

3.3.3 系统高级配置

  • 创建集群:选择创建新的DoraCloud集群。
  • 用户数据库:选择本地群组数据库;如果企业有AD域环境,也可选择使用AD作为用户数据库。
  • 静态IP配置:将DoraCloud管理系统的IP从DHCP修改为静态IP,确保系统地址固定。

4 虚拟桌面环境配置

4.1 桌面模板准备

4.1.1 下载预置模板

  1. 在DoraCloud管理界面中,进入【模板】菜单,选择【远程镜像仓库】。
  2. 根据设计软件需求选择合适的模板,如:
    • win10LTSC2021GPU:适用于GPU加速的设计场景。
    • 预装SolidWorks/NX的专业模板:可快速部署专业设计环境。
  3. 点击下载选定的模板,等待下载完成(3GB的镜像大约需要10分钟,具体取决于网络速度)。

4.1.2 定制办公模板(可选)

为提高部署效率,建议对下载的基础模板进行定制:

  1. 对基础模板执行复制操作,创建新模板(如命名为"win10-design")。
  2. 按照模板制作向导,登录模板虚拟机(默认账号:administrator/123456)。
  3. 在模板虚拟机中安装必要的办公和应用软件,如Office、浏览器等。
  4. 完成后返回DoraCloud管理后台,完成模板准备过程。

4.2 桌面池创建与配置

4.2.1 创建桌面池

  1. 在【桌面池】菜单中,点击【新建桌面池】。
  2. 填写基本设置:
    • 桌面池名称:如"GPU-Design"
    • 模板:选择之前下载或定制的模板
    • 虚拟机名称前缀:如"dsgn"
    • 虚拟机名称后缀:数字格式
    • 顺序编号:推荐使用顺序编号便于管理

4.2.2 资源配置策略

根据设计软件需求配置适当的资源分配:

  • vCPU分配:每桌面4-10个vCPU核心,根据设计软件需求调整。
  • 内存分配:每桌面15-20GB内存,确保设计软件流畅运行。
  • vGPU配置:选择适当的vGPU型号(如A5000-4Q),根据用户数分配显存资源。

4.2.3 桌面池策略设置

  • 创建策略:设置预创建数目和最大创建数目。
  • 桌面池类型:设计场景推荐使用专用桌面池,确保用户数据持久化。
  • 绑定账号:设置自动绑定模板默认账号,避免用户需要输入两次密码。
  • USB重定向:启用USB重定向功能,支持专业外设使用。

4.3 用户与群组管理

4.3.1 创建用户群组

  1. 在【用户管理】菜单中,创建新群组(如"DesignGroup")。
  2. 为该群组关联对应的桌面池(如前面创建的"GPU-Design"桌面池)。

4.3.2 批量创建用户

  1. 选择批量增加用户功能,创建设计用户(如design01~design06)。
  2. 设置统一的初始密码(如"123456"),并指定所属群组为"DesignGroup"。
  3. 用户创建完成后,系统会自动将用户与桌面池关联,用户继承所在群组的桌面池签约关系。

5 性能优化与安全配置

5.1 vGPU优化策略

5.1.1 vGPU配置选择

根据设计软件的需求和用户数量,选择合适的vGPU配置方案:

  • 高性能场景:对图形性能要求高的用户,可采用**直通(PCIe Passthrough)**方式分配整块GPU。
  • 多用户共享:一般情况下,使用NVIDIA vGPU技术按需切分GPU资源(如A5000→4×6GB vGPU)。

5.1.2 图形性能调优

  • 启用RDP加速:在虚拟机显示设置中,安装朵拉云RDP加速包,对RDP协议的性能进行调优,确保流畅的用户体验。
  • vGPU调度策略:NVIDIA vGPU支持不同的vGPU调度策略,可以结合SolidWorks Performance测试,选取最佳的vGPU调度策略。

5.2 存储优化方案

5.2.1 分层存储策略

  • 系统盘:使用NVMe SSD存储虚拟机系统盘,确保系统响应速度。
  • 数据盘:用户数据可存放在SATA SSD存储池,平衡性能与成本。
  • 缓存加速:为用户数据盘启用SSD缓存,提升I/O性能。

5.2.2 存储性能优化

  • 固定大小虚拟硬盘:使用固定大小虚拟硬盘,避免动态扩展的性能波动。
  • 存储分离:将模板存储与用户数据存储分离,避免I/O竞争。

5.3 安全管控配置

5.3.1 数据防泄密措施

DoraCloud提供精细化的访问控制,可对以下外设进行用户级别的统一管控:

  • USB存储:禁用或限制USB存储设备的使用,防止数据外泄。
  • 剪贴板共享:控制客户端与虚拟桌面之间的剪贴板共享。
  • 磁盘映射:禁止客户端磁盘映射功能,防止文件非法拷贝。

5.3.2 网络隔离与远程访问

  • 桌面网关部署:部署桌面网关,实现客户端和云桌面之间的网络隔离。
  • 远程访问控制:外网和分支结构的客户通过桌面网关访问企业内网的云桌面,实现远程设计的需求。
  • 网络分段:将桌面网络与企业核心网络隔离,减少安全风险。

5.4 高可用与备份

5.4.1 高可用设计

  • DoraCloud集群:DoraCloud支持对等集群架构,多个DoraCloud管理系统可以组织成无中心节点的对等集群,实现N+1冗余。
  • 负载均衡:集群模式下可实现负载均衡和线性扩容。

5.4.2 备份策略

  • 模板备份:定期备份桌面模板,确保系统故障时可快速恢复。
  • 用户数据备份:制定用户数据定期备份策略,结合增量备份和全量备份。
  • 快照管理:利用虚拟化平台的快照功能,在重大变更前创建系统快照。

6 客户端访问与测试

6.1 客户端接入方式

6.1.1 客户端选择

DoraCloud支持多种客户端接入方式,满足不同场景需求:

  • DoraClient客户端:Windows/macOS专用客户端,支持协议优化,提供最佳用户体验。
  • Web浏览器访问:通过HTTPS直接访问,受限USB功能,适合临时访问。
  • 瘦终端:朵拉云JC系列或旧PC刷写DoraOS,降低成本。

6.1.2 DoraClient配置

  1. 从朵拉云官网下载并安装DoraClient客户端。
  2. 首次运行时,配置服务器地址(DoraCloud管理系统的IP地址)。
  3. 输入用户账号(如user01)和密码(123456)进行登录。
  4. 登录成功后,系统会自动下载RDP文件并连接到虚拟桌面。

6.2 性能验证与测试

6.2.1 基础功能验证

  • vGPU状态检查:在虚拟桌面的设备管理器中应显示NVIDIA A5000-4Q等vGPU设备。
  • 外设测试:验证USB设备重定向功能是否正常工作。
  • 网络性能:测试网络传输速度,确保满足设计软件的数据传输需求。

6.2.2 设计软件性能测试

  • SolidWorks基准测试:运行SolidWorks性能基准测试,验证图形渲染与I/O吞吐性能。
  • WebGL测试:访问WebGL测试页面(如WebGL - Jellyfish),检测3D加速性能。
  • 实际项目测试:打开典型的设计项目文件,验证软件运行流畅度。

6.2.3 多用户并发测试

  • 资源监控:在多用户同时使用时,监控服务器资源使用情况(CPU、内存、GPU显存)。
  • 性能分析:检查是否有资源瓶颈,必要时调整资源分配策略。

7 常见问题排查

7.1 安装与配置问题

7.1.1 桌面启动失败

  • 问题现象:虚拟桌面创建后无法正常启动。
  • 解决方案
    1. 检查Proxmox存储空间是否充足。
    2. 验证vGPU驱动状态,重新安装NVIDIA vGPU驱动。
    3. 检查虚拟机配置参数是否合理。

7.1.2 vGPU未识别

  • 问题现象:虚拟桌面中无法检测到vGPU设备。
  • 解决方案
    1. 验证BIOS中SR-IOV设置已启用。
    2. 重新安装NVIDIA Host驱动。
    3. 检查vGPU类型选择是否正确。

7.2 性能与使用问题

7.2.1 图形性能不佳

  • 问题现象:设计软件运行卡顿,3D图形渲染缓慢。
  • 解决方案
    1. 检查vGPU分配是否合理,考虑增加单用户显存分配。
    2. 启用RDP加速功能。
    3. 调整vGPU调度策略。

7.2.2 用户连接问题

  • 问题现象:用户无法连接到虚拟桌面。
  • 解决方案
    1. 检查DoraCloud许可证状态,免费版支持25用户。
    2. 验证网络连接和DH服务状态。
    3. 检查用户账号是否已正确绑定桌面池。

8 维护与管理

8.1 日常维护任务

8.1.1 系统监控

  • 资源监控:定期检查CPU、内存、存储和GPU资源使用情况。
  • 性能分析:监控虚拟桌面性能指标,及时发现瓶颈。
  • 日志审查:定期检查系统日志,发现潜在问题。

8.1.2 用户支持

  • 账号管理:建立用户账号创建、修改和删除流程。
  • 资源调整:根据用户需求变化,适时调整资源分配。
  • 故障处理:响应用户报告的故障和问题,及时解决。

8.2 许可证管理与升级

8.2.1 许可证管理

  • 免费版限制:DoraCloud免费版支持25用户,不支持vGPU和其他一些功能,适合简单办公。
  • 商业授权:生产环境建议购买商业授权获取完整功能与技术支持。

8.2.2 系统升级

  • DoraCloud升级:定期检查DoraCloud版本更新,获取新功能和性能改进。
  • 安全更新:及时安装虚拟化平台和安全补丁,确保系统安全。

8.3 灾难恢复

8.3.1 备份策略

  • 系统配置备份:定期备份DoraCloud系统配置和虚拟化平台配置。
  • 模板备份:确保桌面模板有可用的备份,以便快速恢复。
  • 用户数据备份:制定用户数据备份策略,防止数据丢失。

8.3.2 恢复流程

  • 系统恢复:建立系统故障时的恢复流程。
  • 数据恢复:制定用户数据恢复流程,确保业务连续性。
  • 应急方案:准备应急方案,应对严重系统故障。

通过本文档的指导,可以顺利完成戴尔T3680工作站上DoraCloud工作站虚拟化系统的部署,实现多用户共享高性能设计环境的目标。该方案不仅能够降低硬件成本,还能提高数据安全性和管理效率,特别适合中小型设计团队、教育培训实验室和安全敏感场景使用。