Dolphin Linux 虚拟机搭建指南
一 目标与前置准备
- 明确目标产品:常见的“Dolphin”包含两类,分别是DolphinDB(分布式时序数据库)与Apache DolphinScheduler(分布式工作流调度)。两者在 Linux 虚拟机中的部署方式与依赖完全不同。
- 虚拟化平台选择:主机为Deepin Linux时,推荐安装VirtualBox或KVM/QEMU(配合 virt-manager);创建虚拟机时按需选择NAT/桥接/仅主机网络模式,便于后续访问与隔离测试。
- 资源建议:至少分配2–4 核 CPU、4–8 GB 内存、40–100 GB 磁盘;如部署 DolphinDB 做功能验证,建议将数据目录单独挂到一块 SSD 或虚拟磁盘上,便于后续扩展与性能观测。
二 在虚拟机中安装 Linux
- 安装虚拟化软件
- VirtualBox:在 Deepin 中添加 Oracle 官方源后执行安装,并建议安装对应版本的扩展包以获得 USB、RDP 等增强能力。
- KVM/QEMU:安装 qemu-kvm、libvirt 与 bridge-utils,并使用 virt-manager 进行图形化管理。
- 创建与安装
- 新建虚拟机,选择操作系统类型(如Linux → CentOS 7/8 或 Ubuntu 20.04/22.04),分配内存与磁盘,加载 ISO 启动安装。
- 安装过程中完成分区(/、/home 等)、用户创建与网络配置;为便于后续服务访问,建议记录虚拟机的IP 地址。
- 网络模式要点
- NAT:虚拟机可访问外网,主机可访问虚拟机,配置简单。
- 桥接:虚拟机与主机处于同一网段,便于局域网其他主机访问。
- 仅主机:与主机私网互通,适合离线/隔离环境。
三 部署 DolphinDB 于虚拟机
- 准备环境
- 选择稳定版 Linux(如 CentOS 7/8) 作为 Guest OS,确保内核≥2.6.19,安装 gcc ≥ 4.8.5。
- 为提升性能与可维护性,建议将元数据、redo log、数据实体分别放置在不同磁盘/分区;文件系统优先XFS(支持动态调整 inode,避免因 inode 耗尽导致写入失败)。
- 安装与目录规划
- 创建专用用户(如 dolphindb),解压发行包至如 /opt/dolphindb;按规划创建 data、log、config 等目录并赋权。
- 编辑配置文件 dolphindb.cfg,常用项包括:listenPort(默认 8848)、maxConnections、dataDir、logDir 等。
- 启动与验证
- 以专用用户启动服务,检查端口监听(默认 8848),使用浏览器或客户端连接验证。
- 如需持久化与开机自启,可配置 systemd 服务单元。
四 部署 Apache DolphinScheduler 于虚拟机
- 基础依赖
- 准备 JDK 1.8、MySQL 5.7、Zookeeper 3.5、Hadoop 3.x(或兼容发行版);如采用单机伪集群进行验证,可在同一台虚拟机中部署上述组件(生产环境请分离部署)。
- 安装步骤
- 下载并解压后端与前端安装包;创建数据库与用户并初始化表结构(按官方脚本/文档执行)。
- 配置数据库连接(如 MySQL),放置对应 JDBC 驱动;按需配置 Zookeeper、Master/Worker 节点与资源存储(HDFS 或本地)。
- 启动后端服务与前端 Web,浏览器访问 http://<虚拟机IP>:<端口> 完成登录与项目初始化。
五 常见问题与优化
- 性能与磁盘
- 使用 XFS 并关注 inode 使用率;当磁盘空间充足却无法写入时,可通过 xfs_growfs -m <百分比> <挂载点> 动态提升 inode 占比。
- 网络连通性
- 无法从主机访问服务时,检查虚拟机网络模式(NAT/桥接/仅主机)、防火墙/安全组与服务监听地址(0.0.0.0 vs 127.0.0.1)。
- 虚拟化性能
- 在主机 BIOS 启用 VT-x/AMD-V,合理分配内存与 CPU,安装增强功能/Guest Additions以提升 I/O 与显示性能。