以下是在CentOS上搭建Python分布式计算的步骤,以Dask框架为例:
安装Python环境
sudo yum install -y python3 python3-pippython3 -m venv myenv && source myenv/bin/activate安装分布式计算框架
pip install dask distributed搭建Dask集群
dask-scheduler(默认监听8786端口)dask-worker <调度器IP>:8786http://<调度器IP>:8787查看集群信息。编写并运行分布式任务
from dask.distributed import Client
import dask.bag as db
# 连接集群
client = Client('<调度器IP>:8786')
# 提交任务
data = db.from_sequence(range(100))
results = data.map(lambda x: x**2).compute()
print(results)
其他框架参考:
ray,通过@ray.remote定义任务,适合机器学习场景。注意事项:
8786、8787)。