你好,我正在尝试使用多个gpu来训练arcgis。学习模型,但得到错误如下:
复制
重现行为的步骤:
python-米火炬。分布。发射--nproc_per_node=8测试。py测试。py代码如下:从arcgis。学习进口prepare_data,UnetClassifier,DeepLab进口操作系统进口火炬打印(“可用设备”,火炬。cuda。device_count ())路径=r / home / gpu_test02 /数据/ label382_chip512_rota120”数据=prepare_data (路径,chip_size=512年,batch_size=6)米=DeepLab (数据)m。解冻()m。fit (1,0.001)m。保存(“model_test”)
错误:
文件“/ home / gpu_test02 / miniconda3 / env / arcgis / lib / python3.6 /网站/ arcgis /学习/模型/ _arcgis_model.py”,行1000年,在_save文件“/ home / gpu_test02 / miniconda3 / env / arcgis / lib / python3.6 /网站/ arcgis /学习/模型/ _arcgis_model.py”,行1000年,在_save操作系统。makedirs (自我。学习。路径/自我。学习。model_dir)文件“/ home / gpu_test02 / miniconda3 / env / arcgis / lib / python3.6 / os.py”,行220年,在makedirs操作系统。makedirs (自我。学习。路径/自我。学习。model_dir)文件“/ home / gpu_test02 / miniconda3 / env / arcgis / lib / python3.6 / os.py”,行220年,在makedirs操作系统。makedirs (自我。学习。路径/自我。学习。model_dir)操作系统。makedirs (自我。学习。路径/自我。学习。model_dir)文件“/ home / gpu_test02 / miniconda3 / env / arcgis / lib / python3.6 / os.py”,行220年,在makedirs文件“/ home / gpu_test02 / miniconda3 / env / arcgis / lib / python3.6 / os.py”,行220年,在makedirs操作系统。makedirs (自我。学习。路径/自我。学习。model_dir)文件“/ home / gpu_test02 / miniconda3 / env / arcgis / lib / python3.6 / os.py”,行220年,在makedirs操作系统。makedirs (自我。学习。路径/自我。学习。model_dir)文件“/ home / gpu_test02 / miniconda3 / env / arcgis / lib / python3.6 / os.py”,行220年,在makedirsmkdir (的名字,模式)mkdir (的名字,模式)mkdir (的名字,模式)mkdir (的名字,模式)FileExistsError:(Errno17)文件存在:“/ home / gpu_test02 /数据/ label382_chip512_rota120 /模型/ checkpoint_2021-06-19_15-30-17”FileExistsError:(Errno17)文件存在:“/ home / gpu_test02 /数据/ label382_chip512_rota120 /模型/ checkpoint_2021-06-19_15-30-17”mkdir (的名字,模式)FileExistsError:(Errno17)文件存在:“/ home / gpu_test02 /数据/ label382_chip512_rota120 /模型/ checkpoint_2021-06-19_15-30-17”FileExistsError:(Errno17)文件存在:“/ home / gpu_test02 /数据/ label382_chip512_rota120 /模型/ checkpoint_2021-06-19_15-30-17”FileExistsError:(Errno17)文件存在:“/ home / gpu_test02 /数据/ label382_chip512_rota120 /模型/ checkpoint_2021-06-19_15-30-17”mkdir (的名字,模式)FileExistsError:(Errno17)文件存在:“/ home / gpu_test02 /数据/ label382_chip512_rota120 /模型/ checkpoint_2021-06-19_15-30-17”
截图
预期行为
清楚而简洁地描述你期望发生的事情。
平台(请填写以下信息):
额外的上下文
在这里添加关于这个问题的任何其他上下文,附件等。