本地开发包 caicloud.tensorflow
为了方便在本地进行开发调试,Caicloud 提供了单机版的本地开发包 caicloud.tensorflow。安装该本地开发包之后,我们便可以在本地调试我们的模型训练任务代码。
前置条件
目前 TaaS 平台只支持 r1.0.0 以上版本的 TensorFlow,所以在安装 caicloud.tensorflow 包之前要先确保你本地安装的 TensorFlow 版本满足要求。
安装
我们可以通过 pip 直接安装 caicloud.tensorflow,
$ sudo pip install caicloud.tensorflow
使用
所需环境变量
在 TaaS 平台上创建分布式 TensorFlow 模型训练任务的时候,需要指定一些运行参数,例如最大训练轮数、训练日志路径、自动保存模型时间间隔等。而本地开发包 caicloud.tensorflow 将通过环境变量来获取这些参数。所以我们在调试我们的模型训练任务代码的时候,需要通过设置环境变量的方式来提供这些信息。
所需的环境变量:
环境变量 | 说明 | 默认值 |
---|---|---|
TF_MAX_STEPS | 训练最大轮数 | 1 |
TF_LOGDIR | 训练日志保存路径 | 随机生成的目录 |
TF_SAVE_CHECKPOINTS_SECS | 自动保存模型 checkpoint 文件的时间间隔 | 600 秒 |
TF_SAVE_SUMMARIES_STEPS | 自动保存模型训练日志的轮数频率 | 100 轮 |
本地运行
通过运行下面命令来启动本地单机版运行,
$ TF_MAX_STEPS=1000 TF_LOGDIR=/tmp/logdir python /paht/to/your/entry.py [args]