本地开发包 caicloud.tensorflow

为了方便在本地进行开发调试,Caicloud 提供了单机版的本地开发包 caicloud.tensorflow。安装该本地开发包之后,我们便可以在本地调试我们的模型训练任务代码。

前置条件

目前 TaaS 平台只支持 r1.0.0 以上版本的 TensorFlow,所以在安装 caicloud.tensorflow 包之前要先确保你本地安装的 TensorFlow 版本满足要求。

安装

我们可以通过 pip 直接安装 caicloud.tensorflow

$ sudo pip install caicloud.tensorflow

使用

所需环境变量

在 TaaS 平台上创建分布式 TensorFlow 模型训练任务的时候,需要指定一些运行参数,例如最大训练轮数、训练日志路径、自动保存模型时间间隔等。而本地开发包 caicloud.tensorflow 将通过环境变量来获取这些参数。所以我们在调试我们的模型训练任务代码的时候,需要通过设置环境变量的方式来提供这些信息。

所需的环境变量:

环境变量 说明 默认值
TF_MAX_STEPS 训练最大轮数 1
TF_LOGDIR 训练日志保存路径 随机生成的目录
TF_SAVE_CHECKPOINTS_SECS 自动保存模型 checkpoint 文件的时间间隔 600 秒
TF_SAVE_SUMMARIES_STEPS 自动保存模型训练日志的轮数频率 100 轮

本地运行

通过运行下面命令来启动本地单机版运行,

$ TF_MAX_STEPS=1000 TF_LOGDIR=/tmp/logdir python /paht/to/your/entry.py [args]

results matching ""

    No results matching ""