TensorFlow 0.12模型文件

TensorFlow 0.12 Model Files

本文关键字:文件 模型 TensorFlow      更新时间:2023-10-16

我训练一个模型并使用保存它

saver = tf.train.Saver()
saver.save(session, './my_model_name')

除了检查点文件(它只包含指向模型最新检查点的指针)之外,这在当前路径中创建了以下3个文件:

  1. my_model_name.meta
  2. my_model_name.index
  3. my_model_name.data-00000-of00001

我想知道每个文件都包含什么。

我想用C++加载这个模型并运行推理。label_image示例使用ReadBinaryProto()从单个.bp文件加载模型。我想知道如何从这3个文件中加载它。以下的C++等价物是什么?

new_saver = tf.train.import_meta_graph('./my_model_name.meta')
new_saver.restore(session, './my_model_name')

您的保护程序创建的内容被称为"Checkpoint V2",并在TF 0.12中引入。

我做得很好(尽管C++部分的文档很糟糕,所以我花了一天时间才解决)。有些人建议将所有变量转换为常数或冻结图形,但实际上不需要这些。

Python部分(保存)

with tf.Session() as sess:
tf.train.Saver(tf.trainable_variables()).save(sess, 'models/my-model')

如果您使用tf.trainable_variables()创建Saver,您可以节省一些麻烦和存储空间。但是,有些更复杂的模型可能需要保存所有数据,然后将此参数删除到Saver,只需确保在创建图形后创建Saver即可。给所有变量/层提供唯一的名称也是非常明智的,否则您可能会遇到不同的问题。

C++部分(推理)

请注意,checkpointPath不是任何现有文件的路径,只是它们的公共前缀。如果您错误地将.index文件的路径放在那里,TF不会告诉您这是错误的,但它会在推理过程中由于未初始化的变量而死亡。

#include <tensorflow/core/public/session.h>
#include <tensorflow/core/protobuf/meta_graph.pb.h>
using namespace std;
using namespace tensorflow;
...
// set up your input paths
const string pathToGraph = "models/my-model.meta"
const string checkpointPath = "models/my-model";
...
auto session = NewSession(SessionOptions());
if (session == nullptr) {
throw runtime_error("Could not create Tensorflow session.");
}
Status status;
// Read in the protobuf graph we exported
MetaGraphDef graph_def;
status = ReadBinaryProto(Env::Default(), pathToGraph, &graph_def);
if (!status.ok()) {
throw runtime_error("Error reading graph definition from " + pathToGraph + ": " + status.ToString());
}
// Add the graph to the session
status = session->Create(graph_def.graph_def());
if (!status.ok()) {
throw runtime_error("Error creating graph: " + status.ToString());
}
// Read weights from the saved checkpoint
Tensor checkpointPathTensor(DT_STRING, TensorShape());
checkpointPathTensor.scalar<std::string>()() = checkpointPath;
status = session->Run(
{{ graph_def.saver_def().filename_tensor_name(), checkpointPathTensor },},
{},
{graph_def.saver_def().restore_op_name()},
nullptr);
if (!status.ok()) {
throw runtime_error("Error loading checkpoint from " + checkpointPath + ": " + status.ToString());
}
// and run the inference to your liking
auto feedDict = ...
auto outputOps = ...
std::vector<tensorflow::Tensor> outputTensors;
status = session->Run(feedDict, outputOps, {}, &outputTensors);

为了完整起见,这里是Python的等价物:

Python中的推理

with tf.Session() as sess:
saver = tf.train.import_meta_graph('models/my-model.meta')
saver.restore(sess, tf.train.latest_checkpoint('models/'))
outputTensors = sess.run(outputOps, feed_dict=feedDict)

我自己目前也在努力解决这个问题,我发现目前做起来不是很简单。关于这个主题,最常被引用的两个教程是:https://medium.com/jim-fleming/loading-a-tensorflow-graph-with-the-c-api-4caaff88463f#.goxwm1e5j和https://medium.com/@hamedmp/exporting-trained-tensorflow-models-to-c-the-right-way-cf24b609d183#.g1gak956i

相当于

new_saver = tf.train.import_meta_graph('./my_model_name.meta')
new_saver.restore(session, './my_model_name')

只是

Status load_graph_status = LoadGraph(graph_path, &session);

假设您已经"冻结了图形"(使用的脚本将图形文件与检查点值组合在一起)。另外,请参阅此处的讨论:Tensorflow在C++中导出和运行图的不同方法