登录注册

做网站
做推广
做电商

服务支持
应用与服务
关于中企

中企商学院

查看更多

核心必备

数字门户内贸营销版

全球营销版通用版

企业域名企业邮箱

行业应用

医院专业版学校专业版

律所专业版数字名片

视觉设计

VR全景视频制作

图片拍摄

网络安全

等保认证 SSL证书

查看更多

核心必备

全球SEO 百度首屏展位

Yandex推广 Google海外推广

解决方案

外贸推广解决方案

查看更多

核心必备

全网商城移动商城

装修服务

电商产品拍摄

解决方案

零售行业OMO解决方案政府采购电商平台解决方案

查看更多

查看更多

查看更多

帮助中心

数字门户产品服务保障服务中心

设计师信息化讲堂

解决方案

外贸数字营销解决方案企业视频直播解决方案

企业安全等保解决方案品牌数字化营销解决方案

品牌零售数字商业解决方案智慧园区解决方案

B2B电商平台建设解决方案数字化政务门户解决方案

开拓型外贸企业解决方案成长型外贸企业解决方案

行业解决方案

实战应用

产品剖析律所行业专家

平台产品导入外贸信息洞察

行业解读

学习中心

电商运营学院网站建设学院

查看更多

应用与服务

VR智能全景个性化场景定制服务

网站安全服务云定制

企业视频直播 Banner设计

产品主图设计图片处理

查看更多

企业概况

关于我们企业文化

发展历程数码庄园

法律隐私

资质荣誉

企业资质所获荣誉

新闻中心

新闻公告媒体报道

社会公益视频中心

行业资讯

联系我们

联系我们全国网点

工作机会

查看更多

查看更多

使用TFRecord存取多个数据案例

时间：2021-05-22

TensorFlow提供了一种统一的格式来存储数据，就是TFRecord，它可以统一不同的原始数据格式，并且更加有效地管理不同的属性。

TFRecord格式

TFRecord文件中的数据都是用tf.train.Example Protocol Buffer的格式来存储的，tf.train.Example可以被定义为：

message Example{ Features features = 1}message Features{ map<string, Feature> feature = 1}message Feature{ oneof kind{ BytesList bytes_list = 1 FloatList float_list = 1 Int64List int64_list = 1 }}

可以看出Example是一个嵌套的数据结构，其中属性名称可以为一个字符串，其取值可以是字符串BytesList、实数列表FloatList或整数列表Int64List。

将数据转化为TFRecord格式

以下代码是将MNIST输入数据转化为TFRecord格式：

# -*- coding: utf-8 -*-import tensorflow as tffrom tensorflow.examples.tutorials.mnist import input_dataimport numpy as np# 生成整数型的属性def _int64_feature(value): return tf.train.Feature(int64_list=tf.train.Int64List(value=[value]))# 生成浮点型的属性def _float_feature(value): return tf.train.Feature(float_list=tf.train.FloatList(value=[value])) #若想保存为数组，则要改成value=value即可# 生成字符串型的属性def _bytes_feature(value): return tf.train.Feature(bytes_list=tf.train.BytesList(value=[value]))mnist = input_data.read_data_sets("/tensorflow_google", dtype=tf.uint8, one_hot=True)images = mnist.train.images# 训练数据所对应的正确答案，可以作为一个属性保存在TFRecord中labels = mnist.train.labels# 训练数据的图像分辨率，这可以作为Example中的一个属性pixels = images.shape[1]num_examples = mnist.train.num_examples# 输出TFRecord文件的地址filename = "/tensorflow_google/mnist_output.tfrecords"# 创建一个writer来写TFRecord文件writer = tf.python_io.TFRecordWriter(filename)for index in range(num_examples): # 将图像矩阵转换成一个字符串 image_raw = images[index].tostring() # 将一个样例转化为Example Protocol Buffer, 并将所有的信息写入这个数据结构 example = tf.train.Example(features=tf.train.Features(feature={ 'pixels': _int64_feature(pixels), 'label': _int64_feature(np.argmax(labels[index])), 'image_raw': _bytes_feature(image_raw)})) # 将一个Example写入TFRecord文件 writer.write(example.SerializeToString())writer.close()

本程序将MNIST数据集中所有的训练数据存储到了一个TFRecord文件中，若数据量较大，也可以存入多个文件。

从TFRecord文件中读取数据

以下代码可以从上面代码中的TFRecord中读取单个或多个训练数据：

# -*- coding: utf-8 -*-import tensorflow as tf# 创建一个reader来读取TFRecord文件中的样例reader = tf.TFRecordReader()# 创建一个队列来维护输入文件列表filename_queue = tf.train.string_input_producer(["/Users/gaoyue/文档/Program/tensorflow_google/chapter7" "/mnist_output.tfrecords"])# 从文件中读出一个样例，也可以使用read_up_to函数一次性读取多个样例# _, serialized_example = reader.read(filename_queue)_, serialized_example = reader.read_up_to(filename_queue, 6) #读取6个样例# 解析读入的一个样例，如果需要解析多个样例，可以用parse_example函数# features = tf.parse_single_example(serialized_example, features={# 解析多个样例features = tf.parse_example(serialized_example, features={ # TensorFlow提供两种不同的属性解析方法 # 第一种是tf.FixedLenFeature,得到的解析结果为Tensor # 第二种是tf.VarLenFeature,得到的解析结果为SparseTensor，用于处理稀疏数据 # 解析数据的格式需要与写入数据的格式一致 'image_raw': tf.FixedLenFeature([], tf.string), 'pixels': tf.FixedLenFeature([], tf.int64), 'label': tf.FixedLenFeature([], tf.int64),})# tf.decode_raw可以将字符串解析成图像对应的像素数组images = tf.decode_raw(features['image_raw'], tf.uint8)labels = tf.cast(features['label'], tf.int32)pixels = tf.cast(features['pixels'], tf.int32)sess = tf.Session()# 启动多线程处理输入数据coord = tf.train.Coordinator()threads = tf.train.start_queue_runners(sess=sess, coord=coord)# 每次运行可以读取TFRecord中的一个样例，当所有样例都读完之后，会重头读取# for i in range(10):# image, label, pixel = sess.run([images, labels, pixels])# # print(image, label, pixel)# print(label, pixel)# 读取TFRecord中的前6个样例，若加入循环，则会每次从上次输出的地方继续顺序读6个样例image, label, pixel = sess.run([images, labels, pixels])print(label, pixel)sess.close()>> [7 3 4 6 1 8] [784 784 784 784 784 784]

输出结果显示，从TFRecord文件中顺序读出前6个样例。

以上这篇使用TFRecord存取多个数据案例就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持。

声明：本页内容来源网络，仅供用户参考；我单位不保证亦不表示资料全面及准确无误，也不保证亦不表示这些资料为最新信息，如因任何原因，本网内容或者用户因倚赖本网内容造成任何损失或损害，我单位将不会负任何法律责任。如涉及版权问题，请提交至online#300.cn邮箱联系删除。

相关文章

电话沟通

400-660-5555

QQ咨询

我们联系您

扫一扫添加动力姐姐微信

微信扫码关注动力小姐姐X