当前位置: 首页 > news >正文

双向循环神经网络(BiRNN)MNIST手写体识别(tensorflow)

 

tf.contrib.rnn.static_bidirectional_rnn() 函数

#1、将mnist每个字体的像素序列当做时间序列,喂给网络
#2、实现一个双向RNN网络,其中的cell可以是LSTM,也可以是GRU


import tensorflow as tf
import numpy as np

learning_rate = 0.01    # 因为优化器是adam,所以学习速率较低
max_samples = 400000    # 最大训练样本数为40万
batch_size = 128
display_step = 10       # 每间隔10次训练,就展示一次训练情况
n_input = 28 # 图像的宽度为28,因此设置输入为28
n_steps = 28 # 图像的高度为28,因此设置LSTM的展开步数(unrolled steps of LSTM)也设置为28
n_hidden = 256 # 定义一个方向的cell的数量
n_classes = 10 # 0-9,共有10个分类.

from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)
# endregion

# region 定义softmax层的权重
# 因为要合成两个LSTM的输入,所以第一个维度是2*n_hidden
weights = {
    # Hidden layer weights => 2*n_hidden because of foward + backward cells
    'out': tf.Variable(tf.random_normal([2*n_hidden, n_classes]))
}
biases = {
    'out': tf.Variable(tf.random_normal([n_classes]))
}
# endregion

# region 构建计算图
# x是一个二维结构,但是和卷积网络中的空间二维结构不同,
# 这里的二维被理解成第一个维度是时间序列n_steps,第二维度是每个时间点下的数据n_input
x = tf.placeholder("float", [None, n_steps, n_input])
y = tf.placeholder("float", [None, n_classes])
# 将x拆成一个长度为n_steps的列表,每个元素tensor的尺寸为[batch_size,n_input]
x_unstack = tf.unstack(x, axis=1)

# lstm_fw_cell = tf.contrib.rnn.BasicLSTMCell(n_hidden, forget_bias=1.0)
lstm_fw_cell = tf.contrib.rnn.GRUCell(n_hidden)
# lstm_bw_cell = tf.contrib.rnn.BasicLSTMCell(n_hidden, forget_bias=1.0)
lstm_bw_cell = tf.contrib.rnn.GRUCell(n_hidden)

outputs, _, _ = tf.contrib.rnn.static_bidirectional_rnn(lstm_fw_cell, lstm_bw_cell, x_unstack,
                                           dtype=tf.float32)
pred=tf.matmul(outputs[-1], weights['out']) + biases['out']
cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits=pred, labels=y))
optimizer = tf.train.AdamOptimizer(learning_rate=learning_rate).minimize(cost)
# tf.argmax(pred,1)求每行中最大的元素的角标(即列号)
correct_pred = tf.equal(tf.argmax(pred,1), tf.argmax(y,1))
# tf.cast(correct_pred, tf.float32),将correct_pred转化为浮点型
accuracy = tf.reduce_mean(tf.cast(correct_pred, tf.float32))
init = tf.global_variables_initializer()
# endregion

# region 执行计算图
with tf.Session() as sess:
    sess.run(init)
    step = 1
    while step * batch_size < max_samples:# step*128<400000
        # 直接读出来的batch_x的尺寸为[batch_size,784]
        batch_x, batch_y = mnist.train.next_batch(batch_size)
        # batch_x经过reshape后,尺寸变为(batch_size, n_steps, n_input)
        batch_x = batch_x.reshape((batch_size, n_steps, n_input))
        sess.run(optimizer, feed_dict={x: batch_x, y: batch_y})
        if step % display_step == 0:
            acc = sess.run(accuracy, feed_dict={x: batch_x, y: batch_y})
            loss = sess.run(cost, feed_dict={x: batch_x, y: batch_y})
            print("Iter " + str(step*batch_size) + ", Minibatch Loss= " + \
                  "{:.6f}".format(loss) + ", Training Accuracy= " + \
                  "{:.5f}".format(acc))
        step += 1
    print("Optimization Finished!")

    test_len = 10000
    test_data = mnist.test.images[:test_len].reshape((-1, n_steps, n_input))
    test_label = mnist.test.labels[:test_len]
    print("Testing Accuracy:", \
        sess.run(accuracy, feed_dict={x: test_data, y: test_label}))
# endregion

 

 

参考:

https://github.com/leichaocn/BiRNN

相关文章:

  • 双向循环神经网络(BiRNN)
  • MIPS
  • FPGA
  • Verilog硬件描述语言
  • SLAM
  • 深度估计(Depth Estimation)
  • 视觉里程计Visual Odometry(VO)
  • LiDar 激光雷达
  • Gazebo
  • Data Mining KDD
  • Word Embedding词嵌入(word2vec)
  • PageRank网页排名算法
  • Random Walk 随机游走算法
  • Apriori算法
  • Weka(二)—Classification(糖尿病数据集Cross-validation交叉验证meta-classifier(CVParameter)Weka Knowledge Flow)
  • ECMAScript入门(七)--Module语法
  • ES10 特性的完整指南
  • ES学习笔记(12)--Symbol
  • input实现文字超出省略号功能
  • java中的hashCode
  • Linux Process Manage
  • MobX
  • oldjun 检测网站的经验
  • Vultr 教程目录
  • XML已死 ?
  • 闭包,sync使用细节
  • 从 Android Sample ApiDemos 中学习 android.animation API 的用法
  • 聊聊flink的TableFactory
  • 前端_面试
  • 前端代码风格自动化系列(二)之Commitlint
  • 试着探索高并发下的系统架构面貌
  • 腾讯大梁:DevOps最后一棒,有效构建海量运营的持续反馈能力
  • 通过来模仿稀土掘金个人页面的布局来学习使用CoordinatorLayout
  • 吴恩达Deep Learning课程练习题参考答案——R语言版
  • 小程序01:wepy框架整合iview webapp UI
  • 一个6年java程序员的工作感悟,写给还在迷茫的你
  • 摩拜创始人胡玮炜也彻底离开了,共享单车行业还有未来吗? ...
  • ​io --- 处理流的核心工具​
  • ​LeetCode解法汇总2696. 删除子串后的字符串最小长度
  • #Lua:Lua调用C++生成的DLL库
  • (poj1.2.1)1970(筛选法模拟)
  • (分享)自己整理的一些简单awk实用语句
  • (附源码)ssm高校实验室 毕业设计 800008
  • (企业 / 公司项目)前端使用pingyin-pro将汉字转成拼音
  • (四)鸿鹄云架构一服务注册中心
  • .NET CORE 第一节 创建基本的 asp.net core
  • .Net FrameWork总结
  • .NET 除了用 Task 之外,如何自己写一个可以 await 的对象?
  • .NET 解决重复提交问题
  • .Net多线程总结
  • .net之微信企业号开发(一) 所使用的环境与工具以及准备工作
  • .pyc文件还原.py文件_Python什么情况下会生成pyc文件?
  • [ARM]ldr 和 adr 伪指令的区别
  • [BZOJ 4598][Sdoi2016]模式字符串
  • [BZOJ3223]文艺平衡树