2.2.1 全连接层的定义与实现_TensorFlow知识图谱实战-QQ阅读男生历史网

上QQ阅读APP看书，第一时间看更新

全连接层的每一个结点都与上一层的所有结点相连，用来把前边提取到的特征综合起来。由于其全相连的特性，一般全连接层的参数也是最多的。图2.11所示的是一个简单的全连接网络。

图2.11　全连接层

其推导过程如下：

将推导公式转化一下写法，具体如下：

可以看到，全连接的核心操作就是矩阵向量乘积：。

下面举一个例子，使用TensorFlow自带的API实现一个简单的矩阵计算。

首先通过公式计算对数据做一个先行验证，按推导公式计算如下：

(1×1+1×1)+0.17=2.17

(2×1+2×1)+0.17=4.17

这样最终形成了一个新的矩阵[2.17,4.17]，代码如下：

【程序2-9】

最终打印结果如下：

     tf.Tensor([[2.17] [4.17]], shape=(2, 1), dtype=float32)

最终计算出一个Tensor，大小为shape=(2, 1)，类型为float32，其值为[[2.17] [4.17]]。

计算本身非常简单，全连接的计算方法相信读者也很容易掌握。现在回到代码中，请注意我们在定义参数和定义输入值的时候采用的不同写法：

     weight = tf.Variable([[1.],[1.]])
     input_xs = tf.constant([[1.,1.],[2.,2.]])

这里对参数的定义，使用的是Variable函数；对输入值的定义，采用的是constant函数，将其对应内容打印如下：

    <tf.Variable 'Variable:0' shape=(2, 1) dtype=float32, numpy=array([[1.], [1.]],
dtype=float32)>

input_xs打印如下：

     tf.Tensor([[1. 1.][2. 2.]], shape=(2, 2), dtype=float32)

通过对比可以看到，这里的weight被定义成一个可变参数Variable类型，供在后续的反向计算中进行调整。constant函数直接读取数据并将其定义成Tensor格式。