发布网友 发布时间:2022-04-23 08:07
共2个回答
热心网友 时间:2022-06-18 03:36
paddlepaddle有四种数据类型和三种序列格式。四种数据类型分别是:dense_vector,sparse_binary_vector,sparse_float_vector和integer。三种序列格式分别是SequenceType.NO_SEQUENCE,SequenceType.SEQUENCE,SequenceType.SUB_SEQUENCE。详细的介绍可参考paddlepaddle官网说明。
举个简单的例子:
如果你的数据是 x = [1.0, 2.0, 3.0, 4.0, 5.0],那么就应该使用dense_vector,维度为输入数据的维度,这里是5,代码如下:
x = paddle.layer.data(name='x', type=paddle.data_type.dense_vector(5))如果你的数据是 x = [[1.0, 2.0, 3.0], [2.0, 3.0, 4.0], [3.0, 4.0, 5.0], [3.0, 5.0, 6.0]],那么这个数据有4个时间步长,每个步长维度为3,代码如下:
x = paddle.layer.data(name='x', type=paddle.data_type.dense_vector_sequence(3))同样的其他类似。
另外,你提到reader,你可能更想知道的是如何构造reader。paddle的reader是一个生成器,返回的是一个函数。
def train_reader(train_x, train_y):定义好reader后,现在我们生成我们需要的训练数据
data = np.array([[1, 1], [1, 2], [3, 4], [5, 2]])如此就可以使用train_reader进行模型训练了,test_reader的构造方式一样。
热心网友 时间:2022-06-18 03:37
dense_vector:稠密的浮点数向量。
sparse_binary_vector:稀疏的二值向量,即大部分值为0,但有值的地方必须为1。
sparse_float_vector:稀疏的向量,即大部分值为0,但有值的部分可以是任何浮点数。
integer:整型格式