gru

Unidad recurrente cerrada

Sintaxis

Y = gru(X,H0,weights,recurrentWeights,bias)

[Y,hiddenState] = gru(X,H0,weights,recurrentWeights,bias)

___ = gru(X,H0,weights,recurrentWeights,bias,DataFormat=FMT)

___ = gru(X,H0,weights,recurrentWeights,bias,Name=Value)

Descripción

La operación de unidad recurrente cerrada (GRU) permite que una red aprenda dependencias entre unidades de tiempo de series de tiempo y datos secuenciales.

Nota

Esta función aplica la operación GRU de deep learning a los datos de un objeto dlarray. Si desea aplicar una operación GRU dentro de un objeto dlnetwork, use gruLayer.

Y = gru(X,H0,weights,recurrentWeights,bias) aplica un cálculo de unidad recurrente cerrada (GRU) a la entrada X empleando el estado oculto inicial H0 y los parámetros weights, recurrentWeights y bias. La entrada X debe ser un objeto dlarray con formato. La salida Y es un objeto dlarray con formato con el mismo formato de dimensión que X, excepto en el caso de las dimensiones "S".

La función gru actualiza el estado oculto empleando la función tangente hiperbólica (tanh) como la función de activación del estado. La función gru utiliza la función sigmoide dada por $σ (x) = {(1 + e^{- x})}^{- 1}$ como la función de activación de la puerta.

ejemplo

[Y,hiddenState] = gru(X,H0,weights,recurrentWeights,bias) también devuelve el estado oculto después de la operación GRU.

___ = gru(X,H0,weights,recurrentWeights,bias,DataFormat=FMT) también especifica el formato de dimensión FMT donde X no es un objeto dlarray con formato. La salida Y es un objeto dlarray sin formato con el mismo orden de dimensión que X, excepto en las dimensiones "S".

___ = gru(X,H0,weights,recurrentWeights,bias,Name=Value) especifica opciones adicionales con uno o más argumentos nombre-valor.

Ejemplos

contraer todo

Aplicar la operación GRU a datos secuenciales

Abrir script en vivo

Realice una operación GRU utilizando 100 unidades ocultas.

Cree los datos de secuencia de entrada como 32 observaciones con 10 canales y una longitud de secuencia de 64.

numFeatures = 10;
numObservations = 32;
sequenceLength = 64;

X = randn(numFeatures,numObservations,sequenceLength);
X = dlarray(X,"CBT");

Cree el estado oculto inicial con 100 unidades ocultas. Utilice el mismo estado oculto inicial para todas las observaciones.

numHiddenUnits = 100;
H0 = zeros(numHiddenUnits,1);

Cree los parámetros que se pueden aprender para la operación GRU.

weights = dlarray(randn(3*numHiddenUnits,numFeatures));
recurrentWeights = dlarray(randn(3*numHiddenUnits,numHiddenUnits));
bias = dlarray(randn(3*numHiddenUnits,1));

Realice el cálculo GRU.

[Y,hiddenState] = gru(X,H0,weights,recurrentWeights,bias);

Visualice el tamaño y el formato de dimensión de la salida.

size(Y)

ans = 1×3

   100    32    64

Y.dims

ans = 
'CBT'

Visualice el tamaño del estado oculto.

size(hiddenState)

ans = 1×2

   100    32

Puede utilizar el estado oculto para realizar un seguimiento del estado de la operación GRU e introducir más datos secuenciales.

Argumentos de entrada

contraer todo

`X` — Datos de entrada
`dlarray` | Arreglo numérico

Datos de entrada, especificados como un objeto dlarray con formato, un objeto dlarray sin formato o un arreglo numérico. Cuando X no es un objeto dlarray con formato, debe especificar el formato de etiqueta de dimensión con el argumento nombre-valor DataFormat. Si X es un arreglo numérico, al menos uno de H0, weights, recurrentWeights o bias debe ser un objeto dlarray.

X debe contener una dimensión de secuencia etiquetada "T". Si X cuenta con alguna dimensión espacial etiquetada "S", esta se aplana en la dimensión de canal "C". Si X no cuenta con una dimensión de canal, se añade una. Si X cuenta con alguna dimensión sin especificar etiquetada "U", esta debe ser única.