Correct weight Initialization in CNN

Question

Andres Ramirez el 29 de Jul. de 2018

0
Enlazar

Enlace directo a esta pregunta

https://la.mathworks.com/matlabcentral/answers/412549-correct-weight-initialization-in-cnn

Editada: Maria Duarte Rosa el 5 de Jul. de 2019

When a very deep DAG network is built from scratch, the initialization of the weights made by matlab is not very good since it presents a vanishing gradient problem which causes the CNN not to learn.

What is the function with which Matlab does the initiation of CNN weights?

Why do you implement initialization functions in Matlab such as XAVIER or RELU AWARE SCALALED?

Thank you for your answers.

2 comentarios
Mostrar NingunoOcultar Ninguno

Greg Heath el 31 de Jul. de 2018

I do not understand

"Why do you implement initialization functions in Matlab such as XAVIER or RELU AWARE SCALALED?"

Please explain.

Greg

Yuze Zou el 3 de Jul. de 2019

I guess this issuse has been solved in the latest release (R2019a) via new default weights initialization method (i.e., Xavier/Glorot) for `fullyConnectedLayer`. You can find more details here.

Iniciar sesión para comentar.

Iniciar sesión para responder a esta pregunta.

Answer 1

Maria Duarte Rosa el 5 de Jul. de 2019

1
Enlazar

Enlace directo a esta respuesta

https://la.mathworks.com/matlabcentral/answers/412549-correct-weight-initialization-in-cnn#answer_382152

Editada: Maria Duarte Rosa el 5 de Jul. de 2019

In R2019a, the following weight initializers are available (including a custom initializer via a function handle):

Glorot is also know as Xavier initializer.

Here is a page comparing 3 initializers when training LSTMs:

https://www.mathworks.com/help/deeplearning/examples/compare-layer-weight-initializers-example.html

I hope this helps,

Maria

0 comentarios
Mostrar -2 comentarios más antiguosOcultar -2 comentarios más antiguos

Iniciar sesión para comentar.

Answer 2

Andres Ramirez el 31 de Jul. de 2018

0
Enlazar

Enlace directo a esta respuesta

https://la.mathworks.com/matlabcentral/answers/412549-correct-weight-initialization-in-cnn#answer_331085

Hello Gerg, thanks for answering ... I'll explain:

I have built very deep networks such as: Googlenet, Resnet and VGG19, and I want to train them from scratch with my databases; However, when I do the training of any of these networks, the network does not learn and only reaches a maximum performance of 12 or 15%. I think the low performance is mainly due to the random initialization of the weights made by defaul in matlab does not work for very deep networks, according to the literature, random initialization causes a vanishing gradient problem which causes the network do not learn.

For the above, my questions are:

Why do not implement in matlab more appropriate weight initialization functions for the training of deep DAG networks, for example, XAVIER or RELA AWARE SCALALED?

I hope to have been clear the explanation of the problem I have ...

Thank you.

Greetings.

1 comentario
Mostrar -1 comentarios más antiguosOcultar -1 comentarios más antiguos

Greg Heath el 1 de Ag. de 2018

Editada: Greg Heath el 1 de Ag. de 2018

Abrir en MATLAB Online

Do you have a reference for

RELA AWARE SCALALED

I have no idea what this is.

Thanks

Greg

Iniciar sesión para comentar.

Answer 3

fareed jamaluddin el 4 de Ag. de 2018

0
Enlazar

Enlace directo a esta respuesta

https://la.mathworks.com/matlabcentral/answers/412549-correct-weight-initialization-in-cnn#answer_331600

I think you can take a look at this example https://www.mathworks.com/help/images/single-image-super-resolution-using-deep-learning.html

I am also looking for a way on weight initialization options, you can see in the example it create the initialization with He method for every conv layer.

0 comentarios
Mostrar -2 comentarios más antiguosOcultar -2 comentarios más antiguos

Iniciar sesión para comentar.

Correct weight Initialization in CNN

2 comentarios
Mostrar NingunoOcultar Ninguno

Respuesta aceptada

0 comentarios
Mostrar -2 comentarios más antiguosOcultar -2 comentarios más antiguos

Más respuestas (2)

1 comentario
Mostrar -1 comentarios más antiguosOcultar -1 comentarios más antiguos

0 comentarios
Mostrar -2 comentarios más antiguosOcultar -2 comentarios más antiguos

Ver también

Categorías

Etiquetas

Productos

Versión

Community Treasure Hunt

Correct weight Initialization in CNN

2 comentarios Mostrar NingunoOcultar Ninguno

Respuesta aceptada

0 comentarios Mostrar -2 comentarios más antiguosOcultar -2 comentarios más antiguos

Más respuestas (2)

1 comentario Mostrar -1 comentarios más antiguosOcultar -1 comentarios más antiguos

0 comentarios Mostrar -2 comentarios más antiguosOcultar -2 comentarios más antiguos

Ver también

Categorías

Etiquetas

Productos

Versión

Community Treasure Hunt

2 comentarios
Mostrar NingunoOcultar Ninguno

0 comentarios
Mostrar -2 comentarios más antiguosOcultar -2 comentarios más antiguos

1 comentario
Mostrar -1 comentarios más antiguosOcultar -1 comentarios más antiguos

0 comentarios
Mostrar -2 comentarios más antiguosOcultar -2 comentarios más antiguos