Definición de Red Neuronal Convolucional
Las redes neuronales convolucionales son similares a las redes neuronales multicanal, su principal ventaja es que cada parte de la red se le entrena para realizar una tarea, esto reduce significativamente el número de capas ocultas, por lo que el entrenamiento es más rápido. Además, presenta invarianza a la traslación de los patrones a identificar.
Las redes neuronales convolucionales son muy potentes para todo lo que tiene que ver con el análisis de imágenes, debido a que son capaces de detectar características simples como por ejemplo detención de bordes, lineas, etc y componer en características más complejas hasta detectar lo que se busca.
Arquitectura
Convolución – convolution
En la convolución se realizan operaciones de productos y sumas entre la capa de partida y los n filtros (o kernel) que genera un mapa de características. Los características extraídas corresponden a cada posible ubicación del filtro en la imagen original.
La ventaja es que el mismo filtro (= neurona) sirve para extraer la misma característica en cualquier parte de la entrada, con esto que consigue reducir el número de conexiones y el número de parámetros a entrenar en comparación con una red multicapa de conexión total.
Después de aplicar la convolución se le aplica a los mapas de características una función de activación.
La función de activación recomendada es signoide ReLU, seleccionando una tasa de aprendizaje adecuada y monitorizar la fracción de neuronas muertas, también se puede podría probar con Leaky ReLu o Maxout, pero nunca utilizar sigmoide logística.
Reducción – pooling
En la reducción se disminuye la cantidad de parámetros al quedarse con las características más comunes.
La forma de reducir parámetros se realiza mediante la extracción de estadísticas como el promedio o el máximo de una región fija del mapa de características, al reducir características el método pierde precisión aunque mejora su compatibilidad.
Clasificador – red perceptrón multicapa
El final de las capas convolucional y de reducción, se suele utilizar capas completamente conectadas en la que cada pixel se considera como una neurona separada al igual que en un perceptrón multicapa.
La última capa de esta red es una capa clasificadora que tendrá tantas neuronas como el número de clases a predecir.
0 comentarios