El concepto de aprendizaje profundo fue promovido por Rina Dechter en 1986 e Igor Aizenberg en el año 2000. Este concepto forma parte de una familia más amplia de métodos de aprendizaje automático basados en redes neuronales artificiales. El aprendizaje profundo modela patrones de datos como redes complejas de múltiples capas y tiene el potencial de resolver problemas difíciles.
En la actualidad se ha aplicado con éxito en diversos campos como visión artificial, reconocimiento de voz, procesamiento de lenguaje natural, reconocimiento de audio, filtrado de redes sociales, traducción automática, bioinformática, diseño de fármacos, análisis de imágenes médicas, inspección de materiales.
En un estudio de McKinsey del año 2018 se explica que los modelos computacionales inspirados en redes neuronales se remontan al año 1940. En la actualidad están adquiriendo gran importancia por los aumentos en la capacidad de procesamiento de las computadoras.
Se pueden dividir en redes neuronales recurrentes, redes neuronales antagónicas y redes neuronales convolucionales. Se estima que el mercado del aprendizaje profundo podría alcanzar los 23.000 millones de dólares americanos para el año 2024. Las empresas que están liderando su avance incluyen, entre otras, a IBM, Intel, NVIDIA, Alphabet, Microsoft, Amazon o ARM.