Pájaro

Pájaro

Omicrono

Así funciona el reconocimiento de imágenes de Google

17 junio, 2013 16:40

Noticias relacionadas

Si tuviéramos que decir la verdad, tendríamos que admitir que Google, la famosa empresa detrás del buscador con el mismo nombre, ha sido la responsable de desarrollar algunos de los inventos más interesantes de los últimos años. La calidad y eficacia les avala, lo que significa que, en la mayoría de los casos, encontraremos productos que servirán para nuestras necesidades en la red de redes.

Aunque uno de los últimos proyectos de la empresa nos ha llamado especialmente la atención, ya que parece ser algo muy trabajado, y en lo que se ha puesto bastante empeño. Nos referimos al reconocimiento de imágenes, una herramienta que ya hemos podido probar, y que ha demostrado ser bastante interesante.

Para empezar, podemos encontrarla en algunos productos como Google Drive o Google+ Photos, lo que significa que podemos utilizarla para buscar imágenes, aunque estas no tengan datos adicionales que las identifiquen.

Así funciona

Según ha explicado Google:

El reconocimiento de imágenes está potenciado por varias herramientas tecnológicas, que hacen que se pueda usar el contenido visual de una imagen para generar tags para las fotos. Esto, unido a otros aspectos como los tags textuales y los metadatos EXIF, sirve para conseguir una foto que pueda ser buscada con facilidad.

También debemos tener en cuenta una de las adquisiciones que Google ha hecho: La de la empresa DNNresearch, una start-up que contaba con una “tecnología que utiliza aprendizaje profundo y redes neuronales convolucionales“. Aunque uno de los aspectos más interesantes de esta tecnología es que venció los enfoques más tradicionales de comprensión de imagenes. Por supuesto, es algo que pudo ser usado por la compañía de Sillicon Valley, desarrollando diversos métodos de reconocimiento de objetos, lo cual les proporcionó nuevas maneras de hacer las cosas. Incluso, Chuck Rosenberg, empleado del equipo de búsqueda de imagenes de Google, admitía que habían cogido una investigación de un laboratorio académico, lanzando una alternativa en poco más de 6 meses.

El resultado se puede leer en un documento publicado, aunque nosotros lo resumiremos un poco. Según se explica en una parte del texto, “se utiliza aprendizaje supervisado, con 7 capas de peso oculto, y extractores de características, extraídas de los datos“. Además, también se especificaba que la red neuronaltiene 60 millones de parámetros con valores reales y 650.000 neuronas. Se entrenó al equipo en 224 x 224 parches extraídos al azar de imagenes de 256 x 256, incluyendo sus reflexiones horizontales“.

Reconocimiento facial

Reconocimiento facial

Tras publicar el documento, Google seguía trabajando en el invento, perfeccionándolo e intentado que fuera aún mejor. Finalmente, la compañía comentaba que la característica de búsqueda de fotos permite el reconocimiento de hasta 1.100 tags. “Se nos ocurrió un conjunto de aproximadamente 2.000 clases visuales, basadas en las marcas más populares de Google+ Photos, que parecieran tener un componente visual, y que un ser humano pudiera reconocer fácilmente. También usamos entidades FreeBase. Una entidad es una manera de identificar de forma única algo, de forma independiente al lenguaje“. Por último, desde la empresa ha explicado que han querido “ofrecer etiquetas de alta precisión, perfeccionando las tags de nuestra serie inicial“.

Podemos esperar más

No podemos olvidar que detrás de la característica de reconocimiento de imagenes hay un montón de pruebas y proyectos que, en definitiva, han ayudado a la creación de uno de los productos más interesantes de Google. No obstante, el proyecto sigue en desarrollo, lo que significa que próximamente podríamos ver novedades al respecto.

Por el momento, el reconocimiento de imagenes ya puede ser observado en algunos de los productos que están disponibles, lo que nos ayudará a realizar búsquedas más exactas de imagenes, obteniendo el resultado más exacto que se pueda conseguir.

Vía | Google Operating System
Imagenes | Wikimedia y Blogspot