Google Vision API: El reconocimiento de imágenes de Google Photos para cualquier aplicación
Google Vision API es un servicio de reconocimiento de imágenes, creado por Google, que permite llevar el reconocimiento de fotos a cualquier aplicación.
19 febrero, 2016 19:42Google es una compañía que dispone de un gran número de servicios con los que hacen su negocio. Además de la publicidad, tenemos también otros tantos importantes como pueden ser el propio Android, la nube de Google Drive o incluso el servicio de Google Maps, el cual también genera ingresos al «alquilarlo» a terceros desarrolladores.
Hoy conocemos un nuevo servicio de Google que llegará muy pronto a todos los desarrolladores, y que pocas compañías tienen los recursos para crear, dejando a un lado compañías como Amazon, Microsoft o Qualcomm.
Se trata de Vision API, y se trata de un servicio de reconocimiento de imágenes que Google pone a disposición de los desarrolladores, que pueden utilizar desde hoy para mejorar sus productos.
Vision API: el reconocimiento de imágenes de Google
Recientemente Google ha liberado una API de desarrolladores que permite reconocer imágenes. Para aquellos que no sepan lo que es una API, es un conjunto de funciones ya creadas que los programadores pueden utilizar para ahorrarse mucho trabajo.
Con Vision API, los desarrolladores pueden usar el reconocimiento de imágenes sin tener que desarrollar sus propias herramientas
Por ejemplo, en este lugar, si queremos utilizar un programa que utilice reconocimiento de imágenes podemos utilizar la API directamente en lugar de desarrollar un costoso software que nos permita reconocerlas.
Google Vision API forma parte de la plataforma de Google en la Nube (Google Cloud), y lo que hace básicamente es aprovechar la inteligencia artificial de análisis de imágenes, que Google lleva años preparando, para ponerla al servicio de los desarrolladores (por un módico precio, claro está). Todo de una forma similar a la que vemos en aplicaciones como Google Photos.
¿Para qué sirve Vision API?
¿Pero que podemos hacer con Vision API? La respuesta es sencilla. Como usuarios no podremos hacer nada con ella, pues son unas herramientas dedicadas para que sean usadas por los desarrolladores. Si somos desarrolladores, sí podremos hacer que nuestras aplicaciones hagan lo siguiente gracias a Vision API:
Clasificar imágenes por categorías
Imaginad que tenemos una imagen en la que tenemos varios elementos. Se trata de una instantánea donde tenemos la Torre Eiffel, en la que hay dos personas tomándose un batido mientras pasean un perro. Con Vision API, podemos extraer de esa imagen la siguiente información:
- La torre Eiffel
- Dos personas humanas
- Comida
- Un perro
Todo esto se consigue mediante el reconocimiento de imágenes que ya conocimos con Google Photos, y que sirve para buscar imágenes por los elementos que aparecen en la foto, por ejemplo.
Análisis de imágenes
La Vision API permite utilizar el reconocimiento de imágenes y rostros para hacer un análisis de las emociones de una persona en una determinada imagen. Puede ser de utilidad para realizar estudios de un producto, analizando los rostros de las personas que lo estén probando o utilizando.
Reconocimiento óptico de texto
El reconocimiento óptico de texto nos permite extraer el texto de una fotografía y convertirlo a un formato reconocible para el ordenador. Un uso muy interesante para el reconocimiento de texto es el de aplicaciones que sean capaces de escanear libros en un formato editable como el de Word, o incluso para crear un traductor que entienda lo que ve nuestra cámara.
Detección de contenido inapropiado
Google Vision API es capaz de utilizar el reconocimiento de imágenes para combinarlo con el filtro SafeSearch, para identificar si una imagen contiene contenido indebido para nuestra aplicación. Un uso interesante de esta función sería para censurar imágenes en redes sociales en las que estén presentes menores de edad.
Así se amortiza Google Photos y su almacenamiento ilimitado
Vision API es una API para desarrolladores que podemos utilizar de forma gratuita para un uso personal, para pruebas o para aplicaciones con poca cuota de mercado.
Sin embargo, y como podéis ver en la tabla de precios, Google nos pasará factura si las aplicaciones que la utilicen comienzan a tener una cuota de uso más elevada. Este estilo de facturación ya lo hemos visto con servicios como Google Maps, donde Google saca tajada por ofrecernos unas herramientas que nosotros mismos no podríamos conseguir de forma sencilla.
Lo más interesante del asunto es que los beneficios que Google vaya a sacar de esta aplicación han sido gracias a nosotros. Para conseguir una Inteligencia Artificial tan precisa, Google ha necesitado millones y millones de imágenes distintas, todo para que su reconocimiento fuese perfeccionado.
Efectivamente, todas esas millones de fotos son las que hemos subido de forma gratuita a la nube de Google Photos. El almacenamiento ilimitado en la nube fue el precio que la gran G nos ha pagado para entrenar a su inteligencia artificial, y con este desarrollo, proveer a los desarrolladores toda esa potencia de procesamiento a un precio.
Google nunca nos ha ocultado que usan nuestros datos para perfeccionar sus servicios
Esto no tiene por qué ser algo malo, ya que la compañía nos ha ofrecido un servicio de calidad a cambio de una necesidad: crear un producto que los desarrolladores podrán utilizar para crear mejores aplicaciones, sin olvidarnos que también están dotando a Android de un gran valor añadido (todo suma). Y también cabe decir que nunca nos han ocultado que usan nuestros datos para perfeccionar sus servicios, datos que cedemos de forma voluntaria.
¿Creéis que ha sido un movimiento perfecto de Google, o por lo contrario que haya utilizado nuestras imágenes para crear un producto os parece suficiente motivación para abandonar Google Photos?