Charles Sansbury, CEO de Cloudera: "Las empresas no están dispuestas a mover cada fragmento de datos a la nube"
- El líder de esta multinacional defiende la necesidad de interoperabilidad en entornos híbridos para sacar partido a los datos en la era de la IA.
- Más información: Los datos son el ingrediente base de la receta perfecta con la que afrontar el futuro de la inteligencia artificial
Para los veteranos del sector digital, Hadoop significó un antes y un después en la evolución del 'big data'. No sólo a nivel tecnológico, como primera plataforma adoptada a gran escala para almacenar y explotar ingentes cantidades de información, sino porque trajo consigo la aparición de nuevos jugadores tecnológicos que aprovecharan el tirón de esta tendencia para abrir un nuevo mercado.
Uno de ellos fue Cloudera, fundada en 2008, que en el imaginario colectivo sigue marcada a fuego como la empresa detrás de la distribución más extendida de Hadoop en el mundo empresarial. Pero los tiempos cambian, y esta multinacional busca transformarse en tiempos en que los datos son omnipresentes y la inteligencia artificial necesita de éstos para poderse construir.
“El legado de Cloudera es importante porque nos dio un entendimiento profundo sobre cómo las grandes empresas abordan los retos de procesar y gestionar enormes volúmenes de datos”, explica Charles Sansbury, CEO de la compañía desde hace poco más de un año. “Pero hemos invertido una gran cantidad de tiempo y recursos en evolucionar nuestra tecnología. Hoy participamos en decenas de proyectos de código abierto, unimos esas tecnologías y las hacemos utilizables para grandes compañías. Ya no somos sólo una empresa de Hadoop, aunque algunos competidores insistan en etiquetarnos así”.
En entrevista con DISRUPTORES - EL ESPAÑOL, Sansbury defiende que esta transición no ha sido únicamente tecnológica, sino también estratégica y muy ligada a la mudanza de hogar que están viviendo los propios datos, desde los centros de datos propios de cada empresa a entornos de nube pública y, cada vez más, en aproximaciones híbridas que combinan ambos mundos.
“Cuando llegué aquí, muchas organizaciones decían que el 100% de sus cargas de trabajo se moverían a la nube. Pero hoy, después de haber hablado con más de la mitad de los bancos más grandes del mundo y con muchos gobiernos, lo que escucho es muy diferente: únicamente un cuarto, tal vez un tercio de sus operaciones, está en la nube pública”, comenta el ejecutivo. “Las grandes corporaciones están apostando por una plataforma híbrida que les permita gestionar cargas de trabajo en entornos locales y en la nube. Esto es una gran noticia para nosotros, porque nuestra apuesta siempre fue ofrecer esa capacidad”.
Se refiere a la Cloudera Data Platform, una solución que combina tecnologías como Spark y Ozone con herramientas para gestionar datos en entornos híbridos. Según Sansbury, esta plataforma permite además integrar datos estructurados, no estructurados, sintéticos y generados por máquinas en una única plataforma.
“Es interesante ver cómo tanto los grandes proveedores de la nube como las empresas de gestión de datos basadas en la nube están empezando a aceptar la necesidad de interoperar mejor con los datos locales”, señala Sansbury. “Aunque no lo admitan abiertamente, sus acciones reflejan que han escuchado a sus clientes. Las empresas no están dispuestas a mover cada fragmento de sus datos a la nube, y eso les obliga a buscar plataformas que ofrezcan interoperabilidad entre diferentes infraestructuras”.
“Es fácil decir que puedes juntar un par de hojas de cálculo, pero la realidad es muy diferente cuando hablamos de enormes volúmenes de datos transaccionales globales que se crean y analizan continuamente. Eso es exactamente lo que nuestra plataforma está diseñada para gestionar, proporcionando herramientas que hacen posible la ingestión, almacenamiento y análisis de los conjuntos de datos más complejos”, sentencia.
Le pido concreción para bajar esta idea al ámbito terrenal y apela al sector financiero: “El saldo de una cuenta al final del día es el resultado de múltiples interacciones: depósitos, retiradas, intereses acumulados… Cada uno de esos elementos tiene su propia complejidad de gestión de datos. Y lo que escuchamos de nuestros clientes es la necesidad de tener certeza sobre el origen y la relevancia de esos datos para sus análisis”.
La repatriación de los datos
Lo que queda claro, en cualquier caso, es que las promesas de la nube pública como solución universal -económica, eficiente y segura- para la gestión de datos se ha quedado en agua de borrajas.
“Las empresas han descubierto que los ahorros prometidos al adoptar una arquitectura basada en la nube no se han materializado. En muchos casos, los costes han aumentado debido a los gastos variables de cómputo y electricidad, que son componentes clave de los precios en la nube”, corrobora Charles Sansbury. “Estos costes no solo no están bajando, sino que, particularmente en el caso de la electricidad, están aumentando”.
Y cual efectó dominó, muchas organizaciones se han puesto manos a la obra para redefinir sus estrategias al respecto: “Hemos visto casos donde los costes asociados a la nube no han subido un 50%, sino varios órdenes de magnitud más de lo esperado. Ciertas cargas de trabajo que operan constantemente y requieren grandes recursos de cómputo deberían ejecutarse en infraestructura local o en una nube privada sobre hardware propio. Por otro lado, tareas más temporales o con necesidades variables, como una promoción puntual o pruebas de concepto, son ideales para la nube pública”.
Ahora la promesa pasa por el modelo híbrido que combina la nube con infraestructuras locales. Según el máximo responsable de Cloudera, “al permitir a las empresas asignar sus cargas de trabajo al entorno adecuado, no solo optimizamos costes, sino que también ofrecemos una flexibilidad operativa que resulta crucial en un mundo donde los requisitos tecnológicos cambian constantemente”.
Del gran 'datalake' al 'edge computing'
El edge computing, aunque ha perdido algo de protagonismo en los últimos años, sigue siendo un tema central en la estrategia de muchos CIO, también de proveedores como el que nos ocupa. Charles Sansbury incluso defiende que esta tendencia está comenzando a ganar tracción nuevamente entre sus clientes. “En los últimos 12 meses hemos visto cómo la conversación sobre el edge ha resurgido. Inicialmente, la tendencia era centralizar todo en grandes repositorios de datos, pero algunas industrias, como las que explotan recursos naturales o de energía, están explorando cómo aprovechar el análisis de datos directamente en el edge”.
Un ejemplo que el ejecutivo destaca es el de las empresas de petróleo y gas: “Estas compañías, que operan tanto en tierra como en plataformas marítimas, están liderando el desarrollo de casos de uso en el edge. En algunos casos, los datos capturados en puntos remotos son suficientes para ejecutar análisis locales, lo que elimina la necesidad de centralizarlos. Pero en otros, los datos necesitan integrarse con otros conjuntos provenientes de diferentes ubicaciones para obtener una visión completa”.
Por tanto, el desafío pasa por determinar en qué escenarios los análisis locales en el edge son suficientes y cuándo es necesario unificar los datos: “Todavía estamos en una etapa temprana, y las empresas están intentando encontrar un equilibrio entre mantener el análisis en el edge y centralizar los datos para una visión más holística. No obstante, creemos que a largo plazo, el modelo evolucionará hacia más capacidad de cómputo y almacenamiento en el edge, simplemente porque será más eficiente”.
Comer o ser comidos
Cloudera fue una empresa cotizada en bolsa hasta que dos fondos de inversión decidieron sacarla de los parqués para agilizar su reconversión e impulsar su crecimiento. Sin embargo, el tamaño de esta firma es todavía pequeño en comparación con muchos de sus rivales (que incluyen a los grandes hiperescalares de la nube, por ejemplo) pero mantiene una posición interesante de dominio en su capa de actividad.
Una situación paradigmática que nos lleva a una disyuntiva clásica: comer o ser comido. “Somos propiedad de dos firmas de private equity. En este entorno, no puedes predecir el futuro, así que me centro en lo que puedo controlar, que es construir grandes productos, ofrecer un excelente servicio al cliente y crear un entorno donde el equipo esté empoderado”, elude Sansbury la cuestión de una posible venta.
Para Sansbury, el tamaño de Cloudera, que la hace competitiva pero también atractiva para adquisiciones, no es una desventaja si se mantiene el enfoque en los fundamentos. “Si haces las cosas bien, creas opciones: puedes atraer capital, adquirir empresas o regresar al mercado público”, explica.
En ese sentido, por ahora la estrategia de Cloudera incluye fusiones y adquisiciones para acelerar la innovación. “Nuestros clientes nos indican qué capacidades les gustaría ver. Identificamos tecnologías relevantes para ellos y las incorporamos en el momento adecuado”, añade a renglón seguido el CEO de Cloudera. “Integramos soluciones en nuestro ecosistema para acelerar la investigación y el desarrollo de manera rentable. Es una forma de optimizar costes y aportar valor tanto a nuestros clientes como a nuestra compañía”.