DATA ENGINEER

  • Híbrido (46010, Valencia, Valencia, España)

💧 ¿Te apasionan los datos, la IA y construir plataformas que convierten información compleja en impacto real?

En Xylem Vue, formarás parte de un equipo colaborativo donde tu trabajo habilita directamente la predicción, la optimización y la toma de decisiones basada en IA en el sector del agua. Si buscas un puesto en el que puedas dar forma a la base de la IA a escala—y crecer con ello…

¡Esta oportunidad es para ti!

🚀 ¿Cuál será tu misión?
Jugar un papel clave en la definición de la dirección técnica y la estrategia del Data Lake de Xylem Vue, construyendo datasets analíticos de alta calidad y pipelines escalables que impulsen analítica avanzada y soluciones basadas en IA en toda la plataforma.

Tus responsabilidades incluirán:
• Definir la estrategia técnica y la arquitectura del Data Lake para dar soporte a modelos de IA/ML y flujos de trabajo analíticos
• Construir y mantener modelos analíticos y datasets de features para predicción, detección de anomalías, optimización y soporte a la decisión
• Diseñar pipelines de datos end-to-end (ingesta, transformación, control de calidad, trazabilidad/lineage) para múltiples fuentes del sector del agua (telemetría time-series, modelos hidráulicos, datos geoespaciales, activos e historiales de eventos)
• Garantizar la calidad, consistencia, gobierno y disponibilidad de los datos en todo el Data Lake
• Colaborar con AI Engineers, data scientists, equipos de producto y arquitectos para entender requisitos de modelos y traducirlos a tareas accionables de data engineering
• Liderar la adopción de buenas prácticas en arquitectura de datos, gestión de metadatos, modelado de datos y MLOps/feature engineering
• Desarrollar capacidades a nivel plataforma (feature stores, interfaces modelo-dato, herramientas de automatización) para acelerar el desarrollo de IA en los equipos de producto
• Monitorizar el rendimiento y la fiabilidad de los pipelines, resolviendo proactivamente cuellos de botella o incidencias de datos
• Documentar arquitecturas, transformaciones y estructuras de datos para asegurar transparencia y mantenibilidad a largo plazo

🌟 ¿Qué te hará destacar?
• Grado o Máster en Informática, Data Engineering o un campo técnico relacionado
• Sólida experiencia práctica en ingeniería de datos: construcción de pipelines ETL/ELT, trabajo con grandes volúmenes de datos e implementación de flujos distribuidos
• Experiencia diseñando y manteniendo Data Lakes en la nube y tecnologías Big Data
• Buen entendimiento de las necesidades de datos para IA/ML, feature engineering y diseño de datasets “model-ready”
• Dominio de Python y SQL, y herramientas como PySpark/Spark, Databricks, Airflow (o similares)
• Experiencia con APIs, microservicios y patrones de integración de datos
• Familiaridad con herramientas de MLOps, feature stores y marcos de gobierno del dato
• Habilidad para colaborar con equipos multidisciplinares y comunicar conceptos complejos con claridad
• (Valorable) Conocimiento de tipos de datos y contexto operativo del sector del agua