🌐

Linaje e Impact Analysis

Saber qué depende de qué antes de tocar un dataset. Vista de linaje, análisis de impacto y cómo enriquecerlo con Microsoft Purview.

Intermedio
🔗

¿Qué es el linaje?

El árbol genealógico de tus datos

El linaje documenta el camino que recorren los datos desde su origen hasta el informe que consume el usuario. En Power BI / Fabric se visualiza como un grafo con nodos (orígenes, dataflows, datasets, informes, dashboards, lakehouses) y aristas (relaciones de dependencia).

Sirve para responder preguntas cotidianas que de otro modo requieren detective:

  • "Si renombro esta columna en SQL, ¿qué informes se romperán?"
  • "¿De dónde sale el número de este dashboard? ¿De qué tabla, de qué refresh?"
  • "¿Quién está usando este dataflow? ¿Lo puedo borrar?"

Ejemplo visual de un linaje típico:

[Azure SQL: Ventas]
       ↓
[Dataflow Gen2: Bronze_Ventas]
       ↓
[Lakehouse: Silver_Ventas]
       ↓
[Semantic Model: Modelo_Ventas_Iberia]   ← Certified ✅
       ↓                          ↓
[Informe: Pipeline Comercial]   [Informe: KPI Cierre Mensual]
       ↓
[Dashboard: Dirección Comercial]
👁️

Vista de linaje del workspace

Activación y uso

  • En cualquier workspace, esquina superior derecha → icono de vista en cascada
  • Disponible para roles Admin, Member y Contributor (Viewer no la ve por defecto)
  • Muestra solo elementos del workspace actual y cómo enlazan con otros workspaces vía datasets compartidos

Lo que verás en cada nodo

  • Tipo de artefacto y nombre
  • Propietario y endorsement (Promoted / Certified)
  • Último refresh exitoso y estado
  • Sensitivity label aplicada
  • Atajos a Settings, View metrics e Impact analysis

Filtros útiles

  • Por tipo de artefacto: solo datasets, solo informes...
  • Por origen de datos: muestra todo lo que tira de un mismo origen
  • Por endorsement: aislar lo Certified
  • Por refresh fallido: detectar cadenas rotas rápidamente
💡 Tip kawaii: Cuando heredas un workspace que no conoces, lo primero que abres es la vista de linaje. En 30 segundos tienes el mapa mental de qué hace cada artefacto. 🌸
💥

Impact Analysis

"¿Qué pasa si toco esto?"

El Impact Analysis es el panel que muestra, para un dataset o dataflow, todo el contenido que aguas abajo lo consume. Aparece en la vista de linaje (botón "Impact analysis") y también desde el menú "..." del artefacto.

Información que aporta

  • Número de informes, dashboards y datasets dependientes
  • Vistas únicas en los últimos 30 días por artefacto consumidor (qué duele más romper)
  • Lista de workspaces afectados
  • Capacidades involucradas (importante en migraciones a Fabric)
  • Botón "Notify contacts" para mandar un aviso por email a propietarios consumidores

Cuándo usarlo

  • Antes de renombrar tablas / columnas / medidas
  • Antes de cambiar el modo de almacenamiento (Import ↔ DirectQuery)
  • Antes de despromocionar o eliminar un dataset
  • Antes de migrar un workspace a otra capacidad
⚠️ Ojo: El Impact Analysis solo ve los artefactos del Service. Los informes PBIX que viven en discos compartidos o las conexiones desde Excel no salen aquí. Para esos casos, complementa con Purview o con tu activity log.
📚

Linaje en Microsoft Purview

Cuando Power BI no basta

La vista nativa de Power BI es excelente para el linaje dentro del Service. Para el linaje end-to-end que también incluye sistemas operacionales (Azure SQL, Synapse, Databricks, Salesforce...) la herramienta es Microsoft Purview (antes Azure Purview):

  • Escanea orígenes externos y catálogos
  • Importa metadatos de Power BI vía conexión nativa
  • Construye un grafo de linaje a nivel de columna en muchos sistemas
  • Permite añadir glossary terms y clasificaciones de datos sensibles
  • Integra con sensitivity labels y DLP

Patrón habitual

Power BI lineage view para los analistas; Purview para el equipo de plataforma y compliance. Sin solapamiento, complementarios.

🔄

Workflow de cambios seguros

Receta para no romper informes ajenos

  1. Identifica el cambio y el artefacto afectado en Dev
  2. Abre Impact Analysis sobre el dataset / dataflow afectado en Prod
  3. Categoriza los consumidores: críticos, importantes, exploratorios
  4. Comunica a los propietarios con "Notify contacts" o por canal interno
  5. Aplica el cambio en Dev → Test → Prod a través de Deployment Pipelines
  6. Verifica refresh y visuals en al menos 1 informe representativo de cada consumidor crítico
  7. Documenta la fecha del cambio en la descripción del dataset y, si aplica, en la wiki del CoE
📌 Buena práctica: Combina Impact Analysis con la auditoría de uso. Un informe que figura como consumidor pero nadie ha visto en 60 días casi nunca justifica retrasar un cambio necesario.
🚀 Siguiente paso: Para mover cambios entre etapas sin sustos, sigue por Deployment Pipelines. Y para entender realmente quién usa qué, Auditoría y Activity Log.