Saber qué depende de qué antes de tocar un dataset. Vista de linaje, análisis de impacto y cómo enriquecerlo con Microsoft Purview.
Intermedio
🔗
¿Qué es el linaje?
El árbol genealógico de tus datos
El linaje documenta el camino que recorren los datos desde su origen hasta el informe que consume el usuario. En Power BI / Fabric se visualiza como un grafo con nodos (orígenes, dataflows, datasets, informes, dashboards, lakehouses) y aristas (relaciones de dependencia).
Sirve para responder preguntas cotidianas que de otro modo requieren detective:
"Si renombro esta columna en SQL, ¿qué informes se romperán?"
"¿De dónde sale el número de este dashboard? ¿De qué tabla, de qué refresh?"
"¿Quién está usando este dataflow? ¿Lo puedo borrar?"
En cualquier workspace, esquina superior derecha → icono de vista en cascada
Disponible para roles Admin, Member y Contributor (Viewer no la ve por defecto)
Muestra solo elementos del workspace actual y cómo enlazan con otros workspaces vía datasets compartidos
Lo que verás en cada nodo
Tipo de artefacto y nombre
Propietario y endorsement (Promoted / Certified)
Último refresh exitoso y estado
Sensitivity label aplicada
Atajos a Settings, View metrics e Impact analysis
Filtros útiles
Por tipo de artefacto: solo datasets, solo informes...
Por origen de datos: muestra todo lo que tira de un mismo origen
Por endorsement: aislar lo Certified
Por refresh fallido: detectar cadenas rotas rápidamente
💡 Tip kawaii: Cuando heredas un workspace que no conoces, lo primero que abres es la vista de linaje. En 30 segundos tienes el mapa mental de qué hace cada artefacto. 🌸
💥
Impact Analysis
"¿Qué pasa si toco esto?"
El Impact Analysis es el panel que muestra, para un dataset o dataflow, todo el contenido que aguas abajo lo consume. Aparece en la vista de linaje (botón "Impact analysis") y también desde el menú "..." del artefacto.
Información que aporta
Número de informes, dashboards y datasets dependientes
Vistas únicas en los últimos 30 días por artefacto consumidor (qué duele más romper)
Lista de workspaces afectados
Capacidades involucradas (importante en migraciones a Fabric)
Botón "Notify contacts" para mandar un aviso por email a propietarios consumidores
Cuándo usarlo
Antes de renombrar tablas / columnas / medidas
Antes de cambiar el modo de almacenamiento (Import ↔ DirectQuery)
Antes de despromocionar o eliminar un dataset
Antes de migrar un workspace a otra capacidad
⚠️ Ojo: El Impact Analysis solo ve los artefactos del Service. Los informes PBIX que viven en discos compartidos o las conexiones desde Excel no salen aquí. Para esos casos, complementa con Purview o con tu activity log.
📚
Linaje en Microsoft Purview
Cuando Power BI no basta
La vista nativa de Power BI es excelente para el linaje dentro del Service. Para el linaje end-to-end que también incluye sistemas operacionales (Azure SQL, Synapse, Databricks, Salesforce...) la herramienta es Microsoft Purview (antes Azure Purview):
Escanea orígenes externos y catálogos
Importa metadatos de Power BI vía conexión nativa
Construye un grafo de linaje a nivel de columna en muchos sistemas
Permite añadir glossary terms y clasificaciones de datos sensibles
Integra con sensitivity labels y DLP
Patrón habitual
Power BI lineage view para los analistas; Purview para el equipo de plataforma y compliance. Sin solapamiento, complementarios.
🔄
Workflow de cambios seguros
Receta para no romper informes ajenos
Identifica el cambio y el artefacto afectado en Dev
Abre Impact Analysis sobre el dataset / dataflow afectado en Prod
Categoriza los consumidores: críticos, importantes, exploratorios
Comunica a los propietarios con "Notify contacts" o por canal interno
Verifica refresh y visuals en al menos 1 informe representativo de cada consumidor crítico
Documenta la fecha del cambio en la descripción del dataset y, si aplica, en la wiki del CoE
📌 Buena práctica: Combina Impact Analysis con la auditoría de uso. Un informe que figura como consumidor pero nadie ha visto en 60 días casi nunca justifica retrasar un cambio necesario.