Estamos atravesando la era de la información, y es la calidad de esta la que condicionará el éxito de las decisiones tomadas por las compañías, las cuales depositan cada vez más confianza en el nivel de calidad de sus datos.
Pensemos por un momento en sistemas críticos, en el ámbito de la salud por ejemplo, una mala calidad del dato podría significar la diferencia entre la vida y la muerte o llevado al plano financiero, la diferencia entre una gran inversión o la quiebra de la empresa.
Esto nos impulsa a todos los equipos involucrados en un proyecto de inteligencia de negocios (áreas funcionales, técnicas, de calidad del software y de gestión) a trabajar en el aseguramiento de calidad del dato para generar una ventaja competitiva en un mundo cada día más globalizado, donde las fuentes de información tienden a aumentar en volumen, complejidad y diversidad.
A qué nos enfrentamos?
Se pueden detectar distintos tipos de incidencias relacionadas a la calidad de los datos. En el siguiente ejemplo observamos datos bancarios de una tabla de registros de clientes (datos ficticios), los cuales presentan distintos tipos de inconsistencias:
•Existencia: José López no tiene su número de cuenta en los registros.
•Conformidad: El valor ingresado no corresponde a un código postal.
•Consistencia: La relación país – ciudad no es correcta.
•Precisión: el código postal no se corresponde con la ciudad.
•Duplicados: Marta Díaz tiene duplicada su cuenta bancaria en el sistema.
•Integridad: Los clientes con ID “51616” y ”58975”, pertenecen al mismo banco: “BBVA” y “Banco Bilbao Vizcaya”, sin embargo no hay ningún campo que los relacione entre sí.
Algunas instancias críticas donde la calidad del dato se puede ver afectada por este tipo de inconsistencias son: entrada de datos (Data Entry), incorporación de datos externos, errores de carga en sistemas transaccionales o migraciones de datos.
Implementando procesos, mejorando la información y tomando mejores decisiones.
Con la calidad del dato como objetivo final, el equipo de BI ejecutará las siguientes actividades, las cuales serán parte del proceso de mejora continua a lo largo de la vida del proyecto:
Por su parte, desde calidad del software (QA), se aplican diversas metodologías de madurez de procesos de pruebas, las cuales orientan a los equipos de desarrollo a trabajar en una hoja de ruta hacia el aseguramiento de la calidad de sus productos resultantes.
En el caso de la metodología Six Sigma, plantea DMAIC (Define, Measure, Analyze, Improve, Control), una estrategia de calidad basada en estadística, que da mucha importancia a la recolección de información y a la veracidad de los datos como base de una mejora.
DEFINIR ( DEFINE )
Se refiere a definir los requerimientos del cliente, quién es, sus expectativas y entender los procesos importantes afectados. Estos requerimientos del cliente se denominan CTQs (por sus siglas en inglés: Critical To Quality). Además se determina el alcance del proyecto: las fronteras que delimitarán el inicio y final del proceso que se busca mejorar. En esta etapa se elabora un mapa del flujo del proceso.
MEDIR ( MEASURE )
El objetivo de esta etapa es medir el desempeño actual del proceso que se busca mejorar. Se utilizan los CTQs para determinar los indicadores y tipos de defectos que se utilizarán durante el proyecto. Posteriormente, se diseña el plan de recolección de datos y se identifican las fuentes de los mismos, se lleva a cabo la recolección de las distintas fuentes, se organizan las hipótesis causa – efecto. Por último, se comparan los resultados actuales con los requerimientos del cliente para determinar la magnitud de la mejora requerida.
ANALIZAR ( ANALYZE )
En esta etapa se lleva a cabo el análisis de la información recolectada para determinar las causas raíz de los defectos y oportunidades de mejora. Posteriormente se priorizan las oportunidades de mejora, de acuerdo a su importancia para el cliente y se identifican y validan sus causas de variación.
MEJORAR ( IMPROVE )
Se diseñan soluciones que ataquen el problema raíz y lleve los resultados hacia las expectativas del cliente. También se desarrolla el plan de implementación.
CONTROLAR ( CONTROL )
Tras validar que las soluciones funcionan, es necesario implementar controles que aseguren que el proceso se mantendrá en su nuevo rumbo. Para prevenir que la solución sea temporal, se documenta el nuevo proceso y su plan de monitoreo.
Al congeniar las actividades naturales de depuración del dato que aplica un equipo de BI junto con un proceso enfocado en la recolección de información para la mejora continua (como puede ser DMAIC ), estaremos aportando un valor diferencial a nuestros proyectos, ahorrando tiempo, optimizando el aprovechamiento de los recursos, minimizando los riesgos y como consecuencia, tomando mejores decisiones.