calidad de los datos en las empresas

Importancia de la Calidad de los Datos en las empresas

¿Por qué la preparación causa tanto revuelo en una organización?

Los avances tecnológicos en la captura y almacenamiento de datos e información, ha impulsado a las empresas hacían un crecimiento exponencial en cuanto a la cantidad y diversidad de datos que están por gestionar, relacionado no solo con el aumento en volumen de datos, sino también los elementos asociados a los datos e información. Por tal razón, la mala calidad de datos es un factor influyente en el desempeño de la empresa, puesto que se deteriora de alguna forma las relaciones que se mantienen con los elementos a los que están asociados los datos (proveedores, clientes internos y externos y empleados). Aquí los directivos podrán ver las dificultades en la gestión organizacional derivadas de una mala calidad de los datos.

Importancia de los datos

Entendiendo los datos podemos definirlos como «termino general par indicar alguno o todos de los hechos, letras, símbolos y números referidos a/o que describen un objeto, idea, situación, condición u otro factor» que constituyen un elemento fundamental en la toma de decisiones objetivas en toso los niveles de una organización. Actualmente, para las organizaciones modernas es posible decir que los datos constituyen unos de los recursos estratégicos.

Lograr la «gestión del conocimiento» se ha posicionado en un tema de gran interés organizacional en la actualidad. Lo que implica, en primer lugar, la toma de datos a través de los distintos procesos empresariales y convertirlos al agregarles valor mediante procesos de agrupación, clasificación, etc; para posteriormente convertirlos en conocimiento, a través de procesos de separación, evaluación, comparación, etc.

Por otra parte, para garantizar el correcto funcionamiento de una organización tenemos el uso de datos para la toma de decisiones (una de las prácticas ampliamente recomendada), contrario a la toma de decisiones con base en la intuición. Uno de los principios de gestión de la calidad es su enfoque basado en hechos, el cual plnatea que las decisiones eficaces se basan en el análisis de los datos y la información.

Sin embargo, la existencia de datos no es  suficientes para basar las decisiones que se tomen, en ellos, se requiere una calidad adecuada. Es decir que, cuando con base en los datos se favorezca una decisión sobre otra, se tenga la certeza de que los datos estén libres de errores y que, además, posean atributos relevantes y actualizados.

Calidad de los datos

El término en relación con los datos, toma sentido por el hecho de que los datos al igual que los productos y servicios, deben adecuarse al uso que se les pretende dar. Para el uso en este caso implica que dentro de cualquier contexto operacional, el dato que va a ser utilizado satisfaga las expectativas de los usuarios de estos. Dichas expectativas se satisfacen en gran medida si los datos son útiles para lo que estos los necesitan, son fáciles de entender e interpretar, y además son correctos.

Para garantizar estos aspectos, en principio,  se debe hacer un diseño apropiado de la base, tabla o lista de datos, con el fin de definir correctamente los atributos o tipos de datos en la misma; y posteriormente realizar un adecuado diseño de los procesos de producción de datos, garantizando que los datos lleguen a la base o tabla de datos, libres de defecto y con las demás características deseadas.

De estas definiciones se puede deducir que hablar de calidad de los datos es un concepto relativo. Por ejemplo, los datos que alguien puede considerar como de calidad aceptable, no lo son para otro observador consumidor con requisitos más rigurosos de uso o con otros usos previstos. Por lo tanto, al variar las expectativas de los usuarios respecto a los datos, también varían las características que deben tener los mismos para ser considerados como adecuados. y  se denominan dimensiones de calidad de los datos a estas características o cualidades que deben poseer los datos para ser considerados como adecuados.

Por lo tanto la calidad de los datos está asociada a un conjunto de dimensiones o atributos que son los que la definen. Un objetivo fundamental de las dimensiones es poder establecer un lenguaje común y también focalizar los problemas y las oportunidades de mejora en cuanto a calidad de los datos. Entre las dimensiones más importantes (las más utilizadas y referenciadas) están la exactitud, la integridad, la consistencia y la coherencia, es conveniente señalar que éstas deben ser definidas teniendo en cuenta las características propias de cada sector.

calidad de datos
Portada Data Sheet calidad de datos

Data Sheet Calidad de Datos

¿Cómo puedo obtener una Calidad de Datos óptima en mi empresa? Conózcalo aquí, descargue ahora de forma gratuita


Descargar

Implicaciones de la mala calidad de datos

La mala calidad de los datos afecta de diversas maneras la gestión empresarial. Obviamente una afectación primaria, la constituye su efecto sobre la toma de decisiones, lo que implicará procesos de toma de decisiones inefectivos y, en última instancia, ineficientes. Esta ineficacia se materializa cuando los datos son erróneos, e implican decisiones erróneas en las diversas alternativas sobre las que se decide. Considerando que las decisiones que se toman en la empresa están relacionadas con una multitud de elementos (clientes, proveedores, productos, procedimientos de trabajo, etc), se deduce a su vez la afectación que produce una inadecuada toma de decisiones. Por otra parte la ineficiencias puede ser ya que muchas veces se logra tomar decisiones con datos correctos, pero con una inversión adicional en tiempo debido a la demora o falta de puntualidad de los datos.

Otro resultado es el efecto sobre los clientes algo que resulta costoso. Este se puede materializar en la insatisfacción de los clientes debido al uso de nombres incorrectos, facturas con cantidades erróneas, envío de productos o cantidades equivocadas, o el compartir información irrelevante para cada uno de ellos, etc. Además pudiera materializarse en costos que se generen en los clientes, por ejemplo, el tiempo que dedique el cliente a solucionar el problema creado por el error.

Estas dificultades probablemente provocarán la pérdida del cliente, e incluso de otros clientes potenciales. Los costos en tiempo y demás recursos que las empresas dedican a la detección y corrección de errores en los datos es otra secuela de la baja calidad de los datos. En algunas empresas de producción, gran parte del personal administrativo e incluso parte del personal directamente relacionado con la producción, dedica un porcentaje significativo de tiempo a la corrección de errores en los datos; o en el departamento de ventas o de servicio al cliente incurre en diversos costos al tener que realizar continuamente correcciones de las direcciones, pedidos y facturas de los clientes.

Otras consecuencias negativas con menor impacto económico de la inadecuación de los datos, quizás sea la insatisfacción en los empleados al corregir continuamente datos erróneos y el trabajar procesando los datos que tienen frecuentemente problemas. También es considerable el efecto de la mala calidad de los datos en el éxito de muchas de las nuevas aplicaciones informáticas de ayuda a la toma de decisiones, como los Almacenes de Datos, la Minería de Datos y los Sistemas de Gestión de Relaciones con los Clientes.

Cuando en un proceso de producción de datos se obtienen malos resultados, no es conveniente aplicar nuevas tecnologías, pues su efecto podría ser nulo e incluso negativo; ya que no es conveniente automatizar procesos ineficientes. Apesar de todos los inconvenientes comentados en muchas organizaciones aún no se tiene en cuenta la calidad de los datos; por diversos factores, las grandes cantidades de datos que se generan, lo cual dificulta el proceso de detección y corrección de errores, el hecho de que los datos son intangibles, lo que dificulta su medición.

¿Cómo evaluar la calidad de los datos?

Una manera sencilla y práctica de evaluar la calidad de los datos es el cálculo de una tasa de error, para todos, o para los más importantes atributos dentro de una base de datos. Para esto es recomendable comparar un número de veces que sea estadísticamente adecuado, los datos entre la fuente original y la base, lista o tabla de datos. Otra manera de medir la calidad de los datos es enfocándose en las dimensiones de calidad. Para esto se hace necesario, en principio, definir las dimensiones de calidad que sean importantes para el conjunto de datos en análisis, y después se deben establecer indicadores que permitan cuantificar o calificar el grado de adecuación del dato atendiendo a cada dimensión. Algunas de las dimensiones que se definan, sobre todo las relacionadas con los valores de los datos,  podrán ser medidas a partir del cálculo de un indicador que sea el resultado de comparar los datos entre la fuente original y la base, lista o tabla de datos.

Sin embargo en el caso de otras dimensiones cuya medición directa sea más compleja (relevancia, puntualidad, accesibilidad, etc.), una forma de evaluación sería la aplicación de encuestas al personal implicado en la producción y utilización de los datos, para obtener criterios cualitativos respecto a las dimensiones. Otros indicadores del nivel de calidad de los datos menos relacionados con mediciones directas realizadas sobre la base de datos, serían las estimaciones que se puedan obtener del costo (en tiempo o dinero) dedicado a la detección y corrección de errores en los datos, las quejas y reclamaciones de los clientes de la empresa que estén asociadas a este factor, así como cualquier otro indicador que pueda ser reflejo de un inadecuado comportamiento empresarial a causa de la mala calidad de los datos.

Enfoques para mejorar la calidad de los datos

En la actualidad la tecnología informática es ampliamente utilizada con el objetivo de mejorar el desempeño organizacional en cuanto a calidad de datos, por lo cual en Datos Maestros™  hemos desarrollado una amplia gama de soluciones en software. Con nuestras soluciones lo que se realiza es un proceso denominado limpieza de datos. La limpieza de datos implica la exploración, validación y verificación del contenido del conjunto de datos, mediante parámetros de validez lógicos lo que permite detectar los posibles problemas y trabajar en su corrección.

Dentro de este proceso se desarrollan diversos pasos importantes (preparación, depuración), los cuales agregan valor en sí mismo al esfuerzo desarrollado para mejorar la calidad. Estos pasos son: el análisis, corrección y estandarización de los datos; la comparación así diversas fuentes. La fuente original (Única fuente verdadera), es la fuente donde se registra el dato por primera vez, por ejemplo, en el caso de datos de producción, los documentos donde se registran estos datos en el área productiva.

También los esfuerzos para garantizar un diseño adecuado de entrada de datos. El uso de cuadros de edición, listas desplegables, controles numéricos, etc., ayudan a lograr una entrada de datos casi libre de errores. Esta es una práctica especialmente importante porque se ha demostrado que cuando este esfuerzo no se hace, el proceso de entrada de datos engendra una razón de error de un 5% o más. Para mejorar definitivamente la calidad de los datos únicos, la tecnología informática no es la solución, ya que para encontrar las causas de los problemas e incluso para mejorarlos, se necesita enfocarse en cuestiones no sólo relacionadas con el uso de tecnología de punta.

Pretender mejorar la calidad de los datos sólo a partir de buscar y corregir errores actuaría sobre los efectos del problema, cuando lo importante es detectar las causas de los errores. Por lo tanto los llamados sistemas de calidad de datos de generación, los cuales tratan de segunda identificar y eliminar las causas de familias completas de errores para evitar errores futuros (más que para detectarlos y corregirlos) y de implantar una infraestructura de gestión que permita desarrollar adecuadamente este objetivo.

Un elemento importante considerado en estos sistemas es el diagnóstico. En ese sentido también se han desarrollado procedimientos o metodologías para el diagnóstico de la calidad de los datos que, entre otros aspectos, inciden en la búsqueda de las causas que provocan los problemas de calidad. Algunos de estos problemas son consecuencia de: cadenas de información aparecerán de forma deficiente, poca motivación de los trabajadores en cuanto importancia de los datos y su calidad, inadecuada capacitación de los trabajadores vinculados a los procesos de producción de datos, condiciones ergonómicas inadecuadas en estos procesos, entre otras.

Todos estos factores requieren soluciones y están allí donde Datos Maestros ™  está para ayudar con nuestra amplia trayectoria y experiencia en calidad de datos. En aquellas organizaciones que presentan estos problemas, no se emprenden iniciativas para la mejora de la misma, motivadas en muchas ocasiones por la dificultad de medir la ganancia esperada de estas. No obstante, la ganancia se puede materializar en el ahorro de costos que pueda tener la empresa al poner en práctica la iniciativa de calidad de datos. En última instancia, si al poner en práctica la iniciativa, se espera mejorar el servicio al cliente y las relaciones con éstas, son estas razones suficientes para empezar.

Para más información: https://revista.uclm.es/index.php/ruiderae/article/view/1837

Te deseamos mucho éxito y no te pierdas nuestros útiles consejos sobre la importancia de la caliad de los datos que estaremos subiendo a nuestro canal de youtube https://www.youtube.com/@DatosMaestrosLATAM ¡Esperamos poder ayudarte a alcanzar tus metas con la importancia de la calidad de los datos con nuestros servicios y combinado con CUBO iQ® PlataForma de auditoria de calidad de  datos
con un enfoque no invasivo de la importancia de la calidad de los datos! ???

También puedes comunicarte con nosotros si tienes preguntas relacionadas con este documento o si deseas discutir sobre tu iniciativa de la importancia de la calidad de los datos. Escríbenos a contacto@datosmaestros.com o agenda aqui sin compromiso


Agendar Cita

MANUEL SUAREZ

Manuel Suarez es el Co-Fundador y CEO de Datos Maestros, una empresa líder en el campo de la gestión de datos maestros. Padre de 4 y apasionado por la tecnologia Big Data, ML, AI y mas.

Anterior Hacer de una práctica tediosa y engorrosa un proceso rápido y automático: esto es la preparación de datos