¿Los datos grandes se están volviendo demasiado grandes? Un enorme 90% de todos los datos existentes en el mundo se produjo en los últimos dos años, y solo el 20% de ellos se está utilizando. Dado que el análisis de big data no puede seguir el ritmo, este aumento exponencial es imposible de manejar, y hay un resultado muy obvio: la mayoría de los datos que recopilan las empresas, los individuos y los sensores de Internet de las cosas no se están utilizando..

Los datos no estructurados, no utilizados y no amados que acechan en las computadoras, los servidores y los archivos de las organizaciones en todo el mundo son una clara evidencia de que las empresas, aunque cada vez más digitalizadas y centradas en los datos, aún viven en la oscuridad..

Los datos oscuros pueden ser metadatos producidos por otros sistemas (Crédito de imagen: NASA)

¿Qué es datos oscuros??

Los datos no utilizados u "oscuros" son la historia del mundo de los negocios que no está a la altura de las expectativas en una escala masiva. Gartner define los datos oscuros como "los activos de información que las organizaciones recopilan, procesan y almacenan durante las actividades comerciales normales, pero que generalmente no se utilizan para otros fines".

“Principalmente, estamos hablando de información transaccional, archivos de registro, metadatos que no se han utilizado, pequeños fragmentos de información no analizada que parecen no tener valor y pueden considerarse como el producto de desecho de otros sistemas y procesos.,” dice John Culkin, Director de Gestión de la Información en Crown Records Management, quien asesora a las empresas sobre políticas de datos. También agrega a esa lista borrador, correos electrónicos temporales y antiguos, y archivos ZIP.

Los datos oscuros pueden estar al acecho en las computadoras portátiles de la empresa no utilizadas

¿De dónde vienen los datos oscuros??

“Los datos oscuros representan alrededor del 80% del contenido total en cualquier organización,” dice Stephen Mackey, Consultor Senior de IM en la empresa de gestión de la información Kefron, quien insiste en que es el resultado de los procesos comerciales cotidianos estándar. “Los datos oscuros son todo el contenido que se deja, se oculta en los sistemas y servidores, y se subutiliza u olvida.,” él añade.

Según IDC, el 90% de los datos no estructurados nunca se analizan, lo que a menudo es el resultado de una actitud anti-eliminación peligrosa, impulsada por la regulación de cumplimiento y la disponibilidad de almacenamiento de datos baratos en la nube y en otros lugares..

“Para una empresa minorista o de fabricación, por ejemplo, la información financiera puede mantenerse correctamente como un registro,” dice Culkin, añadiendo, “pero aunque los datos generados por muchos sistemas de venta y entrega no son necesarios, rara vez se eliminan.” Pero una actitud conservadora hacia los datos a la vez crea riesgos..

Podría haber 21 mil millones de dispositivos IoT para 2020

¿Por qué los datos oscuros dañan??

Hay dos formas principales en que los datos oscuros pueden dañar un negocio. En primer lugar, existe un riesgo de seguridad al no eliminar datos. “Es importante que los archivos no sean olvidados.,” dice Mackey. “Si no se monitorean y se mantienen seguros, la información crítica para el negocio que contienen podría extraerse sin conocimiento y usarse por razones infames..”

Los datos que no se van a utilizar deben eliminarse o protegerse del acceso no autorizado, ya que la información confidencial, confidencial y no estructurada podría incluir detalles de la cuenta del cliente, lo que genera problemas de cumplimiento..

La segunda forma en que los datos oscuros pueden dañar a una empresa es costándole dinero de manera indirecta. “Muchas empresas desconocen qué tipo de datos existen, y son estos datos ocultos los que dificultan las revisiones internas y las auditorías externas.,” dice Mackey. “¿Qué pasa si se plantea un problema sobre una cuenta de hace dos años y se cuestiona el pago, pero no se pueden encontrar las facturas y los registros??” él pide. La respuesta es simple; datos oscuros cuestan dinero a las empresas.