Cognyte I Formerly a Verint company 8 La increíble ariedad de fuentes, la asta cantidad de datos y la fragmentación de estos datos crean obstáculos signiåfcati os. Esto es toda ía más frustrante porque estos datos deberían ser usados como un activo estratégico, pero muchos de los datos deberían ser usados como un acti o estratégico, a pesar de que muchos de los datos a los cuales tienen acceso las organizaciones de seguridad son tratados con negligencia (o ni siquiera tratados) e inexplorados para su análisis. DATOS NO ESTRUCTURADOS Los datos no estructurados son aquellos que no tienen una estructura de acuerdo con los modelos de datos establecidos y no pueden ser fácilmente capturados en bases de datos relacionales. Esta categoría es asta e inclu e casi todo lo que no está incluido en la categoría de datos estructurados (fotos, videos, e-mails, reportes, archivos de logs, publicaciones en redes sociales, imágenes de satélite y datos de sensores, entre otros). Este fenómeno es verdadero y relevante tanto para los delincuentes como para los ciudadanos comunes. Usando analíticas, e iste el potencial para que las organi aciones de seguridad åfltrar las enormes cantidades de datos, obteniendo una visión más profunda de las intenciones y acciones de un criminal, descubriendo patrones y conexiones ocultas y alcanzar conocimiento que sería imposible encontrar manualmente. Pero extraer este conocimiento no es una tarea sencilla. LA VARIEDAD, VOLUMEN Y FRAGMENTACIÓN DE DATOS PLANTEAN DESAFÍOS COMPLEJOS El mundo está inundado de experiencias digitales y el subproducto de eso es la creciente huella digital. Como informa la åfrma de in estigación IDC, “Hoy en día, más de 5 mil millones de consumidores interactúan con datos todos los días – en 2025, ese número será de 6 mil millones, o el 75% de la población mundial. Para el 2025, cada persona conectada en el mundo, en promedio, entrará en contacto con datos digitales más de 4.900 veces por día – cerca de 1 interacción digital cada 18 segundos.” 8 La ariedad de datos se reåfere a la enorme diversidad de tipos de datos que deben ser colectados y analizados para investigaciones, especialmente por organizaciones de seguridad gubernamentales. Con el åfn de obtener una comprensión detallada de las actividades e intenciones de un delincuente, los equipos de investigación deben combinar datos de fuentes variadas, incluyendo bancos de datos del gobierno, como registros criminales y registros de ehículos, así como datos de internet, transacciones åfnancieras, registros de uelos, rutas de na ío muchas otras fuentes. Y esta di ersidad continúa creciendo a medida que nuevas fuentes surgen, desde tarjetas digitales a chatbots. Además, los datos de cada fuente tienen una inåfnidad de diferentes tipos formatos, se estima que el 80% de los datos generados hoy son datos no estructurados. La naturaleza inherente de los datos no estructurados hace el trabajo de procesar y minar los datos para obtener conocimientos mucho más difícil que con datos estructurados. VARIEDADE De acuerdo con John Edwards, CIO de la Agencia Central de Inteligencia de los EE.UU. (CIA), la variedad de datos que las organizaciones de seguridad analizan es vasta y mucho más amplia que la de la mayoría de las empresas privadas. Añade que “los conjuntos de datos están probablemente entre los más complejos del mundo.” 12 TENDENCIA 2: EL VOLUMEN DE DATOS ESTÁ CRECIENDO RÁPIDAMENTE Y LOS DATOS ESTÁN ALTAMENTE FRAGMENTADOS, DIFICULTANDO “CONECTAR LOS PUNTOS”