Cognyte I Formerly a Verint company 8
La increíble ariedad de fuentes, la asta cantidad
de datos y la fragmentación de estos datos
crean obstáculos signiåfcati os. Esto es toda ía
más frustrante porque estos datos deberían ser
usados como un activo estratégico, pero muchos
de los datos deberían ser usados como un acti o
estratégico, a pesar de que muchos de los datos
a los cuales tienen acceso las organizaciones
de seguridad son tratados con negligencia (o ni
siquiera tratados) e inexplorados para su análisis.
DATOS NO ESTRUCTURADOS
Los datos no estructurados son aquellos que no
tienen una estructura de acuerdo con los modelos
de datos establecidos y no pueden ser fácilmente
capturados en bases de datos relacionales. Esta
categoría es asta e inclu e casi todo lo que no está
incluido en la categoría de datos estructurados
(fotos, videos, e-mails, reportes, archivos de logs,
publicaciones en redes sociales, imágenes de
satélite y datos de sensores, entre otros).
Este fenómeno es verdadero y relevante tanto
para los delincuentes como para los ciudadanos
comunes. Usando analíticas, e iste el potencial
para que las organi aciones de seguridad åfltrar
las enormes cantidades de datos, obteniendo
una visión más profunda de las intenciones y
acciones de un criminal, descubriendo patrones y
conexiones ocultas y alcanzar conocimiento que
sería imposible encontrar manualmente. Pero
extraer este conocimiento no es una tarea sencilla.
LA VARIEDAD, VOLUMEN Y FRAGMENTACIÓN
DE DATOS PLANTEAN DESAFÍOS COMPLEJOS
El mundo está inundado de experiencias digitales y el subproducto de eso es la creciente huella digital. Como
informa la åfrma de in estigación IDC, “Hoy en día, más de 5 mil millones de consumidores interactúan
con datos todos los días – en 2025, ese número será de 6 mil millones, o el 75% de la población
mundial. Para el 2025, cada persona conectada en el mundo, en promedio, entrará en contacto con
datos digitales más de 4.900 veces por día – cerca de 1 interacción digital cada 18 segundos.”
8
La ariedad de datos se reåfere a la enorme
diversidad de tipos de datos que deben ser
colectados y analizados para investigaciones,
especialmente por organizaciones de seguridad
gubernamentales.
Con el åfn de obtener una comprensión detallada
de las actividades e intenciones de un delincuente,
los equipos de investigación deben combinar
datos de fuentes variadas, incluyendo bancos de
datos del gobierno, como registros criminales y
registros de ehículos, así como datos de internet,
transacciones åfnancieras, registros de uelos, rutas
de na ío muchas otras fuentes. Y esta di ersidad
continúa creciendo a medida que nuevas fuentes
surgen, desde tarjetas digitales a chatbots.
Además, los datos de cada fuente tienen una
inåfnidad de diferentes tipos formatos, se estima
que el 80% de los datos generados hoy son datos
no estructurados. La naturaleza inherente de los
datos no estructurados hace el trabajo de procesar
y minar los datos para obtener conocimientos
mucho más difícil que con datos estructurados.
VARIEDADE
De acuerdo con John Edwards, CIO de la Agencia
Central de Inteligencia de los EE.UU. (CIA), la variedad
de datos que las organizaciones de seguridad
analizan es vasta y mucho más amplia que la de
la mayoría de las empresas privadas. Añade que
“los conjuntos de datos están probablemente
entre los más complejos del mundo.”
12
TENDENCIA 2: EL VOLUMEN DE DATOS ESTÁ CRECIENDO RÁPIDAMENTE Y LOS DATOS ESTÁN ALTAMENTE FRAGMENTADOS,
DIFICULTANDO “CONECTAR LOS PUNTOS”