Visitas: 24
Un nuevo método de aprendizaje automático desarrollado por científicos de ETH permite predecir los robos incluso en áreas escasamente pobladas.
Cortesia ETH: Ladrones y robos no ocurren en todas partes todo el tiempo. Ciertas comunidades, vecindarios y calles, así como las estaciones del año y las horas del día, tienen un riesgo mayor o menor de que ocurra un robo. Usando estadísticas de robo, las técnicas de aprendizaje automático pueden identificar patrones y predecir el riesgo de un robo en una ubicación específica. De este modo, los programas informáticos pueden ayudar a la policía a identificar puntos de acceso de ladrones (lugares con un riesgo particularmente alto de asalto) en cualquier día, lo que les permite desplegar patrullas en consecuencia.
El desequilibrio de clase hace que el aprendizaje sea más difícil
Hasta la fecha, dichos sistemas de alerta solo funcionan en áreas densamente pobladas, principalmente en ciudades. Esto se debe a que los programas de computadora necesitan datos suficientes para reconocer patrones y el crimen es menos frecuente en áreas escasamente pobladas. Esto se conoce como un «desequilibrio de clase» en las estadísticas. Específicamente, esto significa que por cada tramo de carretera que tiene un accon de ladrones, hay varios cientos o incluso mil que no lo hacen.
Los algoritmos trabajan en paralelo.
Cristina Kadar es una informática y estudiante de doctorado en el Departamento de Administración, Tecnología y Economía. Ella ha desarrollado un método que puede hacer pronósticos confiables a pesar de los datos desequilibrados. Su investigación acaba de ser publicada en la revista Decision Support Systems. Probó numerosos métodos de aprendizaje automático con una gran cantidad de datos de robos en el cantón suizo de Aargau, los combinó y comparó las tasas de éxito. Un método que utiliza el aprendizaje conjunto y combina los análisis de diferentes algoritmos demostró ser el más preciso.
El aprendizaje automático es cuando un algoritmo utiliza grandes conjuntos de datos para entrenarse a sí mismo para clasificar los datos correctamente. En este ejemplo, toma variables como la hora del día, el lugar, la densidad de población y mucho más, y aprende de ellas si clasifica una determinada parcela de tierra en riesgo o no en riesgo de robo en un momento dado.
El desafío consistía en entrenar los algoritmos de clasificación a pesar del pequeño número de robos en el conjunto de datos. Kadar preprocesó el conjunto de datos mediante la eliminación aleatoria de unidades de datos sin robos hasta que llegó al mismo número de unidades con robos que las unidades sin. Este método estadístico se llama «submuestreo aleatorio». Kadar entrenó numerosos algoritmos de clasificación con este conjunto reducido de datos en paralelo, y sus pronósticos agregados produjeron el pronóstico de robo. Kadar tomó celdas de cuadrícula de 200 por 200 metros en un día determinado como sus unidades de datos individuales.
Si bien los sistemas de advertencia convencionales utilizan principalmente datos de robo, Kadar también alimentó los algoritmos de clasificación con datos de población agregados impersonales, como densidad de población, estructura de edad, tipo de desarrollo del edificio, infraestructura (presencia de escuelas, estaciones de policía, hospitales, carreteras), proximidad a Fronteras nacionales, así como información temporal que incluye el día de la semana, los días festivos, las horas de luz e incluso la fase de la luna.
Tasa de golpes mejor que en las ciudades.
Con el nuevo método, Kadar pudo mejorar significativamente la tasa de aciertos en comparación con los métodos convencionales. Ella ordenó a la computadora que usara su método para predecir los puntos críticos donde la accon de los ladrones podría ocurrir dentro del cantón. Una revisión mostró que alrededor del 60 por ciento de los robos reales se cometieron en los hotspots previstos. En comparación, cuando se predijeron los hotspots usando el método tradicional empleado por la policía, solo el 53 por ciento de los robos reales ocurrieron en el área predicha. «Con los datos desequilibrados, el método logra al menos lo mismo bien y, en algunos casos, mejores tasas de aciertos que los métodos convencionales en áreas urbanas, donde los datos son más densos y están distribuidos de manera más equitativa», dice Kadar.
Los hallazgos son útiles ante todo para la policía, ya que el método también se puede usar para predecir regiones y tiempos con un mayor riesgo de robo en áreas menos densamente pobladas. Sin embargo, no hay ninguna razón por la que el método no pueda usarse para predecir otros riesgos: riesgos para la salud, por ejemplo, o la probabilidad de llamadas de emergencia al servicio de ambulancia. La industria de bienes raíces también podría usarla para pronosticar el desarrollo de los precios de las propiedades sobre la base de factores espaciales.
Referencia
Kadar C, Maculan R, Feuerriegel S: Apoyo a la decisión pública para áreas de baja densidad de población: un conjunto de hipersensibilidad para el desequilibrio para la predicción del crimen espacio temporal. Decision Support Systems, 2019, doi: 10.1016 / j.dss.2019.03.001
Dejar una contestacion