Views: 134
Um novo método de aprendizado de máquina desenvolvido pelos cientistas da ETH torna possível prever ladrões arrombando mesmo em áreas pouco povoadas.
Cortesia ETH : Ladrões arrombando não acontecem em todos os lugares o tempo todo. Certas comunidades, bairros e ruas, bem como as estações do ano e as horas do dia, têm um risco menor ou maior de ocorrer um assalto. Usando estatísticas de invasão, as técnicas de aprendizado de máquina podem identificar padrões e prever o risco de uma invasão em um local específico. Os programas de computador podem, assim, ajudar a polícia a identificar hotspots de assaltos – locais com alto risco de invasão – em qualquer dia, permitindo que eles implementem patrulhas de acordo.
O desequilíbrio de classes dificulta o aprendizado
Até o momento, esses sistemas de alerta funcionam apenas em áreas densamente povoadas, principalmente nas cidades. Isso porque os programas de computador precisam de dados suficientes para reconhecer padrões, e o crime é menos frequente em áreas pouco povoadas. Isso é chamado de “desequilíbrio de classe” nas estatísticas. Especificamente, isso significa que, para cada seção da estrada que tem ação de ladrões, há várias centenas ou até mesmo milhares que não.
Algoritmos funcionam paralelamente
Cristina Kadar é cientista da computação e estudante de doutorado no Departamento de Administração, Tecnologia e Economia. Ela desenvolveu um método que pode fazer previsões confiáveis, apesar dos dados desequilibrados. Sua pesquisa acaba de ser publicada na revista Decision Support Systems. Ela testou numerosos métodos de aprendizado de máquina com um grande conjunto de dados de ação de ladrões no cantão suíço de Aargau, combinou-os e comparou as taxas de acerto. Um método que usa aprendizado conjunto e combina análises de diferentes algoritmos provou ser o mais preciso.
O aprendizado de máquina é quando um algoritmo usa grandes conjuntos de dados para se treinar para classificar os dados corretamente. Neste exemplo, são necessárias variáveis como hora do dia, local, densidade populacional e muito mais, e aprende-se com elas se é necessário classificar um determinado lote de terra como estando em risco ou não em risco de roubo em qualquer momento.
O desafio estava no treinamento dos algoritmos de classificação, apesar do pequeno número de assaltos no conjunto de dados. O Kadar pré-processou o conjunto de dados removendo aleatoriamente unidades de dados sem assaltos até que ela chegasse ao mesmo número de unidades com assaltos como unidades sem. Este método estatístico é chamado de “subamostragem aleatória”. Kadar treinou numerosos algoritmos de classificação com este conjunto de dados reduzido em paralelo, e suas previsões agregadas produziram a previsão de roubo. Kadar pegou as células da grade de 200 por 200 metros em um determinado dia como suas unidades de dados individuais.
Enquanto sistemas de alerta convencionais utilizam principalmente dados de roubo, Kadar também alimentou os algoritmos de classificação com dados populacionais agregados impessoais, como a densidade populacional, estrutura etária, tipo de construção de desenvolvimento, infra-estrutura (presença de escolas, delegacias, hospitais, estradas), a proximidade de fronteiras nacionais, bem como informações temporais, incluindo dia da semana, feriados, horas de luz do dia e até mesmo a fase da lua.
Taxa de acertos melhor do que nas cidades
Com o novo método, Kadar foi capaz de melhorar significativamente a taxa de acerto em comparação com os métodos convencionais. Ela orientou o computador a usar seu método na previsão de pontos críticos onde os assaltos provavelmente ocorreriam no cantão. Uma análise mostrou que cerca de 60% dos arrombamentos reais foram cometidos nos hotspots previstos. Em comparação, quando os hotspots foram previstos usando o método tradicional empregado pela polícia, apenas 53% dos assaltos reais ocorreram na área prevista. “Com dados desequilibrados, o método alcança taxas pelo menos igualmente boas e, em alguns casos, melhores do que os métodos convencionais em áreas urbanas, onde os dados são mais densos e distribuídos de maneira mais uniforme”, diz Kadar.
Os resultados são úteis em primeiro lugar para a polícia, já que o método também pode ser usado para prever regiões e tempos com um risco maior de assaltos em áreas menos densamente povoadas. No entanto, não há razão para que o método não possa ser usado para prever outros riscos: riscos para a saúde, por exemplo, ou a probabilidade de chamadas de emergência para o serviço de ambulância. O setor imobiliário também poderia usá-lo para prever o desenvolvimento dos preços dos imóveis com base em fatores espaciais.
Referência
Kadar C, Maculan R, Feuerriegel S: Apoio de decisão pública para áreas de baixa densidade populacional: Um hiper-conjunto para a previsão espaço-temporal do crime. Sistemas de Apoio à Decisão, 2019, doi: 10.1016 / j.dss.2019.03.001
Faça um comentário