A filtragem automa¡tica de e-mails e a identificaça£o de mensagens de spam éaltamente vantajosa, pois pode reduzir o risco de ataques de phishing e facilitar a navegaa§a£o dos usuários em suas contas.

Crédito: Unsplash (Brett Jordan)
E-mails de spam são mensagens indesejadas que geralmente são enviadas para muitos usuários aleata³rios em massa. Essas mensagens podem conter anaºncios, mas também links de phishing ou malware. A filtragem automa¡tica de e-mails e a identificação de mensagens de spam éaltamente vantajosa, pois pode reduzir o risco de ataques de phishing e facilitar a navegação dos usuários em suas contas.
Nos últimos anos, cientistas da computação desenvolveram modelos computacionais cada vez mais avana§ados para detectar automaticamente emails de spam. Para ter um bom desempenho, no entanto, a maioria desses modelos precisa ser treinada em grandes conjuntos de dados de e-mail, que foram rotulados manualmente por humanos.
Pesquisadores do Sinhgad Institute of Technology Lonavala, na andia, criaram recentemente uma nova técnica para a detecção automa¡tica de e-mails de spam. Essa técnica, apresentada em um artigo publicado no International Journal of Intelligent Robotics and Applications, pode ajudar a melhorar a segurança dos usuários, além de ajuda¡-los a filtrar e-mails irrelevantes ou indesejados.
“Nosso modelo também reduz as velocidades de treinamento e leva a uma maior eficiência de classificaçãoâ€, disse Vikas Samarthrao Kadam, um dos pesquisadores que realizaram o estudo. "Ao contra¡rio de outros modelos, aumenta a taxa de convergaªncia da detecção de e-mails de spam, obtendo melhores resultados."
O modelo desenvolvido por Kadam e seus colegas ébaseado na seleção de recursos multiobjetivos e em uma rede de ca¡psulas adapta¡veis, uma nova e altamente promissora técnica de aprendizado profundo. Em contraste com outros manãtodos desenvolvidos anteriormente, o modelo foi treinado em conjuntos de dados de imagem e texto.
"Nosso modelo introduz um novo algoritmo heurastico habrido e alcana§a a seleção ideal de recursos, com função multiobjetivo", explicou Kadam. "Nosso trabalho confirma a promessa de novos e aprimorados modelos de detecção baseados em algoritmos de aprendizado profundo. A detecção automa¡tica de e-mails de spam énecessa¡ria devido a sua simplicidade."
O modelo desenvolvido pelos pesquisadores éde fa¡cil implementação e pode ser treinado rapidamente, em curtos períodos de tempo. Nas avaliações iniciais, Kadam e seus colegas descobriram que ele pode detectar e-mails de spam com maior precisão do que outros manãtodos existentes.
“A detecção de spam éessencial, pois pode garantir justia§a para os vendedores e manter a confianção do comprador nas lojas onlineâ€, disse Kadam. "Ao contra¡rio de outros manãtodos, melhora a velocidade do treinamento e a eficiência da classificação. Nosso modelo pode melhorar com a qualidade de vida das pessoas que recebem grandes quantidades de e-mails, permitindo que naveguem pelos e-mails sem problemas e usem suas contas apenas para seus finalidade desejada."
No futuro, a técnica de filtragem de spam criada por Kadam e seus colegas podera¡ ser implementada em larga escala, melhorando a segurança e a eficiência dos servia§os de e-mail. Notavelmente, o modelo pode ser aplicado a uma ampla gama de servia§os existentes, incluindo Gmail, Yahoo mail e Outlook.
“Quase todos os pesquisadores apresentam seus resultados com base na exatida£o, precisão e recuperação de seus modelos, mas sentimos que a complexidade do tempo dos modelos de aprendizado de ma¡quina também deve ser considerada como uma manãtrica de avaliaçãoâ€, disse Kadam. "Alguns pesquisadores mostram resultados promissores no processo de extração de recursos usando um pacote de palavras, pois afirmam que o cabea§alho do email étão importante para a detecção de spam quanto o conteaºdo do corpo. Portanto, a extração profunda de recursos da linha do cabea§alho também pode ser considerado no futuro."
Atéagora, a nova técnica de filtragem de spam desenvolvida por essa equipe de pesquisa alcana§ou resultados muito promissores, pois pode detectar com eficiência e-mails de spam com alta precisão. No entanto, Kadam e seus colegas sentem que sua velocidade e precisão podem ser melhoradas ainda mais no futuro.
"A segurança dos sistemas de detecção e filtragem de spam écrucial para obter melhor precisão e resultados confia¡veis, que podem ser aprimorados no futuro usando o aprendizado conjunto", acrescentou Kadam. "A taxa de falsos positivos de muitos modelos ainda émaior do que o necessa¡rio, mas deve ser reduzida ao menor valor possível no futuro. A classificação de spam em tempo real émuito necessa¡ria, pois a maioria dos modelos propostos não funciona bem com dados."