Doutorando já conquistou dois prêmios com trabalho que combina técnicas de processamento de sinais e aprendizado de máquina para construir modelos úteis em áreas tão diversas quanto a saúde pública, o reconhecimento de fala e o processamento de música
Quem nunca foi perturbado, no meio de uma noite de sono, pelo zumbido irritante e característico de um inseto? Esse som da batida das asas é a chave para que os pesquisadores possam identificar um inseto. Ensinar o computador a reconhecer esse som e a classificar automaticamente as espécies foi o desafio que mobilizou Diego Silva durante seu mestrado no Instituto de Ciências Matemáticas e de Computação (ICMC) da USP, em São Carlos.
O método criado por Silva já está sendo aplicado em um sensor e uma armadilha que poderão contribuir para combater a dengue, a malária e diversas pragas agrícolas em um projeto coordenado pelo professor Gustavo Batista, do ICMC, que foi orientador de Silva durante o mestrado. A novidade é que, além dessa aplicação, há diversas outros campos em que os métodos estudados podem ser empregados como no reconhecimento de fala, no processamento de música ou na obtenção de informações em dados numéricos que variam com o tempo, conhecidas como séries temporais.
Um bom exemplo disso são os trabalhos gerados em um estágio sanduíche no exterior realizado por Diego na Columbia University, sob a supervisão do pesquisador Daniel Ellis, entre fevereiro e julho de 2013, quando recebeu uma Bolsa Estágio de Pesquisa no Exterior da FAPESP. Em um desses trabalhos, os pesquisadores propuseram uma técnica para encontrar músicas semelhantes a uma canção consultada, obtendo resultados melhores que o estado-da-arte. Com uma técnica semelhante, puderam classificar séries temporais geradas a partir de batimentos cardíacos, movimento humano, formas de objetos, entre outros.
Para alcançar seu objetivo, Diego estudou uma série de técnicas para extrair características do som. Dessa forma, ele conseguiu obter uma ferramenta capaz de selecionar as informações relevantes, excluindo ruídos e transformando o que eram apenas sinais sonoros em uma série de características descritivas do sinal. A ferramenta reconhece os atributos específicos de cada uma das espécies de inseto e as identifica. É como se atribuíssemos, por exemplo, o número 1 ao batimento das asas da abelha e o número 2 ao batimento das asas do Aedes aegypti. Esses números são o ingrediente-chave para ensinar o computador a identificar cada espécie.
O modelo criado também é capaz de reconhecer os diferentes sexos dos mosquitos. Isso é muito relevante, pois no caso de doenças como a dengue, apenas as fêmeas são vetores da doença. “Nosso sistema de classificação conseguiu obter uma acurácia de 96,1% na correta identificação das espécies e sexo desses insetos”, explica Batista.
Silva conta que, no início do projeto, não sabia qual técnica funcionaria melhor para a classificação automática dos insetos, por isso, precisou explorar diversos métodos e algoritmos de outras áreas para ver qual alcançava os resultados mais satisfatórios. “Chegamos à conclusão de que os atributos utilizados em reconhecimento de fala eram os que funcionavam melhor”, diz Silva. Esses atributos são os mesmos empregados por sites como o Google, por exemplo, para reconhecer o que diz um internauta.
Reconhecimento – A dissertação de mestrado de Silva (Classificação de séries temporais por similaridade e extração de atributos com aplicação na identificação automática de insetos) conquistou a segunda colocação no 28º Concurso de Teses e Dissertações do 35º Congresso da Sociedade Brasileira de Computação, realizado em Recife entre os dias 20 e 23 de julho. Além disso, obteve também o terceiro lugar no Concurso de Teses e Dissertações em Inteligência Artificial e Computacional (CTDIAC) do Encontro Nacional de Inteligência Artificial e Computacional (ENIAC) e do Brazilian Conference on Intelligent Systems (BRACIS), realizados em outubro do ano passado em São Carlos.
“O trabalho de Silva resultou em mais de 10 artigos científicos em diferentes áreas, o que é um índice bastante relevante para um mestrado”, ressalta Gustavo. No momento, Silva prossegue com suas investigações no campo da inteligência artificial e do aprendizado de máquina em seu doutorado no ICMC, também com bolsa da FAPESP.
Texto: Denise Casatti – Assessoria de Comunicação do ICMC/USP