Dissertação de Mestrado
DISERTAÇÃO DO PROGRAMA DE MESTRADO - ANO: 1989 -1992
Ciência de dados
Ciência de Dados é uma linha de pesquisa e aplicação interdisciplinar centrada no estudo e análise de dados de diversos domínios - tais como saúde, educação, esportes, jogos, segurança, cidades, governos, astronomia, biologia, economia, engenharias, química, entre outros - que visa apoiar a tomada de decisão e a eficiência nos processos desses domínios. Nessa linha de pesquisa, são estudados e propostos métodos de análise e visualização de dados, incluindo conceitos e técnicas de diversas áreas do conhecimento, tais como Estatística, Banco de Dados, Mineração de Dados, e Aprendizado de Máquina.
Professores:
- Alexandre Plastino de Carvalho
- Aline Marins Paes Carvalho
- Antonio Augusto de Aragão Rocha
- Celso da Cruz Carneiro Ribeiro
- Daniel Cardoso Moraes de Oliveira
- Eugene Francis Vinod Rebello
- Leonardo Gesta Paulino Murta
- Luis Antonio Brasil Kowada
- Marcos de Oliveira Lage Ferreira
- Marcos Vinícius Naves Bêdo
- Raphael Carlos Santos Machado
- Vanessa Braganholo Murta
Disciplinas:
Obrigatórias da Linha de Pesquisa
- Aprendizado de Máquina
- Bancos de Dados Distribuídos
- Mineração de Dados
Optativas
- Biologia Computacional
- e-Science
- Gerência de Dados Semiestruturados
- Gerência de Grandes Volumes de Dados
- Visualização de Dados
- Web Semântica: Tecnologia e Aplicações
Obrigatórias do Curso Recomendadas
- Estrutura de Dados e Algoritmos
- Tratamento de Incertezas
Tópicos de Pesquisa:
Análise de Dados
Trata-se de um tópico de pesquisa interdisciplinar centrado no estudo e desenvolvimento de técnicas de mineração e visualização de dados, com aplicação em múltiplos domínios, tais como saúde, educação, esportes, jogos, segurança, cidades, governos, astronomia, biologia, economia, engenharias, química, entre outros. A análise e exploração desses dados visam apoiar a tomada de decisão e a eficiência nos processos desses diversos domínios. Alguns temas de pesquisa explorados pelo grupo de professores e seus alunos são: (i) mineração de opinião e análise de sentimento, (ii) mineração de dados incertos, (iii) algoritmos de seleção supervisionada de atributos, (iv) mineração de dados biológicos, e (v) mineração de repositórios de software.
e-Science
Estuda métodos e algoritmos para auxiliar o cientista na condução de suas pesquisas, propondo soluções para todo o ciclo de vida do experimento científico: concepção, execução e análise. Em todas as etapas, preocupa-se com a gerência dos dados de proveniência do experimento. Especificamente em relação a proveniência, há uma preocupação em capturar os dados de entrada e intermediários, assim como as ações feitas pelos cientistas que levaram aos resultados do experimento. Com isso, é possível apoiar a reprodução, auditoria e depuração dos experimentos.
Ciência de Dados em Segurança Cibernética
Pesquisa o uso de métodos orientados a dados (data-driven) no contexto da Segurança Cibernética. Isso inclui, por um lado, compreender como a Ciência de Dados pode ser utilizada durante um ataque cibernético e, por outro lado, desenvolver métodos orientados a dados para realizar a detecção de ataques cibernéticos. Apresentamos, a seguir, alguns dos temas pesquisados nesta linha: (i) ataques furtivos a sistemas de controle em rede; (ii) identificação de bots em redes sociais; (iv) detecção de ataques DDoS a partir de dados de SIEM; (iii) classificação de malware via aprendizado de máquina.