ANÁLISE INTELIGENTE DE DADOS

1999/2000

Mini Projectos

Página Principal

Apoio On-Line às Disciplinas da Licenciatura

Departamento de Engenharia Informática

 


FOI ASSIM EM 1998/99 ... ...

O trabalho de mini projecto consiste no desenvolvimento de uma aplicação de ECBD baseada em data sets fornecidos aos alunos ou noutros data sets propostos por estes.

Este trabalho compreende também um estudo de síntese sobre algoritmos de aprendizagem aplicados em ECBD e análise comparativa dos mesmos.

Nestes trabalhos, de natureza individual, o aluno deve procurar demonstrar uma adequada integração dos conceitos apresentados nas aulas e uma visão estruturada do processo de ECBD. É fortemente valorizado o poder de síntese.

A avaliação do mini projecto é assim baseada nos seguintes elementos:

ESTRUTURA - Descrição aplicação
(max. 10 pgs A4 a 1 1/2 espaços fonte ARIAL 11pt)

Índice

Introdução

Contexto do trabalho
Descrição sumária do objectivo do trabalho
Apresentação das secções seguintes

Caracterização do data-set

(nº de atributos, tipo, nº de classes, prevalências, etc…)

Preparação dos dados

Descrição do objectivo
Transformações nos dados (normalizações, discretizações, derivações)
Tratamento de dados em branco e de ruido
Tratamento de dados dependentes do tempo (quando existam)

Redução dos dados

Redução ao nível de casos, atributos e valores
Forma de geração do data set de treino e de teste

Extracção de padrões

Métodos de extracção utilizados
Modelos produzidos
Combinações de modelos utilizadas
Resultados obtidos sobre o data set de teste

Controlo de qualidade

(Estudo comparativo dos modelos obtidos
com e sem redução de dados
e recorrendo aos diferentes métodos de extracção e à sua
combinação)

Conclusões

Bibliografia

Anexos

Texto de síntese
sobre algorítmos de aprendizagem

(texto individual, manuscrito, a 1 1/2 espaços e num máximo de 6 pags).

Algoritmos a descrever:

  • ID3, C4.5 e CN2 (um à escolha).
  • Redes neuronais com retropropagação e redes de Kohonen (uma à escolha).
  • KNN e alg. Genéticos (um à escolha)

Seguem-se sugestões de temas de aplicações a desenvolver bem como data sets sintetizados para o efeito.

Os alunos podem ainda sugerir outros temas em alternativa.

As aplicações devem ser desenvolvidas por grupos de 3 alunos.

Os alunos devem registar o seu trabalho junto do docente do curso, altura em que lhes são fornecidas fotocópias com a descrição dos data sets.

Data limite para entrega dos trabalhos: 15 de FEVEREIRO de 1999

Os trabalhos entregues depois desta data têm uma penalização de 5% para o primeiro dia útil e de 10% nos dias seguintes.


DATA SET PARA:

Detecção de padrões de fraude em dados relativos à declaração de IRS (ECBD 01)

Ficheiros:

Ficheiro #1
Ficheiro #2

Aplicação a desenvolver por:

Alexandre Pires
Patricia Marques


DATA SET PARA:

Análise de um data set disponível na web (ECBD 02)

Ficheiros:

Data Sets

Aplicação a desenvolver por:

Catarina Reis
Joana Monteiro
Susana Piedade


DATA SET PARA:

Estudo de expansão de uma rede POPs com base em dados de utilização dos POPs actualmente disponibillizados por um ISP (ECBD 03)

Ficheiros:

Ficheiro #1

Aplicação a desenvolver por:

Henrique Matos
João Silva
Alfredo Almeida


DATA SET PARA:

Segmentação de clientes de uma grande superfície com base em dados de caixa e em cruzamentos com instrumentos de pagamento automático (ECBD 04)

Ficheiros:

Ficheiro #1
Ficheiro #2

Aplicação a desenvolver por:

Paulo Neves
Romeu Costa


DATA SET PARA:

Geração de uma mailing list no sector das confecções a partir de dados de vendas por correspondência e de cruzamentos de informação (ECBD 05)

Ficheiros:

Ficheiro #1
Ficheiro #2

Aplicação a desenvolver por:

Paulo Paiva
Sergio Sousa
Telmo Menezes


DATA SET PARA:

Construção de um sistema de apoio à decisão sobre atribuição de cartões de crédito com base em dados bancários (ECBD 06)

Ficheiros:

Ficheiro #1

Aplicação a desenvolver por:

Ana Maria Silva
Fernando Bernardino
Luis Machado


DATA SET PARA:

Construção de um sistema de alerta de fraudes com cartões de crédito extraviados baseado em padrões de ''consumo'' anormal produzidos a partir de dados sobre a utilização de cartões de crédito (ECBD 07)

Ficheiros:

Ficheiro #1
Ficheiro #2
Ficheiro #3
Ficheiro #4

Aplicação a desenvolver por:

Eduardo Lourenco
Rui Pedro Ferreira
Pedro Andrade


DATA SET PARA:

Construção de um sistema de decisão sobre a distribuição de produtos numa grande superficie com base nos outputs de caixa (ECBD 08)

Ficheiros:

Ficheiro #1
Ficheiro #2
Ficheiro #3

Aplicação a desenvolver por:

Pedro Abreu
Monica Sobreira
Pedro Mota


DATA SET PARA:

Desenvolvimento de uma campanha de marketing de uma empresa do sector alimentar com base em dados de vendas relativos a várias empresas do sector (ECBD 09)

Ficheiros:

Ficheiro #1

Aplicação a desenvolver por:

Antonio Silva
Pedro Ladeira
Luis Semedo


DATA SET PARA:

Construção de um sistema de apoio à decisão sobre limiares de crédito com base em dados bancários (ECBD 10)

Ficheiros:

Ficheiro #1

Aplicação a desenvolver por:

Ana Almeida
Ada Afonso


DATA SET PARA:

Análise de um data set disponível na web (ECBD 11)

Ficheiros:

Data Sets

Aplicação a desenvolver por:

Rui Monteiro