FOI ASSIM EM
1998/99 ... ...
O trabalho de
mini projecto consiste no desenvolvimento de
uma aplicação de ECBD baseada em data
sets fornecidos aos alunos ou noutros data
sets propostos por estes.
Este trabalho
compreende também um estudo de síntese
sobre algoritmos de aprendizagem aplicados em
ECBD e análise comparativa dos mesmos.
Nestes
trabalhos, de natureza individual, o aluno
deve procurar demonstrar uma adequada
integração dos conceitos apresentados nas
aulas e uma visão estruturada do processo de
ECBD. É fortemente valorizado o poder de
síntese.
A avaliação
do mini projecto é assim baseada nos
seguintes elementos:
ESTRUTURA - Descrição
aplicação
(max. 10 pgs A4 a 1 1/2 espaços fonte ARIAL
11pt)
Índice
Introdução
Contexto do trabalho
Descrição sumária do objectivo do
trabalho
Apresentação das secções seguintes
Caracterização do data-set
(nº de atributos, tipo, nº
de classes, prevalências, etc
)
Preparação dos dados
Descrição do objectivo
Transformações nos dados
(normalizações, discretizações,
derivações)
Tratamento de dados em branco e de ruido
Tratamento de dados dependentes do tempo
(quando existam)
Redução dos dados
Redução ao nível de
casos, atributos e valores
Forma de geração do data set de treino
e de teste
Extracção de padrões
Métodos de extracção
utilizados
Modelos produzidos
Combinações de modelos utilizadas
Resultados obtidos sobre o data set de
teste
Controlo de qualidade
(Estudo comparativo dos
modelos obtidos
com e sem redução de dados
e recorrendo aos diferentes métodos de
extracção e à sua
combinação)
Conclusões
Bibliografia
Anexos
Texto
de síntese
sobre algorítmos de aprendizagem
(texto individual, manuscrito, a
1 1/2 espaços e num máximo de 6 pags).
Algoritmos a descrever:
- ID3, C4.5 e CN2 (um à
escolha).
- Redes neuronais com
retropropagação e redes de Kohonen
(uma à escolha).
- KNN e alg. Genéticos
(um à escolha)
Seguem-se
sugestões de temas de aplicações a
desenvolver bem como data sets
sintetizados para o efeito.
Os
alunos podem ainda sugerir outros temas em
alternativa.
As
aplicações devem ser desenvolvidas por
grupos de 3 alunos.
Os
alunos devem registar o seu trabalho junto do
docente do curso, altura em que lhes são
fornecidas fotocópias com a descrição dos data
sets.
Data
limite para entrega dos trabalhos: 15
de FEVEREIRO de 1999
Os
trabalhos entregues depois desta data têm
uma penalização de 5% para o primeiro dia
útil e de 10% nos dias seguintes.
DATA
SET PARA:
Detecção
de padrões de fraude em dados relativos à
declaração de IRS (ECBD 01)
Ficheiros:
Ficheiro #1
Ficheiro #2
Aplicação
a desenvolver por:
Alexandre
Pires
Patricia Marques
DATA
SET PARA:
Análise
de um data set disponível na web
(ECBD 02)
Ficheiros:
Data Sets
Aplicação
a desenvolver por:
Catarina
Reis
Joana Monteiro
Susana Piedade
DATA
SET PARA:
Estudo
de expansão de uma rede POPs com base em
dados de utilização dos POPs actualmente
disponibillizados por um ISP (ECBD 03)
Ficheiros:
Ficheiro #1
Aplicação
a desenvolver por:
Henrique
Matos
João Silva
Alfredo Almeida
DATA
SET PARA:
Segmentação
de clientes de uma grande superfície com
base em dados de caixa e em cruzamentos com
instrumentos de pagamento automático (ECBD
04)
Ficheiros:
Ficheiro #1
Ficheiro #2
Aplicação
a desenvolver por:
Paulo
Neves
Romeu Costa
DATA
SET PARA:
Geração
de uma mailing list no sector das
confecções a partir de dados de vendas por
correspondência e de cruzamentos de
informação (ECBD 05)
Ficheiros:
Ficheiro #1
Ficheiro #2
Aplicação
a desenvolver por:
Paulo
Paiva
Sergio Sousa
Telmo Menezes
DATA
SET PARA:
Construção
de um sistema de apoio à decisão sobre
atribuição de cartões de crédito com base
em dados bancários (ECBD 06)
Ficheiros:
Ficheiro #1
Aplicação
a desenvolver por:
Ana
Maria Silva
Fernando Bernardino
Luis Machado
DATA
SET PARA:
Construção
de um sistema de alerta de fraudes com
cartões de crédito extraviados baseado em
padrões de ''consumo'' anormal produzidos a
partir de dados sobre a utilização de
cartões de crédito (ECBD 07)
Ficheiros:
Ficheiro #1
Ficheiro #2
Ficheiro #3
Ficheiro #4
Aplicação
a desenvolver por:
Eduardo
Lourenco
Rui Pedro Ferreira
Pedro Andrade
DATA
SET PARA:
Construção
de um sistema de decisão sobre a
distribuição de produtos numa grande
superficie com base nos outputs de caixa
(ECBD 08)
Ficheiros:
Ficheiro #1
Ficheiro #2
Ficheiro #3
Aplicação
a desenvolver por:
Pedro
Abreu
Monica Sobreira
Pedro Mota
DATA
SET PARA:
Desenvolvimento
de uma campanha de marketing de uma empresa
do sector alimentar com base em dados de
vendas relativos a várias empresas do sector
(ECBD 09)
Ficheiros:
Ficheiro #1
Aplicação
a desenvolver por:
Antonio
Silva
Pedro Ladeira
Luis Semedo
DATA
SET PARA:
Construção
de um sistema de apoio à decisão sobre
limiares de crédito com base em dados
bancários (ECBD 10)
Ficheiros:
Ficheiro #1
Aplicação
a desenvolver por:
Ana
Almeida
Ada Afonso
DATA
SET PARA:
Análise
de um data set disponível na web
(ECBD 11)
Ficheiros:
Data Sets
Aplicação
a desenvolver por:
Rui
Monteiro
|