Description: Description: Description: Description: Description: Description: Description: D:\LOBOMOBILE\webpage_isegi\isegi_dm2\texture_top.gif

Acetatos usados nas aulas

Trabalhos, Notas, e Avisos para o ano lectivo 2011/2012

Sites relevantes sobre Data Mining & Modelos Preditivos

Description: Description: Description: Description: Description: Description: Description: D:\LOBOMOBILE\webpage_isegi\isegi_dm2\texture_top.gif

Acetatos das aulas de Data Mining II (Modelos Preditivos)

 

1 – Introdução a Datamining II – Modelos preditivos

2 – Introdução à Aprendizagem Automática

3- Classificadores Bayesianos e baseados em protótipos

4 – Árvores de Decisão

5 – Redes Neuronais (1/2)

6 – Redes Neuronais (2/2)

 

Exemplos de perguntas de exame

 

EXTRA – Weka (por Eibe Frank, equipa de desenvolvimento do weka)

Description: Description: Description: Description: Description: Description: Description: D:\LOBOMOBILE\webpage_isegi\isegi_dm2\texture_top.gif

Trabalhos, Notas e Avisos para 2012/2012

Trabalho: Enunciado, e dados

 

Exercícios: enunciado1

 

Description: Description: Description: Description: Description: Description: Description: D:\LOBOMOBILE\webpage_isegi\isegi_dm2\texture_top.gif

Sites relevantes sobre Data Mining

SOFTWARE

n  WEKA – Software livre para análise de dados. Corre em Java, tem um bom interface com utilizador, e muitos dos algoritmos usados nesta disciplina

n  MATLAB – Linguagem de programação para computação científica, engenharia, e muito mais. É muito versátil, tem um bom sistema de visualização e muitas bibliotecas de programas. Há dois clones livres compatíveis com Matlab: OCTAVE (software GNU)e SciLab (de origem francesa). Há também outro sistema, que embora não seja compatível com Matlab é parecido e muito usado pela comunidade estatística: o R.

·         SOMTOOLBOX (freeware) para MATLAB – Conjunto de rotinas para treinar e visualisar SOM (Self-Organizing Maps), bem como fazer k-médias, projecções de Sammon, e outras técnicas de clustering e projecção de dados.

·         NETLAB (freeware) para MATLAB – Conjunto de rotinas para implementar Redes Neuronais, Estimadores Bayesianos, e outras técnicas para previsão e reconhecimento de padrões.

·         FastICA (freeware) para MATLAB -  Conjunto de rotinas para implementar ICA-Independant Component Analysis

n  SAS Enterprise Miner – Sistema para datamining baseado no sistema para processamento de dados SAS que é um dos líderes de mercado em Business Intelligence.

n  Intelligent MinerSofware gratuito desenvolvido pela IBM.

n  Orange – Software “open source” para datamining visual, com interface gráfico, scpripting, e muitas ferramentas. Escrito pelo Laboratório de Inteligência Artificial da Universidade de Ljubljana (disponível em http://orange.biolab.si/)

n  Muitos outros fabricantes têm módulos para datamining, como a SPSS e a SAP.

DADOS

n  Repositório de dados de Irvine (Machine Learning Repository, University of Califórnia at Irvine) -  Um site com bases de dados usadas como “benchmarks” para problemas de análise de dados, reconhecimento de padrões, e aprendizagem automática.

n  Repositório da Universidade de Edimburgo – Vários datasets para Data Mining, incluindo vários dataset usados no concurso KDD.

n  Repositório de sites da KD Nuggets – Apontadores para vários repositórios de datasts (ver abaixo a descrição da empresa)

n  Dados locais (usados nesta disciplina): Iris (XLS, TXT), Temperaturas (XLS,CSV), Sonar (XLS,TXT)

Outros Sites

n  KBSI Knowlege Bases Systems, Inc - Site com informação sobre produtos e projectos de Business Intelligence e Datamining na área da defesa.

n  KD_Nuggets – Um site da empresa kdnuggets (do Prof. Gregory Piatetsky-Shapiro), com muitos links para fabricantes de software, bases de dados, notícias de conferências, etc.