Ensemble Feature Selector

Overview

This project aims to identify redundant variables in order to improve Feature Selection. Relevant variables identification is performed via an Ensemble method based on resampling without replacement. In order to detect redundant variables I perform maximum-relevance minimum-redundancy (MRMR) approaches, plus a novel algorithm which individually swaps each feature set item by an ensemble top-picked variable (rivalry detection).

Data

The SNP dataset has been collected on diabetes disease (∼1:64 samples to variables relation). From a machine learning point of view, the method largely reduces the curse of dimensionality. From a medical point of view, the outcome should help to focus only on genetic variables related with the disease, making laboratory validation more affordable. insight.

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
Minor Thesis		Minor Thesis
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Ensemble Feature Selector

Overview

Data

About

Releases

Packages

Languages

RaulCoroban/EnsembleFeatureSelector_MinorThesis

Folders and files

Latest commit

History

Repository files navigation

Ensemble Feature Selector

Overview

Data

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages