Remove variables with near zero variance and/or high correlations Hiermee verwijder je direct de kolommen uit je dataset, zonder ze te bekijken! Handig om wel te kijken en de orinele data te bewaren!
library(caret)
library(corrplot)
# Remove variables with near zero variance and/or high correlations
# NB hiermee verwijder je direct de kolommen uit je dataset, zonder ze te bekijken!
# Handig om wel te kijken en de orinele data te bewaren!
index <- nearZeroVar(my.data)
my.data <- my.data[,-index]
correlations <- cor(my.data)
corrplot(correlations, method = "square", tl.cex = 0.5)
index <- findCorrelation(correlations, cutoff = 0.95)
my.data <- my.data[,-index]