THE DATA SCIENCE LIBRARY

Feature Selection Techniques – Embedded Method (Lasso)

30/03/2020 admin 0

300320202027 Embedded methods are iterative in a sense that takes care of each iteration of the model training process and carefully extract those features which […]

Feature Selection Techniques – Recursive Feature Elimination (RFE)

30/03/2020 admin 0

300320201719 It is a greedy optimization algorithm which aims to find the best performing feature subset. It repeatedly creates models and keeps aside the best […]

Feature Selection Techniques – Backward Elimination

30/03/2020 admin 0

300320201313 In backward elimination, we start with all the features and removes the least significant feature at each iteration which improves the performance of the […]

Feature Selection Techniques [numerical result] – Step Forward Selection

30/03/2020 admin 0

300320201248 Forward selection is an iterative method in which we start with no function in the model. In each iteration, we add a function that […]

Feature Selection Techniques – Variance Inflation Factor (VIF)

29/03/2020 admin 0

290320202006 Collinearity is the state where two variables are highly correlated and contain similar information about the variance within a given dataset. The Variance Inflation […]

Feature Selection Techniques – Pearson correlation

29/03/2020 admin 0

290320201454 In [1]: import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt from sklearn.preprocessing import LabelEncoder, OneHotEncoder import warnings […]

Feature Selection Techniques (by filter methods): numerical_ input, categorical output

28/03/2020 admin 0

280320200940 Source of data: https://archive.ics.uci.edu/ml/datasets/Air+Quality In this case, statistical methods are used: We always have continuous and discrete variables in the data set. This procedure […]

Perfect Plot: Classification charts

28/03/2020 admin 0

Feel free to read the code on GitHub data source: https://archive.ics.uci.edu/ml/datasets/Air+Quality In [1]: import numpy as np import pandas as pd import seaborn as sns import […]

Feature Selection Techniques (by filter methods): categorical input, categorical output

26/03/2020 admin 0

categorical input – categorical output 260320201223 In this case, statistical methods are used: We always have continuous and discrete variables in the data set. This […]

Perfect model: Random forest classifier (1)

23/03/2020 admin 0

part 1: Determining the depth of trees by visualization using visualization¶ 230320201052 In [1]: import numpy as np import matplotlib.pyplot as plt import seaborn as […]

How to use PCA in logistic regression?

23/03/2020 admin 0

230320200907 Principal component analysis (PCA) https://jakevdp.github.io/PythonDataScienceHandbook/05.08-random-forests.html https://www.geeksforgeeks.org/principal-component-analysis-with-python/ In [1]: import pandas as pd import numpy as np import seaborn as sns import matplotlib.pyplot as plt df= […]

THE DATA SCIENCE LIBRARY

Wojciech Moszczyński

Feature Selection Techniques – Embedded Method (Lasso)

Feature Selection Techniques – Recursive Feature Elimination (RFE)

Feature Selection Techniques – Backward Elimination

Feature Selection Techniques [numerical result] – Step Forward Selection

Feature Selection Techniques – Variance Inflation Factor (VIF)

Feature Selection Techniques – Pearson correlation

Feature Selection Techniques (by filter methods): numerical_ input, categorical output

Perfect Plot: Classification charts

Feature Selection Techniques (by filter methods): categorical input, categorical output

Perfect model: Random forest classifier (1)

How to use PCA in logistic regression?

Part. 2 How to improve the classification model? Principal component analysis (PCA)

Feature Selection Techniques – Random Forest Classifier

Testy Kruskal -Wallis

Part_7 Stroke_Prediction – Model Sieci neuronowych PyTorch Technika Osadzania