Regresja Logistyczna Dummy_Variables

September 30, 2019 admin 0

Exercise 25 Istnieją dwa sposoby budowania modelu na zmiennych dyskretnych. PYTANIE: czy model zbudowany na różnych metodach kodowania może mieć różne właściwości predykcyjne? 15 kwietnia […]

Formuła Pandas: groupby part 2

September 27, 2019 admin 0

In [4]: import pandas as pd import numpy as np df = pd.DataFrame({‘A’ : [‘foo’, ‘foo’, ‘bar’, ‘foo’, ‘bar’, ‘foo’], ‘B’ : [‘one’, ‘two’, ‘three’,’two’, ‘two’, […]

Formuła Pandas: groupby part 1

September 27, 2019 admin 0

źródło danych: http://sigmaquality.pl/wp-content/uploads/2019/09/phone_data.csv In [1]: import pandas as pd import dateutil import numpy as np df = pd.read_csv(‘c:/1/phone_data.csv’) df.head(4) Out[1]: index date duration item month network […]

Wykresy typu sns.relplot

September 27, 2019 admin 0

In [3]: import pandas as pd import seaborn as sns df2 = pd.read_csv(‘c:/8/dots2.txt’) df2.sample(8) Out[3]: align choice time coherence firing_rate 367 dots T2 540 3.2 37.178237 […]

Krzywa oceny hiperparametrów _validation curve

September 27, 2019 admin 0

Przy budowie modelów ML występuje problrm dobrania najlepszych parametrów. Poniżej dowiemy się jak dobierać optymalne hiperparametry dla modelu. źródło: https://towardsdatascience.com/optimizing-hyperparameters-in-random-forest-classification-ec7741f9d3f6 https://chrisalbon.com/machine_learning/model_evaluation/plot_the_validation_curve/ In [1]: import numpy as […]

Procedura oversampling dla Random Forest Classifier

September 27, 2019 admin 0

Przy budowie modelów klasyfikacji 0-1 występuje problem  zbilansowanych zbiorów źródło: http://sigmaquality.pl/machine-learning/model-regresji-logistycznej-czesc-2-oversampling/ In [1]: import numpy as np import pandas as pd #import xgboost as xgb import […]