Regresja Logistyczna Dummy_Variables

September 30, 2019 admin 0

Exercise 25 Istnieją dwa sposoby budowania modelu na zmiennych dyskretnych. PYTANIE: czy model zbudowany na różnych metodach kodowania może mieć różne właściwości predykcyjne? 15 kwietnia […]

Formuła Pandas: groupby part 1

September 27, 2019 admin 0

źródło danych: http://sigmaquality.pl/wp-content/uploads/2019/09/phone_data.csv In [1]: import pandas as pd import dateutil import numpy as np df = pd.read_csv(‘c:/1/phone_data.csv’) df.head(4) Out[1]: index date duration item month network […]

Formuła Pandas: groupby part 2

September 27, 2019 admin 0

In [4]: import pandas as pd import numpy as np df = pd.DataFrame({‘A’ : [‘foo’, ‘foo’, ‘bar’, ‘foo’, ‘bar’, ‘foo’], ‘B’ : [‘one’, ‘two’, ‘three’,’two’, ‘two’, […]

Procedura oversampling dla Random Forest Classifier

September 27, 2019 admin 0

Przy budowie modelów klasyfikacji 0-1 występuje problem  zbilansowanych zbiorów źródło: http://sigmaquality.pl/machine-learning/model-regresji-logistycznej-czesc-2-oversampling/ In [1]: import numpy as np import pandas as pd #import xgboost as xgb import […]