Произвольный граф вычислений
с возможностью отдельной настройки параметров каждого нода
и общих настроек пайплайна
Все ноды имеют универсальный интерфейс.
Новые нужно зарегистрировать в lib.nodes._node_map
vw
h2o
lightgbm
arima
Ridge / LogisticRegression
RandomForestRegressor / RandomForestClassifier
RidgeCV / LogisticRegressionCV
BayesianRidge / GaussianNB
Ветвление графа пайплайна (кастомно)
Паралеллизм потоков внутри нода (см. https://github.com/nnnet/Parallelize-pandas.DataFrame-Pool)
Стак данных и результатов преобразования моделей внутри пайплайна
lib.features.select_features
lgb & boruta
В файле main.py
закомментированы ниже
if __name__ == '__main__': main()
В последней строке примеры вызова из командной строки для контеста SDSJ2018
Примеры начала pipeline
(посм. граф можно AutoML(args.model_dir, params=params_autoML).pipeline_draw(view=True)
)