Реализация алгоритма спектральных вложений Грассмана-Штифеля

в рамках библиотеки scikit-learn

Вельдяйкин Николай Олегович, Группа 154

The project over 2 year of HSE Faculty of Computer Science 2016-2017

Задача актуальна, так как она дополняет библиотеку достаточно извеcтными инструментом, и в случае публикации даст новые возможности в manifold learning.

Так как нам дана бибилиотека, которая доллжна исползоваться, то инструменты такие, которые подходят для работы с этой бибилиотекой: интерпретатор Python с нужными зависимостями, сама библиотека scikit-learn, как основа и GitHub.

Контрольные точки:

План:

КТ1: Документация по проекту и репозиторий

КТ2: "Out of sample" для алгоритма Spectral Embedding: для "nearest_neighbors" метода поиска affinity matrix

КТ3: "Inverse out of sample" для реализованого алгоритма к КТ2

Выполнено:

Выложена документация к проекту
Разобрана теоритическая основа проекта
Реализован метод получения вложения для новых точек ("Out of sample")
Выстроена логика тестирования моего вклада в эту бибилиотеку
Протестирована реализация "Out of sample"
Реализован метод получения точки в исходной размерности пространства для новых точек вложения ("Inverse out of sample")
Протестирована реализация "Inverse out of sample"

Архитектура:

Исходная точка репозитория - дубликат репозитория scikit-learn.

Были изменены следующие объекты:

Были добавлены следующие объекты:

Инструкция:

Подготовка

Способ 1, как задумывалось, но этот способ не для всех:

Этот способ у меня не заработал на трех из трех операционных системах семейства Ubuntu

Так как я дописываю библиотеку scikit-learn, то наилучшая документация находится в репозитории scikit-learn и на страницах бибилиотеки. У меня хранится копия инструкции по работе с исходным кодом (раздел development).

Способ 2, стабильный, но нестандартный:

Есть следующая инструкция по установке:

Устанавливаем необходимые для сборки компоненты
Переходим к параграфу для сборки из исходного кода
Скачиваем исходный код по предложенной ссылке на pypi
В распакованном коде подменяем файлы с кодом файлами, которые модифицировались, из этого репозитория, на данный момент это: spectral_embedding_.py, ~~mds.py (Для MDS сделаны только сигнатуры,но не алгоритм)~~
Изучите скрипт reinstall.sh в mytests и при необходимости адаптируте под свою систему. Неизвестно, что будет, если к моменту запуска этого скрипта или сборке по инструкции есть установленный иным способом sklearn!
Первый раз можно установить, как строкой "python3 setup.py install", так и запуском скрипта из корневой директории скачанного с pypi sklearn (скрипт запускать с правами администратора). Работа на python2 не гарантируется!
При необходимости переустановки запустите скрипт из корневой директории скачанного с pypi sklearn с правами администратора

Эксплуатация

После выполнения шагов по подготовке в собственном python-коде можно написать "import sklearn", "import sklearn.manifold" или "from sklearn.manifold import SpectralEmbedding" (если нужно использовать написанное мной), чтобы использовать scikit-learn

Тестирование

Работа на python2 и всех системах кроме Ubuntu 14.04.5 Desktop и старше не гарантируется! Для тестирования есть два модуля в папке mytests (генератор выборки dataset_generator.py и файл с тестирующим SpectralEmbedding кодом se_test.py, они могут быть в любом месте, но главное, чтобы в одной директории.

В директории с этими модулями написать "python3 se_test.py аргументы", где первый опциональный аргумент может принимать значение "list" (показывается результат работы всех генераторов) или "show" (показать результат работы n-ого генератора, n - целочисленное неотрицательное значение второго аргумента). "python3 se_test.py" эквивалентно "0". Если первый аргумент "show" и не указан второй аргумент или указан неправильно, то поведение неопределенно. В остальных случаях программа завершится, ничего не сделав.

Генераторы: 0. Базовый, согнутый участок плосоксти

Труба ширины 1 и радиусом 2
Сдвинутое кольцо ширины 1
Спираль ширины 1 из одного витка
Сдвинутая спираль ширины 1 из одного витка
Сдвинутая спираль ширины 2000 из одного витка
Лента Мёбиуса ширины 1 и радиуса 1
Плоскость, согнутая в форме S
Плоскость, согнутая в спираль

Пример: "python3 se_test.py show 7" Сверху слева исходная выборка, сверху второе изображение - это исходная выборка + 1000 новых точки, сверху третье изображение - исходная выборка, снизу слева вложение, полученное имеющимся алгоритмом, снизу в центре вложение новых точек, наложенных на вложение исходных точек, вложение с помощью OoS исходной выборки, наложенное на вложение исходной выборки (для оценки работы алгоритма, получилось хорошо).

Name		Name	Last commit message	Last commit date
Latest commit History 33 Commits
benchmarks		benchmarks
build_tools		build_tools
doc		doc
examples		examples
mytests		mytests
sklearn		sklearn
.coveragerc		.coveragerc
.gitattributes		.gitattributes
.gitignore		.gitignore
.landscape.yml		.landscape.yml
.mailmap		.mailmap
.travis.yml		.travis.yml
AUTHORS.rst		AUTHORS.rst
CONTRIBUTING.md		CONTRIBUTING.md
COPYING		COPYING
ISSUE_TEMPLATE.md		ISSUE_TEMPLATE.md
LICENSE		LICENSE
MANIFEST.in		MANIFEST.in
Makefile		Makefile
PULL_REQUEST_TEMPLATE.md		PULL_REQUEST_TEMPLATE.md
README.md		README.md
README.rst		README.rst
appveyor.yml		appveyor.yml
circle.yml		circle.yml
setup.cfg		setup.cfg
setup.py		setup.py
setup32.cfg		setup32.cfg
site.cfg		site.cfg

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Licenses found

Repository files navigation

Реализация алгоритма спектральных вложений Грассмана-Штифеля

в рамках библиотеки scikit-learn

Вельдяйкин Николай Олегович, Группа 154

Контрольные точки:

План:

Выполнено:

Архитектура:

Инструкция:

Подготовка

Способ 1, как задумывалось, но этот способ не для всех:

Способ 2, стабильный, но нестандартный:

Эксплуатация

Тестирование

About

Licenses found

Releases

Packages

Languages

License

Licenses found

NickVeld/scikit-learn-proj

Folders and files

Latest commit

History

Repository files navigation

Реализация алгоритма спектральных вложений Грассмана-Штифеля

в рамках библиотеки scikit-learn

Вельдяйкин Николай Олегович, Группа 154

Контрольные точки:

План:

Выполнено:

Архитектура:

Инструкция:

Подготовка

Способ 1, как задумывалось, но этот способ не для всех:

Способ 2, стабильный, но нестандартный:

Эксплуатация

Тестирование

About

Resources

License

Licenses found

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages