Описание глав
Глава 1 Подготовка данных
Общее описание Data Science. Показаны наиболее распространные элементы подготовки данных.
Глава 2. Статистическое исследование
Общее описание статистических тестов, а также показаны примеры применения некоторых популярных тестов. Показано применение базовой обработки языковых данных.
Глава 3. Линейная регрессия
Общее описание линейной регрессии. Регрессия показана через применение визуального, статистического подходов, а также машинное обучение. Приведены способы обработки выбросов.
Глава 4. Логистическая регрессия
Общее описание логистической регрессии, а также применение решающих деревьев, случайного леса.
Глава 5. Кластеризация
Описание методов кластеризации, k-ближайших соседей.
Глава 6. Нейронные сети
Приведены примеры из официального учебника tensorflow. Показано применение нейронных сетей на данных Goodreads.
Глава 7. Полезный код
Приводится код, который либо часто требуется, либо не нашел места в других главах, но является полезным.
Описание наборов данных
books.csv исходный набор данных
gd_clean_data обработанные данные по итогам главы 2
gd_augmentation обогащенные данные по итогам главы 3
Текущая версия
0.0.0a2
Изменения в предыдущих версиях
0.0.0a2 редакторские правки