Описание
[Яндекс Практикум] Как стать аналитиком данных. Часть 1,2,3,4,5,6 (2021)
Все 6 из 6-ти частей курса «Как стать аналитиком данных«.
Аналитик данных извлекает из данных смысл: структурирует их, формулирует и проверяет гипотезы, находит закономерности и делает выводы. Его работа помогает принимать решения в бизнесе, управлении и науке. На курсе мы хотим научить вас пользоваться основными инструментами для получения профессии: Python и его библиотеки, Jupyter Notebook, SQL.
71,1% выпускников трудоустраиваются
Мы делаем всё, чтобы студенты нашли новую работу после обучения: выдаём официальный диплом, учим собирать портфолио проектов, помогаем с поиском работы.
71,1% выпускников находят работу, большинство из них — за 4 месяца после выпуска. Институт образования НИУ ВШЭ подтвердил данные через исследование трудоустройства выпускников.
Часть 1
Часть 2
Исследовательский анализ данных
- Первые графики и выводы
- Введение
- Знакомство с задачей
- Сводные таблицы для расчета среднего
- Применяем сводные таблтицы
- Есть ли проблемы в данных?
- Базовая проверка данных
- Гистограмма
- Гистограмма для двух кубиков
- Распределения
- Диаграмма размаха
- Диаграмма размаха в Python
- Описание данных
- Заключение
- Изучение срезов данных
- Введение
- Срезы данных методом query()
- Возможности query()
- Срезы в действии
- “Слишком долгая” заправка — это сколько?
- Работа с датой и временем
- Графики
- Группировка с pivot_table()
- Помечаем срез данных
- Сохраняем результаты
- Заключение
- Работа с несколькими источниками данных
- Введение
- Срез по данным из внешнего словаря
- Срез по данным из внешнего словаря (продолжение)
- Добавляем столбец
- Добавляем столбец(продолжение)
- Объединяем данные из двух таблиц
- Переименование столбцов
- Объединение столбцов методом merge() и join()
- Заключение.
- Взаимосвязь данных
- Введение
- Диаграмма рассеяния
- Корреляция
- Матрица диаграмм рассеяния
- Как выжать максимум из очевидности
- Заключение
- Валидация результатов
- Введение
- Укрупняем группы
- Разбитые по группам данные
- Заключение
Проектная работа (Проект)
Часть 3
Статический анализ данных
- Описательная статистика
- Введение
- Непрерывные и дискретные переменные
- Гистограммы частот
- Гистограммы часто для непрерывной переменной
- Гистограммы плотностей
- Характеристика положений
- Кто разбросал данные?
- Дисперсия
- Стандартное отклонение
- Скошенность наборов данных
- Заключение
- Теория вероятностей
- Введение
- Эксперименты, элементарные исходы, события
- Закон больших чисел
- Взаимоисключающие и независимые события, умножение вероятностей
- Случайные величины, распределение вероятностей и интервалы значений
- Математическое ожидание и дисперсия
- Вероятность успеха в биномиальном эксперименте
- Биномиальное распределение
- Нормальное распределение
- Нормальная аппроксимация биномиального распределения
- Заключение
- Проверка гипотез
- Введение
- Случайная выбора и выборочное среднее
- Формулирование двусторонних гипотез
- Формулирование односторонних гипотез
- Гипотеза о равенстве средних двух генеральных совокупностей
- Гипотезы о равенстве средних для зависимых (парных) выборок
- Заключение
- Проектная работа (Проект)
- Заключение
- Сборный проект
- Итоги первого модуля
- Работа с документацией
- Проектная работа (Проект)
- Заключение.
Часть 4
Сбор и хранение данных
- Извлечение данных из веб-ресурсов
- Введение
- Что такое Web Mining
- Что аналитик должен знать об интернете? Браузер. HTML. HTTP.
- Что такое транспортный протокол
- Введение в HTML
- Инструменты разработчика
- Ваш первый get-запрос
- Регулярные выражения
- Парсинг HTML
- API
- JSON
- Заключение
- SQL как инструмент работы с данными.
- Введение
- Базы данных и таблицы
- Таблицы
- Ваш первый SQL-запрос
- Срезы данных в SQL
- Агрегирующие функции
- Изменение типов
- Заключение
- Расширенные возможности для аналитика в SQL
- Введение
- Группируем данные
- Сортируем данные
- Обработка данных в группировке
- Операторы и функции для работы с датами
- Подзапросы
- Заключение
- Отношение между таблицами
- Введение
- Типы связей в таблицах
- ER-диаграммы
- Приятно познакомится, таблицы!
- Типовые роли пользователей без данных
- Поиск пропусков в данных
- Поиск данных в таблице
- JOIN. INNER JOIN
- Внешнее объединение таблиц. LEFT JOIN
- Внешнее объединения таблиц. RIGHT JOIN
- Объединение нескольких таблиц
- Агрегация в запросах JOIN
- Объединения запросов
- Заключение
- Контекст и проработка запроса
- Введение
- Контекст задачи
- Проработка запроса
- Доработка результата
- Заключение
- Проект
- Итоги курса
- Описание проекта
- Парсинг данных
- Работа с базой данных
- Работа с данными в Python.
- Заключение
- Анализ бизнес-показателей
- Метрики и воронки
- Введение
- Доходы, прибыль и возврат на инвестиции
- Конверсии
- Воронки
- Маркетинговая воронка: показы, клики, СTR и CR
- Маркетинговая воронка: группировка по неделям и месяцам.
- Простая продуктовая воронка
- Продуктовая воронка с учетом последовательности событий.
- Заключение
- Когортный анализ
- Введение
- Когортный анализ
- Когортный анализ в Python
- Оценка изменений абсолютных показателей по месяцам
- Оценка изменения относительных показателей по времени жизни
- Визуализация когортного анализа
- Retention Rate и Churn Rate
- Расчет Retention Rate в Python
- Расчет Churn Rate в Python
- Поведенческие когорты
- Заключение
- Юнит-экономика
- Введение
- Экономика одной продажи
- Экономика одной продажи: строим модель
- Экономика одного покупателя: LTV и CAC
- Считаем экономику одного покупателя в интернет-магазине
- Заключение.
- Пользовательские метрики
- Введение
- Оценка пользовательской актиновсти
- Пользовательская сессия
- Фреймворки метрик
- Расследование аномалий
- Яндекс.Метрика
- API Яндекс.Метрики
- Работа с сырыми данными
- Заключение
- Проектная работа(проект)
- Заключение
- Метрики и воронки
Часть 5
Принятие решений в бизнесе на основе данных
- Основы проверки гипотез в бизнесе
- Введение
- Что нужно бизнесу
- Опережающие метрики. Декомпозиция
- Определение важных метрик
- База экспериментов
- Оставить нельзя экспериментировать
- Как генерировать идеи
- Формулируем гипотезу правильно
- Заключение
- Выбор метода проведения эксперимента
- Введение
- Методы проведения эксперимента
- Качественные методы проверки гипотезы
- Количественные методы проверки гипотезы. A/B-тест
- Преимущества и недостатки A/B-теста
- Пример результатов A/B-теста
- Заключение
- Приоритизация гипотез
- Введение
- Зачем и как приоритизировать гипотезы
- Параметр Reach
- Параметр Impact
- Параметр Confidence
- Параметр Efforts
- Заключение
- Подготовка к проведениею A/B-теста
- Введение
- A/A-тест
- Ошибки I и II рода при проверке гипотез. Мощность и значимость
- Множественные сравнения: A/B и A/B/n-тесты
- Расчет размера выборки и длительности теста
- Графический анализ метрик и определение предметной области
- Заключение
- Анализ результатов A/B-теста
- Введение
- Проверка гипотезы о равенстве долей
- Проверка данных на нормальность. Критерий Шапиро-Уилка
- Непараметрический тест Уилкоксона-Манна-Уитни
- Стабильность кумулятивных метрик
- Анализ выбросов и всплесков: крайние значения данных
- Анализ A/B-теста шаг за шагом
- Долгожданные выводы из A/B-теста
- Основные ошибки при анализе A/B-тестов
- Заключение
- Поведенческие алгоритмы
- Факты, эмоции и оценка
- Умение внятно объяснить свою позицию
- Проектная работа(проект)
- Как рассказать историю с помощью данных
- Подготовка презентации
- Введение
- Как рассказать о своем исследовании
- Кому рассказывать истории
- Сезонность и внешние факторы
- Покупаем авиабилеты
- Абсолютные и относительные величины
- Парадокс Симпсона
- Когда график — ваш враг
- Виды графиков для различной информации
- Основные принципы построения презентации
- Отчет в Jupyter Notebook
- Заключение
- Библиотека Seaborn
- Введение
- Почему не хватате matplotlib?
- Метод jointplot()
- Цветовая гамма
- Стили графиков
- Категориальные данные
- Визуализация распределения
- Нестандартные графики в seaborn
- Заключение
- Библиотека plotly
- Введение
- Интерактивные графики
- Установка Python и Jupyter Notebook
- Базовые графики plotly.
- Круговая диаграмма
- График воронки
- Заключение
- Проектная работа (проект).
- Подготовка презентации
- Cборный проект — 2
- Событийная аналитика
§ Введение
§ Что такое событийная аналитика
§ Принципы отслеживания событий
§ Приемы событийно аналитики
§ Aha-момент
§ Заключение
o Проектная работа (Проект)
o Заключение
Часть 6
Автоматизация
- Основы запуска скриптов
- Введение
- Основы работы с командной строкой
- Доступ к командной строке на вашей локальной машине
- Основные команды для работы с консолью
- Настройка учетной записи в Яндекс.Облако
- Установка Python на локальной машине
- Запуск скрипта из командной строки
- Запуск скрипта из командной строки в Яндекс.Облаке
- Запуск скрипта по расписанию
- Памятка по отладке cron.
- Заключение
- Что такое дата-пайплайны и зачем они нужны
- Введение
- Дата-пайплайны для автоматизации дащбордов
- Агрегация данных и создание таблиц в БД
- Вертикальные и горизонтальные таблицы
- Создание скрипта пайплайна
- Заключение
- Проектирование и разработка дашбордов в dash.
- Введение
- Дашборды
- Сбор требований при создании дашборда
- Как создавать основные типы график в dash
- Основы работы с элементами управления
- Базовые элементы управления в dash
- Элементы управления и интерактивность
- Элементы дашборда
- Разработка дашборда, основы композиции
- Запуск дашборда на локальной машине
- Запуск дашборда на виртуальной машине
- Заключение
- Tableau
- Введение
- Начало работы с Tableau Public
- Как работать с Tableau
- Подготовка данных
- Таблицы и простые вычисления
- Фильтры
- Публикация дашборда.
- Простые графики
- Линейные графики и области с накомлением
- Специальный типы графиков
- Сборка дашборда
- Заключение
- Проектная работа
- Часть 1. Составления технического задания
- Часть 2. Создание дашборда
- Прогнозы и предсказания
- Введение
- Задачи машинного обучения в бизнесе
- Введение
- Что такое обучение?
- Введение в прогнозирование и машинное обучение
- Обучение с учителем
- Обучение без учителя
- Обучение модели в Python. Библиотека sklearn.
- Тестовая, валидационная и обучающая выборки
- Нелообучение и переобучение
- Разделяй и валидируй
- Пайпланй машинного обучения
- Почему машинное обучение — не панацея?
- Заключение
- Алгоритм машинного обучения
- Введение
- Линейная регрессия и функция ошибки
- Градиентный спуск
- Предобработка. Масштабирование признаков
- Регуляризация
- Реализация линейный моделей
- Метрики регресии
- Логистическая регрессия
- Метрики классификации. Работа с метками.
- Метрики классификации. Смотрим на вероятности.
- Порог и баланс классов
- Дерево принятия решений
- Ансамбль деревьев: случайный лест и градиентный бустинг.
- Алгоритмы обучения без учителя: кластеризация
- При чем здесь расстояние?
- K-Means и агломеративная иерархическая кластеризация
- Метрики для задачи обучения без учителя
- Заключение
- Процесс решения задач машинного обучения
- Введение
- Постановка задачи
- EDA. Анализ качества признаков
- EDA. Формулировка гипотез
- Предварительная обработка данных
- Random и time split.
- Выбор метрик
- Выбор модели машинного обучения
- Обучаем модели и выбираем лучшую
- Важность признаков
- Заключение.
- Проектная работа(Проект)
- Заключение.
Автор курса: Яндекс Практикум
Сайт продажника: https://practicum.yandex.ru/data-analyst/
У нас Вы можете приобрести всего за 390 руб.
Отзывы
Отзывов пока нет.