[Яндекс Практикум] Как стать аналитиком данных. Часть 1,2,3,4,5,6 (2021)

390 

Описание

[Яндекс Практикум] Как стать аналитиком данных. Часть 1,2,3,4,5,6 (2021)

[Яндекс Практикум] Как стать аналитиком данных. Часть 1,2,3,4,5,6 (2021)

Все 6 из 6-ти частей курса «Как стать аналитиком данных«.

Аналитик данных извлекает из данных смысл: структурирует их, формулирует и проверяет гипотезы, находит закономерности и делает выводы. Его работа помогает принимать решения в бизнесе, управлении и науке. На курсе мы хотим научить вас пользоваться основными инструментами для получения профессии: Python и его библиотеки, Jupyter Notebook, SQL.

71,1% выпускников трудоустраиваются
Мы делаем всё, чтобы студенты нашли новую работу после обучения: выдаём официальный диплом, учим собирать портфолио проектов, помогаем с поиском работы.

71,1% выпускников находят работу, большинство из них — за 4 месяца после выпуска. Институт образования НИУ ВШЭ подтвердил данные через исследование трудоустройства выпускников.

Часть 1

Часть 2

Исследовательский анализ данных

  • Первые графики и выводы
    • Введение
    • Знакомство с задачей
    • Сводные таблицы для расчета среднего
    • Применяем сводные таблтицы
    • Есть ли проблемы в данных?
    • Базовая проверка данных
    • Гистограмма
    • Гистограмма для двух кубиков
    • Распределения
    • Диаграмма размаха
    • Диаграмма размаха в Python
    • Описание данных
    • Заключение
  • Изучение срезов данных
    • Введение
    • Срезы данных методом query()
    • Возможности query()
    • Срезы в действии
    • “Слишком долгая” заправка — это сколько?
    • Работа с датой и временем
    • Графики
    • Группировка с pivot_table()
    • Помечаем срез данных
    • Сохраняем результаты
    • Заключение
  • Работа с несколькими источниками данных
    • Введение
    • Срез по данным из внешнего словаря
    • Срез по данным из внешнего словаря (продолжение)
    • Добавляем столбец
    • Добавляем столбец(продолжение)
    • Объединяем данные из двух таблиц
    • Переименование столбцов
    • Объединение столбцов методом merge() и join()
    • Заключение.
  • Взаимосвязь данных
    • Введение
    • Диаграмма рассеяния
    • Корреляция
    • Матрица диаграмм рассеяния
    • Как выжать максимум из очевидности
    • Заключение
  • Валидация результатов
    • Введение
    • Укрупняем группы
    • Разбитые по группам данные
    • Заключение
      Проектная работа (Проект)

Часть 3

Статический анализ данных

  • Описательная статистика
    • Введение
    • Непрерывные и дискретные переменные
    • Гистограммы частот
    • Гистограммы часто для непрерывной переменной
    • Гистограммы плотностей
    • Характеристика положений
    • Кто разбросал данные?
    • Дисперсия
    • Стандартное отклонение
    • Скошенность наборов данных
    • Заключение
  • Теория вероятностей
    • Введение
    • Эксперименты, элементарные исходы, события
    • Закон больших чисел
    • Взаимоисключающие и независимые события, умножение вероятностей
    • Случайные величины, распределение вероятностей и интервалы значений
    • Математическое ожидание и дисперсия
    • Вероятность успеха в биномиальном эксперименте
    • Биномиальное распределение
    • Нормальное распределение
    • Нормальная аппроксимация биномиального распределения
    • Заключение
  • Проверка гипотез
    • Введение
    • Случайная выбора и выборочное среднее
    • Формулирование двусторонних гипотез
    • Формулирование односторонних гипотез
    • Гипотеза о равенстве средних двух генеральных совокупностей
    • Гипотезы о равенстве средних для зависимых (парных) выборок
    • Заключение
  • Проектная работа (Проект)
  • Заключение
  • Сборный проект
    • Итоги первого модуля
    • Работа с документацией
    • Проектная работа (Проект)
    • Заключение.

Часть 4

Сбор и хранение данных

  • Извлечение данных из веб-ресурсов
    • Введение
    • Что такое Web Mining
    • Что аналитик должен знать об интернете? Браузер. HTML. HTTP.
    • Что такое транспортный протокол
    • Введение в HTML
    • Инструменты разработчика
    • Ваш первый get-запрос
    • Регулярные выражения
    • Парсинг HTML
    • API
    • JSON
    • Заключение
  • SQL как инструмент работы с данными.
    • Введение
    • Базы данных и таблицы
    • Таблицы
    • Ваш первый SQL-запрос
    • Срезы данных в SQL
    • Агрегирующие функции
    • Изменение типов
    • Заключение
  • Расширенные возможности для аналитика в SQL
    • Введение
    • Группируем данные
    • Сортируем данные
    • Обработка данных в группировке
    • Операторы и функции для работы с датами
    • Подзапросы
    • Заключение
  • Отношение между таблицами
    • Введение
    • Типы связей в таблицах
    • ER-диаграммы
    • Приятно познакомится, таблицы!
    • Типовые роли пользователей без данных
    • Поиск пропусков в данных
    • Поиск данных в таблице
    • JOIN. INNER JOIN
    • Внешнее объединение таблиц. LEFT JOIN
    • Внешнее объединения таблиц. RIGHT JOIN
    • Объединение нескольких таблиц
    • Агрегация в запросах JOIN
    • Объединения запросов
    • Заключение
  • Контекст и проработка запроса
    • Введение
    • Контекст задачи
    • Проработка запроса
    • Доработка результата
    • Заключение
  • Проект
    • Итоги курса
    • Описание проекта
    • Парсинг данных
    • Работа с базой данных
    • Работа с данными в Python.
  • Заключение
  • Анализ бизнес-показателей
    • Метрики и воронки
      • Введение
      • Доходы, прибыль и возврат на инвестиции
      • Конверсии
      • Воронки
      • Маркетинговая воронка: показы, клики, СTR и CR
      • Маркетинговая воронка: группировка по неделям и месяцам.
      • Простая продуктовая воронка
      • Продуктовая воронка с учетом последовательности событий.
      • Заключение
    • Когортный анализ
      • Введение
      • Когортный анализ
      • Когортный анализ в Python
      • Оценка изменений абсолютных показателей по месяцам
      • Оценка изменения относительных показателей по времени жизни
      • Визуализация когортного анализа
      • Retention Rate и Churn Rate
      • Расчет Retention Rate в Python
      • Расчет Churn Rate в Python
      • Поведенческие когорты
      • Заключение
    • Юнит-экономика
      • Введение
      • Экономика одной продажи
      • Экономика одной продажи: строим модель
      • Экономика одного покупателя: LTV и CAC
      • Считаем экономику одного покупателя в интернет-магазине
      • Заключение.
    • Пользовательские метрики
      • Введение
      • Оценка пользовательской актиновсти
      • Пользовательская сессия
      • Фреймворки метрик
      • Расследование аномалий
      • Яндекс.Метрика
      • API Яндекс.Метрики
      • Работа с сырыми данными
      • Заключение
    • Проектная работа(проект)
    • Заключение

Часть 5

Принятие решений в бизнесе на основе данных

  • Основы проверки гипотез в бизнесе
    • Введение
    • Что нужно бизнесу
    • Опережающие метрики. Декомпозиция
    • Определение важных метрик
    • База экспериментов
    • Оставить нельзя экспериментировать
    • Как генерировать идеи
    • Формулируем гипотезу правильно
    • Заключение
  • Выбор метода проведения эксперимента
    • Введение
    • Методы проведения эксперимента
    • Качественные методы проверки гипотезы
    • Количественные методы проверки гипотезы. A/B-тест
    • Преимущества и недостатки A/B-теста
    • Пример результатов A/B-теста
    • Заключение
  • Приоритизация гипотез
    • Введение
    • Зачем и как приоритизировать гипотезы
    • Параметр Reach
    • Параметр Impact
    • Параметр Confidence
    • Параметр Efforts
    • Заключение
  • Подготовка к проведениею A/B-теста
    • Введение
    • A/A-тест
    • Ошибки I и II рода при проверке гипотез. Мощность и значимость
    • Множественные сравнения: A/B и A/B/n-тесты
    • Расчет размера выборки и длительности теста
    • Графический анализ метрик и определение предметной области
    • Заключение
  • Анализ результатов A/B-теста
    • Введение
    • Проверка гипотезы о равенстве долей
    • Проверка данных на нормальность. Критерий Шапиро-Уилка
    • Непараметрический тест Уилкоксона-Манна-Уитни
    • Стабильность кумулятивных метрик
    • Анализ выбросов и всплесков: крайние значения данных
    • Анализ A/B-теста шаг за шагом
    • Долгожданные выводы из A/B-теста
    • Основные ошибки при анализе A/B-тестов
    • Заключение
  • Поведенческие алгоритмы
    • Факты, эмоции и оценка
    • Умение внятно объяснить свою позицию
  • Проектная работа(проект)
  • Как рассказать историю с помощью данных
    • Подготовка презентации
      • Введение
      • Как рассказать о своем исследовании
      • Кому рассказывать истории
      • Сезонность и внешние факторы
      • Покупаем авиабилеты
      • Абсолютные и относительные величины
      • Парадокс Симпсона
      • Когда график — ваш враг
      • Виды графиков для различной информации
      • Основные принципы построения презентации
      • Отчет в Jupyter Notebook
      • Заключение
    • Библиотека Seaborn
      • Введение
      • Почему не хватате matplotlib?
      • Метод jointplot()
      • Цветовая гамма
      • Стили графиков
      • Категориальные данные
      • Визуализация распределения
      • Нестандартные графики в seaborn
      • Заключение
    • Библиотека plotly
      • Введение
      • Интерактивные графики
      • Установка Python и Jupyter Notebook
      • Базовые графики plotly.
      • Круговая диаграмма
      • График воронки
      • Заключение
    • Проектная работа (проект).
  • Cборный проект — 2
    • Событийная аналитика

§ Введение
§ Что такое событийная аналитика
§ Принципы отслеживания событий
§ Приемы событийно аналитики
§ Aha-момент
§ Заключение

o Проектная работа (Проект)
o Заключение

Часть 6

Автоматизация

  • Основы запуска скриптов
    • Введение
    • Основы работы с командной строкой
    • Доступ к командной строке на вашей локальной машине
    • Основные команды для работы с консолью
    • Настройка учетной записи в Яндекс.Облако
    • Установка Python на локальной машине
    • Запуск скрипта из командной строки
    • Запуск скрипта из командной строки в Яндекс.Облаке
    • Запуск скрипта по расписанию
    • Памятка по отладке cron.
    • Заключение
  • Что такое дата-пайплайны и зачем они нужны
    • Введение
    • Дата-пайплайны для автоматизации дащбордов
    • Агрегация данных и создание таблиц в БД
    • Вертикальные и горизонтальные таблицы
    • Создание скрипта пайплайна
    • Заключение
  • Проектирование и разработка дашбордов в dash.
    • Введение
    • Дашборды
    • Сбор требований при создании дашборда
    • Как создавать основные типы график в dash
    • Основы работы с элементами управления
    • Базовые элементы управления в dash
    • Элементы управления и интерактивность
    • Элементы дашборда
    • Разработка дашборда, основы композиции
    • Запуск дашборда на локальной машине
    • Запуск дашборда на виртуальной машине
    • Заключение
  • Tableau
    • Введение
    • Начало работы с Tableau Public
    • Как работать с Tableau
    • Подготовка данных
    • Таблицы и простые вычисления
    • Фильтры
    • Публикация дашборда.
    • Простые графики
    • Линейные графики и области с накомлением
    • Специальный типы графиков
    • Сборка дашборда
    • Заключение
  • Проектная работа
    • Часть 1. Составления технического задания
    • Часть 2. Создание дашборда
  • Прогнозы и предсказания
    • Введение
    • Задачи машинного обучения в бизнесе
      • Введение
      • Что такое обучение?
      • Введение в прогнозирование и машинное обучение
      • Обучение с учителем
      • Обучение без учителя
      • Обучение модели в Python. Библиотека sklearn.
      • Тестовая, валидационная и обучающая выборки
      • Нелообучение и переобучение
      • Разделяй и валидируй
      • Пайпланй машинного обучения
      • Почему машинное обучение — не панацея?
      • Заключение
    • Алгоритм машинного обучения
      • Введение
      • Линейная регрессия и функция ошибки
      • Градиентный спуск
      • Предобработка. Масштабирование признаков
      • Регуляризация
      • Реализация линейный моделей
      • Метрики регресии
      • Логистическая регрессия
      • Метрики классификации. Работа с метками.
      • Метрики классификации. Смотрим на вероятности.
      • Порог и баланс классов
      • Дерево принятия решений
      • Ансамбль деревьев: случайный лест и градиентный бустинг.
      • Алгоритмы обучения без учителя: кластеризация
      • При чем здесь расстояние?
      • K-Means и агломеративная иерархическая кластеризация
      • Метрики для задачи обучения без учителя
      • Заключение
    • Процесс решения задач машинного обучения
      • Введение
      • Постановка задачи
      • EDA. Анализ качества признаков
      • EDA. Формулировка гипотез
      • Предварительная обработка данных
      • Random и time split.
      • Выбор метрик
      • Выбор модели машинного обучения
      • Обучаем модели и выбираем лучшую
      • Важность признаков
      • Заключение.
    • Проектная работа(Проект)
    • Заключение.
Автор курса: Яндекс Практикум

Сайт продажника: https://practicum.yandex.ru/data-analyst/

У нас Вы можете приобрести всего за 390 руб.

Отзывы

Отзывов пока нет.

Будьте первым, кто оставил отзыв на “[Яндекс Практикум] Как стать аналитиком данных. Часть 1,2,3,4,5,6 (2021)”