Описание курса

В процессе деятельности любая компания постоянно ищет новые способы развития: оптимизирует производство, улучшает бизнес-процессы, увеличивает вложения в рекламу и маркетинг, повышает уровень сервиса. Но если успехи компании сходят на нет, зачастую сложно понять, что именно идет не так и почему.

Есть область, ресурсы которой еще не исчерпаны – это Data Science. Накопленные в компании данные, полученные из разных источников, таят в себе огромный потенциал. Грамотный анализ больших объемов разнородных данных (Big Data), выведение скрытых закономерностей приводят аналитиков порой к неожиданным открытиям и выводам. Оперируя этими сведениями, можно вывести свою компанию в лидеры рынка.

Этот курс – введение в сложную и многогранную область науки по работе с большими данными – Data Science.

Вопросы, на которые вы получите ответы:

  • Что представляет собой Data Science и как она связана с большими данными (Big Data)?
  • Как «приложить» Data Science к вашему бизнесу и нужно ли?
  • Какие данные можно использовать для анализа?
  • Где именно искать и какие результаты ожидать?

Для кого этот курс?

  • Руководители компаний и подразделений
  • Линейные менеджеры
  • Бизнес-аналитики
  • Разработчики
  • Другие сотрудники, вовлеченные в аналитическую деятельность компании

Что даст вам прохождение курса?

  • Вы поймете, как подготовить компанию и сотрудников к практическому применению больших данных (Big Data) в работе.
  • Вы сможете повысить эффективность принятия решений за счет грамотного сбора, структурирования и применения современных техник анализа больших данных (Big Data).
  • Полученные знания и навыки позволят слушателям повысить эффективность принятия решений за счет грамотного сбора, структурирования и применения современных техник анализа больших объемов данных: Data – Information – Knowledge – Wisdom: от данных к мудрости в принятии решений!

В курсе рассматриваются вопросы:

  • источники информации: структурированные и неструктурированные;
  • стандартный межотраслевой процесс анализа данных CRISP-DM;
  • основные характеристики больших данных и способы их анализа;
  • понятие «озер данных» (data lake) и обзор инструментария;
  • элементы классификации данных и машинного обучения;
  • основы статистического анализа, построение регрессионных зависимостей;
  • визуализация «больших данных»;
  • обзор классов задач, решаемых инструментами машинного обучения и ИИ: распознавание образов, звуков, текста, прогностика, анализ соцсетей;
  • обзор математических инструментов решения: нейронные сети, графы, нечеткие и К-значные логики;
  • обзор прикладных инструментов: AWS, Azure AI, machine learning.ru c демонстрацией применения;
  • обзор инструментов «без кода» (nocode);
  • специальности в области «больших данных» и формирование команд: аналитики данных, «ученые по данным», программисты по «большим данным», менеджеры по «большим данным» (CDO);
  • методы реорганизации работы компании при применении анализа «больших данных».

Спешите записаться на наш курс «Основы работы с большими данными (Data Science)», чтобы освоить Big Data и вывести свою компанию в лидеры!

Вы научитесь

  • определять источники сбора информации и формировать требования к ним;
  • применять стандартный CRISP-DM процесс для Вашей организации;
  • подбирать команду для работы с большими данными (Big Data);
  • выбирать инструментарий для практической работы;
  • применять специализированные инструменты Excel – «Пакет анализа данных» и «Тренды»;
  • применять «дерево решений»;
  • определять подходящие инструменты и методы для решения основных классов задач машинного обучения и взаимодействовать с разработчиками;
  • использовать методы классификации данных для машинного обучения;
  • подбирать выборки разработки, тестовую и обучающую для достижения наилучших результатов анализа информации;
  • работать с nocode инструментом (на примере одного инструмента);
  • организовывать реорганизацию работы компании для применения управления на основе больших данных.

После окончания обучения слушатель будет знать:

  • концепцию больших данных (Big Data);
  • типовые задачи, для решения которых применяется машинное обучение: анализ трендов, социальных сетей; распознавание графических, видео- и аудио-образов, текста; прогностика действий (на примере покупок);
  • базовые математические понятия;
  • основные методы обработки и анализа данных: регрессия, нейронные сети; графы, К-значные логики;
  • основные современные инструменты анализа данных, включая data lake, no code;
  • принципы организации и структуру команд по работе с бигдата.

Предварительная подготовка

Требуемая подготовка:

Базовые знания Excel, или эквивалентная подготовка.

Программа курса (16 ак. ч. + 4 ак. ч. Самостоятельно)

  • Модуль 1. Область применения больших данных. Типовые задачи (1 ак.ч)

    • Цели курса
    • Определение основных понятий
    • История науки о данных
    • Выгоды от работы с большими данными
    • Типовые задачи: прогноз продаж, производства, спроса. Анализ поведения. Распознавание образов. Экспертные системы.
  • Модуль 2. Сбор и подготовка исходных данных. Методика CRISP-DM (2 ак.ч)

    • С чего начать. Межотраслевая стандартная методика работы с данными CRISP-DM.
    • Описательное и ассоциативное исследование исходных данных
    • Сегментирование и очистка данных (slice and dice). Примеры инструментов Excel.
    • Визуализация данных в Excel. Как использовать сводные таблицы и диаграммы.
    • «Озера данных» (Data lakes)
    • Отличия озер данных от структурированных хранилищ
    • Обзор инструментария
    • Практическая работа. Сегментировать и очистить тестовый набор данных.
  • Модуль 3. Модуль 3. Основы математической статистики, ANOVA. Надстройка Excel «Пакет анализа» (2 ак.ч)

    • Описательная статистика
    • Среднее, наиболее вероятное, медиана
    • Дисперсия, стандартное отклонение, стандартная ошибка
    • Виды распределений
    • Пакет анализа данных Excel
    • Обзор других прикладных средств работы с данными (R, Python, Octave, MathLab, специализированные БД)
    • Практическая работа. Определить статистические характеристики выборки данных.
  • Модуль 4. Задача прогноза продаж. Понятие машинного обучения. Корреляция. Регрессионный анализ. (3 ак.ч)

    • Постановка задачи оценки взаимосвязи между различными факторами и построение прогноза
    • Корреляция. Коэффициент Пирсона.
    • Критерий Стьюдента (T-анализ)
    • Основы машинного обучения
    • Регрессионный анализ
    • Построение и анализ трендов в Excel
    • Регрессионный анализ на трендах
    • Практическая работа. Определить наличие корреляции и регрессионную зависимость между двумя выборками данных. Построить тренд.
  • Модуль 5. Задачи классификации и распознавания образов, видео, речи, текста. Понятие нейронных сетей. Примеры применения (3 ак.ч)

    • Задача сегментации дискретных данных на примере задач распознавания (графика, речь, текст)
    • Нейронные сети как инструмент решения задач классификации
    • Демонстрация источников библиотек и no-code
  • Модуль 6. Задача исследования социальных сетей. Задача прогнозирования поведения пользователя. Социальные и направленные графы. Деревья решений. Примеры применения (3 ак.ч)

    • Задачи классификации данных в социальных сетях и поиска оптимального решения (маршрута)
    • Графы как инструмент решения задач на социальных графах и прогнозирования поведения
    • Дерево решений
    • Разбиение на выборки (обучающую, тестовую, проверочную)
    • Анализ ошибок обучения. Базис и отклонения. Ручная корректировка.
    • Практическая работа: провести классификацию набора данных и его разбиение на сегменты.
  • Модуль 7. Продвинутые инструменты: глубокое машинное обучение, искусственный интеллект, нечеткие множества (1 ак.ч)

    • Понятие Deep Machine Learning
    • Понятия естественного языка и нечетких логик
    • Многофакторный бизнес анализ на примере нечетких логик
  • Модуль 8. Профориентация по специальностям в Data Science. Выводы и рекомендации по построению и организации работы команды (1 ак.ч)

    • Роли специалистов по DS: аналитик данных, ученый по данным, программист, цифровой директор.
    • Требования к компетенциям и взаимодействию сотрудников в области аналитики данных
    • Состав и требования к проектной команде для DS
    • Подготовка компании к применению «бигдата»

Расписание курса

Оставьте заявку на корпоративное обучение *

* Корпоративное обучение обеспечивает рост результативности, соответствие более высоким профессиональным стандартам, формирует эффективно работающую команду специалистов.

Преподаватели

Динцис Данил

Стоимость обучения

3170 ₪