Описание курса
В процессе деятельности любая компания постоянно ищет новые способы развития: оптимизирует производство, улучшает бизнес-процессы, увеличивает вложения в рекламу и маркетинг, повышает уровень сервиса. Но если успехи компании сходят на нет, зачастую сложно понять, что именно идет не так и почему.
Есть область, ресурсы которой еще не исчерпаны – это Data Science. Накопленные в компании данные, полученные из разных источников, таят в себе огромный потенциал. Грамотный анализ больших объемов разнородных данных (Big Data), выведение скрытых закономерностей приводят аналитиков порой к неожиданным открытиям и выводам. Оперируя этими сведениями, можно вывести свою компанию в лидеры рынка.
Этот курс – введение в сложную и многогранную область науки по работе с большими данными – Data Science.
Вопросы, на которые вы получите ответы:
- Что представляет собой Data Science и как она связана с большими данными (Big Data)?
- Как «приложить» Data Science к вашему бизнесу и нужно ли?
- Какие данные можно использовать для анализа?
- Где именно искать и какие результаты ожидать?
Для кого этот курс?
- Руководители компаний и подразделений
- Линейные менеджеры
- Бизнес-аналитики
- Разработчики
- Другие сотрудники, вовлеченные в аналитическую деятельность компании
Что даст вам прохождение курса?
- Вы поймете, как подготовить компанию и сотрудников к практическому применению больших данных (Big Data) в работе.
- Вы сможете повысить эффективность принятия решений за счет грамотного сбора, структурирования и применения современных техник анализа больших данных (Big Data).
- Полученные знания и навыки позволят слушателям повысить эффективность принятия решений за счет грамотного сбора, структурирования и применения современных техник анализа больших объемов данных: Data – Information – Knowledge – Wisdom: от данных к мудрости в принятии решений!
В курсе рассматриваются вопросы:
- источники информации: структурированные и неструктурированные;
- стандартный межотраслевой процесс анализа данных CRISP-DM;
- основные характеристики больших данных и способы их анализа;
- понятие «озер данных» (data lake) и обзор инструментария;
- элементы классификации данных и машинного обучения;
- основы статистического анализа, построение регрессионных зависимостей;
- визуализация «больших данных»;
- обзор классов задач, решаемых инструментами машинного обучения и ИИ: распознавание образов, звуков, текста, прогностика, анализ соцсетей;
- обзор математических инструментов решения: нейронные сети, графы, нечеткие и К-значные логики;
- обзор прикладных инструментов: AWS, Azure AI, machine learning.ru c демонстрацией применения;
- обзор инструментов «без кода» (nocode);
- специальности в области «больших данных» и формирование команд: аналитики данных, «ученые по данным», программисты по «большим данным», менеджеры по «большим данным» (CDO);
- методы реорганизации работы компании при применении анализа «больших данных».
Спешите записаться на наш курс «Основы работы с большими данными (Data Science)», чтобы освоить Big Data и вывести свою компанию в лидеры!
Вы научитесь
- определять источники сбора информации и формировать требования к ним;
- применять стандартный CRISP-DM процесс для Вашей организации;
- подбирать команду для работы с большими данными (Big Data);
- выбирать инструментарий для практической работы;
- применять специализированные инструменты Excel – «Пакет анализа данных» и «Тренды»;
- применять «дерево решений»;
- определять подходящие инструменты и методы для решения основных классов задач машинного обучения и взаимодействовать с разработчиками;
- использовать методы классификации данных для машинного обучения;
- подбирать выборки разработки, тестовую и обучающую для достижения наилучших результатов анализа информации;
- работать с nocode инструментом (на примере одного инструмента);
- организовывать реорганизацию работы компании для применения управления на основе больших данных.
После окончания обучения слушатель будет знать:
- концепцию больших данных (Big Data);
- типовые задачи, для решения которых применяется машинное обучение: анализ трендов, социальных сетей; распознавание графических, видео- и аудио-образов, текста; прогностика действий (на примере покупок);
- базовые математические понятия;
- основные методы обработки и анализа данных: регрессия, нейронные сети; графы, К-значные логики;
- основные современные инструменты анализа данных, включая data lake, no code;
- принципы организации и структуру команд по работе с бигдата.
Предварительная подготовка
Требуемая подготовка:
Базовые знания Excel, или эквивалентная подготовка.
Программа курса (16 ак. ч. + 4 ак. ч. Самостоятельно)
-
- Цели курса
- Определение основных понятий
- История науки о данных
- Выгоды от работы с большими данными
- Типовые задачи: прогноз продаж, производства, спроса. Анализ поведения. Распознавание образов. Экспертные системы.
-
- С чего начать. Межотраслевая стандартная методика работы с данными CRISP-DM.
- Описательное и ассоциативное исследование исходных данных
- Сегментирование и очистка данных (slice and dice). Примеры инструментов Excel.
- Визуализация данных в Excel. Как использовать сводные таблицы и диаграммы.
- «Озера данных» (Data lakes)
- Отличия озер данных от структурированных хранилищ
- Обзор инструментария
- Практическая работа. Сегментировать и очистить тестовый набор данных.
-
- Описательная статистика
- Среднее, наиболее вероятное, медиана
- Дисперсия, стандартное отклонение, стандартная ошибка
- Виды распределений
- Пакет анализа данных Excel
- Обзор других прикладных средств работы с данными (R, Python, Octave, MathLab, специализированные БД)
- Практическая работа. Определить статистические характеристики выборки данных.
-
- Постановка задачи оценки взаимосвязи между различными факторами и построение прогноза
- Корреляция. Коэффициент Пирсона.
- Критерий Стьюдента (T-анализ)
- Основы машинного обучения
- Регрессионный анализ
- Построение и анализ трендов в Excel
- Регрессионный анализ на трендах
- Практическая работа. Определить наличие корреляции и регрессионную зависимость между двумя выборками данных. Построить тренд.
-
- Задача сегментации дискретных данных на примере задач распознавания (графика, речь, текст)
- Нейронные сети как инструмент решения задач классификации
- Демонстрация источников библиотек и no-code
-
- Задачи классификации данных в социальных сетях и поиска оптимального решения (маршрута)
- Графы как инструмент решения задач на социальных графах и прогнозирования поведения
- Дерево решений
- Разбиение на выборки (обучающую, тестовую, проверочную)
- Анализ ошибок обучения. Базис и отклонения. Ручная корректировка.
- Практическая работа: провести классификацию набора данных и его разбиение на сегменты.
-
- Понятие Deep Machine Learning
- Понятия естественного языка и нечетких логик
- Многофакторный бизнес анализ на примере нечетких логик
-
- Роли специалистов по DS: аналитик данных, ученый по данным, программист, цифровой директор.
- Требования к компетенциям и взаимодействию сотрудников в области аналитики данных
- Состав и требования к проектной команде для DS
- Подготовка компании к применению «бигдата»
Расписание курса
-
Преподаватель
Динцис Данил
Дата
Удобные для Вас даты
Формат обучения
Место
Онлайн, из удобного местаЯзык
РусскийСтоимость
3170 ₪
Оставьте заявку на корпоративное обучение *
* Корпоративное обучение обеспечивает рост результативности, соответствие более высоким профессиональным стандартам, формирует эффективно работающую команду специалистов.