Описание курса
Всего за несколько лет средства анализа данных, доступные разработчикам на Python, совершили рывок вперёд. Появились мощные пакеты, реализующие алгоритмы машинного обучения, обработку естественных языков, статистический анализ и визуализацию.
Инструменты языка Python просты в использовании, при этом имеют широкие возможности применения. Программирование на Python – простой и эффективный вариант для вхождения в популярную сферу Data Science.
Уникальная особенность языка – возможность быстрого встраивания анализа данных в веб-приложения.
Курс «Анализ и визуализация данных на языке Python. Библиотеки Pandas, numpy, Matplotlib» предназначен для тех, кто ищет гибкий инструмент обработки, анализа и визуализации данных и планирует применять свои навыки в работе большими массивами информации.
Слушатели изучат важнейшие и широко распространенные библиотеки numpy, Matplotlib и Pandas, которые массово применяются в различных областях производственной, финансовой и научной деятельности.
Обучение на курсе построено на примерах реальных проектов в области обработки данных.
Курс читается на базе операционной системы Linux, однако его материал может быть применен и на Windows.
Курс предназначен для программистов, аналитиков, научных работников. Также курс может служить введением в Data Science.
Вы научитесь
- Создавать и обрабатывать числовые массивы.
- Создавать диаграммы и графики различных видов и форматов.
- Объединять и переформировывать данные.
После окончания обучения Вы будете знать:
- Основы анализа и визуализации данных, применяемый для этой цели базовый инструментарий языка Python;
- Основные понятия и методики библиотеки numpy: массив, скаляр, массовая операция, основные операции с массивами, основные функции библиотеки;
- Библиотеку Matplotlib ее основные понятия и методики применения;
- Основные виды графиков и диаграмм, способы их построения;
- Основные понятия и методики библиотеки Pandas.
Предварительная подготовка
Требуемая подготовка:
Успешное окончание курса Программирование на языке Python. Уровень 1. Базовый курс, или эквивалентная подготовка.
Программа курса (40 ак. ч. + 20 ак. ч. Самостоятельно)
-
- Принципы организации и управления вычислениями. Используемые языки программирования и взаимосвязь между ними.
- Необходимые пакеты Python: numpy, Matplotlib, Pandas, Jupyter и другие.
- Дистрибутив Anaconda, его преимущества и недостатки.
- Установка пакетов в Linux.
- Установка пакетов в Windows. Возможные проблемы и методы их решения.
-
- Понятие массива и его основные характеристики.
- Структура библиотеки.
- Типы данных библиотеки numpy.
- Принципы вычислений.
- Универсальные функции.
- Важнейшие стандартные функции.
-
Работа с массивами и матрицами.
-
- Виды графиков и диаграмм.
- Основные элементы диаграммы.
- Создание диаграммы.
- Форматы изображений.
-
- График функции.
- Гистограмма.
-
- Объект Series.
- Объект DataFrame.
-
Первичная обработка данных.
- Загрузка и выгрузка данных.
- Организация колонок и строчек.
- Пропуски и повторы.
-
- Типы данных для представления времени.
- Объект Period.
- Основные операции статистики.
-
Статистика. Объединение и переформирование данных.
- Объединение данных.
- Сцепление и наложение (concatenating and stacking).
- Слияние (merging and joining).
Расписание курса
-
Преподаватель
Шиховцов Вадим
Дата
Удобные для Вас даты
Формат обучения
Место
Онлайн, из удобного местаЯзык
РусскийСтоимость
9830 ₪
Оставьте заявку на корпоративное обучение *
* Корпоративное обучение обеспечивает рост результативности, соответствие более высоким профессиональным стандартам, формирует эффективно работающую команду специалистов.