Курс “Data Science”
Общая информация:
Курс “Data Science” рассчитан как на аудиторию, у которой уже есть определенный опыт программирования, так и на людей, которые никогда не программировали. Курс является собственной разработкой и по существу является экстрактом курсов ведущих зарубежных топовых университетов (Stanford University, Princeton University, Higher School of Economics). В первых главах будет знакомство с языком программирования Python. Вы научитесь писать функции, разбираться в типах данных и применять свои навыки на практике в проектах по автоматизации документации, табличных данных. Вы научитесь извлекать ценную информацию из сайтов, упорядочивая ее в табличном виде. В конце, вы познакомитесь с алгоритмами регрессии классификации и кластеризации и примените их на реальных данных.
Продолжительность курса: Продолжительность курса — 1.5 месяца. Занятия будут проводиться 2 раза в неделю по 1 академическому часу.
Формат обучения: онлайн.
Стоимость курса: 200,000 тенге.
Преподавательский состав:
- Бакыт Жаркынбай — M.S applied mathematics, Skolkovo Institute of Science and Technology, Moscow.
- Ержан Апсаттаров — M.S. in Computer Science and Data Analytics, Warwick University, Coventry, UK.
- Фархад Акимов — M.S. in Nuclear Engineering, Purdue University, USA.
Обучение проводится на платформе Google Colab (для пользования необходим аккаунт Google)
Занятие | Тема | Описание |
---|---|---|
Занятие 1 | Введение в программирование. Строки. Условные операции | Виды языков программирования. Среда разработки. Интерпретатор Python. Условные операции Логические операторы. Else, if, elif. Оператор сравнения. Решение задач. |
Занятие 2 | Циклы в Python | Функция range. Цикл for. Цикл while. Бесконечный цикл. Операторы break, continue. Решение задач. |
Занятие 3 | Списки. Кортежи. Словари. Множества. | Знакомство с основными встроенными коллекциями Python. Решение задач. |
Занятие 4 | Функции в Python | Создание функций. Параметры функций. Return keyword. Лямбда Функции. *args, **kwargs. Рекурсия. |
Занятие 5 | Полезные модули Python (os, re, folium, etc) | Полезные модули Python. Работа с регулярными выражениями. Работа с файловой системой. |
Занятие 6 | Введение в Pandas. Работа с пропущенными данными. Работа с некорректно заполненными данными Удаление дубликатов | Что такое DataFrame, Pandas series Использование Pandas функций. Заполнение или удаление строк с пропущенными данными |
Занятие 7 | Автоматизация табличных данных с применением Python | Создание шаблонов табличных данных для заполнения. Использование специальных библиотек Python для автоматизации табличных данных |
Занятие 8 | Автоматизация текстовых данных с применением python-docx, docxtpl | Создание шаблонов текстовых данных для заполнения. Использование специальных библиотек Python для автоматизации текстовых данных |
Занятие 9 | Парсинг статичных сайтов с использованием Beautiful Soup | Агрегация данных и сбор данных с различных сайтов |
Занятие 10 | Регрессионный анализ | Предсказание цен на недвижимость используя реальные данные Boston Housing dataset. |
Занятие 11 | Классификация | Классификация объектов, субъектов и нахождение ответов в данных с помощью алгоритмов машинного обучения |
Занятие 12 | Кластеризация | Кластеризация клиентов используя алгоритм K Nearest Neighbors. |