Курс “Data Science”

Общая информация:

Курс “Data Science” рассчитан как на аудиторию, у которой уже есть определенный опыт программирования, так и на людей, которые никогда не программировали. Курс является собственной разработкой и по существу является экстрактом курсов ведущих зарубежных топовых университетов (Stanford University, Princeton University, Higher School of Economics). В первых главах будет знакомство с языком программирования Python. Вы научитесь писать функции, разбираться в типах данных и применять свои навыки на практике в проектах по автоматизации документации, табличных данных. Вы научитесь извлекать ценную информацию из сайтов, упорядочивая ее в табличном виде. В конце, вы познакомитесь с алгоритмами регрессии классификации и кластеризации и примените их на реальных данных.  

Продолжительность курса: Продолжительность курса — 1.5 месяца. Занятия будут проводиться 2 раза в неделю по 1 академическому часу.

Формат обучения: онлайн.

Стоимость курса: 200,000 тенге.

Преподавательский состав:

  1. Бакыт Жаркынбай — M.S applied mathematics, Skolkovo Institute of Science and Technology, Moscow.
  2. Ержан Апсаттаров — M.S. in Computer Science and Data Analytics, Warwick University, Coventry, UK.
  3. Фархад Акимов — M.S. in Nuclear Engineering, Purdue University, USA.

Обучение проводится на платформе Google Colab (для пользования необходим аккаунт Google)

ЗанятиеТемаОписание
Занятие 1Введение в программирование.
Строки.
Условные операции
Виды языков программирования. Среда разработки. Интерпретатор Python.
Условные операции Логические операторы. Else, if, elif. Оператор сравнения. Решение задач.
Занятие 2Циклы в PythonФункция range. Цикл for. Цикл while. Бесконечный цикл. Операторы break, continue. Решение задач.
Занятие 3Списки. Кортежи.
Словари. Множества.
Знакомство с основными встроенными коллекциями Python. Решение задач.
Занятие 4Функции в PythonСоздание функций. Параметры функций. Return keyword. Лямбда Функции. *args, **kwargs. Рекурсия. 
Занятие 5Полезные модули Python (os, re, folium, etc)Полезные модули Python. Работа с регулярными выражениями. Работа с файловой системой.
Занятие 6Введение в Pandas.
Работа с пропущенными данными. Работа с некорректно заполненными данными
Удаление дубликатов
Что такое DataFrame, Pandas series
Использование Pandas функций. Заполнение или удаление строк с пропущенными данными
Занятие 7Автоматизация табличных данных с применением PythonСоздание шаблонов табличных данных для заполнения. Использование специальных библиотек Python для автоматизации табличных данных
Занятие 8Автоматизация текстовых данных с применением python-docx, docxtplСоздание шаблонов текстовых данных для заполнения. Использование специальных библиотек Python для автоматизации текстовых данных
Занятие 9Парсинг статичных сайтов с использованием Beautiful SoupАгрегация данных и сбор данных с различных сайтов
Занятие 10Регрессионный анализПредсказание цен на недвижимость используя реальные данные Boston Housing dataset.
Занятие 11КлассификацияКлассификация объектов, субъектов и нахождение ответов  в данных с помощью алгоритмов машинного обучения
Занятие 12 КластеризацияКластеризация клиентов используя алгоритм K Nearest Neighbors.