Курс «Data Science»

Arrow
Назад
Курс «Data Science»

Course

Курс «Data Science»

21.11.2022

Admin

Общая информация:

Курс “Data Science” рассчитан как на аудиторию, у которой уже есть определенный опыт программирования, так и на людей, которые никогда не программировали. Курс является собственной разработкой и по существу является экстрактом курсов ведущих зарубежных топовых университетов (Stanford University, Princeton University, Higher School of Economics). В первых главах будет знакомство с языком программирования Python. Вы научитесь писать функции, разбираться в типах данных и применять свои навыки на практике в проектах по автоматизации документации, табличных данных. Вы научитесь извлекать ценную информацию из сайтов, упорядочивая ее в табличном виде. В конце, вы познакомитесь с алгоритмами регрессии классификации и кластеризации и примените их на реальных данных.

Продолжительность курса:

1.5 месяца. Занятия будут проводиться 2 раза в неделю по 1 академическому часу

Формат обучения:

онлайн

Стоимость курса:

200,000 тенге

Обучение проводится на платформе Google Colab

(для пользования необходим аккаунт Google)

Преподавательский состав:

1. Бакыт Жаркынбай

M.S applied mathematics, Skolkovo Institute of Science and Technology, Moscow

2. Ержан Апсаттаров

M.S. in Computer Science and Data Analytics, Warwick University, Coventry, UK

3. Фархад Акимов

M.S. in Nuclear Engineering, Purdue University, USA

Курс

Содержание курса

Занятие

Тема

Описание

Занятие 1

Введение в программирование.
Строки.
Условные операции

Виды языков программирования. Среда разработки. Интерпретатор Python. Условные операции Логические операторы. Else, if, elif. Оператор сравнения. Решение задач.

Занятие 2

Циклы в Python

Функция range. Цикл for. Цикл while. Бесконечный цикл. Операторы break, continue. Решение задач.

Занятие 3

Списки. Кортежи.
Словари. Множества.

Знакомство с основными встроенными коллекциями Python. Решение задач.

Занятие 4

Функции в Python

Создание функций. Параметры функций. Return keyword. Лямбда Функции. *args, **kwargs. Рекурсия.

Занятие 5

Полезные модули Python (os, re, folium, etc)

Полезные модули Python. Работа с регулярными выражениями. Работа с файловой системой.

Занятие 6

Введение в Pandas.
Работа с пропущенными данными. Работа с некорректно заполненными данными.
Удаление дубликатов

Что такое DataFrame, Pandas series. Использование Pandas функций. Заполнение или удаление строк с пропущенными данными

Занятие 7

Автоматизация табличных данных с применением Python

Создание шаблонов табличных данных для заполнения. Использование специальных библиотек Python для автоматизации табличных данных

Занятие 8

Автоматизация текстовых данных с применением python-docx, docxtpl

Создание шаблонов текстовых данных для заполнения. Использование специальных библиотек Python для автоматизации текстовых данных

Занятие 9

Парсинг статичных сайтов с использованием Beautiful Soup

Агрегация данных и сбор данных с различных сайтов

Занятие 10

Регрессионный анализ

Предсказание цен на недвижимость используя реальные данные Boston Housing dataset.

Занятие 11

Классификация

Классификация объектов, субъектов и нахождение ответов в данных с помощью алгоритмов машинного обучения

Занятие 12

Кластеризация

Кластеризация клиентов используя алгоритм K Nearest Neighbors.

Комментарии

Комментариев пока нет

Добавить комментарий

Ваш адрес email не будет опубликован.

Обязательные поля помечены *

* Имя

* Email

Сайт

* Комментарий

Спасибо

Ваш комментарий

был успешно

отправлен

Send comment