Общая информация:
Курс “Data Science” рассчитан как на аудиторию, у которой уже есть определенный опыт программирования, так и на людей, которые никогда не программировали. Курс является собственной разработкой и по существу является экстрактом курсов ведущих зарубежных топовых университетов (Stanford University, Princeton University, Higher School of Economics). В первых главах будет знакомство с языком программирования Python. Вы научитесь писать функции, разбираться в типах данных и применять свои навыки на практике в проектах по автоматизации документации, табличных данных. Вы научитесь извлекать ценную информацию из сайтов, упорядочивая ее в табличном виде. В конце, вы познакомитесь с алгоритмами регрессии классификации и кластеризации и примените их на реальных данных.
Продолжительность курса:
1.5 месяца. Занятия будут проводиться 2 раза в неделю по 1 академическому часу
Стоимость курса:
200,000 тенге
Обучение проводится на платформе Google Colab
(для пользования необходим аккаунт Google)
Преподавательский состав:
1. Бакыт Жаркынбай
M.S applied mathematics, Skolkovo Institute of Science and Technology, Moscow
2. Ержан Апсаттаров
M.S. in Computer Science and Data Analytics, Warwick University, Coventry, UK
3. Фархад Акимов
M.S. in Nuclear Engineering, Purdue University, USA
Введение в программирование.
Строки.
Условные операции
Виды языков программирования. Среда разработки. Интерпретатор Python. Условные операции Логические операторы. Else, if, elif. Оператор сравнения. Решение задач.
Функция range. Цикл for. Цикл while. Бесконечный цикл. Операторы break, continue. Решение задач.
Списки. Кортежи.
Словари. Множества.
Знакомство с основными встроенными коллекциями Python. Решение задач.
Создание функций. Параметры функций. Return keyword. Лямбда Функции. *args, **kwargs. Рекурсия.
Полезные модули Python (os, re, folium, etc)
Полезные модули Python. Работа с регулярными выражениями. Работа с файловой системой.
Введение в Pandas.
Работа с пропущенными данными. Работа с некорректно заполненными данными.
Удаление дубликатов
Что такое DataFrame, Pandas series. Использование Pandas функций. Заполнение или удаление строк с пропущенными данными
Автоматизация табличных данных с применением Python
Создание шаблонов табличных данных для заполнения. Использование специальных библиотек Python для автоматизации табличных данных
Автоматизация текстовых данных с применением python-docx, docxtpl
Создание шаблонов текстовых данных для заполнения. Использование специальных библиотек Python для автоматизации текстовых данных
Парсинг статичных сайтов с использованием Beautiful Soup
Агрегация данных и сбор данных с различных сайтов
Предсказание цен на недвижимость используя реальные данные Boston Housing dataset.
Классификация объектов, субъектов и нахождение ответов в данных с помощью алгоритмов машинного обучения
Кластеризация клиентов используя алгоритм K Nearest Neighbors.
Спасибо
Ваш комментарий
был успешно
отправлен