Магистратура
Машинное обучение и анализ данных

Машинное обучение и анализ данных

КВАЛИФИКАЦИЯ

  • Научно-педагогическое направление - магистр технических наук

МОДЕЛЬ ВЫПУСКНИКА

ON 1 Использовать понятийный аппарат, методы, методики и технологии разработки программного обеспечения (ПО) для индуктивного обучения на основе анализа и синтеза информационных потоков данных, являющимися прецедентами решаемой задачи. Такие наборы задач характерных для банковской сферы, интернет торговли, IoT, социальных сетей, данных измерительных устройств сложных технических объектов(ТО), серверов ДЦ;
ON 2 Проводить сравнительно–регрессионный, сравнительно-вероятностный, системный и структурный анализ для моделирования и формализации больших информационных потоков данных интернет пространства. Использовать как альтернативу этим статистическим методам подходы data mining & information extraction;
ON 3 Решать сетевые технические, экономико-маркетинговые, банковские, информационные и задачи прогнозирования, основанные на Базах Знаний, накопленных экспертными системами в Data-центрах для структурирования этих сведений в единую, понятную и самообучающуюся формализованную математическую модель;
ON 4 Обрабатывать потоки данных серверов, ТО, интернет источников для построения множества ситуационных объектов и множества возможных откликов, реакций изучаемой в зависимости от причинно- временного развития системы. Уметь решать типовые задачи помощью гугловского имитатора DeepMind;
ON 5 Соотносить методологические основы аналитических подходов формальной математики с концепциями нечеткой логики и поиска неявных решений алгоритмами нейронных сетей, основанных на эмпирической формализации решений;
ON 6 Эффективно разработанные самообучающуюся системы для обобщения разнообразных потоков информации ДЦ, интернет -ресурсов, показаний многочисленных датчиков сложных ТО для выработки адекватного отклика на данные выпадающие за пределы обучающей выборки ситуаций;
ON 7 Создавать новые базы знаний и сегменты в ДЦ. Проектировать пилотную Machine Learning для ТО и бизнес процессов с формированием самообучающихся математических моделей по обработке больших потоков данных ДЦ КазНУ имени аль Фараби;
ON 8 Создавать проекты на базе искусственных нейронных сетей для глубокого обучения с учителем, применять методы коррекции ошибок, обратного распространения ошибок и опрных впекторов;
ON 9 Формировать пилотные курсы для обучения сотрудников бизнес компаний, проводить тренинги по большим данным, машинному обучению и разработке интерфейсов. Уметь прозрачно и наглядно презентовать понятийный аппарат ML / AI / Big Data и области их применения;
ON 10 Владеть навыками пользования прикладными программами пакета Machine Learning в аппроксимации функций, распознавании рукописного текста, технической диагностики;
ON 11 Применять методы Machine Learning для изучения временных рядов или сигналов, изображения или видеоряда;
ON 12 Использовать навыки работы с информацией из различных литературных источников, представлять ее в различных формах сообщений, презентаций и докладов с учетом специфики аудитории, обосновывая и грамотно излагая свою точку зрения на проблемные вопросы. Эффективно работать в команде при поиске и решении научно-исследовательских проблем ОП.

Паспорт программы

Название
Машинное обучение и анализ данных
Шифр
7M07115
Факультет
Информационных технологий

дисциплины

Иностранный язык (профессиональный)
  • Количество кредитов - 6
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Цель – приобретение и совершенствование компетенций в соответствии с международными стандартами иноязычного образования, с целью общения в межкультурной, профессиональной и научной среде. Магистрант должен уметь интегрировать новую информацию, понимать организацию языков, взаимодействовать в социуме, отстаивать свою точку зрения.

Инфраструктура больших данных
  • Количество кредитов - 9
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Цель дисциплины состоит в формировании способности создавать инфраструктуру и средства интеграции систем, приложений и сервисов для обработки больших данных. Содержание дисциплины: Технологии распределенных вычислений. Распределенные файловые системы. Проектирование инфраструктуры больших данных. Разработка и поддержка средств интеграции систем, приложений и сервисов. Пакетная обработка больших данных. Потоковая обработка больших данных. Интерактивная обработка больших данных. Оптимизация размещения больших данных.

История и философия науки
  • Количество кредитов - 3
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Курс вводит в проблематику феномена науки как предмета специального философского анализа, формирует знания об истории и теории науки; о закономерностях развития науки и структуре научного знания; о науке как профессии и социальном институте; о методах ведения научных исследований; о роли науки в развитии общества.

Компьютерные модели вычислений
  • Количество кредитов - 6
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Цель дисциплины состоит в формировании способности применять инструменты и методы, необходимые для предложения алгоритмических решений реальных задач, которые имеют строгие теоретические ограничения использования времени и пространства. В рамках дисциплины рассматриваются следующие аспекты: асимптотическая запись, рекурсия, парадигма «разделяй и властвуй».

Методы статистического анализа данных
  • Количество кредитов - 5
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Цель дисциплины состоит в формировании способности применять концепции статистического анализа и более продвинутых процедур статистического моделирования с использованием языка программирования Python для интерпретации и анализа данных. В рамках дисциплины рассматриваются следующие аспекты: Методы статистического моделирования. Корреляционный анализ. Регрессионный анализ. Канонический анализ. Методы сравнения средних. Частотный анализ. Кросстабуляция (сопряжение). Иерархические и многоуровневые модели и методы байесовского вывода.Анализ соответствий. Кластерный анализ. Дискриминантный анализ. Факторный анализ. Деревья классификации. способы использования Python в качестве инструмента, включая библиотеки Numpy, Pandas, Statsmodels, Matplotlib и Seaborn. Создание визуализации и управление данными в Python. Анализ главных компонент и классификация. Многомерное шкалирование.

Организация и планирование научных исследований (англ)
  • Количество кредитов - 6
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Цель дисциплины: заключается в обучении магистров проведению научных исследований, осуществлении научно-методической работы, социализации обучающейся молодежи и участии их в системе корпоративного управления ОВПО. Магистранты учатся взаимодействовать со стейкхолдерами ОВПО, участвовать в исследовательских проектах.

Педагогика высшей школы
  • Количество кредитов - 5
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Цель – формирование способности к педагогической деятельности в вузе на основе знаний дидактики высшей школы, теорий воспитания и менеджмента образования, анализа и самооценки преподавательской деятельности. Курс рассматривает проектирование образовательной деятельности будущего преподавателя с применением КТО, реализации Болонского процесса, овладения лекторским, кураторским мастерством с использованием стратегий и методов обучения/воспитания и оценивания (TLA-стратегий).

Предиктивный анализ
  • Количество кредитов - 6
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Цель дисциплины состоит в формировании способности применять статистические методы и модели машинного обучения для предиктивного анализа данных. Содержание дисциплины: Подходы для предиктивного анализа данных. Статистические методы для анализа данных. Обработка данных. Машинное обучение для предиктивного анализа. Поиск закономерностей и взаимосвязей в больших хранилищах данных. Прогнозное моделирование. Оценка и развертывание модели. Инструменты визуализации.

Психология управления
  • Количество кредитов - 3
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Цель дисциплины: сформировать способность применять важнейшие аспекты сферы управления в процессе профессионального становления. В рамках курса раскрываются предмет, основные принципы психологии управления, личность в управленческих взаимодействиях, управление поведением личности, психология управления групповыми явлениями и процессами, психологические особенности личности руководителя, индивидуальный стиль управления, психология влияния в управленческой деятельности, управление конфликтными ситуациями.

Специализированные технологии больших данных
  • Количество кредитов - 5
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Цель дисциплины состоит в формировании способности работать с архитектурами интеграционных платформ, приложениями и сервисами высоконагруженных систем хранения и обработки больших данных. В рамках дисциплины рассматриваются следующие аспекты: Введение в специализированные технологии больших данных. Платформы обработки сверхбольших данных CLAVIRE 2.0. ASPEN – платформа всесторонней оценки систем обработки потоковой информации. Расширенная платформа SparkStreamingс интегрированным механизмом планирования. Оптимизация размещения больших данных. Семантическое хранилище Exarch. Блокчейн технологии в задачах хранения данных.

Приведены данные за 2021-2024 гг.

дисциплины

Архитектуры нейронных сетей для глубокого обучения
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Цель дисциплины состоит в формировании способности проводить визуальное проектирование нейронных сетей, использовать графический интерфейс для переноса слоев нейронной архитектуры, производить настройку и развертывание моделей с помощью популярных сред глубокого обучения. В рамках дисциплины рассматриваются следующие аспекты: Введение в глубокое обучение. Практические аспекты глубокого обучения. Глубокие сети прямого распространения. Рекуррентные и рекурсивные сети. Продвинутые алгоритмы глубоких нейронных сетей. Настройка гиперпараметров. Регуляризация и оптимизация. Пакетная нормализация и программирование фреймворков. Сверточные нейронные сети. Оптимизация гиперпараметров. Визуальное проектирование нейронных сетей. Защищенная облачная инфраструктура.

Визуализация данных
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Цель дисциплины состоит в формировании способности использовать методы и приложения обнаружения шаблонов в интеллектуальном анализе данных, создавать и интерпретировать визуализацию. В рамках дисциплины рассматриваются следующие аспекты: История развития визуализации. Основные понятия и направления в визуализации. Данные: абстракции данных и их типы. Алфавит визуализации. Эскизирование и проектирование визуализационных решений. Визуальное восприятие человека. Осознание образов. Восприятие цвета. Задачи: абстракции задач и способы их постановки. Человеко-компьютерное взаимодействие. Визуализация данных. Сети и графы. Визуализация текста и документов. Визуализация пространственных данных. Объемы, потоки, карты. Социальная визуализация. Анализ социальных данных. Визуализация для социума. Визуализация и искусство. Визуализация как искусство.

Глубокое обучение
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Курс охватывает следующие аспекты: aрхитектура глубоких нейронных сетей; настройка гиперпараметров и платформ глубокого обучения; сверточные нейронные сети, их приложения; классификация объектов и подобные методы; сверточные нейронные сети, их приложения; рекуррентные нейронные сети, их приложения; параллельные алгоритмы глубокого обучения; ускорение обучения нейронной сети.

Методы и модели многомерного анализа данных
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Цель дисциплины состоит в формировании способности применять современные многомерные статистические методы и современные программные системы при решении задач анализа различных процессов и явлений. В рамках дисциплины рассматриваются следующие аспекты: Вероятностные модели для одномерных и многомерных случайных величин.

Методы машинного обучения для обработки промышленных данных
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Цель дисциплины сформировать способность оценивать особенности промышленных данных, разрабатывать методы машинного обучения для анализа и визуализации промышленных данных. Содержание дисциплины: Промышленные данные. Платформы промышленных данных. Использование промышленных данных. API интеграции. Методы машинного обучения для промышленных данных. Обучение с учителем. Обучение без учителя. Обучение с подкреплением. Мониторинг состояния и цифровые двойники

Нейронные сети
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Цель дисциплины состоит в формировании способности строить, обучать и применять глубокие нейронные сети для решения задач анализа данных, требующих больших вычислительных ресурсов. Содержание дисциплины: Архитектура нейронных сетей. Неглубокие нейронные сети. Ключевые вычисления, лежащие в основе глубокого обучения. Построение и обучение глубоких нейронных сетей. Настройка гиперпараметров, регуляризация и оптимизация. Оценка качества обучения.

Облачные решения для машинного обучения
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Цель дисциплины состоит в формировании способности применять инженерию машинного обучения и инфраструктуру облачных вычислений для создания облачных приложений прогнозной аналитики. Содержание дисциплины: Основы облачных вычислений. Базовая инфраструктура облачных вычислений. Облачная виртуализация. Контейнеры и API. Облачная инженерия данных. Использование AutoML. Стратегии MLOps и передовые методы разработки облачных решений. Стратегии Edge Machine Learning. Использование AI API.

Обработка и анализ данных
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Цель дисциплины состоит в формировании способности выполнять анализ и обработку данных с помощью MATLAB, создавать приложения для прогнозного моделирования. В рамках дисциплины рассматриваются следующие аспекты: Принципы обработки и анализа данных Импорт данных. Визуализация и фильтрация данных. Выполнение расчетов.

Построение и анализ алгоритмов
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Цель дисциплины состоит в формировании способности реализовывать высокоэффективные алгоритмы и структуры данных для фундаментальных вычислительных задач в различных областях. В рамках дисциплины рассматриваются следующие аспекты: Основные алгоритмы: асимптотическая запись, рекурсия, парадигма «разделяй и властвуй», базовые структуры данных. Сбалансированные бинарные деревья, 2-3 дерева, B-деревья, структуры для множеств, хеширование, сжатие текста (кодирование Хаффмана). Применение алгоритмов максимального потока Рандомизированный выбор и сортировка. Автоматы, сопоставление строк (алгоритм Бойера и Мура, алгоритм Кнута-Морриса-Пратта), сопоставление с образцом. Классы сложности P и NP, NP-полнота, некоторые NP-полные задачи. Стратегии параллельного дизайна. Алгоритмы распределенных вычислений.

Прикладное машинное обучение
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Цель дисциплины состоит в формировании способности использовать инструменты манипулирования данными для решения задач машинного обучения, разрабатывать алгоритмы для интеллектуального анализа данных. В рамках дисциплины рассматриваются следующие аспекты: Логические методы: решающие деревья и решающие леса. Метрические методы классификации. Линейные методы, стохастический градиент.

Прикладной кластерный анализ
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Цель дисциплины сформировать способность применять различные алгоритмы кластеризации данных для решения прикладных задач, визуализировать сформированные кластеры и анализировать результаты. Содержание дисциплины: Введение в кластеризацию. Метод K-means и модификации. Иерархическая кластеризация. Организация кластеров в виде иерархического дерева. Алгоритм модели гауссовой смеси. Метрики расстояния, используемые в кластеризации. Определение подходящего количества кластеров. Оценка эффективности кластеризации.

Программирование для data science
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Цель дисциплины состоит в формировании способности применять методы получения, преобразования и предобработки данных, разрабатывать программное обеспечение для анализа и визуализации данных. Содержание дисциплины: Преобразование необработанных данных в структурированный вид. Разработка конвейера анализа данных. Обработка данных. Визуализация данных. Взаимодействие с фреймворками машинного обучения. Разработка программного обеспечения для анализа и визуализации данных.

Приведены данные за 2021-2024 гг.

ПРАКТИКИ

Исследовательская
  • Тип контроля - Защита практики
  • Описание - Цель практики: приобретение опыта в исследовании актуальной научной проблемы, расширение профессиональных знаний, полученных в процессе обучения, и формирование практических навыков ведения самостоятельной научной работы. Практика направлена на развитие навыков исследования, анализа и применения экономических знаний.

Педагогическая
  • Тип контроля - Защита практики
  • Описание - Цель дисциплины: формирование способности осуществлять педагогическую деятельность в вузах, проектировать образовательный процесс и проводить отдельные виды учебных занятий с использованием инновационных образовательных технологий.

Приведены данные за 2021-2024 гг.