Магистратура
Вычислительная лингвистика

Вычислительная лингвистика

КВАЛИФИКАЦИЯ

  • Научно-педагогическое направление - магистр технических наук

МОДЕЛЬ ВЫПУСКНИКА

По завершении данной образовательной программы ожидается, что магистранты будут способны:
1.обсуждать методологии и технологические достижения в области вычислительной лингвистики и обработки естественного языка;
2.выбирать методологии и технологии для решения задач обработки естественного языка;
3. использовать средства автоматизированного перевода текста;
4. анализировать грамматическую систему казахского и других языков;
5. сравнивать и противопоставлять языки с точки зрения систематических различий в фонетике, фонологии, морфологии, синтаксисе и семантике;
6. использовать инструменты ОЕЯ для анализа больших наборов документов, определения тематики и реферирования;
7. разработать языковые ресурсы и инструменты казахского языка;
8. разработать ресурсы и инструменты ОЕЯ (обработка естественного языка);
9. создать параллельные и сопоставимые корпуса между казахским и иностранными языками;
10. вносить собственный оригинальный вклад в развитие сферы вычислительной лингвистики: подготовить на основе резуль¬татов выполненных исследований публикации, научно-техни¬ческие отчеты, отзывы;
11. вести научно-педагогическую деятельность, участво¬вать в раз¬работке образовательных и методических материалов для преподавания дисциплин по направлению образовательной программы «Вычислительная лингвистика»;
12. формировать решения проблем, основанные на исследованиях в области информационных систем, путем интеграции знаний из новых или междис-циплинарных областей и с учетом социальных, этических, лингвистических и научных соображений.

Паспорт программы

Название
Вычислительная лингвистика
Шифр
7M06101
Факультет
Информационных технологий

дисциплины

Введение в программирование для обработки естественного языка (Python, R, Prolog)
  • Количество кредитов - 6
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Цель дисциплины формирование у магистрантов способности создавать программы для обработки естественного языка с целью повышения эффективности их последующего использования. Основным фокусом дисциплины является изучение языка программирования Python, который является одним из стандартных инструментов обработки естественного языка.

Иностранный язык (профессиональный)
  • Количество кредитов - 6
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Цель дисциплины: сформировать практические навыки в различных видах речевой деятельности на иностранном языке. Учебный курс формирует способность воспринимать, понимать и переводить информацию в современном глобальном пространстве, участвовать в научных мероприятиях для апробации собственных исследований. Дисциплина направлена на совершенствование компетенций в соответствии с международными стандартами иноязычного образования.

История и философия науки
  • Количество кредитов - 3
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Цель дисциплины - рассматривается на основе исторической динамики и в исторически изменяющемся социокультурном контексте. Знакомит с проблемами феномена науки, являющегося предметом специального философского анализа, формирует знания об истории и теории науки, закономерностях развития науки и структуре научного знания, особенностях науки как профессии и социального института, роли науки в развитии общества.

Методы машинного обучения в обработке естественного языка
  • Количество кредитов - 5
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - В содержание дисциплины входит выявление видов задач, решаемых методами машинного обучения, и выбор подходящих методов; изучение методов классификации (метрических, логических, линейных), методов прогнозирования , методов кластеризации, методов композиции алгоритмов; построение различных моделей машинного обучения и рассмотрение способов оценки качества моделей.

Онтологии и семантические технологии
  • Количество кредитов - 5
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Цель дисциплины формирование способностей магистрантов проектировать и реализовать программные решения в сфере семантических технологий. При изучении дисциплин будут рассмотрены следующие аспекты: цели и задачи использования методов и средств представления знаний, основные типы представления информации и знаний и др.

Организация и планирование научных исследований (англ.)
  • Количество кредитов - 6
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Цель дисциплины: сформировать способность самостоятельно вести научный поиск, ставить конкретные научные задачи и знать методы и приемы их решения для создания научной работы. Дисциплина изучает: формы и методы планирования, организации и оформления научных статей и диссертации; формы обобщения результатов научных исследований в презентациях, выступлениях, проектах, статьях.

Педагогика высшей школы
  • Количество кредитов - 5
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Цель – формирование способности к педагогической деятельности в вузе на основе знаний дидактики высшей школы, теорий воспитания и менеджмента образования, анализа и самооценки преподавательской деятельности. Курс рассматривает проектирование образовательной деятельности будущего преподавателя с применением КТО, реализации Болонского процесса, овладения лекторским, кураторским мастерством с использованием стратегий и методов обучения/воспитания и оценивания (TLA-стратегий).

Понимание естественного языка
  • Количество кредитов - 6
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Цель дисциплины: Дисциплина нацелена на овладение магистрантами основами автоматической обработки текстов, написанных на естественном языке. Это предполагает не только умение использовать готовые приложения для лингвистического анализа, но и понимание принципов их работы, а также знакомство с базовыми математическими моделями, лежащими в основе современной компьютерной лингвистики.

Психология управления
  • Количество кредитов - 3
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Цель дисциплины: сформировать способность применять важнейшие аспекты сферы управления в процессе профессионального становления. В рамках курса раскрываются предмет, основные принципы психологии управления, личность в управленческих взаимодействиях, управление поведением личности, психология управления групповыми явлениями и процессами, психологические особенности личности руководителя, индивидуальный стиль управления, психология влияния в управленческой деятельности, управление конфликтными ситуациями.

Технологии машинного перевода
  • Количество кредитов - 9
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Цель дисциплины формирование способностей магистрантов работать с системами машинного перевода для разработки эффективных алгоритмов машинного перевода. В результате изучения дисциплины обучающийся будет способен: применять полученные при разработке автоматических систем результаты для извлечения новых знаний о естественном языке; оценивать гибридные и статистические подходы и приемы машинного обучения.

Технологии программирования для NLP
  • Количество кредитов - 5
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Цель дисциплины изучить язык Python и научиться применять его для решения задач анализа данных и машинного обучения в NLP . Основные конструкции и идиомы языка Python;, использовать и применять углубленные знания в области в NLP

Формальные грамматики
  • Количество кредитов - 5
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Цель дисциплины формирование способности магитстрантов работать с формальными грамматиками естественных языков для совершенствования моделей обработки естественных языков. демонстрировать понимание формального аппарата для описания алгоритмических языков: системы регулярных выражений, контекстно-свободные грамматики, конечные автоматы без памяти и со стековой памятью;

Приведены данные за 2021-2024 гг.

дисциплины

Анализ языка
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Понятие языкового знака и системы. Язык как средство представления информации. Уровни анализа языка- Лексический, Морфологический Семантический анализ и синтез. Денотативные аспекты слова, словосочетание. Предложение и способы автоматического обнаружения синтаксической структуры. Проблемы генерации предложений и текста.

Вычислительная морфология
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Цель дисциплины формирование способности магистрантов работать с формальными моделями автоматической обработки текстов на естественном языке для задач машинного обучения. применять в исследовательской и прикладной деятельности современные языки программирования и языки манипулирования данными, операционные системы, пакеты программ и т.д.;

Глубокое обучение
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Цель дисциплины формирование способности использования моделей и методов глубокого обучения для внедрения, обучения и валидации нейронных сетей, а также улучшение понимания текущих исследований в области обработки текстов. Применять инструменты и проектировать и реализовывать системы глубокого обучения к решению практических задач обработки и анализа текстов;

Интеллектуальный анализ данных
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Целью дисциплины является формирование способностей использовать теоретические и практические знания при работе с данными различных объемов и сложности. Дисциплина направлена на изучение методов сбора данных, их обработки и анализа для дальнейшего выявления закономерностей, присущих изучаемому явлению.

Информационные технологии для NLP
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Изучение современных информационных технологии и инструментов для NLP. Уровни анализа языка. Лексический уровень языка в автоматической обработке. Денотативные аспекты слова, словосочетание. Предложение и способы автоматического обнаружения синтаксической структуры. Способы кодирования смыслового содержания текста и автоматической его обработки. Естественно-языковые интерфейсы.

Машинное обучение в обработке естественного языка
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Цель дисциплины формирование глубоких теоретических знаний в области машинного обучения, включая дискриминантный, кластерный и регрессионный анализ, овладение навыками практического решения задач интеллектуального анализа данных; а также формирование способностей использования стандартных программных пакетов для машинного обучения и реализация линейных и нелинейных моделей для классификации данных.

Методы поиска и извлечения информации
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Цель дисциплины: формирование у магистрантов необходимой теоретической базы и практических навыков, которые позволят всесторонне и системно понимать современные проблемы прикладной математики и информатики, проблемы обработки и анализа информации и методы извлечение данных.

Модели и методы нейронных сетей в NLP
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Курс вводит в проблематику обработки естественных языков и машинного обучения, формирует знания о простых и продвинутых векторных представлениях слов, архитектуре и моделях нейронных сетей. изучение вопросов конструирования сетей, обучения и подбора параметров; изучение рекуррентных и рекурсивных нейронных сетей и их применении в областях NLP.

Обработка речи
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Цель дисциплины сформировать способность применения скрытых марковских моделей для моделирования изменяющихся во времени сигналов, принципов языкового моделирования и стратегий уменьшения шумовых сигналов, методов глубокого обучения для создания современных систем обработки разговорного языка.

Онтологии, семантические технологии
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Цель дисциплины формирование способностей магистрантов проектировать и реализовать программные решения в сфере семантических технологий. При изучении дисциплин будут рассмотрены следующие аспекты: цели и задачи использования методов и средств представления знаний, основные типы представления информации и знаний и др.

Понимание естественного языка
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Дисциплина нацелена на овладение магистрантами основами автоматической обработки текстов, написанных на естественном языке. Это предполагает не только умение использовать готовые приложения для лингвистического анализа, но и понимание принципов их работы, а также знакомство с базовыми математическими моделями, лежащими в основе современной компьютерной лингвистики.

Статистические методы для обработки естественного языка
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Цель дисциплины изучение различных статистических методов, обычно используемых в обработке естественного языка, и изучение способов применения этих методов к различным языковым проблемам. Этот курс охватывает широкий спектр тем в обработке естественного языка, , классификацию текста и лексическое устранение неоднозначности.

Технология сентимент анализа
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Цель дисциплины – формирование теоретических знаний о методах и инструментах, используемых для сентимент анализа, об областях применения сентимент анализа, а также практических навыков в сборе данных, предобработке текстов, определении настроений, классификации настроений и визуализации результатов.

Формальные грамматики
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Цель дисциплины формирование способности магитстрантов работать с формальными грамматиками естественных языков для совершенствования моделей обработки естественных языков; анализировать алгоритмы лексического, синтаксического и семантического анализа, реализуемые соответствующими конечными автоматами; оценивать методы генерации объектного кода для конкретной целевой машины.

Языковые ресурсы
  • Тип контроля - [РК1+MT+РК2+Экз] (100)
  • Описание - Цель дисциплины формирование способности магистрантов работать с языковыми ресурсами и базами данных для вычислительной лингвистики для их использования в обработке текстов языка; использовать принципы сохранения целостности и поддержки безопасности в базах данных; создавать запросы к базам данных.

Приведены данные за 2021-2024 гг.

ПРАКТИКИ

Исследовательская
  • Тип контроля - Защита практики
  • Описание - Цель практики: приобретение опыта в исследовании актуальной научной проблемы, расширение профессиональных знаний, полученных в процессе обучения, и формирование практических навыков ведения самостоятельной научной работы. Практика направлена на развитие навыков исследования, анализа и применения экономических знаний.

Педагогическая
  • Тип контроля - Защита практики
  • Описание - Формирование практических и учебно-методических навыков проведения лекционных, семинарских занятий, творчески применять в педагогической деятельности научно-теоретические знания, практические навыки, проводить учебные занятия по дисциплинам специальности; владеть современными профессиональными приемами, методами организации обучения; использовать на практике новейшие теоретические, методологические достижения, составлять учебно-методическую документацию, организовывать воспитательную работу со студентами.

Приведены данные за 2021-2024 гг.