ПЛАНЫ ПРАКТИЧЕСКИХ ЗАНЯТИЙ
Занятие 1.
Тема: Математическая лингвистика и ее приложения.
План
1. Истоки математической лингвистики как новой научной дисциплины.
- Мощность грамматики и проблема распознавания формальных и естественных языков
- Неукорачивающие грамматики, НС- грамматики, КС-грамматики, КЗ-грамматики, категориальных грамматики и грамматики с автоматной памятью.
- Проблема выделения в естественном языке ядра, соответствующего определенным классам формальных грамматик. Распознающие и порождающие грамматики. Проблема полноты распознавания.
- Грамматика зависимостей и грамматика составляющих как два основных способа представления дерева подчинения. Эквивалентность двух способов представления дерева подчинения.
- Совершенствование теории формальных грамматик и математической лингвистики в 1980-2010-е гг.
Основная литература:
- Норберт Винер. Кибернетика, или управление и связь в животном и машине. 2-е изд., М., 2008.
- А.В.Гладкий, И.А. Мельчук. Элементы математической лингвистики. М., Наука. 2009.
Дополнительная:
- Тестелец Я.Г. Введение в общий синтаксис. М: РГГУ, 2001.
- Хомский Н. Аспекты теории синтаксиса. Пер. с англ. М.: МГУ, 1972.
- Математическая лингвистика. Отв. Ред. С.К.Шаумян. М., 1973.
- Ч.Мидоу. Анализ информационных систем. М., Прогресс, 1977.
- Мельников Г.П. Системология и языковые аспекты кибернетики. М.: Советское радио, 1983.
- Chomsky N. Rules and Representations, New York: Columbia University Press, 2005.
• Clark, Brady Zack. 2005.On stochastic grammar. Language 81(1), pp. 207217.
Занятие 2
Тема: Формальные грамматики и их естественно-языковые соответствия.
План
- Формализация естественного языка и поиск интуитивных соответствий классам формальных граммати.
- Понятия дерева подчинения и виды синтаксических деревьев.
- Соотношение линейного порядка и иерархической структуры. Бинарные проективные деревья составляющих и их линвгистические свойства. Феномен непроективности и его проявления в естественных языках.
- Древоприсоединяющие грамматики (Tree-adjoining grammars) Джоши, и Минималистские грамматики Стейблера.
- Понятия доминации, структурного приоритета, предшествования и непосредственного предшествования.
- Понятия перемещения поддерева (Move), слияния поддеревьев (Merge), скрэмблинга и Барьеров.
Основная литература:
- Казенин К.И., Тестелец Я.Г. Исследование синтаксических ограничений в генеративной грамматике. // Фундаментальные направления современной американской лингвистики /А.А.Кибрик, И.М.Кобозева, И.А.Секерина. М: МГУ, 1997, С. 58-109.
- А.В.Гладкий. Формальные грамматики и языки. М., Наука, 1973.
- Stabler, E.: Derivational Minimalism. // LACL '96: Selected Papers from the 1st International Conference on Logical Aspects of Computational Linguistics. Volume 1328 of Lecture Notes in Computer Science., London, UK, Springer-Verlag (1997) P. 68-95.
- Chomsky, N.: The Minimalist Program. The MIT Press, Cambridge, USA (1995).
• Падучева Е.В. О семантике синтаксиса. Материалы к трансформационной грамматике русского языка. М., Наука. 2-изд. М., УРСС, 2007.
Дополнительная:
- Язык и интеллект. Сб. Пер. с англ. и нем. Сост. и вступ.статья В.В.Петрова. М., Прогресс, 1996.
- А.В.Гладкий, И.А. Мельчук. Элементы математической лингвистики.
М., Наука. 1969.
- Г.Е.Крейдлин, А.Д.Шмелев. Математика помогает лингвистике. Книга для учащихся. Серия «Мир Знаний». М., Просвещение, 1994.
- Ковтунова И.И. Порядок слов в русском языке. М.: УРСС, 2-е изд., 2002.
- Chomsky, N.: Derivation by phase. //Kenstowicz, M., ed.: Ken Hale: A Life in Language. The MIT Press, Cambridge, USA (2001) 1-52.
Занятие 3
Тема: Лингвистический процессор
План
- Уровневая структура естественного языка.
- Понятие автоматического (машинного) перевода.
- Модель «Смысл-Текст» И.А.Мельчука - А.К.Жолковского как обоснование лингвистического процессора на основе грамматики зависимостей.
- Системы «Этап», «Этап 2» и «Этап 3» и их применение для формализации русского языка.
- Вопросы синтаксиса и семантики в системах класса «Этап».
- Словарная и грамматическая информация в системах класса «Этап».
Основная литература:
• «Компьютерная лингвистика и интеллектуальные технологии». Выпуск 9 (16). По материалам международной конференции «Диалог 2010». М., Изд-во РГГУ, 2010.
• Ю.Д.Апресян, И.М.Богуславский, Л.Л.Йомдин, В.З.Санников.
Теоретические проблемы русского синтаксиса. Взаимодействие грамматики и словаря.М., Языки славянских культур, 2010.
• Igor Boguslavsky, Leonid Iomdin, Victor Sizov, Leonid Tsinman, Svetlana Timoshenko. Interfacing the Lexicon and the Ontology in a Semantic Analyzer // COLING 2010. Proceedings of the 6th workshop on Ontologies and Lexical Resources (Ontolex 2010). Bejing, 2010.
•
Дополнительная литература:
- Лингвистический процессор для сложных информационных систем/ Ю.Д.Апресян, И.М.Богуславский, Л.Л.Иомдин и др. М., Наука, 1992.
- Л.Л.Иомдин. Автоматическая обработка текста на естественном языке: модель согласования. М., Наука, 1990.
- И.А.Мельчук. Русский язык в модели «Смысл - Текст». Москва-Вена: Языки славянской культуры, 1995.
- О.С.Кулагина. Исследования по машинному переводу. М., Наука,
1979.
Занятие 4
Тема: Модели Парсинга.
План
1. Понятия парсера и парсинга.
- Грамматически-ориентированные (grammar-driven) и корпусно-ориентированные (data-driven) модели парсинга.
- Левое и правое ветвление синтаксической структуры. Неоднозначные предложения и снятие омономии.
- Понятие глубины памяти и гипотеза Ингве. Машина Тьюринга.
- Алгоритмы отбора правильной синтаксической структуры. Время решения как критерий эффективности парсинга
Основная литература:
- Michael I.Dehktyar, Alexander Ja. Dikovsky. Generalized Categorial Dependency Grammars // Pillars of Computer Science, 2008, P.230-255.
- Епифанов М.А., Антонова А.Ю., Баталина А.М., Кобзарева Т.Ю.
Итеративное применение алгоритмов снятия частеречной омонимии в русском тексте. // «Компьютерная лингвистика и интеллектуальные технологии». Выпуск 9 (16). По материалам международной конференции «Диалог 2010». М., Изд-во РГГУ, 2010. С. 119-123.
• Kibrik Andrej A. Reference in Discourse. Oxford: OUP, 2011.
Дополнительная литература:
- Йокояма О. Когнитивная модель дискурса и русский порядок слов. М.: Языки славянской культуры, 2005.
- Старостин А.С., Арефьев Н.В., Мальковский М.Г. Синтаксический анализатор «Treevial». Принцип динамического ранжирования гипотез. «Компьютерная лингвистика и интеллектуальные технологии». Выпуск 9 (16). По материалам международной конференции «Диалог 2010». М., Изд-во РГГУ, 2010, 477-490.
- Тестелец Я.Г. Введение в общий синтаксис. М: РГГУ, 2001.
- Carl Pollard, Ivan A.Sag. Head-Driven Phrase Structure Grammar. Chicago: University of Chicago Press, 1994.
• HPSG homepage: http://www.ling.ohio-state.edu/research/hpsg/
• Cahill, Aoife, John T. Maxwell III, Paul Meurer, Christian Rohrer, and Victoria Ros'en. 2008b. Speeding up LFG parsing using c-structure pruning. In Coling 2008: Proceedings of the workshop on Grammar Engineering Across Frameworks, pp. 33--40. Manchester, England: Coling 2008 Organizing Committee. http://www.aclweb.org/anthology/W08-1705.
Занятие 5 Тема: Языковые онтологии
План
- Понятие информационно-поискового тезауруса.
- Структура статьи информационно-поискового тезауруса.
- Тезаурусы и базы данных в системах извлечения информации.
- Понятие языковой онтологии.
- Построение онтологии для фрагментов естественного языка.
- Онтологии высшего и среднего уровня в системах SUMO и OPENSYS.
Основная литература:
- Raskin, Victor, Hempelmann, Christian F., Taylor Julia M. Догадка или знание: два подхода к семантике при обработке естественного языка. // «Компьютерная лингвистика и интеллектуальные технологии». Выпуск 9 (16). По материалам международной конференции «Диалог 2010». М., Изд-во РГГУ, 2010, 642- 650.
- Nirenburg S. and Raskin V. Ontological Semantics. Cambridge, MA: MIT
Press, 2004.
- SUGGESTED UPPER MERGE ONTOLOGY (SUMO) www.ontologyportal.org. (SUMO)
- www.opencyc.org (CYC)
- http://wordnet.princeton.edu (WordNet)
Дополнительная:
- Кобозева И.М., Марушкина А.С. Онтология силовых процессов. // «Компьютерная лингвистика и интеллектуальные технологии». Выпуск 9 (16). По материалам международной конференции «Диалог 2010». М., Изд-во РГГУ, 2010, 192-199.
- Лукашевич Н.В. Квазисинонимы в лингвистических онтологиях. // «Компьютерная лингвистика и интеллектуальные технологии». Выпуск 9 (16). По материалам международной конференции «Диалог 2010». М., Изд-во РГГУ, 2010 , 137-312.
Занятие 6
Тема: Синтез речи и мультимодальные системы
План
- Системы извлечения информации.
- Синтез речи.
- Понятие речевого клона.
- Понятие многофакторных процессов.
- Моделирование многофакторных ситуаций в языковой деятельности 6.Мультимодальные системы.
7. Использование виртуальных собеседников (роботов) в модели диалога.
Основная литература:
- А.Н.Баранов. Введение в прикладную лингвистику. М.: УРСС, 2008.
- Б.М.Лобанов, Л.И.Цирульник. Компьютерный синтез и клонирование речи. Минск.: Белорусская наука, 2008.
- Yorick Wilks. Is a Companion a distinctive kind of relationship with a machine? //«Компьютерная лингвистика и интеллектуальные
технологии». Выпуск 9 (16). По материалам международной конференции «Диалог 2010». М., Изд-во РГГУ, 2010, 659-668.
Дополнительная:
- Норберт Винер. Кибернетика, или управление и связь в животном и машине. 2-е изд., М., 1983.
- Wilks Y. (ed). Artificial Companions in Society: scientific, economic,
psychological and philosophical perspective. Amsterdam: John Benjamins.
2010.
• Кибрик А.А., Добров Г.Б., Залманов Д.А.,Линник А.С., Лукашевич
Н.В. Референциальный выбор как многофакторный вероятностный процесс. «Компьютерная лингвистика и интеллектуальные технологии». Выпуск 9 (16). По материалам международной конференции «Диалог 2010». М., Изд-во РГГУ, 2010, 173-180.
Занятия 7-8
Тема: Корпусная лингвистика и корпуса текстов
План
- Понятия корпуса текста и корпусной лингвистики.
- Аннотированные корпуса текстов естественных языков и их структура. 3.Национальный корпус Русского языка, его структура и возможности навигации.
4. Соотношение традиционной и корпусной лингвистики. Проблема
языковой нормы и соотношения синхронного и диахронного срезов в
корпусах текстов.
5. Панхронические тенденции и статистическая оценка узуса.
6. Понятие морфологической дезамбигуации. Синтаксическая и
прагматическая дезамбигуация предложений.
7. Разрешение неоднозначности в корпусах текстов со снятой амбигуацией. 8.
Понятия лемм и тэгов.
9. Наиболее распространенные системы тэггинга.
Основная литература:
- Национальный корпус русского языка. http://ruscorpora.ru/
- Корпусные исследования по русской грамматике. М.: Пробел-2000, 2009.
- Кибрик А.А., Подлесская В.И. Рассказы о сновидениях. Корпусное исследование устного русского дискурса // М., Языки славянских культуры, 2009.
Дополнительная:
• Недолужко А.Ю.Кореферентные отношения в тексте - сравнительный анализ размеченных данных. //«Компьютерная лингвистика и интеллектуальные технологии». Выпуск 9 (16). По материалам международной конференции «Диалог 2010». М., Изд-во РГГУ, 2010,
350-355.
• Hajicova Eva и др. PDT 2.0- Guide, UFLA & GKL, 2006. http: //ufal .mff.cuni .cz./pdt2.0.