Menotec - Menotec

Menotec был инфраструктурным проектом, финансируемым Норвежский исследовательский совет (2010–2012) с целью расшифровки и аннотирования текстовый корпус из Старый норвежский тексты.[1]

Описание

Переписанные тексты были (и будут) опубликованы в Архив средневековых скандинавских текстов, а аннотированные тексты опубликованы в древовидной структуре проекта PROIEL,[2] а также доступ к ним через портал INESS.[3] Финансирование проекта длилось три года с 2010 по 2012 год, но работа над проектом продолжается в новых условиях.

В качестве первого шага были сделаны транскрипции восьми центральных рукописей древне-норвежских законов, содержащих ок. 480 000 слов. Транскрипции были сделаны Анной К. Хорн, а затем проверены несколькими коллегами из Университета Осло:

- Holm perg 34 4to (рука f, ок. 1276–1300), отчасти написана писцом Эйрикром Орндарсоном (рука f), которую часто называют codex optimus из Ландслонг Магнус Хаконарсонар (Свод законов Магнуса Хаконарсона Законодателя)
- AM 78 4to (приблизительно 1276–1300)
- AM 302 fol (ок. 1300), писец Жоргейр Хаконарсон
- AM 305 fol (рука a, ок. 1300), писец Торгейр Хаконарсон (рука a)
- AM 56 4to (ок. 1300), писец Жоргейр Хаконарсон.
- Holm Perg 30 4to (рука b, ок. 1300–1325)
- AM 60 4to (рука b, ок. 1320), используется как базовый кодекс для Ландслонг Магнус Хаконарсонар в редакции Norges Gamle Love, т. 2
- Upps DG 8 I (руки a и b, ок. 1300–1350)

Все, кроме AM 78 4включить Ландслиг Магнус Хаконарсонар (заключено в 1276 г.), и большинство из них также содержат несколько других текстов законов.

На втором этапе была сделана полная лингвистическая аннотация к четырем основным старонорвежским рукописям:

- Старая норвежская книга проповедей, Гаммельнорск гомилибок, в AM 619 4to (ок. 1200–1225)
- Легендарная сага о Святом Олафе, Láfs saga ins helga, в Upps DG 8 II (ок. 1225–1250)
- Strengleikar в Upps DG 4–7 4to (около 1270 г.)
- Ландслонг Магнус Хаконарсонар в вышеупомянутой мс. Holm Perg 34 4to (ок. 1276–1300)

Эти четыре mss. были аннотированы морфологически (добавляя лемму и грамматическую форму каждого слова), а также синтаксически. Синтаксическая аннотация основана на анализе зависимостей, поскольку он был разработан в проекте PROIEL.

Корпус этих четырех mss. насчитывает ок. 200 000 слов, но в ближайшие годы будет увеличено по крайней мере на прибл. 50 000 слов. Menotec - первый проект, предлагающий синтаксическую аннотацию древненорвежского языка. На сайте PROIEL,[4] древненорвежские тексты присоединятся к центральному древнеисландскому произведению - Поэтической Эдде в GKS 2365 4to (рукопись, которую часто называют Кодекс Региус ). Стихи Эддика аннотированы в том же духе, что и тексты Менотека. Кроме того, на сайте PROIEL можно найти несколько других раннегерманских и романских текстов.

Проект Menotec возглавлял Кристиан-Эмиль Оре из Университета Осло, и в него вошли несколько других участников этого университета: Карл Г. Йоханссон, Анна К. Хорн, Сигне Лааке, Кари Кинн, Даг Хауг и Ханне Экхофф. Университет Бергена был партнером проекта, и в этом университете Odd Einar Haugen руководил лингвистической аннотацией. Также из Бергена, Fartein Th. Оверланд участвовали в проекте, а из Исландии - Харальдур Бернхарссон и Эйрикур Кристьянссон. Название Menotec на самом деле не является аббревиатурой, а происходит от названия проекта Menota (которое, в свою очередь, является аббревиатурой от Архив средневековых скандинавских текстов ).

Рекомендации по аннотации были опубликованы Haugen и Øverland и доступны в параллельных версиях на норвежском и английском языках. Retningslinjer[5] и Руководящие указания.[6] Эти рекомендации объясняют условные обозначения морфологической и синтаксической аннотации, а также дают прагматическое введение в анализ зависимостей для древненорвежского языка, охватывая широкий спектр проблем с аннотациями, возникших в ходе проекта.

Дополнительную информацию о кодировании и аннотации средневековых скандинавских источников можно найти на сайте Архив средневековых скандинавских текстов. Поскольку тексты были переписаны на дипломатическом уровне, для отображения текстов необходимы некоторые специальные символы. Кодировка этих символов соответствует рекомендациям Средневековый шрифт Unicode, а несколько подходящих шрифтов можно бесплатно скачать с сайта этого проекта.

Смотрите также

Рекомендации

внешняя ссылка