Модель дерева - Википедия - Tree model

Кладистическое представление Языковая семья майя, вернувшись на 4000 лет назад. (Цифры представляют собой предполагаемые исторические даты в Западный календарь ).

В историческая лингвистика, то модель дерева (также Stammbaum, генетический, или же кладистическая модель) представляет собой модель эволюции языков, аналогичную концепции семейное древо, особенно филогенетическое дерево в биологическая эволюция из разновидность. Как и в случае с видами, предполагается, что каждый язык произошел от единственного родителя или «материнского» языка, причем языки, которые имеют общего предка, принадлежат к одному и тому же языковая семья.

Популяризованный немецким лингвистом Август Шлейхер в 1853 г.,[1][2] древовидная модель всегда была обычным методом описания генетические отношения между языками с момента первых попыток сделать это. Это центральное место в области сравнительное языкознание, который включает использование свидетельств из известных языков и наблюдаемых правил эволюции языковых особенностей для выявления и описания гипотетических протоязыки наследственные каждой языковой семье, например Протоиндоевропейский и Индоевропейские языки. Однако это в значительной степени теоретическое качественное исследование, и лингвисты всегда подчеркивали неотъемлемые ограничения модели дерева из-за большой роли, которую играет горизонтальная передача в развитии языка, начиная от заимствования к креольские языки с несколькими родными языками.[1] В волновая модель был разработан в 1872 году учеником Шлейхера Йоханнес Шмидт в качестве альтернативы модели дерева, которая включает горизонтальную передачу.[3]

Древовидная модель также имеет те же ограничения, что и биологическая таксономия, в отношении проблема вида из квантование постоянное явление, которое включает исключения, такие как виды колец в биологии и диалект континуум на языке. Концепция связь был разработан в ответ и относится к группе языков, которые произошли из диалектного континуума, а не из лингвистически изолированных дочерних языков одного языка.[2]

История

Ветхий Завет и Святой Августин

Генеалогическое древо библейских племен

Августин Гиппопотам предположил, что каждый из потомков Ной основали нацию, и что каждой нации был дан свой язык: Ассирийский за Ассур, иврит за Heber, и так далее.[4] Всего он выделил 72 народа, основателей племен и языков. Путаница и разброс произошли во времена Пелег, сын Хевера, сын Шем, сын Ноя.[5][6] Августин сделал гипотеза мало чем в отличие от более поздних исторических лингвистов, семья Хебера «сохранила этот язык, который, как не безосновательно полагают, был общим языком всей расы ... с тех пор названный еврейским». Однако большинство из 72 языков появились на многие поколения после Хевера. Святой Августин решает эту первую проблему, предполагая, что Хевер, который жил 430 лет, был еще жив, когда Бог назначил 72 года.[7]:123

Урспрах, язык рая

Гипотеза святого Августина не подвергалась сомнению более тысячи лет. Затем в серии трактатов, опубликованных в 1684 году, в которых выражается скептицизм относительно различных верований, особенно библейских, сэр Томас Браун написал:[8]

«Хотя до потопа земля была населена многочисленными народами ... тем не менее, можно очень сомневаться в том, что после большого рассеяния и в течение шестнадцати столетий люди сохранили такой единообразный язык во всех частях ...».

Эдемский сад, дом Урспраха

К тому времени открытие Новый мир и исследование Дальний Восток принес знание числа новых языков далеко за пределы 72, вычисленных святым Августином. Ссылаясь на индейские языки, Браун предполагает, что «смешение языков сначала коснулось только тех, кто присутствовал на Синааре во время работы Вавилона…» «Для тех», кто находился у подножия холмов, где покоился ковчег ... примитивный язык мог бы со временем разветвляться на несколько частей Европы и Азия .... "[9] Это намек на дерево. С точки зрения Брауна, различия в языке объясняются упрощением от более крупного аборигенного языка, чем иврит. Он предлагает древний китайский язык, от которого произошли другие «путаница, примесь и искажение».[10] Позже он ссылается на «смешение и изменение».[11]

Браун сообщает о ряде реконструктивных действий ученых того времени:[12]

"Ученый Casaubon считает, что диалог может быть составлен на саксонском языке только из слов, производных от греческого ... Верстеган не сомневался, что сможет составить письмо, которое могло бы быть понято англичанами, голландцами и восточными фрисландцами ... Буксхорниус Скорее всего, скифский язык как родной язык распространен во всех странах Европы, и даже в Персии, многословное сообщество между столькими народами имеет более разумную трактовку и скорее происходит от общего языка, распространенного через все они. , чем от какой-либо конкретной нации, которая также занимала и держала, но из вторых рук ".

Таким образом, смятение у Вавилонской башни было устранено как препятствие, отложив его в сторону. Попытки найти сходство во всех языках привели к постепенному открытию древнего основного языка, от которого произошли все остальные языки. Браун, несомненно, писал и думал задолго до 1684 года. В том же революционном веке в Британии Джеймс Хауэлл опубликовано Том II из Epistolae Ho-Elianae, квази-вымышленные письма различным важным лицам в сфере, содержащие достоверную историческую информацию. В Письме LVIII метафора дерева языков представляется полностью развитой, если не считать точки зрения профессионального лингвиста:[13]

"Сейчас я подниму парус в Нидерланды, чей язык совпадает с английским, и так было с самого начала, поскольку оба они произошли от высокого голландского [Хауэлл ошибается]: датский также является лишь ответвлением одного и того же дерева ... Сейчас Высокий Голландский или Тевтонский язык, является одним из основных и самых обширных Материнских языков Европы ... это был язык Готы и Вандалы, и продолжает большую часть Польша и Венгрия, у которых свой вульгарный язык на диалекте ... Некоторые из ее писателей заставили бы этот мир поверить, что она была языком, на котором говорят в раю ».

Все лингвисты Европы искали «язык рая». Те, кто писал на латыни, называли это lingua prima, то lingua primaeva или lingua primigenia. В английском это был адамический язык; на немецком языке Ursprache или Hebräische Ursprache если кто-то верил, что это был иврит. Этот таинственный язык обладал аурой чистоты и нетленности, и эти качества служили стандартом для отбора кандидатов. Эта концепция Ursprache вошли в употребление задолго до неограмматики приняли его для своих протоязыков. Разрыв между широко расходящимися семействами языков оставался незамкнутым.[нужна цитата ]

Индоевропейская модель

2 февраля 1786 г. Уильям Джонс доставил его Дискурс к третьей годовщине к Азиатское общество как его президент по теме Индусы. В нем он применил логику древовидной модели к трем языкам, греческому, латинскому и санскриту, но впервые в истории чисто лингвистическим соображениям, отметив «более сильное родство как в корнях глаголов, так и в формах глаголов. грамматики, которая могла быть получена случайно; ... "Он продолжал постулировать, что они возникли из" некоего общего источника, которого, возможно, больше не существует ". К ним он добавил готский, кельтский и персидский языки как «к одной семье».[14]

Джонс не назвал свой «общий источник» и не развил идею дальше, но ее подхватили лингвисты того времени. в (Лондон) Ежеквартальный обзор конца 1813-1814 гг., Томас Янг опубликовал обзор Иоганн Кристоф Аделунг с Митридат, oder allgemeine Sprachenkunde («Митридат, или Всеобщая история языков»), том I которого вышел в 1806 году, а также тома II и III, 1809-1812, продолжил Иоганн Северин Фатер. В работе Аделунга описано около 500 «языков и диалектов» и выдвинута гипотеза о всеобщем происхождении от языка рая, расположенного в Кашмир центральное место в общем диапазоне 500. Янг начинает с того, что указывает на то, что Аделунг в долгу перед Конрад Геснер с Митридат, de Differentiis Linguarum 1555 г. и другие последующие каталоги языков и алфавиты.[15]

Кашмир (красный), местонахождение Эделунга в Эдеме

Янг обязуется представить классификацию Аделунга. В односложный шрифт - самый древний и примитивный, на нем говорят в Азии, к востоку от Эдема, в направлении выхода Адама из Эдема. Затем следует группа Джонса, по-прежнему без названия, но приписываемая Джонсу: «Другой древний и обширный класс языков, объединенных большим количеством сходств, чем вполне может быть случайным». Для этого класса он предлагает имя,[16] «Индоевропейский» - первое известное лингвистическое использование слова, но не первое известное его использование. В Британская Ост-Индская компания использовал «индоевропейскую торговлю» для обозначения торговли товарами между Индией и Европой.[17] Все свидетельства, которые приводит Янг для обозначения группы предков, являются наиболее похожими словами: мать, отец и т. Д.

Дополнительные классы Аделунга были татарским, африканским и американским, что зависело от географии и предполагаемого происхождения из Эдема. Янг не разделяет энтузиазма Аделунга по поводу языка рая и называет его в основном спекулятивным.[нужна цитата ]

Назначение Янга, успешное на английском языке, было лишь одним из нескольких кандидатов, предложенных между 1810 и 1867 годами: индо-германский (Конрад Мальте-Брун, 1810 г.), японетиск (Расмус Кристиан Раск, 1815 г.), индогерманский (Юлиус Клапрот, 1823), indisch-teutsch (F. Schmitthenner, 1826), sanskritisch (Вильгельм фон Гумбольдт, 1827), indokeltisch (А. Ф. Потт, 1840), arioeuropeo (Грациадио Исайя Асколи, 1854 г.), Арийский (Макс Мюллер, 1861) и арьяке (H. Chavée, 1867). Все эти люди были полиглотами и вундеркиндами языков. Клапрот, автор успешного кандидата немецкого языка, Indo-Germanisch, который критиковал Джонса за его некритический метод, знал китайский, японский, тибетский и ряд других языков с их письменностями. Идея библейского Урспраха поразила их воображение. Поскольку надежда найти его постепенно угасла, они вернулись к растущей концепции общего индоевропейского языка, на котором говорили кочевые племена на равнинах Евразии, и, хотя они убедительно доказали, что этот язык может быть выведен методами сравнительной лингвистики, в Дело в том, что они этого не получили. Это был единственный случай, когда их попытки найти Урспраха увенчались успехом.[нужна цитата ]

Неограммарианская модель

В самой строгой формулировке модель обязана Неограмматики. Модель опирается на более ранние концепции Уильям Джонс, Франц Бопп и Август Шлейхер добавив исключительности здравые законы и регулярность процесса. Лингвистом, возможно, наиболее ответственным за установление связи с дарвинизмом был Август Шлейхер.

Модель дерева Шлейхера

Что он сравнивал свои Stammbaum, или генеалогическое древо языков, к изложению эволюции Дарвина вскоре после этого представления, подтверждается открытым письмом, которое он написал в 1863 г. Эрнст Геккель, однако опубликовано посмертно. В 1869 году Геккель предложил ему прочитать Происхождение видов.[нужна цитата ]

Прочитав это, Шлейхер написал Дарвинистская теория и Sprachwissenschaft, «Дарвинизм проверяется наукой о языке».[18] В сценарии, напоминающем сценарий между Дарвином и Уоллесом в связи с открытием эволюции (оба открыли ее независимо), Шлейхер поддержал презентацию Дарвина, но раскритиковал ее за то, что в нее не были включены какие-либо виды. Затем он представил Stammbaum языков, который, однако, был не первым, что он опубликовал.[нужна цитата ]

Эволюция языков не была источником теории эволюции Дарвина. Он основывал это на разнообразии видов, как, например, наблюдал у зябликов в Галапагосские острова, которые оказались модификациями общего предка. Отбор домашних видов для создания нового сорта также сыграл роль в его выводах. Первое издание Происхождение видов в 1859 г. обсуждает языковое дерево, как будто de novo по теме классификации. Дарвин критикует синхронный метод, изобретенный Линней, предлагая заменить его «естественным расположением», основанным на эволюции.[нужна цитата ] Он говорит:[19]

"Возможно, стоит проиллюстрировать этот взгляд на классификацию на примере языков. Если бы мы обладали совершенной родословной человечества, генеалогическое расположение человеческих рас позволило бы наилучшим образом классифицировать различные языки, на которых сейчас говорят на протяжении всей истории человечества. мир; и если бы все вымершие языки и все промежуточные и медленно меняющиеся диалекты должны были быть включены, такое расположение было бы, я думаю, единственно возможным. Тем не менее, возможно, какой-то очень древний язык мало изменился и имел породили несколько новых языков, в то время как другие (из-за распространения и последующей изоляции и состояния цивилизации нескольких рас, происходящих от одной расы) сильно изменились и породили множество новых языков и диалектов. различия в языках из одной и той же группы должны быть выражены группами, подчиненными группам; но правильное или даже единственно возможное расположение все равно будет генеалогическим; и это будет быть строго естественным, так как он соединял бы вместе все языки, как исчезнувшие, так и современные, посредством самого близкого родства и давал бы происхождение и происхождение каждого языка ».

Шлейхер никогда не слышал о Дарвине до того, как Геккель привлек к нему внимание Шлейхера. Он опубликовал свою работу по Stammbaum в статье 1853 г., за шесть лет до первого издания Происхождение видов в 1859 году. Концепция происхождения языков отнюдь не была новой. Томас Джеферсон, сам набожный лингвист, предположил, что постоянная необходимость в неологизмы подразумевает, что языки должны «развиваться» или «развиваться».[20] Эти идеи предвещают эволюцию либо биологических видов, либо языков, но после контакта Шлейхера с идеями Дарвина и, возможно, контакта Дарвина с историческими лингвистами, эволюция и изменение языка были неразрывно связаны и стали основой для классификации. Теперь, как и тогда, основные проблемы будут заключаться в том, чтобы доказать конкретные линии спуска и определить точки ветвления.[нужна цитата ]

Филогенетическое дерево

Старая метафора получила совершенно новое значение под старым названием. Джозеф Гарольд Гринберг в серии эссе, начало которой было положено примерно в 1950 году. С тех пор, как лингвисты приняли метафору генеалогического древа, концепция эволюция был предложен Чарльз Дарвин и был общепринятым в биологии. Таксономия, классификация живых существ, уже была изобретена Карл Линней. Он использовал биноминальная номенклатура назначить разновидность имя и род имя каждому известному живому организму. Они были расположены в биологическом иерархия под несколькими тип, или наиболее общие группы, ответвление в конечном итоге на различные виды. Основа для этого биологическая классификация были наблюдаемые общие физические особенности вида.[нужна цитата ]

Дарвин, однако, возрождает другую древнюю метафору, Дерево жизни, предположили, что группы классификации Линнея (сегодняшняя таксоны ), которые со временем спустились в древовидную структуру от самого простого к самому сложному. Иерархическое дерево Линнея было синхронным; Дарвин предвидел диахронический процесс общее происхождение. Где Линней задумал разряды, которые соответствовали великая цепочка бытия принят рационалисты, Дарвин задумал родословная. Спустя десятилетия после Дарвина стало ясно, что чины в иерархии Линнея не совсем соответствуют родословным. Основной целью таксономии стало обнаружение родословных и изменение классификации, чтобы отразить их, что было сделано под общим руководством Номенклатурные коды, свод правил, которые ведутся международными организациями для утверждения и публикации предложений по реклассификации видов и других таксонов. Новый подход получил название филогения, "поколение типов", которые изобрели новую метафору дерева, филогенетическое дерево. Одна единица в дереве и все ее дочерние единицы были клады и открытие клад было кладистика.[нужна цитата ]

Классификация африканских языковых семей

Гринберг начал писать в то время, когда филогенетической систематике не хватало инструментов, доступных ей позже: компьютера (вычислительная систематика) и Секвенирование ДНК (молекулярная систематика ). Чтобы обнаружить кладистические отношения, исследователи полагались на как можно большее количество морфологических сходств между видами, которые можно было определить и свести в таблицу. Статистически, чем больше сходство, тем больше вероятность того, что виды принадлежат к одной кладе. Такой подход понравился Гринбергу, который был заинтересован в открытии лингвистические универсалии. Изменив модель дерева, чтобы сделать генеалогическое древо филогенетическим, он сказал:[21]

"Любой язык состоит из тысяч форм, имеющих как звук, так и значение ... любой звук может выражать любое значение, какое бы то ни было. Следовательно, если два языка согласуются в значительном количестве таких элементов ... мы обязательно делаем вывод об общем историческом происхождении. Такие генетические классификации не являются произвольными ... аналогия здесь с биологической классификацией чрезвычайно близка ... точно так же, как в биологии мы классифицируем виды в одном и том же роде или высокой единице, потому что сходство таково, что предполагает гипотезу общего происхождения, так же и с генетическими гипотезами в языке ".

В этой аналогии языковая семья похожа на клады, языки похожи на разновидность, то протоязык похож на предка таксон, языковое дерево похоже на филогенетическое дерево а языки и диалекты подобны видам и разновидностям. Гринберг составил большие таблицы характеристик языков Африки, Америки, Индонезии и Северной Евразии, которым до сих пор не уделялось должного внимания, и типизировал их в соответствии с их сходством. Он назвал этот подход "типологический классификация ", разработанная описательная лингвистика а не сравнительное языкознание.[22]

Даты и глоттохронология

В сравнительный метод был использован историческими лингвистами для объединения древовидных моделей с использованием дискретных лексических, морфологических и фонологических данных. Можно найти хронологию, но не существует абсолютных оценок даты с использованием этой системы.

Глоттохронология позволяет оценивать абсолютные даты. Общие родственные слова (родственные слова, означающие, что они имеют общее историческое происхождение) вычисляют время расхождения. Однако позже было обнаружено, что метод был дискредитирован из-за недостоверности данных. Из-за этого исторические лингвисты затрудняются с точной оценкой возраста при определении возраста индоевропейской языковой семьи. Он может варьироваться от 4000 до 40 000 лет назад или где-то между этими датами, согласно Диксону, полученному в результате подъема и падения языка (Cambridge University Press).[23] Как видно в статье здесь.[24]

Возможные решения для глоттохронологии ожидаются в связи с вычислительная филогенетика методы. Такие методы, как использование моделей эволюции, позволяют повысить точность длины и топологии ветвей дерева. Таким образом, используя вычислительные филогенетические методы, вычислительные методы позволяют исследователям анализировать лингвистические данные из эволюционной биологии. Это также помогает в проверке теорий друг против друга, таких как Курганская теория и Анатолийская теория, оба заявляют о происхождении инфоевропейских языков.[24]

Вычислительная филогенетика в исторической лингвистике

Сравнительный метод сравнивает особенности разных языков, чтобы оценить, насколько один язык похож на другой. Результаты такой оценки ориентированы на данные; то есть результаты зависят от количества функций и количества сравниваемых языков. До появления компьютеров в исторической лингвистике цифры в обоих случаях обязательно были небольшими. Эффект заключался в попытке изобразить фотографию с использованием небольшого количества больших пикселей или единиц изображения. Ограничения модели дерева были слишком очевидны, что вызвало жалобы со стороны основных лингвистов-историков.[нужна цитата ]

В конце 20 века лингвисты начали использовать программное обеспечение, предназначенное для биологической классификации, для классификации языков. Программы и методы становились все более изощренными. В начале 21 века проект «Вычислительная филогенетика в исторической лингвистике» (CPHL), консорциум лингвистов-историков, получил финансирование от Национальный фонд науки изучать филогении.[25] Индоевропейская семья - важная тема для изучения. По состоянию на январь 2012 г. они собрали и закодировали «отобранную» базу данных, содержащую «22 фонологических символа, 13 морфологических символов и 259 лексических символов», и еще не прошедшую проверку базу данных. Включены словари 24 индоевропейских языков. Большее количество функций и языков повышает точность при условии, что они соответствуют определенным критериям. Используя специализированное компьютерное программное обеспечение, они проверяют различные филогенетические гипотезы на предмет своей способности объяснять характеры генетическим происхождением.[нужна цитата ]

Ограничения модели

Одним из основных ограничений модели дерева является сама основополагающая презумпция, на которой она основана: она требует классификации, основанной на языках или, в более общем плане, на языковые разновидности. Поскольку разнообразие представляет собой абстракцию от совокупности языковые особенности существует вероятность потери информации при переводе данных (с карты изоглоссы ) в дерево. Например, есть проблема диалект континуум. Они предоставляют разновидности, которые не являются однозначно тем или иным языком, но содержат особенности, характерные для более чем одного языка. Вопрос о том, как их следует классифицировать, аналогичен вопросу, представленному виды колец к концепции разновидность классификация по биологии.[нужна цитата ]

Ограничения древовидной модели, в частности ее неспособность справиться с недискретным распределением общих инноваций в диалект континуум, были решены путем разработки некладистических (не основанных на деревьях) методологий. Они включают Волновая модель; и совсем недавно концепция связь.[3]

Дополнительное ограничение модели дерева включает смешанные и гибридные языки, а также смешение языков в целом, поскольку модель дерева допускает только расхождения. Например, согласно Цукерману (2009: 63),[26] «Израильтянин», его термин для Современный иврит, который он считает семито-европейским гибридом, «демонстрирует, что реальность лингвистического генезиса намного сложнее, чем позволяет простая система генеалогического древа.« Возрожденные »языки вряд ли будут иметь единственного родителя».

Совершенные филогении

Цель филогенетического программного обеспечения - генерировать кладограммы, особый вид дерева, в котором связи только раздваиваются; то есть на любом узле в одном направлении предлагаются только две ветви. Входные данные - это набор символов, которым могут быть присвоены состояния на разных языках, например, присутствует (1) или отсутствует (0). Таким образом, язык может быть описан уникальным набором координат, состоящим из значений состояния для всех рассматриваемых символов. Эти координаты могут быть похожи друг на друга или менее. Языки, которые разделяют большинство состояний, больше всего похожи друг на друга.[нужна цитата ]

Программа массирует все состояния всех символов всех языков одним из нескольких математических методов, чтобы выполнить попарное сравнение каждого языка со всеми остальными. Затем он строит кладограмму на основе степеней сходства; например, предполагается, что гипотетические языки a и b, наиболее близкие друг к другу, имеют общего предка a-b. Предполагается, что следующий ближайший язык, c, имеет общего предка с a-b и т. Д. Результатом является спроектированная серия исторических путей, ведущих от общего общего предка (корня) к языкам (листьям). Каждый путь уникален. Связей между путями нет. Каждый лист и узел имеют одного-единственного предка. Все состояния объясняются происхождением из других состояний. Кладограмма, соответствующая этим требованиям, представляет собой идеальную филогению.[27]

Сначала казалось, что результаты испытаний, в которых варьируются факторы, которые считались значимыми, были незначительными. Новая кладограмма возникла в результате любого изменения, из которого следует, что метод не отражает глубинную эволюцию языков, а лишь отражает импровизированные суждения исследователей. Чтобы найти факторы, влияющие на филогенез, исследователям необходимо было иметь некоторую меру точности своих результатов; то есть результаты необходимо было калибровать с учетом известных филогений. Они провели эксперимент, используя разные предположения, ища те, которые наиболее близки к наиболее надежным индоевропейским филогениям. Эти предположения можно с большей уверенностью использовать в проблемных областях индоевропейской филогении.[нужна цитата ]

Чтобы получить достаточно достоверную филогению, исследователи обнаружили, что им необходимо ввести в качестве входных данных все три типа символов: фонологические, лексические и морфологические, которые требовались для представления картины, достаточно подробной для расчета филогении. Только качественные персонажи дали значимые результаты. Повторяющиеся состояния были слишком неоднозначными для правильной интерпретации программным обеспечением; поэтому персонажи, подпадающие под формирование спины и параллельная разработка, которая возвращала персонажа в предыдущее состояние или принимала состояние, которое эволюционировала в другом персонаже, соответственно, были исключены из входного набора данных.[28]

Совершенные филогенетические сети

Филогенетическая сеть, одна из многих, установленных CPHL. Филогенетическое дерево показано черными линиями. Контактные кромки - красные линии. Вот три, самое экономное число, необходимое для создания реальной сети для индоевропейцев.

Несмотря на их усилия по кодированию наиболее качественных признаков в достаточном количестве, исследователи не смогли получить идеальной филогении для некоторых групп, таких как германские и албанские в пределах индоевропейцев. Они рассудили, что значительное количество знаков, которые нельзя объяснить генетическим происхождением от рассчитанного предка группы, было заимствовано. Предположительно, если волновая модель, объясняющие заимствование, были полным объяснением характеров группы, никакой филогении для нее найти не удалось. Если бы обе модели были частично эффективными, тогда существовало бы дерево, но его нужно было бы дополнить негенетическими объяснениями. Поэтому исследователи модифицировали программное обеспечение и метод, чтобы включить возможность заимствования.[29]

Исследователи ввели в эксперимент концепцию интерфейса или допустимую границу, через которую будут проходить состояния персонажа. Между родителем и потомком существовал односторонний интерфейс или граница. Если бы для объяснения наличия всех состояний в языке было достаточно только односторонних границ, тогда не было бы необходимости выходить за рамки идеальной филогении. Если нет, то к филогении можно добавить одно или несколько контактных ребер или двунаправленных интерфейсов. Таким образом, язык может иметь более одного источника состояний: родительский или контактный язык.[нужна цитата ]

Измененное таким образом дерево больше не было деревом как таковым: могло быть более одного пути от корня к листу. Исследователи назвали это устройство сетью. Состояния персонажа по-прежнему эволюционировали по уникальному пути от корня к листу, но его происхождение могло быть либо рассматриваемым корнем, либо контактным языком. Если бы все состояния эксперимента могли быть объяснены сетью, это было бы названо идеальной филогенетической сетью.[30]

Совместимость и осуществимость

Для создания сетей потребовалось два этапа. На первом этапе исследователи разработали ряд филогений, называемых деревьями кандидатов, для проверки на совместимость. Персонаж совместим, когда его происхождение объясняется порожденной филогенезом.[31] В идеальной филогении все персонажи совместимы, а совместимость дерева - 100%. По принципу экономности, или бритва Оккама, никакие сети не гарантируются. Деревья-кандидаты были получены путем первого запуска программного обеспечения для генерации филогении с использованием индоевропейского набора данных (строки состояний символов) в качестве входных данных, а затем модификации результирующего дерева для других гипотез для проверки.[нужна цитата ]

Ни одно из исходных деревьев-кандидатов не было идеальным филогенезом, хотя некоторые из поддеревьев в них были. Следующим этапом было создание сетей из деревьев с наивысшими показателями совместимости путем добавления интерфейсов по одному, выбора интерфейса с максимальной совместимостью до тех пор, пока не будет достигнута достаточность; то есть совместимость сети была наивысшей. Как оказалось, количество сгенерированных совместимых сетей может варьироваться от нуля до более десятка. Однако исторически не все возможные интерфейсы были осуществимы. Интерфейсы между некоторыми языками географически и хронологически маловероятны. Изучив результаты, исследователи исключили невозможные интерфейсы, пока не остался список только возможных сетей, который можно было расположить в порядке оценки совместимости.[нужна цитата ]

Наиболее подходящая сеть для индоевропейских

Исследователи начали с пяти деревьев-кандидатов для индоевропейских языков, обозначенных буквами A-E, одного, созданного с помощью филогенетического программного обеспечения, двух его модификаций и двух, предложенных Крэйг Мельхерт, исторический лингвист и индоевропейист. Деревья различались в основном расположением самой неоднозначной группы - германских языков и албанского, у которых не было достаточно отличительных знаков, чтобы разместить их точно. Дерево A содержало 14 несовместимых символов; В, 19; С, 17; Д, 21; Е, 18. Деревья A и C имели лучшие показатели совместимости. Все несовместимости были лексическими, и A были подмножеством C.[32]

Последующее поколение сетей обнаружило, что все несовместимости могут быть устранены с помощью минимум трех контактных ребер, кроме дерева E. Поскольку оно не имело высокой совместимости, оно было исключено. Дерево A имело 16 возможных сетей, которые в результате проверки осуществимости сократились до трех. Дерево C имело одну сеть, но поскольку для этого требовался интерфейс с балтийским, а не славянским языком, это было невозможно.[33]

Дерево А, наиболее совместимое и выполнимое дерево, предполагает семь групп, отделяющихся от протоиндоевропейских между примерно 4000 г. до н.э. и 2250 г. до н.э., следующим образом.[34]

  • Первым отделился анатолийец около 4000 г. до н.э.
  • Тохариан последовал за ним около 3500 г. до н.э.
  • Вскоре после этого, около 3250 г., прото-итало-кельтские (западные индоевропейские) отделились, став прото-италийскими и прото-кельтскими примерно в 2500 г. до н. Э.
  • Примерно в 3000 году протоалбано-германские языки отделились, став албанскими и протогерманскими примерно в 2000 году.
  • Примерно в 3000 г. Прото-греко-армянский (южный индоевропейский) разделился, став протогреческим и протоармянским примерно в 1800 г.
  • Балто-славянский язык появился около 2500, разделившись на протобалтийский и протославянский около 1000.
  • Наконец, протоиндоевропейский стал протоиндоиранским (восточно-индоевропейским) примерно в 2250 году.

Деревья B и E предлагают альтернативу протогермано-балто-славянскому (северный индоевропейский), делая албанский язык независимой ветвью. Единственная дата, за которую ручаются авторы, - последняя, ​​исходя из непрерывности Ямная культура, то Андроновская культура и известные индоарийские говорящие культуры. Все остальные описываются как «мертвая расплата».[35]

Учитывая филогенез наилучшей совместимости, A, для обеспечения совместимости требуются три контактных кромки. Это группа ребер с наименьшим количеством событий заимствования:[35]

  • Во-первых, граница между прото-курсивом и протогерманским языком, которая, согласно приведенной схеме датировки, должна была начаться после 2000 года.
  • Второй край соприкосновения был между прото-италийским и протогреко-армянским, который должен был начаться после 2500 г.
  • Третий контактный край - между протогерманским и протобалтийским, который должен был начаться после 1000 года.

Дерево A с описанными выше ребрами описывается авторами как «наше лучшее PPN».[36] Во всех PPN ясно, что, хотя начальные дочерние языки стали отличаться в относительной изоляции, более поздняя эволюция групп может быть объяснена только эволюцией в близости к другим языкам, с которыми происходит обмен посредством волновой модели.

Смотрите также

Примечания

  1. ^ а б Лист, Иоганн-Маттис; Нельсон-Сати, Шиджулал; Гейслер, Ганс; Мартин, Уильям (2014). «Сети лексического заимствования и латерального переноса генов в эволюции языка и генома». BioEssays. 36 (2): 141–150. Дои:10.1002 / bies.201300096. ISSN  0265-9247. ЧВК  3910147. PMID  24375688.
  2. ^ а б Франсуа (2014).
  3. ^ а б Видеть Блумфилд 1933, п. 311; Хеггарти и другие. (2010); Франсуа (2014).
  4. ^ Святой Августин. «XVI: 9-11». Город Бога.
  5. ^ Бытие 10:25
  6. ^ 1 Паралипоменон 1:19.
  7. ^ Святой Августин (епископ Гиппопотама) (1871). Произведения Аврелия Августина: новый перевод. Т. и Т. Кларк.
  8. ^ Браун 1684, стр. 223–241
  9. ^ Браун 1684, п. 224
  10. ^ Браун 1684, п. 225
  11. ^ Браун 1684, п. 228
  12. ^ Браун 1684, стр. 226–228
  13. ^ Хауэлл, Джеймс (1688 г.) [1645]. "Письмо LVIII Достопочтенному графу Р.". Epistolae Ho-Elianae, Знакомые письма, домашние и форренские, разделенные на четыре книги, частично исторические, политические, философские, по возникающим обстоятельствам. Том II (6-е изд.). Лондон: Томас Гай. п. 356.
  14. ^ Джонс, Уильям (1807) [1786], «Беседа о третьей годовщине индуизма», в лорде Тейнмуте (ред.), Произведения сэра Уильяма Джонса с жизнью автора в тринадцати томах, III, Лондон: Джон Стокдейл и Джон Уокер, стр. 34
  15. ^ Молодые 1813, п. 251
  16. ^ Молодые 1813, п. 255
  17. ^ Грант, Роберт (1813). A sketch of the history of the East-India company, from its first formation to the passing of the Regulating act of 1773; with a summary view of the changes that have taken place since that period in the internal administration of British India. London: Black, Parry, and Co. [etc.] pp. xxxiv–xxxv.
  18. ^ D M Williams, D.M.; Malte C Ebach; Gareth J Nelson (2008). Foundations of systematics and biogeography. Нью-Йорк, штат Нью-Йорк: Спрингер. п.45.
  19. ^ Darwin, Charles (1860). On the origin of species by means of natural selection, or, The preservation of favoured races in the struggle for life. Лондон: Дж. Мюррей. п.422. it may be worth while to illustrate this view of classification by taking the case of languages Darwin.
  20. ^ Post, David G (2009). In search of Jefferson's moose: notes on the state of cyberspace. Оксфорд; Нью-Йорк: Издательство Оксфордского университета. п.125.
  21. ^ Greenberg, Joseph H. (1990) [1954], "A Quantitative Approach to the Typological Morphology of Language", in Denning, Keith M.; Kemmer, Suzanne (eds.), On language: selected writings of Joseph H. Greenberg, Stanford: Stanford University Press, pp. 3–4
  22. ^ Greenberg, Joseph Harold (1971). Language, culture, and communication. Стэнфорд: Издательство Стэнфордского университета. п.113.
  23. ^ Dixon, R. M. W. (1997). The Rise and Fall of Languages by R. M. W. Dixon. Кембриджское ядро. Дои:10.1017/CBO9780511612060. ISBN  9780511612060. Получено 2017-09-26.
  24. ^ а б D, Gray, Russell; D, Atkinson, Quentin (2003-11-27). «Времена расхождения языков и деревьев подтверждают анатолийскую теорию индоевропейского происхождения». Природа. Издательская группа "Природа". 426 (6965): 435–9. Дои:10.1038 / природа02029. PMID  14647380. S2CID  42340.
  25. ^ "CPHL: Computational Phylogenetics in Historical Linguistics". 2004–2012.
  26. ^ Zuckermann, Ghil'ad. 2009 г. "Hybridity versus Revivability: Multiple Causation, Forms and Patterns." Журнал языкового контакта, Varia 2:40-67.
  27. ^ Nakhleh 2005, п. 383.
  28. ^ Nakhleh 2005, стр. 384–385.
  29. ^ The technical details of the алгоритмы used are stated in Nakhleh 2005, Приложение. The details of the dataset are stated in Appendix B.
  30. ^ Nakhleh 2005, стр. 388–391.
  31. ^ Nakhleh 2005, п. 387.
  32. ^ Nakhleh 2005, п. 396.
  33. ^ Nakhleh 2005, п. 400.
  34. ^ Nakhleh 2005, п. 398.
  35. ^ а б Nakhleh 2005, п. 401.
  36. ^ Nakhleh 2005, п. 407.

Библиография

внешняя ссылка

  • Labov, William (2010). "15. The Diffusion of Language from Place to Place". Principles of Linguistic Change. Volume 3: Cognition and Cultural Factors. UK: Wiley-Blackwell; scribd.com.
  • Santorini, Beatrice; Kroch, Anthony (2007). "Node Relations". The syntax of natural language: An online introduction using the Trees program. Пенсильванский университет.