Cyc - Википедия - Cyc

Цикл
По часовой стрелке: логотипы для базы знаний Cyc, механизмы вывода, действенный вывод, интеллектуальный выбор данных
По часовой стрелке: логотипы для базы знаний Cyc, механизмы вывода, действенный вывод, интеллектуальный выбор данных
Оригинальный автор (ы)Дуглас Ленат
Разработчики)Cycorp, Inc.
изначальный выпуск1984; 36 лет назад (1984)
Стабильный выпуск
6.1 / 27 ноября 2017; 3 года назад (2017-11-27)
Написано вЛисп, CycL
ТипОнтология и база знаний и представление знаний язык и Механизм логического вывода
Интернет сайтwww.cyc.com

Цикл (произносится /ˈsаɪk/ SYKE ) является долгосрочным искусственный интеллект проект, направленный на сборку комплексного онтология и база знаний это охватывает основные концепции и правила о том, как устроен мир. Надеясь захватить знание здравого смысла, Cyc фокусируется на неявное знание что другие платформы ИИ могут принять как должное. Это контрастирует с фактами, которые можно найти где-нибудь в Интернете или получить через поисковую систему или Википедию. Cyc позволяет приложениям ИИ вести рассуждения, подобные человеческим, и быть менее «хрупкими» при столкновении с новыми ситуациями.

Дуглас Ленат начал проект в июле 1984 г. MCC, где он был главным научным сотрудником в 1984–1994 гг., а затем, с января 1995 г., активно развивался Cycorp компания, где он Исполнительный директор.

Обзор

Потребность в масштабном проекте такого рода символического искусственного интеллекта возникла в начале 1980-х годов. Первые исследователи ИИ за последние 25 лет имели богатый опыт работы с программами ИИ, которые давали обнадеживающие первые результаты, но затем не могли «масштабироваться» - выходить за рамки «обучающего набора» для решения более широкого круга случаев. Дуглас Ленат и Алан Кей обнародовал эту потребность,[1][2][3] и они организовали встречу в Стэнфорде в 1983 году, чтобы решить эту проблему. Скрытые расчеты Дуга, Алана и их коллег (включая Марвин Мински, Аллен Ньюэлл, Эдвард Фейгенбаум, и Джон Маккарти ) указали, что эти усилия потребуют от 1000 до 3000 человеко-лет усилий, что намного превышает стандартную академическую модель проекта. Однако события, произошедшие в течение года после этой встречи, позволили начать работу такого масштаба.

Проект начался в июле 1984 года как флагманский проект на 400 человек. Корпорация микроэлектроники и компьютерных технологий (MCC), исследовательский консорциум, созданный двумя десятками крупных корпораций США "для противодействия зловещим усилиям Японии в области ИИ, так называемым"пятое поколение " проект."[4] Правительство США отреагировало на угрозу пятого поколения, передав Закон о национальных совместных исследованиях 1984 г., что впервые позволило американским компаниям «вступить в сговор» в рамках долгосрочных высокорисковых и прибыльных исследований, и MCC и Сематек возникла, чтобы воспользоваться этой десятилетней возможностью. Первым президентом и главным исполнительным директором MCC был Бобби Рэй Инман, бывший директор АНБ и заместитель директора ЦРУ.

Целью проекта Cyc было систематизировать в машинно-используемой форме миллионы единиц знаний, составляющих человеческий здравый смысл.[5] Это повлекло за собой (1) разработку достаточно выразительного языка представления, CycL,[6] (2) разработка онтологии, охватывающей все человеческие концепции до некоторого соответствующего уровня детализации,[7] (3) разработка базы знаний на этой онтологической основе,[7] включающий все человеческие знания об этих концепциях вплоть до некоторого соответствующего уровня детализации и (4) разработку механизма вывода, экспоненциально более быстрого, чем те, которые использовались в тогдашних традиционных экспертных системах,[8][9] иметь возможность делать те же самые типы и глубину выводов, на которые способны люди, учитывая их знание мира.

Чуть подробнее:

  • Язык представления CycL начался как расширение RLL[10][11] (так называемый язык представлений, разработанный в 1979-1980 годах профессором Дугласом Ленатом из Стэнфордского университета и его аспирантом Рассел Грейнер ), но через несколько лет после запуска проекта Cyc стало ясно, что даже представление типичного новостного сюжета, романа или рекламы потребует большего, чем выразительная сила полной логика первого порядка, а именно исчисление предикатов второго порядка («Какая связь между дождем и водой?»), А затем даже более высокие логические схемы, включая модальная логика, рефлексия (позволяющая системе рассуждать о своем прогрессе на данный момент, над проблемой, над которой она работает) и контекстная логика (позволяющая системе явно рассуждать о контекстах, в которых могут выполняться ее различные посылки и выводы), немонотонная логика, и ограничение. К 1989 г.[6] CycL расширился в выразительной силе до Логика высшего порядка (HOL).
    • Triplestore представления (родственные Рамка-и-паз языки представления 1970-х годов, из которых произошел RLL) сегодня широко распространены в AI. Возможно, будет полезно привести несколько примеров, подчеркивающих или нарушающих этот тип представления, типичных для примеров, которые вынудили проект Cyc перейти от трехуровневого представления к гораздо более выразительному в период 1984-1989 годов:[6] Английские предложения, включая отрицания («У Фреда нет собаки»), вложенные кванторы («У каждого американца есть мать» означает «для всех x существует-существует y» ... но «у каждого американца есть президент» означает, что существует y такие, что для всех x ...), вложенные модальные окна, такие как "Соединенные Штаты считают, что Германия хочет, чтобы НАТО не преследовало ...", и это даже неудобно представлять в Triplestore, отношения арности выше 2, например, «Лос-Анджелес находится между Сан-Диего и Сан-Франциско вдоль US101».
  • Онтология Cyc выросла примерно до 100 000 терминов в течение первого десятилетия проекта, до 1994 г., и по состоянию на 2017 г. содержала около 1 500 000 терминов. Эта онтология включала:
    • 416 000 коллекций (видов, сортов, натуральные виды, который включает как типы вещей, такие как Рыба, так и типы действий, такие как Рыбалка)
    • чуть более миллиона человек, представляющих
      • 42,500 предикаты (отношения, атрибуты, поля, свойства, функции),
      • около миллиона общеизвестных организаций, таких как TheUnitedStatesOfAmerica, BarackObama, TheSigningOfTheUSDeclarationOfIndependence и т. д.
      • Также возможно произвольно большое количество дополнительных терминов. неявно присутствуют в онтологии Cyc в том смысле, что существуют функции, обозначающие термины, такие как CalendarYearFn (когда задан аргумент 2016, он обозначает 2016 календарный год), GovernmentFn (в аргументе France он обозначает правительство Франции), Meter (в аргументе 2016 он обозначает расстояние 2,016 километра), а также вложения и композиции таких обозначающих функции терминов.
  • База знаний Cyc, основанная на общих правилах здравого смысла и утверждениях, включающих эти онтологические термины, была в значительной степени создана вручную путем написания аксиом; он вырос примерно до 1 миллиона в 1994 году, а по состоянию на 2017 год составляет около 24,5 миллиона, а на строительство потребовалось более 1000 человеко-лет.
    • Важно понимать, что инженеры-циконтологи стремятся сохранить эти числа как маленький по возможности, не надувайте их, пока дедуктивное замыкание базы знаний не сокращается. Предположим, что Cyc рассказывается об одном миллионе отдельных людей, животных и т. Д. Тогда можно сказать 1018 факты формы «Микки Маус - не то же лицо, что и <Лось Буллвинк / Авраам Линкольн / Дженнифер Лопес>». Но вместо этого можно было сказать Cyc 10,000 Линнеевская таксономия правил, за которыми следуют всего 108 правила вида «Нет мыши - лось». И, что еще более компактно, Cyc можно было бы просто дать эти 10 000 Линнеевская таксономия правила, за которыми следует только одно правило формы: «Для любых двух линнеевских таксонов, если ни один из них явно не известен как супертаксон другого, то они не пересекаются». Эти 10 001 утверждение имеют такое же дедуктивное завершение, что и ранее упомянутые 1018 факты.
  • Дизайн механизма вывода Cyc отделяет эпистемологическую проблему (какой контент должен быть в Cyc KB) от эвристической проблемы (как Cyc может эффективно выводить аргументы глубиной в сотни шагов в море десятков миллионов аксиом). Чтобы сделать первое, может быть достаточно языка CycL и хорошо понятного логического вывода. Для последнего Cyc использовал архитектуру сообщества агентов, где специализированные модули рассуждений, каждый со своей собственной структурой данных и алгоритмом, «подняли руку», если они могли эффективно добиться прогресса в любой из открытых в настоящее время подзадач. К 1994 году было 20 таких модулей эвристического уровня (HL);[8] по состоянию на 2017 год насчитывается более 1050 модулей HL.[12]
    • Некоторые из этих модулей HL очень общие, например, модуль, который кэширует Клини Стар (переходное закрытие ) всех часто используемых переходные отношения в онтологии Cyc.
    • Некоторые из них относятся к предметной области, например, химический балансир. Они могут быть и часто являются «побегом» (указателем на) некоторой внешней доступной программы, веб-сервиса или онлайн-базы данных, например, модуля для быстрого «вычисления» текущего населения города, зная, где и как это искать.

CycL имеет публично выпущенную спецификацию, а десятки модулей HL описаны в учебнике Лената и Гуха,[8] но фактический код механизма вывода Cyc и полный список из 1000+ модулей HL являются собственностью Cycorp.[3]

Название «Цик» (от «энциклопедия», произносится [сак], подобно "Syke") является зарегистрированным товарным знаком, принадлежащим Cycorp. Доступ к Cyc осуществляется через платные лицензии, но добросовестный Группы исследователей ИИ получают бесплатные лицензии только на исследования (см. ResearchCyc ); по состоянию на 2017 год более 600 таких групп по всему миру имеют эти лицензии.

Типичными элементами знаний, представленными в базе знаний Cyc, являются «Каждое дерево - это растение» и «Растения рано или поздно умирают». На вопрос, умирают ли деревья, машина вывода может сделать очевидный вывод и правильно ответить на вопрос.

Большая часть знаний Cyc, помимо математики, верна только по умолчанию. Например, Cyc знает, что по умолчанию родители любят своих детей, когда вы счастливы, вы улыбаетесь, ваш первый шаг - большое достижение, когда у кого-то, кого вы любите, есть большое достижение, которое делает вас счастливыми, и только у взрослых есть дети. Когда его спросили, есть ли на изображении с надписью «Кто-то наблюдает, как его дочь делает первый шаг» улыбающийся взрослый человек, Cyc может логически заключить, что ответ - да, и «покажите свою работу», представив пошаговые логические аргументы, используя эти пять частей знаний из своей базы знаний. Они сформулированы на языке CycL, который основан на исчисление предикатов и имеет синтаксис аналогично тому из Язык программирования Лисп.

В 2008 году ресурсы Cyc были сопоставлены со многими Википедия статьи.[13] Cyc в настоящее время подключен к Викиданные. В планах на будущее Cyc может подключиться к обоим DBpedia и Freebase.

Большая часть текущей работы Cyc по-прежнему инженерия знаний, представляя факты о мире от руки и внедряя эффективные механизмы вывода на основе этих знаний. Однако все чаще работа в Cycorp включает в себя предоставление системе Cyc возможности общаться с конечными пользователями в естественный язык, и помочь в непрерывном процессе формирования знаний через машинное обучение и понимание естественного языка. Еще одна крупная попытка Cycorp - создание пакета Cyc-powered онтологическая инженерия инструменты для снижения планки входа для отдельных лиц, которые могут вносить свой вклад, редактировать, просматривать и запрашивать Cyc.

Как и многие компании, Cycorp стремится использовать обработку естественного языка Cyc для анализа всего Интернета для извлечения структурированных данных; в отличие от всех других, он может вызывать саму систему Cyc, чтобы она действовала как индуктивное смещение и как судья двусмысленность, метафора, и многоточие. Систематических сравнительных исследований производительности Cyc мало, если таковые вообще имеются.

База знаний

Названия концептов в Cyc - CycL. термины или же константы.[6] Константы начинаются с необязательного символа «# $» и чувствительны к регистру. Есть константы для:

  • Отдельные предметы, известные как отдельные лица, например # $ BillClinton или # $ France.
  • Коллекции, например # $ Tree-ThePlant (содержащий все деревья) или # $ EquivalenceRelation (содержащий все отношения эквивалентности ). Член коллекции называется пример из этой коллекции.[8]
  • Функции, которые производят новые термины из заданных. Например, # $ FruitFn с аргументом, описывающим тип (или коллекцию) растений, вернет коллекцию своих плодов. По соглашению, функциональные константы начинаются с заглавной буквы и заканчиваются строкой «Fn».
  • Функции истины, который может применяться к одному или нескольким другим концепциям и возвращать либо истину, либо ложь. Например, # $ siblings - это родственные отношения, истина, если два аргумента являются братьями и сестрами. По соглашению, константы функции истинности начинаются с строчной буквы. Функции истины могут быть разбиты на логические связки (такие как # $ and, # $ or, # $ not, # $ подразумевает), квантификаторы (# $ forAll, # $ thereExists и т. Д.) И предикаты.

Два важных бинарных предиката - это # ​​$ isa и # $ genls. Первый описывает, что один предмет является пример какой-то коллекции, второй, что одна коллекция является подколлекцией другой. Факты о концепциях утверждаются с использованием определенного CycL. фразы. Предикаты записываются перед аргументами в круглых скобках:

 (# $ isa # $ BillClinton # $ UnitedStatesPresident)

«Билл Клинтон принадлежит к собранию президентов США».

 (# $ genls # $ Tree-ThePlant # $ Plant)

«Все деревья - растения».

 (# $ capitalCity # $ France # $ Paris)

"Париж - столица Франции."

Предложения также могут содержать переменные, строки, начинающиеся с "?". Эти предложения называются «правилами». Одно важное правило, установленное для предиката # $ isa, гласит:

(# $ подразумевает (# $ and (# $ isa? OBJ? SUBSET) (# $ genls? SUBSET? SUPERSET)) (# $ isa? OBJ? SUPERSET))

"Если OBJ является экземпляром коллекции ПОДМНОЖЕСТВО а SUBSET - это подколлекция SUPERSET, то OBJ является экземпляром коллекции SUPERSET ". Другой типичный пример:

 (# $ RelationsAllExists # $ BiologicalMother # $ ChordataPhylum # $ FemaleAnimal)

что означает, что для каждого экземпляра коллекции # $ ChordataPhylum (т.е. для каждого хордовый ), существует самка животного (экземпляр # $ FemaleAnimal), которая является его матерью (описывается предикатом # $ologicalMother).[8]

В база знаний поделен на микротеории (Mt), наборы концепций и фактов, обычно относящиеся к одной конкретной области знания. В отличие от базы знаний в целом, каждая микротеория должна быть свободна от монотонный противоречия. Каждая микротеория - это первоклассный объект в онтологии Cyc; он имеет имя, которое является обычной константой; Константы микротеории по соглашению содержат строку «Mt». Примером может служить # $ MathMt, микротеория, содержащая математические знания. Микротеории могут наследовать друг от друга и организованы в иерархию: одна из специализаций # $ MathMt - это # ​​$ GeometryGMt, микротеория о геометрии.

Механизм логического вывода

An Механизм логического вывода это компьютерная программа, которая пытается получить ответы на основе базы знаний. Механизм вывода Cyc выполняет общие логическая дедукция (включая modus ponens, модус толленс, универсальная количественная оценка и экзистенциальная количественная оценка ).[14] Он также выполняет индуктивное мышление, статистическое машинное обучение и символическое машинное обучение, а также похищающие рассуждения (но, конечно, экономно и используя существующую базу знаний в качестве фильтра и руководства).

Релизы

OpenCyc

Первая версия OpenCyc была выпущена весной 2002 г. и содержала всего 6 000 концепций и 60 000 фактов. База знаний выпущена под Лицензия Apache. Cycorp заявил о своем намерении выпустить OpenCyc под параллельными неограниченными лицензиями для удовлетворения потребностей пользователей. В CycL и интерпретатор SubL (программа, которая позволяет пользователям просматривать и редактировать базу данных, а также делать выводы) был выпущен бесплатно, но только в виде двоичного кода, без исходного кода. Он был доступен для Linux и Майкрософт Виндоус. Texai с открытым исходным кодом[15] проект выпустил RDF -совместимый контент, извлеченный из OpenCyc.[16] Версия OpenCyc 4.0 была выпущена в июне 2012 года. OpenCyc 4.0 включал большую часть онтологии Cyc того времени, содержащей сотни тысяч терминов, а также миллионы утверждений, связывающих эти термины друг с другом; однако это в основном таксономические утверждения, а не сложные правила, доступные в Cyc. База знаний OpenCyc 4.0 содержала 239 000 концепций и 2 093 000 фактов.

Основная цель выпуска OpenCyc заключалась в том, чтобы помочь исследователям ИИ понять, что отсутствующий от того, что они теперь называют онтологии и графики знаний. Полезно и важно правильно систематизировать такие понятия, как человек, ночь, сон, лежа, бодрствование, счастье и т. Д., Но что отсутствующий из содержимого OpenCyc об этих терминах, но присутствующих в содержимом Cyc KB, представлены различные практические правила, которые большинство из нас разделяют в отношении этих терминов: что (по умолчанию в ModernWesternHumanCultureMt) каждый человек спит ночью, спит лежа , может быть разбужен, не рад, что его разбудили, и так далее. Этот момент не требует постоянно обновляемых выпусков OpenCyc, поэтому с 2017 года OpenCyc больше не доступен.

ResearchCyc

В июле 2006 года Cycorp выпустила исполняемый файл ResearchCyc 1.0, версии Cyc, предназначенной для исследовательского сообщества, бесплатно. (ResearchCyc находился в стадии бета-разработки в течение всего 2004 г .; бета-версия была выпущена в феврале 2005 г.) В дополнение к таксономической информации, содержащейся в OpenCyc, ResearchCyc включает значительно больше семантических знаний (т. Е. Дополнительных фактов и практических правил), включая концепции в своей базе знаний; он также включает большой лексикон, английский инструменты синтаксического анализа и генерации, а также Ява интерфейсы на основе для редактирования и запроса знаний. Кроме того, он содержит систему для Интеграция данных на основе онтологий. По состоянию на 2017 год продолжали появляться регулярные выпуски ResearchCyc, при этом 600 исследовательских групп использовали лицензии по всему миру бесплатно для некоммерческих исследовательских целей. По состоянию на декабрь 2019 года ResearchCyc больше не поддерживается. Cycorp планирует улучшить и пересмотреть инструменты для внешних разработчиков в ближайшие годы.

Приложения

Было более 100 успешных применений Cyc;[17] Здесь перечислены несколько непохожих друг на друга случаев:

Тезаурус фармацевтических терминов Менеджер / интегратор

Более десяти лет Glaxo использовал Cyc для полуавтоматической интеграции всех больших (сотни тысяч терминов) тезаурусы терминов фармацевтической отрасли, которые отражают различное использование в разных компаниях, странах, годах и подотраслях.[18] Эта задача интеграции онтологии требует знания предметной области, поверхностных семантических знаний, а также произвольно глубоких знаний здравого смысла и рассуждений. Фармацевтический словарь варьируется в зависимости от страны, (под) отраслей, компаний, отделов и десятилетий. Например, что такое гель пак? Что такое "название улицы" ранитидина гидрохлорид? Каждый из них п контролируемые словари - это онтология, содержащая примерно 300 тыс. терминов. Исследователям Glaxo необходимо отправить запрос в их текущем словаре, перевести его в нейтральное «истинное значение», а затем преобразовать его в противоположном направлении, чтобы найти возможные совпадения с документами, каждый из которых был написан в соответствии с определенным известным словарём. Они использовали большой посох, чтобы делать это вручную. Cyc используется в качестве универсального интерлингва, способного представлять объединение «истинных значений» всех терминов и способного представлять 300 тысяч преобразований между каждым из этих контролируемых словарей и Cyc, тем самым преобразуя в линейную, не привнося привычного вида «телефонной игры» приглушения смысла. Кроме того, создание каждого из этих 300 тыс. Отображений для каждого тезауруса выполняется Cyc в значительной степени автоматически.

База знаний о терроризме

Комплексный Терроризм База знаний представляла собой разрабатываемое приложение Cyc, которое, в конечном счете, пыталось содержать все соответствующие знания о «террористических» группах, их членах, лидерах, идеологии, основателях, спонсорах, принадлежности, объектах, местах, финансах, возможностях, намерениях, поведении, тактике и т. Д. и полное описание конкретных террористических событий. Знания хранятся в виде утверждений математической логики, пригодных для компьютерного понимания и рассуждений.[19][20]

Фонд кливлендской клиники

В Кливлендская клиника использовал Cyc для разработки запрос на естественном языке интерфейс биомедицинской информации, охватывающей десятилетия информации о кардиоторакальных операциях.[21] Запрос разбирается на набор CycL (логика более высокого порядка) фрагменты с открытыми переменными (например, «этот вопрос касается человека, у которого развилась инфекция эндокардита», «этот вопрос касается подмножества пациентов клиники Кливленда, перенесших там операцию в 2009 году» и т. ); затем применяются различные ограничения (знания в области медицины, здравый смысл, прагматика дискурса, синтаксис), чтобы увидеть, как эти фрагменты могли бы вписаться в один семантически значимый формальный запрос; значительно, в большинстве случаев точно один и только один такой способ включения и интеграции этих фрагментов.[22] Интеграция фрагментов включает в себя (i) решение, какие открытые переменные, в каких фрагментах фактически представляют одну и ту же переменную, и (ii) для всех конечных переменных решить, какой порядок и объем количественной оценки должна иметь эта переменная и какой тип (универсальный или экзистенциальный) . Затем этот логический (CycL) запрос преобразуется в запрос SPARQL, который передается в CCF SemanticDB, который является его озеро данных.

MathCraft

Приложение One Cyc призвано помочь ученикам заниматься математикой на уровне 6-го класса, помогая им глубже понять этот предмет.[23] Он основан на опыте, который мы часто имеем мысль мы кое-что поняли, но только В самом деле поняли это после того, как нам пришлось объяснить или научить этому кого-то еще. В отличие от почти всех других образовательных программ, где компьютер играет роль учителя, это приложение Cyc под названием MathCraft,[24] Cyc играет роль однокурсника, который всегда немного больше сбит с толку, чем вы, пользователь, о предмете. Роль пользователя - наблюдать за аватаром Cyc и давать ему советы, исправлять его ошибки, наставлять его, заставлять видеть, что он делает не так, и т. Д. Поскольку пользователь дает хороший совет, Cyc позволяет аватару делать меньше ошибок этого типа. следовательно, с точки зрения пользователя кажется, что пользователь только что успешно его чему-то научил. Это вариант Обучение через обучение.

Критика

Проект Cyc был описан как «одно из самых противоречивых начинаний в истории искусственного интеллекта».[25] Кэтрин Хаваси, Генеральный директор Luminoso, говорит, что Cyc является предшественником проекта IBM Watson.[26] Ученый в области машинного обучения Педро Домингос называет проект «катастрофическим провалом» по нескольким причинам, включая нескончаемый объем данных, необходимых для получения любых жизнеспособных результатов, и неспособность Cyc развиваться самостоятельно.[27]

Робин Хэнсон Профессор экономики Университета Джорджа Мейсона дает более взвешенный анализ:

Конечно, проект CYC открыт для критики по поводу многих конкретных вариантов. Люди жаловались на его логические и языковые представления, на выбор прототипов для построения (например, статьи энциклопедии), на то, что он сосредоточен на ответах на действия, на то, как часто он перестраивает или поддерживает унаследованные системы, и о том, чтобы быть частным против публикации всего. Но любой крупный проект, подобный этому, вызовет такие споры, и не очевидно, что какой-либо из его вариантов был серьезно неправильным. Им нужно было с чего-то начать, и, на мой взгляд, они собрали базу знаний действительно впечатляющих размеров, масштабов и интеграции. Другие архитектуры могут работать лучше, но если знание участков так же важно, как думает Ленат, я ожидал бы серьезных попыток ИИ импортировать знания CYC, переводя их в новое представление. Ни один другой источник не может сравниться с размером, масштабом и интеграцией CYC.[28]

Аналогичное мнение выразили Марвин Мински: «К сожалению, стратегии, наиболее популярные среди исследователей ИИ в 1980-х годах, зашли в тупик», - сказал Мински. Так называемый "экспертные системы, Который имитировал человеческий опыт в строго определенных предметных областях, таких как право и медицина, мог сопоставлять запросы пользователей с соответствующими диагнозами, статьями и рефератами, но они не могли усвоить концепции, которые большинство детей знает к тому времени, когда им исполнится 3 года. «Для каждого типа проблем, - сказал Мински, - создание экспертных систем приходилось начинать заново, потому что они не накапливали здравого смысла». По словам Мински, только один исследователь взял на себя колоссальную задачу по созданию всеобъемлющей системы логических рассуждений. Дуглас Ленат в рамках своего проекта Cyc руководил построчным вводом более 1 миллиона правил в базу знаний здравого смысла ».[29]

Гэри Маркус, профессор психологии и нейробиологии Нью-Йоркского университета и соучредитель компании по искусственному интеллекту под названием Geometric Intelligence, говорит, что «это представляет собой подход, который сильно отличается от всего глубокого обучения, о котором рассказывали в новостях».[30] Это согласуется с позицией Дуга Лената: «Иногда фанера интеллекта недостаточно ».[31]

Стивен Вольфрам пишет:

На заре развития искусственного интеллекта было много дискуссий о «представлении знаний» с подходами, основанными на грамматике естественного языка, структуре логики предикатов или формализме баз данных. Было предпринято очень мало крупномасштабных проектов (известный контрпример Дуга Лената - Cyc).[32]

Маркус пишет:

Поле могло бы выиграть, если бы CYC систематически описывался и оценивался. Если CYC разрешил значительную часть здравого смысла, то очень важно знать это как полезный инструмент и как отправную точку для дальнейших исследований. Если CYC столкнулся с трудностями, было бы полезно учиться на допущенных ошибках. Если CYC совершенно бесполезен, тогда исследователи могут, по крайней мере, перестать беспокоиться о том, изобретают ли они велосипед заново.[33]


Каждые несколько лет с момента его публикации (1993 г.) выходит новый Проводной журнал статья о Cyc,[34][29][35] некоторые положительные и некоторые отрицательные (включая одну проблему[36] который содержал по одному каждого).

Известные сотрудники

Это список некоторых известных людей, которые работали или работали над Cyc, когда это был проект в MCC (где Cyc был впервые запущен) или Cycorp.

Смотрите также

Рекомендации

  1. ^ Ленат, Дуглас Б.; Браун, Джон Сили (1984-08-01). «Почему am и eurisko работают?». Искусственный интеллект. 23 (3): 269–294. CiteSeerX  10.1.1.565.8830. Дои:10.1016 / 0004-3702 (84) 90016-X.
  2. ^ Ленат, Дуглас Б.; Борнинг, Алан; Макдональд, Дэвид; Тейлор, Крейг; Вейер, Стивен (1983). «Knoesphere: создание экспертных систем с энциклопедическими знаниями». Материалы восьмой Международной совместной конференции по искусственному интеллекту - Том 1. IJCAI'83: 167–169.
  3. ^ а б Ленат, Дуглас. "Наследие Хэла: компьютер 2001 года как мечта и реальность. С 2001 по 2001 год: здравый смысл и разум HAL" (PDF). Cycorp, Inc. Получено 2006-09-26.
  4. ^ Вуд, Ламонт (2002). «Мир в коробке». Scientific American. 286 (1): 18–19. Bibcode:2002SciAm.286a..18W. Дои:10.1038 / scientificamerican0102-18.
  5. ^ Ленат, Дуг; Пракаш, Маянк; Шеперд, Мэри (январь 1986 г.). "CYC: Использование здравого смысла для преодоления хрупкости и узких мест [sic] в получении знаний". Журнал AI. 6 (4): 65–85. ISSN  0738-4602.
  6. ^ а б c d Ленат, Дуглас Б.; Гуха, Р. В. (июнь 1991 г.). «Эволюция CycL, языка представления циклов». СИГАРТ Бык. 2 (3): 84–87. Дои:10.1145/122296.122308. ISSN  0163-5719. S2CID  10306053.
  7. ^ а б Ленат, Дуглас Б.; Guha, R. V .; Питтман, Карен; Пратт, Декстер; Шеперд, Мэри (август 1990). «Цикл: к программам со здравым смыслом». Commun. ACM. 33 (8): 30–49. Дои:10.1145/79173.79176. ISSN  0001-0782. S2CID  7296269.
  8. ^ а б c d е Ленат, Дуглас Б.; Гуха, Р. В. (1989). Построение больших систем, основанных на знаниях; Представление и вывод в циклическом проекте (1-е изд.). Бостон, Массачусетс, США: Addison-Wesley Longman Publishing Co., Inc. ISBN  978-0201517521.
  9. ^ Элкан, Чарльз; Грейнер, Рассел (1993-05-01). «Построение больших систем, основанных на знаниях: представление и вывод в циклическом проекте: Д.Б. Ленат и Р.В. Гуха». Искусственный интеллект. 61 (1): 41–52. Дои:10.1016 / 0004-3702 (93) 90092-П.
  10. ^ «Язык представления». www.aaai.org. Получено 2017-11-27.
  11. ^ Рассел, Грейнер (октябрь 1980 г.). «RLL-1: язык представления». Цитировать журнал требует | журнал = (помощь)
  12. ^ «Расписание - представление знаний и рассуждения: объединение символического и нейронного подходов». sites.google.com. Получено 2017-11-28.
  13. ^ «Интеграция Cyc и Википедии: фольксономия соответствует строго определенному здравому смыслу» (PDF). Получено 2013-05-10.
  14. ^ "Cyc Inference Engine". Получено 2015-06-04.
  15. ^ Проект Texai с открытым исходным кодом
  16. ^ Файлы проекта Texai SourceForge
  17. ^ "Cycorp Products". www.cyc.com. Получено 2017-11-29.
  18. ^ ХИЛЬЦИК, МАЙКЛ А. (21.06.2001). «Рождение мыслящей машины». Лос-Анджелес Таймс. ISSN  0458-3035. Получено 2017-11-29.
  19. ^ Крис Дитон; Блейк Шепард; Чарльз Кляйн; Корринн Майанс; Бретт Саммерс; Антуан Брюссо; Майкл Уитброк; Дуг Ленат (2005). «Всеобъемлющая база знаний о терроризме в цикле». Труды Международной конференции по анализу разведданных 2005 г.. CiteSeerX  10.1.1.70.9247.
  20. ^ Дуглас Б. Ленат; Крис Дитон (апрель 2008 г.). Финальный технический отчет БАЗЫ ЗНАНИЙ ТЕРРОРИЗМА (TKB) (Технический отчет). Римский исследовательский центр, Рим, Нью-Йорк: Управление информации научно-исследовательской лаборатории ВВС. AFRL-RI-RS-TR-2008-125.
  21. ^ «Пример: репозиторий семантического веб-контента для клинических исследований». www.w3.org. Получено 2018-02-28.
  22. ^ Ленат, Дуглас; Витброк, Майкл; Бакстер, Дэвид; Блэкстоун, Юджин; Дитон, Крис; Шнайдер, Дэйв; Скотт, Джерри; Шепард, Блейк (28.07.2010). «Использование цикла для ответов на специальные запросы клинических исследователей». Журнал AI. 31 (3): 13. Дои:10.1609 / aimag.v31i3.2299. ISSN  0738-4602.
  23. ^ Ленат, Дуглас Б.; Дурлах, Паула Дж. (01.09.2014). «Укрепление математических знаний путем погружения студентов в имитацию обучения путем преподавания». Международный журнал искусственного интеллекта в образовании. 24 (3): 216–250. Дои:10.1007 / s40593-014-0016-х. ISSN  1560-4292.
  24. ^ "Mathcraft by Cycorp". www.mathcraft.ai. Получено 2017-11-29.
  25. ^ Бертино, Пьеро и Зарри 2001, п. 275
  26. ^ Хаваси, Кэтрин (9 августа 2014 г.). «Кто использует здравые рассуждения и почему это важно». TechCrunch. Получено 2017-11-29.
  27. ^ Домингос, Педро (2015). Главный алгоритм: как поиски совершенной обучающей машины переделают наш мир. ISBN  978-0465065707.
  28. ^ Робин Хэнсон (1 декабря 2008 г.). «Преодоление предвзятости: I Heart CYC». www.overcomingbias.com. Получено 2017-11-29.
  29. ^ а б Баард, Марк (13 мая 2003 г.). «Основатель AI взрывает современные исследования». ПРОВОДНОЙ. Получено 2017-11-29.
  30. ^ Knight, Will (14 марта, 2016). «ИИ, который 30 лет изучал здравый смысл, готов к работе». Обзор технологий MIT. Получено 2017-11-29.
  31. ^ Дуг Ленат (15 мая 2017 г.). "Иногда лоска интеллекта недостаточно | CogWorld". ognitiveworld.com. Получено 2017-11-29.
  32. ^ «Вычислительный закон, символический дискурс и конституция искусственного интеллекта - блог Стивена Вольфрама». blog.stephenwolfram.com. 12 октября 2016 г.. Получено 2017-11-29.
  33. ^ Дэвис, Эрнест; Маркус, Гэри (2015). «Здравый смысл и здравый смысл в искусственном интеллекте». Коммуникации ACM. 58 (9): 92–103. Дои:10.1145/2701413. S2CID  13583137.
  34. ^ Голдсмит, Джеффри (1 апреля 1994 г.). "CYC-O". ПРОВОДНОЙ. Получено 2017-11-29.
  35. ^ Кейд Мец (25 марта 2016 г.). "Одинокий крестовый поход одного гения, чтобы научить компьютер здравому смыслу". ПРОВОДНОЙ. Получено 2017-11-29.
  36. ^ Staff, Wired (1 ноября 1998 г.). "The Wired 25". ПРОВОДНОЙ. Получено 2017-11-29.

дальнейшее чтение

внешняя ссылка