NUPACK - Википедия - NUPACK

NUPACK
Nupack logo small.png
СделаноКоманда NUPACK в Калтехе
URLwww.nupack.org
КоммерческийНет
Постановка на учетНеобязательный

В Пакет нуклеиновых кислот (NUPACK) - это растущий программный пакет для анализ и дизайн из нуклеиновая кислота системы.[2] Задания можно запускать онлайн на NUPACK веб сервер или NUPACK исходный код можно загрузить и скомпилировать локально для некоммерческого академического использования.[3] Алгоритмы NUPACK сформулированы в терминах вторичной структуры нуклеиновой кислоты. В большинстве случаев, псевдоузлы исключены из структурного ансамбля.

Модель вторичной структуры

Пример чертежа вторичной структуры (слева) и соответствующего графа полимера (справа). Хребты представлены толстыми цветными линиями, а основания и пары оснований представлены тонкими черными линиями.

В вторичная структура нескольких взаимодействующих нитей определяется списком пар оснований.[4] Полимерный граф для вторичной структуры может быть построен путем расположения нитей по кругу, последовательного рисования основных цепей от 5 до 3 футов по окружности с прорезью между каждой цепью и рисования прямых линий, соединяющих парные основания. Вторичная структура псевдоузловой если порядок каждой нити соответствует полимерному графу с пересекающимися линиями. Вторичная структура соединяется, если ни одна из нитей не свободна от других. Алгоритмы сформулированы в терминах упорядоченных комплексов, каждый из которых соответствует структурному ансамблю всех связанных полимерных графов без пересекающихся линий для определенного упорядочения набора нитей. Свободная энергия вторичной структуры без псевдоузлов рассчитывается с использованием эмпирических параметров ближайших соседей для РНК в 1M Na +[5][6] или для ДНК в заданных пользователем концентрациях Na + и Mg ++;[7][8][9] добавленные параметры используются для анализа псевдоузлов (только отдельные цепи РНК).[10][11]

веб сервер

Анализ

Страница анализа позволяет пользователям анализировать термодинамический свойства разбавленного раствора взаимодействующих цепей нуклеиновых кислот в отсутствие псевдоузлов (например, пробирка с нитями ДНК или РНК).[2][4] Для разбавленного раствора, содержащего несколько видов цепей, взаимодействующих с образованием нескольких видов упорядоченных комплексов, NUPACK вычисляет для каждого упорядоченного комплекса:

включая тщательный подход к проблемам различимости, возникающим в многоцепочечной среде.

Дизайн

Страница «Дизайн» позволяет пользователям разрабатывать последовательности для одной или нескольких нитей, предназначенных для принятия не псевдоузловой целевой вторичной структуры в состоянии равновесия.[2] Дизайн последовательности сформулирован как проблема оптимизации с целью уменьшения дефектов ансамбля ниже заданного пользователем условия остановки.[12] Для последовательности-кандидата и данной целевой вторичной структуры дефект ансамбля представляет собой среднее количество неправильно спаренных по структурному ансамблю упорядоченного комплекса.[13] Для целевой вторичной структуры с N нуклеотидами алгоритм стремится достичь дефекта ансамбля ниже N / 100. Эмпирически алгоритм проектирования демонстрирует асимптотическую оптимальность при увеличении N: для достаточно большого N стоимость разработки последовательности обычно составляет только 4/3 стоимости однократной оценки дефекта ансамбля.[12]

Утилиты

Страница Утилиты позволяет пользователям оценивать, отображать и аннотировать равновесные свойства комплекса взаимодействующих цепей нуклеиновых кислот.[2] Страница принимает в качестве входных данных либо информацию о последовательности, либо информацию о структуре, либо и то, и другое, выполняя различные функции на основе предоставленной информации, включая автоматический макет и визуализация вторичных структур с идеальной спиральной геометрией или без нее. В любом случае макет структуры можно редактировать динамически в веб-приложении.

Страница Utilities позволяет отображать вторичные структуры с идеальной спиральной геометрией для сложенных пар оснований, как для этого комплекса из трех цепей РНК со спиралями A-формы (слева) или трех цепей ДНК со спиралями B-формы (справа).

Выполнение

Веб-приложение NUPACK[2] запрограммирован в Рубин на рельсах рамки, использующие Аякс и Набор инструментов Dojo для реализации динамических функций и интерактивной графики. Сюжеты и графика создаются с использованием NumPy и matplotlib. Сайт поддерживается текущими версиями веб-браузеры Сафари, Хром, и Fire Fox. Библиотека алгоритмов анализа и проектирования NUPACK написана на языке программирования. C. Распараллеливание динамических программ с использованием Интерфейс передачи сообщений (MPI).

Условия эксплуатации

Веб-сервер NUPACK и исходный код NUPACK предоставляются для некоммерческих исследовательских целей и не подпадают под это ограничение. Бесплатное программное обеспечение с открытым исходным кодом.

Финансирование

Разработка NUPACK финансируется Национальным научным фондом в рамках проекта молекулярного программирования.[14] и Институтом Бекмана[15] на Калифорнийский технологический институт (Калифорнийский технологический институт).

Смотрите также

внешняя ссылка

Рекомендации

  1. ^ "Информация о сайте Nupack.org". Alexa Интернет. Получено 2014-04-01.
  2. ^ а б c d е Заде, J.N., C.D. Стинберг, Дж. Буа, Б. Вулф, А. Хан, М. Пирс, Р. Диркс, Н.А.Пирс, NUPACK: анализ и дизайн систем нуклеиновых кислот. Журнал вычислительной химии
  3. ^ загрузки
  4. ^ а б Диркс, Р.М., Дж. Бойс, Дж. М. Шеффер, Э. Винфри и Н.А. Пирс, Термодинамический анализ взаимодействующих цепей нуклеиновых кислот SIAM Review, 2007. 49 (1): p. 65-88.
  5. ^ Серра, М.Дж., Д.Х. Тернер, Прогнозирование термодинамических свойств РНК. Методы в энзимологии, 1995. 259: с. 242-261.
  6. ^ Мэтьюз, Д.Х., Дж. Сабина, М. Цукер и Д.Х. Тернер, Расширенная зависимость термодинамических параметров от последовательности улучшает предсказание вторичной структуры РНК. Журнал молекулярной биологии, 1999. 288: с. 911-940.
  7. ^ Санта-Люсия, Дж., Дж., Единый взгляд на термодинамику ближайших соседей полимера, гантели и олигонуклеотида ДНК. Proceedings of the National Academy of Sciences of the United States of America, 1998. 95 (4): p. 1460-1465.
  8. ^ Санта-Люсия, Дж. И Д. Хикс, Термодинамика ДНК структурные мотивы. Ежегодный обзор биофизики и структуры биомолекул, 2004 г. 33: с. 415-440.
  9. ^ Келер, Р. и Н. Пейрет, Термодинамические свойства последовательностей ДНК: характерные значения для генома человека. Биоинформатика, 2005. 21 (16): с. 3333-3339.
  10. ^ Диркс, Р. и Н.А.Пирс, Алгоритм статистической суммы для вторичной структуры нуклеиновой кислоты, включая псевдоузлы. Журнал вычислительной химии, 2003. 24: с. 1664–1677.
  11. ^ Диркс, Р. и Н.А.Пирс, Алгоритм для вычисления вероятностей образования пар нуклеиновых кислот, включая псевдоузлы. Журнал вычислительной химии, 2004. 25: с. 1295-1304.
  12. ^ а б Заде, J.N., B.R. Вулф, Н.А.Пирс, Дизайн последовательности нуклеиновой кислоты с помощью эффективной оптимизации дефектов ансамбля. Журнал вычислительной химии.
  13. ^ Диркс, Р.М., Линь М., Уинфри Э., Пирс Н.А., Парадигмы компьютерного дизайна нуклеиновых кислот. Nucleic Acids Research, 2004. 32 (4): p. 1392-1403.
  14. ^ Проект молекулярного программирования
  15. ^ Институт Бекмана