R-фактор (кристаллография) - R-factor (crystallography)
В кристаллография, то R-фактор (иногда называемый остаточным фактором или коэффициентом надежности, или R-значением, или RРабота) является мерой соответствия кристаллографической модели экспериментальной дифракция рентгеновских лучей данные. Другими словами, это показатель того, насколько хорошо уточненная структура предсказывает наблюдаемые данные.[1] Это значение также иногда называют индекс несоответствия, поскольку он математически описывает разницу между экспериментальными наблюдениями и идеальными расчетными значениями.[2] Он определяется следующим уравнением:
где F так называемый структурный фактор и сумма распространяется на все измеренные отражения рентгеновских лучей и их рассчитанные аналоги соответственно. Структурный фактор тесно связан с интенсивностью отражения, которое он описывает:
Минимально возможное значение равно нулю, что указывает на полное соответствие между экспериментальными наблюдениями и структурными факторами, предсказанными на основе модели. Теоретического максимума нет, но на практике значения значительно меньше единицы даже для плохих моделей при условии, что модель включает подходящий масштабный коэффициент. Случайные экспериментальные ошибки в данных способствуют даже для идеальной модели, и они имеют больше преимуществ, когда данных недостаточно или мало, например, для набора данных с низким разрешением. Несоответствия модели, такие как неправильные или отсутствующие части и немоделированный беспорядок, являются другими основными факторами, влияющими на , что делает его полезным для оценки хода и окончательного результата уточнения кристаллографической модели. Для больших молекул R-фактор обычно находится в диапазоне от 0,6 (при вычислении для случайной модели и набора экспериментальных данных) до 0,2 (например, для хорошо уточненной макромолекулярной модели с разрешением 2,5 Ангстрема). Небольшие молекулы (до ок. 1000 атомов) обычно образуют более упорядоченные кристаллы, чем большие молекулы, и, таким образом, можно получить более низкие R-факторы. в Кембриджская структурная база данных Для низкомолекулярных структур более 95% кристаллов из 500 000+ имеют R-фактор ниже 0,15, а 9,5% имеют R-фактор ниже 0,03.
Кристаллографы также используют свободный R-фактор () [3] чтобы оценить возможное чрезмерное моделирование данных. вычисляется по той же формуле, приведенной выше, но на небольшой случайной выборке данных, которые выделены для этой цели и никогда не включаются в уточнение. всегда будет больше чем потому что модель не приспособлена к отражениям, которые способствуют , но две статистики должны быть похожи, потому что правильная модель должна предсказывать все данные с постоянной точностью. Если две статистические данные значительно различаются, это означает, что модель была чрезмерно параметризована, так что в некоторой степени она предсказывает не идеальные безошибочные данные для правильной модели, а скорее реально наблюдаемые данные с ошибками.
Количество и аналогично используются для описания внутреннего согласия измерений в наборе кристаллографических данных.
Рекомендации
- ^ Моррис А.Л., Макартур М.В., Хатчинсон Э.Г., Торнтон Дж.М. (апрель 1992 г.). «Стереохимическое качество координат структуры белка». Белки. 12 (4): 345–64. Дои:10.1002 / prot.340120407. PMID 1579569.
- ^ «Фактор R». Международный союз кристаллографии. Получено 2013-12-13.
- ^ Брюнгер А.Т. (январь 1992 г.). «Свободное значение R: новая статистическая величина для оценки точности кристаллических структур». Природа. 355 (6359): 472–475. Bibcode:1992Натура.355..472Б. Дои:10.1038 / 355472a0. PMID 18481394.