Intel Tera-Scale - Intel Tera-Scale

Intel Tera-Scale это исследовательская программа Intel который фокусируется на развитии в Процессоры Intel и платформы, использующие присущие параллелизм новых приложений для визуальных вычислений. Такие приложения требуют терафлопс производительности параллельных вычислений для обработки терабайты данных быстро.^[1] Параллелизм - это концепция одновременного выполнения нескольких задач. Использование параллелизма не только повысит эффективность вычислительных устройств (ЦП), но и увеличит количество байтов данных, анализируемых каждую секунду. Чтобы правильно применить параллелизм, ЦП должен уметь обрабатывать несколько потоки и для этого ЦП должен состоять из нескольких ядер. Обычное количество ядер в компьютерах потребительского уровня составляет 2–8 ядер, в то время как компьютеры уровня рабочих станций могут иметь еще большее количество ядер. Однако даже текущее количество ядер недостаточно велико для работы с производительностью терафлопс, что приводит к необходимости добавления еще большего количества ядер. В результате программы были изготовлены два прототипа, которые использовались для проверки возможности иметь намного больше ядер, чем обычно, и оказались успешными.

Прототипы

Чип для исследования терафлопс (Polaris) - это 80-ядерный прототип процессора, разработанный Intel в 2007 году. Он представляет собой первую публичную попытку Intel создать процессор Tera-Scale. Процессор Polaris должен работать на частоте 3,13 ГГц и напряжении 1 В, чтобы сохранить свое название teraFLOP. Пиковая производительность процессора составляет 1,28 терафлопа.^[2]

Однокристальный облачный компьютер - еще один исследовательский процессор, разработанный Intel в 2009 году. Этот процессор состоит из 48 ядер P54C, соединенных в 2D-сетку 6x4.^[3]

Идеология

Параллелизм - это концепция одновременного выполнения нескольких задач, эффективно сокращающая время, необходимое для выполнения данной задачи. Программа исследований Tera-Scale сосредоточена на концепции использования гораздо большего количества ядер, чем обычно, для повышения производительности за счет параллелизма. Основываясь на их предыдущем опыте с увеличением количества ядер в процессорах, удвоение количества ядер позволило почти удвоить производительность без увеличения мощности. При большем количестве ядер появляются возможности повышения энергоэффективности, производительности, увеличения срока службы и новых возможностей. Процессоры Tera-Scale позволят повысить энергоэффективность за счет возможности «усыпить» ядра, которые в данный момент не нужны, и в то же время повысить производительность за счет интеллектуального перераспределения рабочих нагрузок для обеспечения равномерного распределения нагрузки по кристаллу. Увеличенные сроки службы также способны тера-процессоры из-за возможности наличия резервных ядер, которые могут быть переведены в оперативный режим при отказе ядра в процессоре. Наконец, процессоры получат новые возможности и функциональные возможности, поскольку могут быть интегрированы специализированные аппаратные механизмы, такие как графические ядра.^[4]

Аппаратное обеспечение

Intel Tera-Scale ориентирована на создание многоядерных процессоров, которые могут использовать параллельную обработку для достижения производительности вычислений в терафлопс. Современные процессоры состоят из очень сложных ядер; тем не менее, существующие ядра построены таким образом, что количество ядер в ЦП превышает текущее. В результате Intel в настоящее время сосредоточена на создании процессоров Tera-Scale с большим количеством ядер, а не с высокопроизводительными ядрами. Чтобы упростить процессорные ядра, Intel отказалась от процессоров, использующих x86 архитектура к гораздо более простой VLIW архитектура. VLIW - необычная архитектура для настольных компьютеров, но подходит для компьютеров, на которых работают специализированные приложения. Эта архитектура упрощает проектирование оборудования за счет увеличения рабочей нагрузки на стороне компилятора, что означает, что в программирование необходимо вложить больше работы. Этот недостаток компенсируется тем фактом, что количество приложений, которые будут запускаться на процессоре Tera-Scale, достаточно мало, чтобы это не было слишком большой нагрузкой для программного обеспечения.^[2]

Программного обеспечения

С выпуском процессора Polaris 80 в 2007 году люди усомнились в необходимости десятков или сотен ядер. Intel ответила категорией программного обеспечения под названием приложения для распознавания, майнинга и синтеза (RMS), которые требуют вычислительной мощности в десятки или сотни ядер. Приложения распознавания создают модели на основе того, что они идентифицируют, например, лица человека. Приложения для майнинга извлекают один или несколько экземпляров из большого количества данных. Наконец, приложения для синтеза позволяют предсказывать и проектировать новые среды. Примером того, где необходимы RMS и тера-процессоры, является создание спортивных сводок. Обычно спортивные сводки требуют часов для компьютера, чтобы просмотреть сотни тысяч видеокадров, чтобы найти короткие видеоролики, которые будут показаны в спортивных сводках. С помощью программного обеспечения RMS и процессора тера-масштаба спортивные сводки можно было создавать в реальном времени во время спортивных мероприятий.^[1] Процессоры Tera-Scale также демонстрируют потенциал для анализа в реальном времени в таких областях, как финансы, для которых требуется процессор, способный анализировать огромные объемы данных. Из прошлого эволюции Intel от одноядерных процессоров к многоядерным компаниям Intel пришла к выводу, что распараллеливание является ключом к большей вычислительной мощности в будущем. Программа исследований Intel Tera-Scale ориентирована не только на создание процессоров с несколькими ядрами, но и на приложения для распараллеливания сегодня и в будущем. Чтобы продемонстрировать свою приверженность всем аспектам параллельных вычислений, Intel выделила 20 миллионов долларов на создание центров, которые будут исследовать и разрабатывать новые методы использования параллельных вычислений во многих других приложениях.^[5]

Вызовы

В начале 2005 года Intel впервые столкнулась с проблемой пропускной способности памяти. При добавлении большего количества ядер пропускная способность памяти остается неизменной из-за сужения размера, что фактически создает узкие места для ЦП. Они смогли решить эту проблему с помощью процесса, называемого укладкой штампов. Это процесс, в котором ЦП умереть, вспышка и DRAM будут наложены друг на друга, что значительно повысит возможную ширину шины памяти.^[2]Еще одна проблема, с которой столкнулась Intel, заключалась в физических ограничениях электрических шин. Пропускная способность шины - это соединение ЦП с внешним миром, и с текущей пропускной способностью шины он не сможет поспевать за производительностью терафлопов, обусловленной тера-масштабными процессорами. Исследования Intel в области Silicon Photonics позволили создать функциональную оптическую шину, которая может предложить превосходную скорость передачи сигналов и энергоэффективность по сравнению с существующими шинами. Эти оптические шины являются идеальным решением для ограничения полосы пропускания шины для тера-масштабных процессоров.^[2]