Minifloat - Minifloat

В вычисление, минифлоты находятся плавающая точка значения представлены очень немногими биты. Как и ожидалось, они плохо подходят для численных расчетов общего назначения. Они используются для специальных целей, чаще всего в компьютерной графике, где итерации небольшие, а точность имеет эстетические эффекты.[нужна цитата ] Машинное обучение также использует похожие форматы, такие как bfloat16. Кроме того, они часто используются в качестве педагогического инструмента на курсах информатики для демонстрации свойств и структур плавающая точка арифметика и IEEE 754 числа.

Минифлоты с 16 биты находятся половинная точность числа (в отличие от Один и двойная точность ). Также есть минифлоты с 8 битами или даже меньше.

Minifloat может быть разработан в соответствии с принципами IEEE 754 стандарт. В этом случае они должны подчиняться (прямо не прописанным) правилам границы между субнормальные и нормальные числа и должны иметь специальные шаблоны для бесконечность и NaN. Нормализованные числа хранятся с смещенная экспонента. Новая редакция стандарта, IEEE 754-2008, имеет 16-битные двоичные минифлоты.

В Radeon R300 и R420 Графические процессоры использовали формат с плавающей запятой «fp24» с 7 битами экспоненты и 16 битами (неявно +1) мантиссы.[1]«Полная точность» в Direct3D 9.0 - это собственный 24-битный формат с плавающей запятой. Графика Microsoft D3D9 (Shader Model 2.0) API Первоначально поддерживал как FP24 (как в чипе ATI R300), так и FP32 (как в чипе Nvidia NV30) как «Полная точность», а также FP16 как «Частичная точность» для вычислений вершинных и пиксельных шейдеров, выполняемых графическим оборудованием.

Обозначение

Минифлот обычно описывается набором из четырех чисел (S, E, M, B):

  • S - длина поля знака. Обычно это либо 0, либо 1.
  • E - длина поля экспоненты.
  • M - длина поля мантиссы (мантиссы).
  • B это смещение экспоненты.

Формат минифлота, обозначаемый (S, E, M, B) следовательно является, S + E + M биты длинные.

В компьютерной графике минифлоты иногда используются для представления только целых значений. Если в то же время должны существовать субнормальные значения, наименьшее субнормальное число должно быть 1. Значение смещения будет B = E - M - 1 в этом случае предполагается, что в соответствии с IEEE используются два специальных значения показателя степени.

(S, E, M, B) обозначение можно преобразовать в (B, п, L, U) форматировать как (2, M + 1, B + 1, 2S - B) (с использованием экспонент IEEE).

Пример

Макет примера 8-битного минифлота (1.4.3. − 2)
знакпоказатель степенизначимое
76543210

В этом примере для представления целочисленных значений используется минифлот в 1 байт (8 бит) с 1 битом знака, 4 битами экспоненты и 3 битами значащей (короче, минифлот 1.4.3.-2). Все принципы IEEE 754 должны действовать. Единственная бесплатная ценность - это смещение экспоненты, который мы определяем как -2 для целых чисел. Неизвестная экспонента на данный момент называется Икс.

Числа в другой базе помечены как ...основание, например, 1012 = 5. В битовых шаблонах есть пробелы для визуализации их частей.

Представление нуля

0 0000 000 = 0

Субнормальные числа

Мантисса расширяется на «0»:

0 0000 001 = 0.0012 × 2Икс = 0.125 × 2Икс = 1 (наименьшее субнормальное число) ... 0 0000111 = 0,1112 × 2Икс = 0.875 × 2Икс = 7 (наибольшее субнормальное число)

Нормализованные числа

Значение увеличивается на «1»:

0 0001 000 = 1.0002 × 2Икс = 1 × 2Икс = 8 (наименьшее нормализованное число) 0 0001001 = 1,0012 × 2Икс = 1.125 × 2Икс = 9...0 0010 000 = 1.0002 × 2Икс+1 = 1 × 2Икс+1 = 160 0010 001 = 1.0012 × 2Икс+1 = 1.125 × 2Икс+1 = 18...0 1110 000 = 1.0002 × 2Икс+13 =  1.000 × 2Икс+13 =  655360 1110 001 = 1.0012 × 2Икс+13 =  1.125 × 2Икс+13 =  73728...0 1110 110 = 1.1102 × 2Икс+13 =  1.750 × 2Икс+13 = 1146880 1110 111 = 1.1112 × 2Икс+13 =  1.875 × 2Икс+13 = 122880 (наибольшее нормализованное число)

бесконечность

0 1111 000 = + бесконечность 1 1111 000 = −infinity

Если бы поле экспоненты не обрабатывалось специально, значение было бы

0 1111 000 = 1.0002 × 2Икс+14 =  217 = 131072

Не число

Икс 1111 ггг = NaN (если ггг ≠ 000)

Без специальной обработки IEEE 754 наибольшего показателя степени наибольшее возможное значение было бы

0 1111 111 = 1.1112 × 2Икс+14 =  1.875 × 217 = 245760

Значение смещения

Если наименьшее субнормальное значение (вторая строка выше) должно быть 1[нужна цитата ], значение Икс должно быть Икс = 3. Следовательно, смещение должно быть −2[нужна цитата ]; то есть каждый сохраненный показатель должен быть уменьшен на -2 или должен быть увеличен на 2, чтобы получить числовой показатель степени.

Все значения в виде десятичных знаков

Это диаграмма всех возможных значений при обращении с поплавком так же, как с поплавком IEEE.

... 000... 001... 010... 011... 100... 101... 110... 111
0 0000 ...00.1250.250.3750.50.6250.750.875
0 0001 ...11.1251.251.3751.51.6251.751.875
0 0010 ...22.252.52.7533.253.53.75
0 0011 ...44.555.566.577.5
0 0100 ...89101112131415
0 0101 ...1618202224262830
0 0110 ...3236404448525660
0 0111 ...6472808896104112120
0 1000 ...128144160176192208224240
0 1001 ...256288320352384416448480
0 1010 ...512576640704768832896960
0 1011 ...10241152128014081536166417921920
0 1100 ...20482304256028163072332835843840
0 1101 ...40964608512056326144665671687680
0 1110 ...81929216102401126412288133121433615360
0 1111 ...InfNaNNaNNaNNaNNaNNaNNaN
1 0000 ...-0-0.125-0.25-0.375-0.5-0.625-0.75-0.875
1 0001 ...-1-1.125-1.25-1.375-1.5-1.625-1.75-1.875
1 0010 ...-2-2.25-2.5-2.75-3-3.25-3.5-3.75
1 0011 ...-4-4.5-5-5.5-6-6.5-7-7.5
1 0100 ...−8−9−10−11−12−13−14−15
1 0101 ...−16−18−20−22−24−26−28−30
1 0110 ...−32−36−40−44−48−52−56−60
1 0111 ...−64−72−80−88−96−104−112−120
1 1000 ...−128−144−160−176−192−208−224−240
1 1001 ...−256−288−320−352−384−416−448−480
1 1010 ...−512−576−640−704−768−832−896−960
1 1011 ...−1024−1152−1280−1408−1536−1664−1792−1920
1 1100 ...−2048−2304−2560−2816−3072−3328−3584−3840
1 1101 ...−4096−4608−5120−5632−6144−6656−7168−7680
1 1110 ...−8192−9216−10240−11264−12288−13312−14336−15360
1 1111 ...−InfNaNNaNNaNNaNNaNNaNNaN

Все значения как целые числа

Из-за серьезной нехватки точности с 8-битными числами с плавающей запятой рекомендуется использовать их только с масштабированием до целых значений.

... 000... 001... 010... 011... 100... 101... 110... 111
0 0000 ...01234567
0 0001 ...89101112131415
0 0010 ...1618202224262830
0 0011 ...3236404448525660
0 0100 ...6472808896104112120
0 0101 ...128144160176192208224240
0 0110 ...256288320352384416448480
0 0111 ...512576640704768832896960
0 1000 ...10241152128014081536166417921920
0 1001 ...20482304256028163072332835843840
0 1010 ...40964608512056326144665671687680
0 1011 ...81929216102401126412288133121433615360
0 1100 ...1638418432204802252824576266242867230720
0 1101 ...3276836864409604505649152532485734461440
0 1110 ...6553673728819209011298304106496114688122880
0 1111 ...InfNaNNaNNaNNaNNaNNaNNaN
1 0000 ...−0−1−2−3−4−5−6−7
1 0001 ...−8−9−10−11−12−13−14−15
1 0010 ...−16−18−20−22−24−26−28−30
1 0011 ...−32−36−40−44−48−52−56−60
1 0100 ...−64−72−80−88−96−104−112−120
1 0101 ...−128−144−160−176−192−208−224−240
1 0110 ...−256−288−320−352−384−416−448−480
1 0111 ...−512−576−640−704−768−832−896−960
1 1000 ...−1024−1152−1280−1408−1536−1664−1792−1920
1 1001 ...−2048−2304−2560−2816−3072−3328−3584−3840
1 1010 ...−4096−4608−5120−5632−6144−6656−7168−7680
1 1011 ...−8192−9216−10240−11264−12288−13312−14336−15360
1 1100 ...−16384−18432−20480−22528−24576−26624−28672−30720
1 1101 ...−32768−36864−40960−45056−49152−53248−57344−61440
1 1110 ...−65536−73728−81920−90112−98304−106496−114688−122880
1 1111 ...−InfNaNNaNNaNNaNNaNNaNNaN

Однако на практике поплавки точно не отображаются.[нужна цитата ] Вместо этого они округлые; например, если у числа с плавающей запятой было около 3 значащих цифр и было представлено число 8192, оно будет округлено до 8190, чтобы избежать ложная точность, в противном случае число, подобное 1000000, преобразованное в такое число с плавающей запятой и обратно, могло бы сбивать с толку, например, 1000448.[нужна цитата ]

Свойства этого примера

Графическое представление интегральных (1.4.3. − 2) минифлотов

Интегральные минифлоты в 1 байт имеют больший диапазон ± 122880, чем дополнение до двух целое число в диапазоне от -128 до +127. Большой диапазон компенсируется плохой точностью, потому что имеется только 4 бита мантиссы, что эквивалентно чуть более чем одному десятичному знаку. У них также больший диапазон, чем у минифлота половинной точности с диапазоном ± 65 504, что также компенсируется отсутствием дроби и низкой точностью.

Есть только 242 различных значения (если +0 и -0 считаются разными), потому что 14 битовых комбинаций представляют NaN.

Значения от 0 до 16 имеют тот же битовый шаблон, что и minifloat или целое число с дополнением до двух. Первый шаблон с другим значением - 00010001, что составляет 18 как минифлот и 17 как целое число с дополнением до двух.

Это совпадение вообще не происходит с отрицательными значениями, потому что этот минифлот представляет собой формат величины со знаком.

Вертикальная реальная линия справа ясно показывает различную плотность значений с плавающей запятой - свойство, общее для любой системы с плавающей запятой. Эта изменяющаяся плотность приводит к кривой, подобной экспоненциальной функции.

Хотя кривая может казаться гладкой, это не так. График фактически состоит из различных точек, и эти точки лежат на отрезках с дискретными наклонами. Значение битов экспоненты определяет абсолютную точность битов мантиссы, и именно эта точность определяет наклон каждого линейного сегмента.

Арифметика

Добавление

Добавление (1.3.2.3) -минифлотов

На графике показано добавление еще меньших (1.3.2.3) минифлотов с 6 битами. Эта система с плавающей запятой в точности следует правилам IEEE 754. NaN как операнд всегда дает результат NaN. Inf - Inf и (−Inf) + Inf также приводят к NaN (зеленая область). Inf можно увеличивать и уменьшать на конечные значения без изменений. Суммы с конечными операндами могут дать бесконечный результат (т.е. 14.0 + 3.0 = + Inf, так как результат - это голубая область, -Inf - пурпурная область). Диапазон конечных операндов заполнен кривыми Икс + у = c, куда c всегда является одним из представимых значений с плавающей запятой (синий и красный для положительных и отрицательных результатов соответственно).

Вычитание, умножение и деление

Остальные арифметические операции можно проиллюстрировать аналогично:

Во встроенных устройствах

Minifloat также часто используется во встроенных устройствах, особенно на микроконтроллеры где с плавающей запятой в любом случае нужно будет эмулировать программное обеспечение. Для ускорения вычислений мантисса обычно занимает ровно половину битов, поэтому граница регистра автоматически обращается к частям без сдвига.

Смотрите также

Рекомендации

  1. ^ Бак, Ян (13 марта 2005 г.), «Глава 32. Погружение в вычисления на GPU», в Pharr, Мэтт (ред.), Камни GPU, ISBN  0-321-33559-7, получено 5 апреля 2018.

дальнейшее чтение

внешняя ссылка