Minifloat - Minifloat

В вычисление, минифлоты находятся плавающая точка значения представлены очень немногими биты. Как и ожидалось, они плохо подходят для численных расчетов общего назначения. Они используются для специальных целей, чаще всего в компьютерной графике, где итерации небольшие, а точность имеет эстетические эффекты.^{[нужна цитата ]} Машинное обучение также использует похожие форматы, такие как bfloat16. Кроме того, они часто используются в качестве педагогического инструмента на курсах информатики для демонстрации свойств и структур плавающая точка арифметика и IEEE 754 числа.

Минифлоты с 16 биты находятся половинная точность числа (в отличие от Один и двойная точность ). Также есть минифлоты с 8 битами или даже меньше.

Minifloat может быть разработан в соответствии с принципами IEEE 754 стандарт. В этом случае они должны подчиняться (прямо не прописанным) правилам границы между субнормальные и нормальные числа и должны иметь специальные шаблоны для бесконечность и NaN. Нормализованные числа хранятся с смещенная экспонента. Новая редакция стандарта, IEEE 754-2008, имеет 16-битные двоичные минифлоты.

В Radeon R300 и R420 Графические процессоры использовали формат с плавающей запятой «fp24» с 7 битами экспоненты и 16 битами (неявно +1) мантиссы.^[1]«Полная точность» в Direct3D 9.0 - это собственный 24-битный формат с плавающей запятой. Графика Microsoft D3D9 (Shader Model 2.0) API Первоначально поддерживал как FP24 (как в чипе ATI R300), так и FP32 (как в чипе Nvidia NV30) как «Полная точность», а также FP16 как «Частичная точность» для вычислений вершинных и пиксельных шейдеров, выполняемых графическим оборудованием.

Обозначение

Минифлот обычно описывается набором из четырех чисел (S, E, M, B):

S - длина поля знака. Обычно это либо 0, либо 1.
E - длина поля экспоненты.
M - длина поля мантиссы (мантиссы).
B это смещение экспоненты.

Формат минифлота, обозначаемый (S, E, M, B) следовательно является, $S + E + M$ биты длинные.

В компьютерной графике минифлоты иногда используются для представления только целых значений. Если в то же время должны существовать субнормальные значения, наименьшее субнормальное число должно быть 1. Значение смещения будет $B = E - M - 1$ в этом случае предполагается, что в соответствии с IEEE используются два специальных значения показателя степени.

(S, E, M, B) обозначение можно преобразовать в (B, п, L, U) форматировать как $(2, M + 1, B + 1, 2 S - B)$ (с использованием экспонент IEEE).

Пример

Макет примера 8-битного минифлота (1.4.3. − 2)
знак	показатель степени				значимое
7	6	5	4	3	2	1	0

В этом примере для представления целочисленных значений используется минифлот в 1 байт (8 бит) с 1 битом знака, 4 битами экспоненты и 3 битами значащей (короче, минифлот 1.4.3.-2). Все принципы IEEE 754 должны действовать. Единственная бесплатная ценность - это смещение экспоненты, который мы определяем как -2 для целых чисел. Неизвестная экспонента на данный момент называется Икс.

Числа в другой базе помечены как ..._{основание}, например, 101₂ = 5. В битовых шаблонах есть пробелы для визуализации их частей.

Представление нуля

0 0000 000 = 0

Субнормальные числа

Мантисса расширяется на «0»:

0 0000 001 = 0.001₂ × 2^Икс = 0.125 × 2^Икс = 1 (наименьшее субнормальное число) ... 0 0000111 = 0,111₂ × 2^Икс = 0.875 × 2^Икс = 7 (наибольшее субнормальное число)

Нормализованные числа

Значение увеличивается на «1»:

0 0001 000 = 1.000₂ × 2^Икс = 1 × 2^Икс = 8 (наименьшее нормализованное число) 0 0001001 = 1,001₂ × 2^Икс = 1.125 × 2^Икс = 9...0 0010 000 = 1.000₂ × 2^Икс+1 = 1 × 2^Икс+1 = 160 0010 001 = 1.001₂ × 2^Икс+1 = 1.125 × 2^Икс+1 = 18...0 1110 000 = 1.000₂ × 2^Икс+13 =  1.000 × 2^Икс+13 =  655360 1110 001 = 1.001₂ × 2^Икс+13 =  1.125 × 2^Икс+13 =  73728...0 1110 110 = 1.110₂ × 2^Икс+13 =  1.750 × 2^Икс+13 = 1146880 1110 111 = 1.111₂ × 2^Икс+13 =  1.875 × 2^Икс+13 = 122880 (наибольшее нормализованное число)

бесконечность

0 1111 000 = + бесконечность 1 1111 000 = −infinity

Если бы поле экспоненты не обрабатывалось специально, значение было бы

0 1111 000 = 1.000₂ × 2^Икс+14 =  2¹⁷ = 131072

Не число

Икс 1111 ггг = NaN (если ггг ≠ 000)

Без специальной обработки IEEE 754 наибольшего показателя степени наибольшее возможное значение было бы

0 1111 111 = 1.111₂ × 2^Икс+14 =  1.875 × 2¹⁷ = 245760

Значение смещения

Если наименьшее субнормальное значение (вторая строка выше) должно быть 1^{[нужна цитата ]}, значение Икс должно быть Икс = 3. Следовательно, смещение должно быть −2^{[нужна цитата ]}; то есть каждый сохраненный показатель должен быть уменьшен на -2 или должен быть увеличен на 2, чтобы получить числовой показатель степени.

Все значения в виде десятичных знаков

Это диаграмма всех возможных значений при обращении с поплавком так же, как с поплавком IEEE.

	... 000	... 001	... 010	... 011	... 100	... 101	... 110	... 111
0 0000 ...	0	0.125	0.25	0.375	0.5	0.625	0.75	0.875
0 0001 ...	1	1.125	1.25	1.375	1.5	1.625	1.75	1.875
0 0010 ...	2	2.25	2.5	2.75	3	3.25	3.5	3.75
0 0011 ...	4	4.5	5	5.5	6	6.5	7	7.5
0 0100 ...	8	9	10	11	12	13	14	15
0 0101 ...	16	18	20	22	24	26	28	30
0 0110 ...	32	36	40	44	48	52	56	60
0 0111 ...	64	72	80	88	96	104	112	120
0 1000 ...	128	144	160	176	192	208	224	240
0 1001 ...	256	288	320	352	384	416	448	480
0 1010 ...	512	576	640	704	768	832	896	960
0 1011 ...	1024	1152	1280	1408	1536	1664	1792	1920
0 1100 ...	2048	2304	2560	2816	3072	3328	3584	3840
0 1101 ...	4096	4608	5120	5632	6144	6656	7168	7680
0 1110 ...	8192	9216	10240	11264	12288	13312	14336	15360
0 1111 ...	Inf	NaN	NaN	NaN	NaN	NaN	NaN	NaN
1 0000 ...	-0	-0.125	-0.25	-0.375	-0.5	-0.625	-0.75	-0.875
1 0001 ...	-1	-1.125	-1.25	-1.375	-1.5	-1.625	-1.75	-1.875
1 0010 ...	-2	-2.25	-2.5	-2.75	-3	-3.25	-3.5	-3.75
1 0011 ...	-4	-4.5	-5	-5.5	-6	-6.5	-7	-7.5
1 0100 ...	−8	−9	−10	−11	−12	−13	−14	−15
1 0101 ...	−16	−18	−20	−22	−24	−26	−28	−30
1 0110 ...	−32	−36	−40	−44	−48	−52	−56	−60
1 0111 ...	−64	−72	−80	−88	−96	−104	−112	−120
1 1000 ...	−128	−144	−160	−176	−192	−208	−224	−240
1 1001 ...	−256	−288	−320	−352	−384	−416	−448	−480
1 1010 ...	−512	−576	−640	−704	−768	−832	−896	−960
1 1011 ...	−1024	−1152	−1280	−1408	−1536	−1664	−1792	−1920
1 1100 ...	−2048	−2304	−2560	−2816	−3072	−3328	−3584	−3840
1 1101 ...	−4096	−4608	−5120	−5632	−6144	−6656	−7168	−7680
1 1110 ...	−8192	−9216	−10240	−11264	−12288	−13312	−14336	−15360
1 1111 ...	−Inf	NaN	NaN	NaN	NaN	NaN	NaN	NaN

Все значения как целые числа

Из-за серьезной нехватки точности с 8-битными числами с плавающей запятой рекомендуется использовать их только с масштабированием до целых значений.

	... 000	... 001	... 010	... 011	... 100	... 101	... 110	... 111
0 0000 ...	0	1	2	3	4	5	6	7
0 0001 ...	8	9	10	11	12	13	14	15
0 0010 ...	16	18	20	22	24	26	28	30
0 0011 ...	32	36	40	44	48	52	56	60
0 0100 ...	64	72	80	88	96	104	112	120
0 0101 ...	128	144	160	176	192	208	224	240
0 0110 ...	256	288	320	352	384	416	448	480
0 0111 ...	512	576	640	704	768	832	896	960
0 1000 ...	1024	1152	1280	1408	1536	1664	1792	1920
0 1001 ...	2048	2304	2560	2816	3072	3328	3584	3840
0 1010 ...	4096	4608	5120	5632	6144	6656	7168	7680
0 1011 ...	8192	9216	10240	11264	12288	13312	14336	15360
0 1100 ...	16384	18432	20480	22528	24576	26624	28672	30720
0 1101 ...	32768	36864	40960	45056	49152	53248	57344	61440
0 1110 ...	65536	73728	81920	90112	98304	106496	114688	122880
0 1111 ...	Inf	NaN	NaN	NaN	NaN	NaN	NaN	NaN
1 0000 ...	−0	−1	−2	−3	−4	−5	−6	−7
1 0001 ...	−8	−9	−10	−11	−12	−13	−14	−15
1 0010 ...	−16	−18	−20	−22	−24	−26	−28	−30
1 0011 ...	−32	−36	−40	−44	−48	−52	−56	−60
1 0100 ...	−64	−72	−80	−88	−96	−104	−112	−120
1 0101 ...	−128	−144	−160	−176	−192	−208	−224	−240
1 0110 ...	−256	−288	−320	−352	−384	−416	−448	−480
1 0111 ...	−512	−576	−640	−704	−768	−832	−896	−960
1 1000 ...	−1024	−1152	−1280	−1408	−1536	−1664	−1792	−1920
1 1001 ...	−2048	−2304	−2560	−2816	−3072	−3328	−3584	−3840
1 1010 ...	−4096	−4608	−5120	−5632	−6144	−6656	−7168	−7680
1 1011 ...	−8192	−9216	−10240	−11264	−12288	−13312	−14336	−15360
1 1100 ...	−16384	−18432	−20480	−22528	−24576	−26624	−28672	−30720
1 1101 ...	−32768	−36864	−40960	−45056	−49152	−53248	−57344	−61440
1 1110 ...	−65536	−73728	−81920	−90112	−98304	−106496	−114688	−122880
1 1111 ...	−Inf	NaN	NaN	NaN	NaN	NaN	NaN	NaN

Однако на практике поплавки точно не отображаются.^{[нужна цитата ]} Вместо этого они округлые; например, если у числа с плавающей запятой было около 3 значащих цифр и было представлено число 8192, оно будет округлено до 8190, чтобы избежать ложная точность, в противном случае число, подобное 1000000, преобразованное в такое число с плавающей запятой и обратно, могло бы сбивать с толку, например, 1000448.^{[нужна цитата ]}

Свойства этого примера

Графическое представление интегральных (1.4.3. − 2) минифлотов

Интегральные минифлоты в 1 байт имеют больший диапазон ± 122880, чем дополнение до двух целое число в диапазоне от -128 до +127. Большой диапазон компенсируется плохой точностью, потому что имеется только 4 бита мантиссы, что эквивалентно чуть более чем одному десятичному знаку. У них также больший диапазон, чем у минифлота половинной точности с диапазоном ± 65 504, что также компенсируется отсутствием дроби и низкой точностью.

Есть только 242 различных значения (если +0 и -0 считаются разными), потому что 14 битовых комбинаций представляют NaN.

Значения от 0 до 16 имеют тот же битовый шаблон, что и minifloat или целое число с дополнением до двух. Первый шаблон с другим значением - 00010001, что составляет 18 как минифлот и 17 как целое число с дополнением до двух.

Это совпадение вообще не происходит с отрицательными значениями, потому что этот минифлот представляет собой формат величины со знаком.

Вертикальная реальная линия справа ясно показывает различную плотность значений с плавающей запятой - свойство, общее для любой системы с плавающей запятой. Эта изменяющаяся плотность приводит к кривой, подобной экспоненциальной функции.

Хотя кривая может казаться гладкой, это не так. График фактически состоит из различных точек, и эти точки лежат на отрезках с дискретными наклонами. Значение битов экспоненты определяет абсолютную точность битов мантиссы, и именно эта точность определяет наклон каждого линейного сегмента.

Арифметика

Добавление

Добавление (1.3.2.3) -минифлотов

На графике показано добавление еще меньших (1.3.2.3) минифлотов с 6 битами. Эта система с плавающей запятой в точности следует правилам IEEE 754. NaN как операнд всегда дает результат NaN. Inf - Inf и (−Inf) + Inf также приводят к NaN (зеленая область). Inf можно увеличивать и уменьшать на конечные значения без изменений. Суммы с конечными операндами могут дать бесконечный результат (т.е. 14.0 + 3.0 = + Inf, так как результат - это голубая область, -Inf - пурпурная область). Диапазон конечных операндов заполнен кривыми Икс + у = c, куда c всегда является одним из представимых значений с плавающей запятой (синий и красный для положительных и отрицательных результатов соответственно).

Вычитание, умножение и деление

Остальные арифметические операции можно проиллюстрировать аналогично:

Вычитание
Умножение
Разделение

Во встроенных устройствах

Minifloat также часто используется во встроенных устройствах, особенно на микроконтроллеры где с плавающей запятой в любом случае нужно будет эмулировать программное обеспечение. Для ускорения вычислений мантисса обычно занимает ровно половину битов, поэтому граница регистра автоматически обращается к частям без сдвига.

Смотрите также

дальнейшее чтение

внешняя ссылка

OpenGL половинный плавающий пиксель

[1] Бак, Ян (13 марта 2005 г.), «Глава 32. Погружение в вычисления на GPU», в Pharr, Мэтт (ред.), Камни GPU, ISBN 0-321-33559-7, получено 5 апреля 2018.

[1]

Типы данных
Неинтерпретированный	Кусочек Байт Трит Tryte Слово Битовый массив
Числовой	Произвольная точность или bignum Сложный Десятичный Фиксированная точка Плавающая точка Двойная точность Повышенная точность Длинный дубль Восьмеричная точность Четверная точность Одинарная точность Пониженная точность Minifloat Половинная точность bfloat16 Целое число подпись Интервал Рациональный
Указатель	Адрес физический виртуальный Ссылка
Текст	Характер Нить оканчивающийся нулем
Композитный	Алгебраический тип данных обобщенный Множество Ассоциативный массив Учебный класс Зависимый Равенство Индуктивный Пересечение Список Объект метаобъект Тип варианта Товар Запись или структура Уточнение Набор Союз отмечен
Другой	Булево Нижний тип Коллекция Нумерованный тип Исключение Тип функции Непрозрачный тип данных Рекурсивный тип данных Семафор Транслировать Тип верха Типовой класс Тип объекта Пустота
Связанный темы	Абстрактный тип данных Структура данных Общий вид метакласс Тип объекта Параметрический полиморфизм Примитивный тип данных Протокол интерфейс Подтип Конструктор типов Преобразование типов Система типов Теория типов Переменная