Единицы информации - Units of information

В вычисление и телекоммуникации, а единица информации это емкость некоторого стандарта данные система хранения или канал связи, используется для измерения пропускной способности других систем и каналов. В теория информации, единицы информации также используются для измерения энтропия случайных величин и Информация содержится в сообщениях.

Наиболее часто используемые единицы емкости хранилища данных - это немного, емкость системы, имеющей только два состояния, и байт (или октет ), что эквивалентно восьми битам. Несколько таких единиц могут быть сформированы из них с помощью Префиксы SI (степень десяти префиксов) или более новый IEC двоичные префиксы (префиксы степени двойки).

Основные единицы

Сравнение единиц информации: немного, трость, нац, запретить. Количество информации - это высота столбцов. Темно-зеленый уровень - это единица «нат».

В 1928 г. Ральф Хартли соблюдал фундаментальный принцип хранения,[1] что было далее формализовано Клод Шеннон в 1945 году: информация, которая может храниться в системе, пропорциональна логарифм из N возможные состояния этой системы, обозначенные журналб N. Замена основания логарифма с б на другой номер c имеет эффект умножения значения логарифма на фиксированную константу, а именно журналc N = (журналc б) журналб N.Поэтому выбор базы б определяет единицу измерения информации. В частности, если б это положительный целое число, то единица - это количество информации, которое может храниться в системе с N возможные состояния.

Когда б равно 2, единицей измерения является Шеннон, равный информационному содержанию одного "бита" (набор двоичных цифр[2]). Например, система с 8 возможными состояниями может хранить до28 = 3 бита информации. Другие названные единицы включают:

  • База б = 3: единица называется "трость ", и равно журнал2 3 (≈ 1,585) бит.[3]

Trit, ban и nat редко используются для измерения емкости хранения; но в частности, nat часто используется в теории информации, потому что натуральные логарифмы математически более удобны, чем логарифмы в других основаниях.

Единицы, производные от долота

Несколько общепринятых имен используются для наборов или групп битов.

Байт

Исторически сложилось так, что байт было количество бит, использованных для кодирования характер текста в компьютере, который зависел от архитектуры компьютерного оборудования; но сегодня это почти всегда означает восемь бит, то есть октет. Байт может представлять 256 (28) различных значений, таких как неотрицательные целые числа от 0 до 255, или подписанный целые числа от −128 до 127. IEEE 1541-2002 стандарт определяет "B" (верхний регистр) как символ для байта (IEC 80000-13 использует «o» для октета на французском языке,[nb 1] но также позволяет использовать "B" на английском языке, что и используется на самом деле). Байты или кратные им байты почти всегда используются для указания размеров компьютерных файлов и емкости единиц хранения. Большинство современных компьютеров и периферийных устройств предназначены для обработки данных целыми байтами или группами байтов, а не отдельными битами.

Клев

Группа из четырех битов или полбайта иногда называется грызть, нибл или нибл. Этот блок чаще всего используется в контексте шестнадцатеричный числовые представления, поскольку полубайт содержит столько же информации, что и одна шестнадцатеричная цифра.[7]

Крошка

Пара двух бит или четверть байта называлась крошкой,[8] часто использовался в ранних 8-битных вычислениях (см. Atari 2600, ZX Spectrum ).[нужна цитата ] Сейчас он в основном не функционирует.

Слово, блок и страница

Компьютеры обычно обрабатывают биты группами фиксированного размера, обычно называемыми слова. Количество битов в слове обычно определяется размером регистры в компьютере ЦПУ, или по количеству битов данных, извлеченных из его основная память за одну операцию. в IA-32 архитектура, более известная как x86-32, слово - 16 бит, но в других прошлых и текущих архитектурах используются слова с 4,[9] 8,[9] 9,[9] 12,[9] 13,[9] 16,[9] 18,[9] 20,[9] 21,[9] 22,[9] 24,[9] 25,[9] 26, 29,[9] 30,[9] 31,[9] 32,[9] 33,[9] 35,[9] 36,[9] 38,[9] 39,[9] 40,[9] 42,[9] 44,[9] 48,[9] 50,[9] 52,[9] 54,[9] 56,[9] 60,[9] 64,[9] 72,[9] 80 бит или другие.

Немного машинные инструкции и форматы номеров компьютеров используйте два слова («двойное слово» или «двойное слово») или четыре слова («четверное слово» или «четверное слово»).

Компьютер кеши памяти обычно работают на блоки памяти, состоящей из нескольких последовательных слов. Эти агрегаты принято называть блоки кеша, или в Кеши процессора, строки кеша.

Виртуальная память системы разделяют компьютер основное хранилище в еще более крупные единицы, традиционно называемые страницы.

Систематические кратные

Термины для большого количества битов могут быть сформированы с использованием стандартного диапазона префиксов SI для степеней 10, например, килограмм  = 103 = 1000 (как в килобит или кбит), мега  = 106 = 1000000 (как в мегабит или Мбит) и гига  = 109 = 1000000000 (как в гигабит или Гбит). Эти префиксы чаще используются для кратных байтов, как в килобайт (1 кБ = 8000 бит), мегабайт (1 МБ = 8000000немного), и гигабайт (1 ГБ = 8000000000немного).

Однако по техническим причинам емкость компьютерной памяти и некоторых запоминающих устройств часто кратна некоторой большой степени двойки, например 228 = 268435456 байты. Чтобы избежать таких громоздких чисел, люди часто переделывали префиксы SI для обозначения ближайшей степени двойки, например, используя префикс килограмм для 210 = 1024, мега для 220 = 1048576, и гига для 230 = 1073741824, и так далее. Например, оперативная память чип емкостью 228 байты будут называться 256-мегабайтным чипом. В таблице ниже показаны эти различия.

Кратные биты
Десятичная дробь
ЦенностьSI
1000103кбиткилобит
10002106Мбитмегабит
10003109Гбитгигабит
100041012Тбиттерабит
100051015Pbitпетабит
100061018Ebitэксабит
100071021Збитзеттабит
100081024Ybitйоттабит
Двоичный
ЦенностьIECJEDEC
1024210КибиткибибитКбиткилобит
10242220МибитмебибитМбитмегабит
10243230ГибитгибибитГбитгигабит
10244240Тибиттебибит-
10245250ПибитPebibit-
10246260ЭйбитExbibit-
10247270Зибитзебибит-
10248280Yibitйобибит-
СимволПриставкаSI СмыслДвоичный смыслРазница в размерах
kкилограмм103   = 10001210 = 102412.40%
Mмега106   = 10002220 = 102424.86%
ггига109   = 10003230 = 102437.37%
Ттера1012 = 10004240 = 102449.95%
ппета1015 = 10005250 = 1024512.59%
Eexa1018 = 10006260 = 1024615.29%
ZЗетта1021 = 10007270 = 1024718.06%
Yйотта1024 = 10008280 = 1024820.89%

В прошлом заглавные буквы K был использован вместо нижнего регистра k чтобы указать 1024 вместо 1000. Однако это использование никогда не применялось последовательно.

С другой стороны, для внешних систем хранения (таких как оптические диски ) префиксы SI обычно использовались с их десятичными значениями (степенью 10). Было много попыток разрешить эту путаницу, предоставив альтернативные обозначения для кратных степени двойки. В 1998 г. Международная электротехническая комиссия (IEC) выпустил стандарт для этой цели, а именно серию двоичные префиксы которые используют 1024 вместо 1000 в качестве основного основания системы счисления:[10]

Несколько байтов
Десятичная дробь
ЦенностьМетрическая
1000кБкилобайт
10002МБмегабайт
10003ГБгигабайт
10004Туберкулезтерабайт
10005PBпетабайт
10006EBэксабайт
10007ZBзеттабайт
10008YBйоттабайт
Двоичный
ЦенностьIECJEDEC
1024KiBкибибайтКБкилобайт
10242МиБмебибайтМБмегабайт
10243ГиБгибибайтГБгигабайт
10244TiBтебибайт
10245ПиБпебибайт
10246EiBэксбибайт
10247ЗиБзебибайт
10248YiBйобибайт
СимволПриставка
Kiкиби бинарный килограмм1 кибибайт (КиБ)210 байты1024 млрд
МиМеби двоичный мега1 мебибайт (МиБ)220 байты1024 КБ
Giгиби двоичный гига1 гибибайт (ГиБ)230 байты1024 МБ
TiТеби, двоичная тера1 тебибайт (ТиБ)240 байты1024 ГиБ
Пипеби бинарная пета1 пебибайт (ПиБ)250 байты1024 ТиБ
Eiexbi, двоичный exa1 эксбибайт (EiB)260 байты1024 ПиБ

В Стандарты памяти JEDEC однако определите прописные буквы K, M и G для двоичных степеней 210, 220 и 230 для отражения общего использования.[11]

Примеры размеров

  • 1 бит: ответ на вопрос «да / нет».
  • 1 байт: число от 0 до 255.
  • 90 байт: достаточно для хранения типичной строки текста из книги.
  • 512 байт = ½ КиБ: типичный сектор из жесткий диск.
  • 1024 байта = 1 КиБ: классический блокировать размер в UNIX файловые системы.
  • 2048 байт = 2 КиБ: A CD-ROM сектор.
  • 4096 байт = 4 КиБ: A страница памяти в x86 (поскольку Intel 80386 ).
  • 4 КБ: около одной страницы текста из роман.
  • 120 КБ: текст типичной карманной книги.
  • 1 МБ: растровое изображение 1024 × 1024 пикселей с 256 цветами (глубина цвета 8 бит на пиксель).
  • 3 МБ: трехминутный песня (133 кбит / с).
  • 650–900 МБ - компакт-диск.
  • 1 ГБ: 114 минут несжатого звука CD-качества со скоростью 1,4 Мбит / с.
  • 8/16 ГБ: два распространенных размера USB-накопителей.
  • 4 ТБ: размер жесткого диска за 100 долларов (по состоянию на начало 2018 года).
  • 12 ТБ: самый большой жесткий диск (по состоянию на начало 2018 г.)
  • 16 ТБ: крупнейший коммерчески доступный твердотельный накопитель (по состоянию на начало 2018 г.)
  • 100 ТБ: самый большой из построенных твердотельных накопителей (по состоянию на начало 2018 г.)
  • 1.3 ZB: Прогноз объема всего Интернета в 2016 году.

Устаревшие и необычные агрегаты

Названы несколько других единиц хранения информации:[7]

Некоторые из этих имен жаргон, устаревшие или используемые только в очень ограниченном контексте.

Смотрите также

Заметки

  1. ^ Однако IEC 80000-13 сокращение "о" для октеты можно спутать с постфиксом "о" для обозначения восьмеричные числа в Соглашение Intel.

использованная литература

  1. ^ а б c Абрамсон, Норман (1963). Теория информации и кодирование. Макгроу-Хилл.
  2. ^ Маккензи, Чарльз Э. (1980). Наборы кодированных символов, история и развитие. Серия системного программирования (1-е изд.). Addison-Wesley Publishing Company, Inc. п. xii. ISBN  0-201-14460-3. LCCN  77-90165. Получено 2016-05-22. [1]
  3. ^ а б Кнут, Дональд Эрвин. Искусство программирования: получисленные алгоритмы. 2. Эддисон Уэсли.
  4. ^ Шанмугам (2006). Цифровые и аналоговые компьютерные системы.
  5. ^ Джегер, Грегг (2007). Квантовая информация: обзор.
  6. ^ Кумар, И. Рави (2001). Комплексная статистическая теория коммуникации.
  7. ^ а б Ниббл в словаре reference.com; взято из Jargon File 4.2.0, дата обращения 12 августа 2007 г.
  8. ^ а б Вайсштейн, Эрик. W. "Крошка". MathWorld. Получено 2015-08-02.
  9. ^ а б c d е ж г час я j k л м п о п q р s т ты v ш Икс y z аа ab ac объявление ае аф Биби, Нельсон Х. Ф. (22 августа 2017 г.). «Глава I. Целочисленная арифметика». Справочник по вычислению математических функций - Программирование с использованием переносимой программной библиотеки MathCW (1-е изд.). Солт-Лейк-Сити, Юта, США: Springer International Publishing AG. п. 970. Дои:10.1007/978-3-319-64110-2. ISBN  978-3-319-64109-6. LCCN  2017947446. S2CID  30244721.
  10. ^ ISO / Стандарт МЭК ISO / IEC 80000 -13: 2008. Настоящий стандарт отменяет и заменяет подпункты 3.8 и 3.9 IEC 60027-2: 2005. Единственное существенное изменение - добавление явных определений для некоторых величин. Интернет-каталог ISO
  11. ^ Ассоциация твердотельных технологий JEDEC (декабрь 2002 г.). «Термины, определения и буквенные обозначения для микрокомпьютеров, микропроцессоров и интегральных схем памяти» (PDF). JESD 100B.01. Получено 2009-04-05.
  12. ^ а б c Хорак, Рэй (2007). Словарь Вебстера New World Telecom. Джон Уайли и сыновья. п. 402. ISBN  9-78047022571-4.
  13. ^ «Юнибит».
  14. ^ а б Штайнбух, Карл В.; Вагнер, Зигфрид В., ред. (1967) [1962]. Написано в Карлсруэ, Германия. Taschenbuch der Nachrichtenverarbeitung (на немецком языке) (2-е изд.). Берлин / Гейдельберг / Нью-Йорк: Springer-Verlag OHG. С. 835–836. LCCN  67-21079. Заголовок № 1036.
  15. ^ а б Штайнбух, Карл В.; Вебер, Вольфганг; Heinemann, Traute, eds. (1974) [1967]. Написано в Карлсруэ / Бохуме. Taschenbuch der Informatik - Band III - Anwendungen und spezielle Systeme der Nachrichtenverarbeitung. Taschenbuch der Nachrichtenverarbeitung (на немецком). 3 (3-е изд.). Берлин / Гейдельберг / Нью-Йорк: Springer Verlag. С. 357–358. ISBN  3-540-06242-4. LCCN  73-80607.
  16. ^ Бертрам, Х. Нил (1994). Теория магнитной записи (1-е изд.). Издательство Кембриджского университета. ISBN  0-521-44973-1. 9-780521-449731. […] Запись импульса будет включать запись дибита или двух переходов, произвольно близко расположенных друг к другу. […]
  17. ^ Control Data 8092 TeleProgrammer: Справочное руководство по программированию (PDF). Миннеаполис, Миннесота, США: Корпорация Control Data. 1964. IDP 107a. В архиве (PDF) из оригинала на 2020-05-25. Получено 2020-07-27.
  18. ^ а б Свобода, Антонин; White, Donnamaie E. (2016) [2012, 1985, 1979-08-01]. Расширенные методы проектирования логических схем (PDF) (перепечатанное электронное переиздание ред.). Гирлянда STPM Press (оригинальный выпуск) / WhitePubs Enterprises, Inc. (переиздание). ISBN  0-8240-7014-3. LCCN  78-31384. В архиве (PDF) из оригинала на 2017-04-14. Получено 2017-04-15. [2][3]
  19. ^ Пол, Рейнхольд (2013). Elektrotechnik und Elektronik für Informatiker - Grundgebiete der Elektronik. Leitfaden der Informatik (на немецком). 2. Б.Г. Teubner Штутгарт / Springer. ISBN  978-3-32296652-0. Получено 2015-08-03.
  20. ^ Бёме, Герт; Родился Вернер; Вагнер, Б .; Шварце, Г. (2013-07-02) [1969]. Райхенбах, Юрген (ред.). Programmierung von Prozeßrechnern. Reihe Automatisierungstechnik (на немецком языке). 79. ВЭБ Верлаг Техник [де ] Берлин, перепечатка: Springer Verlag. Дои:10.1007/978-3-663-02721-8. ISBN  978-3-663-00808-8. 9/3/4185.
  21. ^ а б «Термины и сокращения / 4.1 Пересечение границ страниц». Руководство по программированию на языке ассемблера MCS-4 - Руководство по программированию микрокомпьютерной системы INTELLEC 4 (PDF) (Предварительная ред.). Санта-Клара, Калифорния, США: Корпорация Intel. Декабрь 1973 г., pp. V, 2-6, 4-1. MCS-030-1273-1. В архиве (PDF) из оригинала 2020-03-01. Получено 2020-03-02. […] Немного - Наименьшая единица информации, которая может быть представлена. (Бит может находиться в одном из двух состояний I 0 или 1). […] Байт - Группа из 8 смежных битов, занимающих одну ячейку памяти. […] символ - Группа из 4 смежных битов данных. […] Программы хранятся либо в ПЗУ, либо в ОЗУ программ, оба из которых разделены на страницы. Каждая страница состоит из 256 8-битных ячеек. Адреса от 0 до 255 составляют первую страницу, 256-511 составляют вторую страницу и так далее. […] (NB. Это Intel 4004 в руководстве используется термин характер ссылаясь на 4-битный а не 8-битный данные сущности. Intel перешла на более общий термин клев для 4-битных сущностей в документации к последующему процессору 4040 уже в 1974 г.)
  22. ^ а б c Шпайзер, Амвросий Пауль (1965) [1961]. Digitale Rechenanlagen - Grundlagen / Schaltungstechnik / Arbeitsweise / Betriebssicherheit [Цифровые компьютеры - Основы / Схемы / Работа / Надежность] (на немецком языке) (2-е изд.). ETH Zürich, Цюрих, Швейцария: Springer-Verlag / IBM. С. 6, 34, 165, 183, 208, 213, 215. LCCN  65-14624. 0978.
  23. ^ Штайнбух, Карл В., изд. (1962). Написано в Карлсруэ, Германия. Taschenbuch der Nachrichtenverarbeitung (на немецком языке) (1-е изд.). Берлин / Геттинген / Нью-Йорк: Springer-Verlag OHG. п. 1076. LCCN  62-14511.
  24. ^ Криспин, Марк Р. (2005). RFC 4042: UTF-9 и UTF-18.
  25. ^ IEEE 754-2008 - Стандарт IEEE для арифметики с плавающей запятой. 2008-08-29. Дои:10.1109 / IEEESTD.2008.4610935. ISBN  978-0-7381-5752-8. Получено 2016-02-10.
  26. ^ Мюллер, Жан-Мишель; Брисебар, Николас; де Динешен, Флоран; Жаннерод, Клод-Пьер; Лефевр, Винсент; Мелькионд, Гийом; Revol, Натали; Stehlé, Damien; Торрес, Серж (2010). Справочник по арифметике с плавающей точкой (1-е изд.). Биркхойзер. Дои:10.1007/978-0-8176-4705-6. ISBN  978-0-8176-4704-9. LCCN  2009939668.
  27. ^ Эрле, Марк А. (21 ноября 2008 г.). Алгоритмы и устройства для десятичного умножения (Тезис). Lehigh University (опубликовано в 2009 г.). ISBN  978-1-10904228-3. 1109042280. Получено 2016-02-10.
  28. ^ Кнейзель, Рональд Т. (2015). Номера и компьютеры. Springer Verlag. ISBN  9783319172606. 3319172603. Получено 2016-02-10.
  29. ^ Збичак, Джо. «Быстрая и грязная документация по AS1600». Получено 2013-04-28.
  30. ^ «Система электронной обработки данных 315» (PDF). NCR. Ноябрь 1965 г. НКР МПН СТ-5008-15. В архиве (PDF) из оригинала от 24.05.2016. Получено 2015-01-28.
  31. ^ Бардин, Гиллель (1963). "Семинар NCR 315" (PDF). Сообщение об использовании компьютера. 2 (3). В архиве (PDF) из оригинала от 24.05.2016.
  32. ^ Шнайдер, Карл (2013) [1970]. Datenverarbeitungs-Lexikon [Лексикон информационных технологий] (на немецком языке) (переиздание в мягкой обложке 1-го изд.). Висбаден, Германия: Springer Fachmedien Wiesbaden GmbH / Betriebswirtschaftlicher Verlag Dr. Th. Gabler GmbH. С. 201, 308. Дои:10.1007/978-3-663-13618-7. ISBN  978-3-409-31831-0. Получено 2016-05-24. […] плита, Абк. аус слог = Silbe, die kleinste adressierbare Informationseinheit für 12 bit zur Übertragung von zwei Alphazeichen oder drei numerischen Zeichen. (NCR) […] Оборудование: Датенструктура: NCR 315-100 / NCR 315-RMC; Wortlänge: Silbe; Биты: 12; Байты: -; Дезимальцифферн: 3; Зейхен: 2; Gleitkommadarstellung: fest verdrahtet; Мантисс: 4 силбена; Показатель: 1 Зильбе (11 Стеллен + 1 Ворзайхен) […] [плита, сокр. для слог = слог, наименьшая адресуемая информационная единица для 12 бит для передачи двух буквенных знаков или трех цифровых знаков. (NCR) […] Аппаратное обеспечение: Структура данных: NCR 315-100  / NCR 315-RMC; Длина слова: Слог; Биты: 12; Байтов: –; Десятичные цифры: 3; Персонажи: 2; Формат с плавающей запятой: проводной; Значительный: 4 слога; Экспонента: 1 слог (11 цифр + 1 префикс)]
  33. ^ а б c d IEEE Std 1754-1994 - Стандарт IEEE для 32-разрядной архитектуры микроконтроллера. Институт инженеров по электротехнике и электронике, Inc. 1995. С. 5–7. Дои:10.1109 / IEEESTD.1995.79519. ISBN  1-55937-428-4. Получено 2016-02-10. (NB. Стандарт определяет дублеты, квадлеты, октлеты и гекслеты как 2, 4, 8 и 16 байты, давая числа биты (16, 32, 64 и 128) только как второстепенное значение. Это может быть важно, учитывая, что байты не всегда понимались как 8 бит (октеты ) исторически.)
  34. ^ а б c Кнут, Дональд Эрвин (2004-02-15) [1999]. Часть 1: MMIX (PDF). Искусство программирования (0-е изд., 15-е изд.). Стэндфордский Университет: Эддисон-Уэсли. В архиве (PDF) из оригинала от 30.03.2017. Получено 2017-03-30.
  35. ^ Бёсёрменьи, Ласло; Хельцль, Гюнтер; Пиркер, Эманеул (февраль 1999 г.). Написано в Зальцбурге, Австрия. Зинтергоф, Питер; Вайтершич, Мариан; Уль, Андреас (ред.). Параллельные кластерные вычисления с IEEE1394–1995. Параллельные вычисления: 4-я международная конференция ACPC, включающая специальные треки по параллельным вычислениям (ParNum '99) и параллельные вычисления в обработке изображений, обработке видео и мультимедиа. Труды: Конспект лекций по информатике 1557 г.. Берлин, Германия: Springer Verlag.
  36. ^ Никуд, Жан-Даниэль (1986). Calculatrices. Traité d’électricité de l'École fédérale polytechnique de Lausanne (На французском). 14 (2-е изд.). Лозанна: Пресса романские политехнические. ISBN  2-88074054-1.
  37. ^ Труды. Симпозиум по опыту работы с распределенными и многопроцессорными системами (SEDMS). 4. Ассоциация USENIX. 1993.
  38. ^ а б «1. Введение: выравнивание сегментов». Утилиты семейства 8086 - Руководство пользователя систем разработки на базе 8080/8085 (PDF). Редакция E (A620 / 5821 6K DD ed.). Санта-Клара, Калифорния, США: Корпорация Intel. Май 1982 [1980, 1978]. п. 1–6. Номер заказа: 9800639-04. В архиве (PDF) из оригинала на 2020-02-29. Получено 2020-02-29.
  39. ^ Дьюар, Роберт Берридейл Кейт; Смосна, Мэтью (1990). Микропроцессоры - взгляд программиста (1-е изд.). Курантский институт, Нью-Йоркский университет, Нью-Йорк, США: Издательство McGraw-Hill. п. 85. ISBN  0-07-016638-2. LCCN  89-77320. (xviii + 462 стр.)
  40. ^ Брусенцов, Н.П .; Маслов, С.П .; Рамиль Альварес, Дж .; Жоголев, Е.А. «Разработка троичных компьютеров в МГУ». Получено 2010-01-20.
  41. ^ US4319227, Малиновский, Кристофер В .; Хайнц Риндерле и Мартин Зигле, "Система сигнализации с тремя состояниями", выпущенный 1982-03-09, передан Департаменту исследований и разработок, AEG-Telefunken, Хайльбронн, Германия 
  42. ^ "US4319227". Google.
  43. ^ "US4319227" (PDF). Патенты.

внешние ссылки