Главная страницаОбратная связьКарта сайта

Способы кодирования данных

Устройства магнитного хранения данных
Способы кодирования данных

Модифицированная частотная модуляция (MFM)
Модифицированная частотная модуляция (MFM)
Кодирование с ограничением длины поля записи (RLL)
Декодеры PRML
Измерение емкости накопителя

Способы кодирования данных

Информация на магнитном носителе хранится в аналоговой форме. В то же время сами данные представлены в цифровом виде, так как являются последовательностью нулей и единиц. При выполнении записи цифровая информация, поступая на магнитную головку, создает на диске магнитные домены соответствующей полярности. Если во время записи на головку поступает положительный сигнал, магнитные домены поляризуются в одном направлении, а если отрицательный — в противоположном. Когда меняется полярность записываемого сигнала, происходит также изменение полярности магнитных доменов. Во время операции чтения регистрируются зоны смены знака поляризации магнитных доменов, в результате чего генерируются положительные и отрицательные импульсы, используемые для реконструкции исходных двоичных данных.

Чтобы оптимальным образом расположить импульсы в сигнале записи, необработанные исходные данные пропускаются через специальное устройство, которое называется кодером/декодером (encoder/decoder). Это устройство преобразует двоичные данные в электрические сигналы, оптимизированные в контексте размещения зон смены знака на дорожке записи. Во время считывания кодер/декодер выполняет обратное преобразование: восстанавливает из сигнала последовательность двоичных данных. За прошедшие годы было разработано несколько методов кодирования данных, причем одни из них лучше и эффективнее других.

В некоторых источниках процесс кодирования данных может быть представлен значительно проще, но при этом упускаются многие факторы, определяющие надежность жесткого диска, в частности синхронизация. Инженеры и разработчики постоянно стремились разместить все больший и больший объем информации на каждом квадратном дюйме носителя, хотя на нем имеется ограниченное количество областей изменения полярности магнитного потока (т.е. перемагничивания). В результате была получена схема, в которой при декодировании информации учитывается не только изменение знака магнитного потока, но и наличие сигнала синхронизации между зонами различной полярности. Чем выше точность синхронизации процесса реверсирования магнитного потока, тем больший объем информации можно закодировать (или впоследствии декодировать) с помощью данных синхронизации.

При работе с цифровыми данными особое значение приобретает синхронизация. Во время считывания или записи очень важно точно определить момент каждой смены знака. Если синхронизация отсутствует, то момент смены знака может быть определен неправильно, в результате чего неизбежна потеря или искажение информации. Чтобы предотвратить это, работа передающего и принимающего устройств должна быть строго синхронизирована. Например, если запись нулевого бита выполняется с помощью магнитных доменов одной полярности, создаваемых на диске в течение определенного времени, или ячейки данных, то 10 нулевых битов, записанных в одну строку, будут представлять собой 10 одинаковых последовательно расположенных участков одной полярности или 10 ячеек, не имеющих зон изменения знака.

Теперь представьте, что во время считывания данных произошло некоторое рассогласование схемы синхронизации кодирующего устройства. Увеличение частоты тактовых импульсов может привести к тому, что кодирующее устройство воспримет длинный участок, состоящий из 10 ячеек, не имеющих зон изменения знака, как 9 ячеек данных. При понижении частоты синхронизации запись может быть распознана уже как 11 ячеек данных. И в том и в другом случаях это приведет к ошибке считывания, т.е. первоначально записанные биты данных будут считаны по другой схеме. Чтобы избежать появления ошибок синхронизации при кодировании/декодировании, необходимо строго синхронизировать процессы чтения и записи данных. Для этого следует синхронизировать работу двух устройств, передавая специальный сигнал синхронизации по отдельному каналу. Можно также объединить сигнал данных с сигналом синхронизации, а затем передать их по одному каналу. Подобное объединение сигналов используется в большинстве схем кодирования данных.

Добавление сигнала синхронизации к передаваемым данным служит гарантией того, что устройства связи будут точно интерпретировать все отдельные однобитовые элементы. Каждый бит информации ограничен двумя ячейками, содержащими определенные тактовые переходы. При передаче синхронизирующих сигналов вместе с данными синхронизация сохра­няется даже в том случае, когда носитель содержит длинные цепочки совершенно одинаковых нулей. К сожалению, ячейки переходов, необходимые только для синхронизации процессов, занимают место на диске, которое могло бы использоваться для записи данных.

Поскольку количество зон смены знака, которые можно записать на диске, ограничено возможностями технологий производства носителей и головок, при разработке дисковых накопителей изобретаются такие способы кодирования данных, с помощью которых можно было бы втиснуть” как можно больше битов данных в минимальное количество зон смены знака. При этом приходится учитывать, что часть из них все равно будет использоваться только для синхронизации.

Хотя разработано множество разнообразных методов, сегодня реально используются только три из них:

■     частотная модуляция (FM);

■     модифицированная частотная модуляция (MFM);

■     кодирование с ограничением длины поля записи (RLL).

В следующих разделах рассматриваются все эти методы, области их использования, а также их преимущества и недостатки. Данный материал поможет вам понять рис. 8.10, на котором каждая из этих схем применена для кодирования на одном и том же носителе символа X”.

Частотная модуляция (FM)

Метод кодирования FM (Frequency Modulation — частотная модуляция) был разработан прежде других и использовался при записи на гибкие диски так называемой одинарной плотности в первых ПК. Емкость таких односторонних дискет составляла всего 80 Кбайт. В 1970-х годах запись по методу FM использовалась во многих устройствах, но сейчас от него полностью отказались.

Модифицированная частотная модуляция (MFM)

Основной целью разработчиков метода MFM (Modified Frequency Modulation — модифицированная частотная модуляция) было сокращение количества зон смены знака для записи того же объема данных по сравнению с FM-кодированием и, соответственно, увеличение потенциальной емкости носителя. При этом способе записи количество зон смены знака, используемых только для синхронизации, сокращается. Синхронизирующие переходы записываются только в начало ячеек с нулевым битом данных и только в том случае, если ему предшествует нулевой бит. Во всех остальных случаях синхронизирующая зона смены знака не формируется. Благодаря такому уменьшению количества зон смены знака при той же допустимой плотности их размещения на диске информационная емкость по сравнению с записью по методу FM удваивается.

Поскольку при рассматриваемом способе записи на одно и то же количество зон смены знака приходится вдвое больше полезных” данных, чем при FM-кодировании, скорость считывания и записи информации на носитель также удваивается.

Вот почему диски, записанные с помощью метода MFM, часто называют дисками двойной плотности. Сегодня этот метод кодирования используется практически во всех приводах гибких дисков; долгие годы он применялся и в жестких дисках. Сегодня почти все жесткие диски перешли на одну из вариаций кодирования RLL, имеющего большую эффективность, чем MFM.

В табл. 8.2 показано соответствие между битами данных и зонами смены знака.

Таблица 8.2. Последовательность зон смены знака при записи по методу MFM
Бит данных                                                            Последовательность зон смены знака

1                                                                            NT1

0 с предшествующим 0                                            TN

0с предшествующей 1                                             NN

1. T - смена знака есть; N -- - смены знака нет.

Кодирование с ограничением длины поля записи (RLL)

Сегодня наиболее популярен метод кодирования с ограничением длины поля записи (Run Length Limited — RLL). Он позволяет разместить на диске в полтора раза больше информации, чем при записи по методу MFM, и в три раза больше, чем при FM-кодировании. При использовании этого метода происходит кодирование не отдельных битов, а целых групп, в ре­зультате чего создаются определенные последовательности зон смены знака. Комбинирование в эти последовательности сигналов данных и синхронизации позволило повысить частоту синхронизации, сохранив то же базовое расстояние между зонами смены знака на магнитном носителе.

Метод RLL был разработан IBM и сначала использовался в дисковых накопителях больших машин. В конце 1980-х годов его стали использовать в накопителях на жестких дисках ПК, а сегодня он применяется почти во всех ПК.

Как уже отмечалось, при записи по методу RLL одновременно кодируются целые группы битов. Термин Run Length Limited (с ограничением длины пробега) составлен из названий двух основных параметров, которыми являются минимальное (длина пробега) и максимальное (предел пробега) число ячеек перехода, которые можно расположить между двумя зонами смены знака. Изменяя эти параметры, можно получать различные методы кодирования, но на практике используются только два из них: RLL 2,7 и RLL 1,7.

Методы FM и MFM, по своей сути, являются частными случаями RLL. Так, например, FM-кодирование можно было бы назвать RLL 0,1, поскольку между двумя зонами смены знака может располагаться максимум одна и минимум нуль ячеек перехода. Метод MFM в этой терминологии можно было бы обозначить RLL 1,3, так как в данном случае между двумя зонами смены знака может располагаться от одной до трех ячеек перехода. Однако при упоминании этих методов обычно используются более привычные названия FM и MFM.

До последнего времени самым популярным был метод RLL 2,7, поскольку он позволял достичь высокой плотности записи данных (в 1,5 раза больше по сравнению с методом MFM) и достоверности (надежности) их воспроизведения. При этом соотношение размеров зон смены знака и участков с постоянной намагниченностью оставалось тем же, что и при методе MFM. Однако для накопителей очень большой емкости метод RLL 2,7 оказался недостаточно надежным. В большинстве современных жестких дисков высокой емкости используется метод RLL 1,7, который позволяет увеличить плотность записи в 1,27 раза по сравнению с MFM при оптимальном соотношении между размерами зон смены знака и участков с постоянной намагниченностью. За счет некоторого снижения плотности записи (по сравнению с RLL 2,7) удалось существенно повысить надежность считывания данных. Это особенно важно, поскольку в накопителях большой емкости носители и головки уже приближаются к пределу возможностей современной технологии.

Еще один, правда довольно редко используемый, вариант RLL — метод RLL 3,9. Иногда его называют усовершенствованным RLL или ARRL (Advanced RLL). С его помощью можно достичь еще большей плотности записи информации, чем при использовании метода RLL 2,7. Но, к сожалению, надежность ARRL-кодирования очень невысока; его пытались применять в некоторых контроллерах, но их выпуск был вскоре прекращен.

Понять сущность RLL-кодирования без наглядных примеров довольно сложно, поэтому рассмотрим метод RLL 2,7, так как именно он чаще всего используется. Даже для этого конкретного варианта можно построить множество (тысячи!) таблиц перекодировки различных последовательностей битов в серии зон смены знака.

В приведенной ниже таблице преобразований (табл. 8.3) группы данных длиной 2, 3 и 4 бит преобразуются в серии зон смены знака длиной 4, 6 и 8 битовых ячеек соответственно. При этом кодирование последовательностей битов происходит так, чтобы расстояние между зонами смены знаков было не слишком маленьким, но и не очень большим.

Первое ограничение вызвано тем, что величины разрешений головки и магнитного носителя, как правило, являются фиксированными. Второе ограничение необходимо для того, чтобы обеспечить синхронизацию устройств.

Таблица 8.3. Последовательность зон смены знака при записи по методу RLL 2,7

Биты данных                                  Последовательность зон смены знака

10                                                                              NTNN1

11                                                                              TNNN

000                                                  NNNTNN

10                                                                              TNNTNN

11                                                                              NNTNNN

 

10                                                                              NNTNNTNN

11                                                                              NNNNTNNN

1              . T - смена знака есть; N -- - смены знака нет.

При внимательном изучении этой таблицы можно заметить, что кодировать, например, байт (в двоичном представлении) 00000001 нельзя, поскольку его нельзя составить из комбинации приведенных в таблице групп битов. Однако на практике никаких проблем не возникает. Дело в том, что контроллер не оперирует байтами, а формирует сразу целые секторы записи. Поэтому, если ему встречается такой байт, он просто начинает искать подходящую для разбивки на группы комбинацию с учетом следующего байта последовательности. Затруднение может возникнуть только в том случае, если указанный байт последний в секторе. В этой ситуации кодер, установленный в контроллере, просто дописывает в конец последнего байта несколько дополнительных битов. При последующем считывании они отбрасываются, и последний байт воспроизводится таким, каким должен быть.




TNNTNNTNNNNNNTNN

T - изменение ориентации магнитного поля

N - без изменения

. - границы битовых ячеек

Рис. 8.10. Сигналы, формируемые во время записи ASCII-кода символа X” при способах кодирования FM, MFM и RLL 2,7
В верхней строке каждой из этих диаграмм показаны отдельные биты данных (01011000) в битовых ячейках, границами которых являются синхронизирующие сигналы, обозначенные точками. Под этой строкой изображен сам сигнал, представляющий собой чередование положительных и отрицательных значений напряжения, причем в моменты смены полярности напряжения происходит запись зоны смены знака. В нижней строке показаны ячейки перехода, причем T обозначает ячейку, содержащую зону смены знака, а N — ячейку, в которой зоны смены знака нет.

Разобраться в FM-кодировании очень просто. В каждой битовой ячейке содержится две ячейки перехода: одна — для синхронизирующего сигнала, другая — для самих данных. Все ячейки перехода, в которых записаны сигналы синхронизации, содержат зоны смены знака. В то же время ячейки перехода, в которых записаны данные, содержат зону смены знака только в том случае, если значение бита равно логической единице. При нулевом значении бита зона смены знака не формируется. Поскольку в нашем примере значение первого бита — 0, он будет записан в виде комбинации TN. Значение следующего бита равно 1, и ему соответствует комбинация TT. Третий бит — тоже нулевой (TN) и т.д. С помощью приведенной выше диаграммы FM-кодирования легко проследить всю кодирующую комбинацию для рассматриваемого примера байта данных. Отметим, что при таком способе записи зоны смены знака могут следовать непосредственно одна за другой; в терминах RLL-кодирования это означает, что минимальный пробег” равен нулю. С другой стороны, максимально возможное количество пропущенных подряд зон смены знака не может превышать единицы — вот почему FM-кодирование можно обозначить как RLL 0,1.

При MFM-кодировании в ячейках также для каждого бита данных записываются синхросигнал и зона смены знака. Но, как видно из схемы, ячейки для записи синхросигнала содержат зону смены знака только в том случае, если значения и текущего, и предыдущего битов равны нулю. Первый бит слева — нулевой, значение же предыдущего бита в данном случае неизвестно, поэтому предположим, что он тоже равен нулю. При этом последовательность зон смены знака будет выглядеть как TN. Значение следующего бита равно единице, которой всегда соответствует комбинация NT. Следующему нулевому биту предшествует единичный, поэтому ему соответствует последовательность NN. Аналогичным образом можно проследить процесс формирования сигнала записи до конца байта. Легко заметить, что минимальное и максимальное число ячеек перехода между любыми двумя зонами смены знака равно 1 и 3 соответственно. Следовательно, MFM-кодирование в терминах RLL может быть названо методом RLL 1,3.

Труднее всего разобраться в диаграмме, иллюстрирующей метод RLL 2,7, поскольку в нем кодируются не отдельные биты, а их группы. Первая группа слева, совпадающая с одной из приведенных в табл. 9.2 комбинаций, состоит из трех битов: 010. Она преобразуется в такую последовательность зон смены знака: TNNTNN. Следующим двум битам (11) соответствует комбинация TNNN, а последним трем (000) — NNNTNN. Как видите, в данном примере для корректного завершения записи дополнительные биты не потребовались.

Обратите внимание, что в этом примере минимальное и максимальное число пустых ячеек перехода между двумя зонами смены знака равно 2 и 6 соответственно, хотя в другом примере максимальное количество пустых ячеек перехода может быть равным 7. Именно поэтому такой способ кодирования называется RLL 2,7. Поскольку в данном случае записывается еще меньше зон смены знака, чем при MFM-кодировании, частоту сигнала синхронизации можно увеличить в 3 раза по сравнению с методом FM и в 1,5 раза по сравнению с методом MFM. Это позволяет на таком же пространстве диска записать больше данных. Но необходимо отметить, что минимальное и максимальное физическое расстояние на поверхности диска между любыми двумя зонами смены знака одинаково для всех трех упомянутых методов кодирования.

Декодеры PRML

В последнее время в накопителях вместо традиционных усилителей считывания с пиковыми детекторами стала использоваться так называемая технология PRML (Partial-Response, Maximum-Likelihood — частичное определение, максимальное правдоподобие). Это позволяет повысить плотность расположения зон смены знака на диске в среднем на 40% и на столько же увеличить емкость носителя.

Увеличение плотности записи приводит к тому, что пиковые значения напряжения при считывании данных могут накладываться друг на друга. При использовании метода PRML контроллер анализирует поток данных с головки посредством фильтрации, обработки и алгоритма определения (элемент частичного определения), а затем предсказывает последователь­ность битов, которые этот поток данных наилучшим образом представляет (элемент максимального правдоподобия). Технология RPML имеет и аналоговую, волновую форму, которая позволяет точно считывать сигнал из сильно зашумленного источника.

Практичность методов считывания информации определяется точностью распознавания данных на битовом уровне. Может показаться, что точность описанного метода невысока, но благодаря использованию фильтров обработки цифрового сигнала появилась возможность значительно снизить уровень шума, тем самым повысив плотность размещения зон изменения полярности на жестком диске. Это, в свою очередь, позволило повысить плотность записи данных. Технология PRML с успехом используется в схемах кодирования/декодирования, применяемых в накопителях емкостью 2 Гбайт и выше.

Измерение емкости накопителя


В декабре 1998 года Международная электротехническая комиссия (МЭК), занимающаяся стандартизацией в области электротехники, представила в качестве официального стандарта систему названий и символов единиц измерения для использования в области обработки и передачи данных. До недавнего времени при одновременном использовании десятичной и двоичной систем измерений один мегабайт мог быть равен как 1000000 байт (106), так и 1048576 байт (220). Стандартные сокращения единиц, используемые для измерения емкости магнитных и других накопителей, приведены в табл. 8.4.


Таблица 8.4. Стандартные единицы измерения емкости накопителей


В соответствии с новым стандартом 1 MiB (мебибайт) содержит 220 (1048576) байт, а 1 Мбайт (мегабайт) — 106 (1000000) байт. К сожалению, не существует общепринятого способа отличать двоичные кратные единицы измерения от десятичных. Другими словами, аббревиатура MB” (или M”) может обозначать как миллионы байтов, так и мегабайты. Как правило, объем памяти измеряется в двоичных единицах, но емкость накопителей — и в десятичных, и в двоичных, что часто приводит к недоразумениям. Заметьте также, что обозначения битов (bits) и байтов (Bytes) отличаются регистром первой буквы (она может быть строчной или прописной). Например, при обозначении миллионов битов используется строчная буква b”, в результате чего единица измерения миллион битов в секунду обозначается Mbps”, в то время как MBps” означает миллион байтов в секунду.

Обсудить статью на форуме


Если прочитаная статья из нашей обширной энциклопедия компьютера - "Способы кодирования данных", оказалась полезной или интересной, Вы можете поставить закладку в социальной сети или в своём блоге на данную страницу:

Так же Вы можете задать вопрос по статье через форму обратной связи, в сообщение обязательно указывайте название или ссылку на статью!
   


Copyright © 2008 - 2017 Дискета.info