Представление информации в памяти компьютера единицы измерения. Представление данных в памяти компьютера Представление информации в памяти компьютере

Главная / Мобильные устройства

Умные электронные машины уже давно и прочно вошли в повседневную жизнь человека. Но, несмотря на это, их устройство до сих пор вызывает элементарные вопросы у многих пользователей. Например, далеко не все знают, какие бывают виды памяти . А ведь здесь все не так уж сложно, хотя и не совсем просто. Существуют две основные разновидности – внутренняя память и внешняя, которые, в свою очередь, имеют собственную градацию.

Виды внутренней памяти компьютера

Внутренняя память называется так потому, что она встроена в основные блоки компьютера и является неотъемлемым элементом системы, обеспечивающим ее работоспособность. Удалить или извлечь ее без негативных последствий невозможно. Различают следующие ее виды:

  • оперативная – представляет собой набор программ и алгоритмов, необходимых для работы миикропроцессора;
  • кэш-память – это своеобразный буфер между оперативкой и процессором, который обеспечивает оптимальную скорость выполнения системных программ;
  • постоянная – закладывается при изготовлении компьютера на заводе, в нее входят инструменты для контроля за состоянием ПК при каждой загрузке; программы, отвечающие за запуск системы и исполнение основных действий; программы настройки системы;
  • полупостоянная – содержит в себе данные о параметрах настройки конкретного ПК;
  • видеопамять – в ней сохраняются видеофрагменты, которые должны выводиться на экран, является частью видеоконтроллера.

Виды оперативной памяти компьютера

Быстродействие и «интеллектуальный уровень» компьютера во многом определяются его оперативной памятью. В ней хранятся данные, используемые во время активной работы электронной машины. Она также может быть разных видов, но чаще всего используются блоки DDR, DDR2,DDR3. Различаются они количеством контактов и скоростными характеристиками.

Виды внешней памяти компьютера

Внешняя память компьютера представлена различными видами съемных носителей информации. На сегодняшний день основными из них являются жесткие диски, usb-накопители, или флешки и карты памяти. Устаревшими считаются лазерные диски и дискеты. Но , хотя и является съемным, все же используется в качестве вместилища постоянной памяти и без него компьютер работать не будет. Однако его можно свободно достать и переместить в другой системный блок, поэтому его и относят к категории внешних устройств памяти.


Представление данных в памяти персонального компьютера

(числа, символы, графика, звук).

Форма и язык представления информации

Воспринимая информацию с помощью органов чувств, человек стремится зафиксировать ее так, чтобы она стала понятной и другим, представляя ее в той или иной форме.

Музыкальную тему композитор может наиграть на пианино, а затем записать с помощью нот. Образы, навеянные все той же мелодией, поэт может воплотить в виде стихотворения, хореограф выразить танцем, а художник - в картине.

Человек выражает свои мысли в виде предложений, составленных из слов. Слова, в свою очередь, состоят из букв. Это - алфавитное представление информации.

Форма представления одной и той же информации может быть различной. Это зависит от цели, которую вы перед собой поставили. С подобными операциями вы сталкиваетесь на уроках математики и физики, когда представляете решение в разной форме. Например, решение задачи: «Найти значение математического выражения..." можно представить в табличной или графической форме. Для этого вы пользуетесь визуальными средствами представления информации: числами, таблицей, рисунком.

Таким образом, информацию можно представить в различной форме:

    знаковой письменной, состоящей из различных знаков, среди которых принято выделять

    символьную в виде текста, чисел, специальных символов (например, текст учебника);

    графическую (например, географическая карта);

    табличную (например, таблица записи хода физического эксперимента);

    в виде жестов или сигналов (например, сигналы регулировщика дорожного движения);

    устной словесной (например, разговор).

Форма представления информации очень важна при ее передаче: если человек плохо слышит, то передавать ему информацию в звуковой форме нельзя; если у собаки слабо развито обоняние, то она не может работать в розыскной службе. В разные времена люди передавали информацию в различной форме с помощью: речи, дыма, барабанного боя, звона колоколов, письма, телеграфа, радио, телефона, факса.

Независимо от формы представления и способа передачи информации, она всегда передается с помощью какого-либо языка.

На уроках математики вы используете специальный язык, в основе которого - цифры, знаки арифметических действий и отношений. Они составляют алфавит языка математики.

На уроках физики при рассмотрении какого-либо физического явления вы используете характерные для данного языка специальные символы, из которых составляете формулы. Формула - это слово на языке физики.

На уроках химии вы также используете определенные символы, знаки, объединяя их в «слова» данного языка.

Существует язык глухонемых, где символы языка - определенные знаки, выражаемые мимикой лица и движениями рук.

Основу любого языка составляет алфавит - набор однозначно определенных знаков (символов), из которых формируется сообщение.

Языки делятся на естественные (разговорные) и формальные. Алфавит естественных языков зависит от национальных традиций. Формальные языки встречаются в специальных областях человеческой деятельности (математике, физике, химии и т. д.). В мире насчитывается около 10000 разных языков, диалектов, наречий. Многие разговорные языки произошли от одного и того же языка. Например, от латинского языка образовались французский, испанский, итальянский и другие языки.

Кодирование информации

С появлением языка, а затем и знаковых систем расширились возможности общения между людьми. Это позволило хранить идеи, полученные знания и любые данные, передавать их различными способами на расстояние и в другие времена - не только своим современникам, но и будущим поколениям. До наших дней дошли творения предков, которые с помощью различных символов увековечили себя и свои деяния в памятниках и надписях. Наскальные рисунки (петроглифы) до сих пор служат загадкой для ученых. Возможно, таким способом древние люди хотели вступить в контакт с нами, будущими жителями планеты и сообщить о событиях их жизни.

Каждый народ имеет свой язык, состоящий из набора символов (букв): русский, английский, японский и многие другие. Вы уже познакомились с языком математики, физики, химии.

Представление информации с помощью какого-либо языка часто называют кодированием.

Код - набор символов (условных обозначений) дли представления информации. Кодирование - процесс представления информации в виде кода.

Водитель передает сигнал с помощью гудка или миганием фар. Кодом является наличие или отсутствие гудка, а в случае световой сигнализации - мигание фар или его отсутствие.

Вы встречаетесь с кодированием информации при переходе дороги по сигналам светофора. Код определяют цвета светофора - красный, желтый, зеленый.

В основу естественного языка, на котором общаются люди, тоже положен код. Только в этом случае он называется алфавитом. При разговоре этот код передается звуками, при письме - буквами. Одну и ту же информацию можно представить с помощью различных кодов. Например, запись разговора можно зафиксировать посредством русских букв или специальных стенографических значков.

По мере развития техники появлялись разные способы кодирования информации. Во второй половине XIX века американский изобретатель Сэмюэль Морзе изобрел удивительный код, который служит человечеству до сих пор. Информация кодируется тремя «буквами»: длинный сигнал (тире), короткий сигнал (точка) и отсутствие сигнала (пауза) для разделения букв. Таким образом, кодирование сводится к использованию набора символов, расположенных в строго определенном порядке.

Люди всегда искали способы быстрого обмена сообщениями. Для этого посылали гонцов, использовали почтовых голубей. У народов существовали различные способы оповещения о надвигающейся опасности: барабанный бой, дым костров, флаги и т. д. Однако использование такого представления информации требует предварительной договоренности о понимании принимаемого сообщения.

Знаменитый немецкий ученый Готфрид Вильгельм Лейбниц предложил еще в XVII веке уникальную и простую систему представления чисел. «Вычисление с помощью двоек... является для науки основным и порождает новые открытия... при сведении чисел к простейшим началам, каковы 0 и 1, везде появляется чудесный порядок».

Сегодня такой способ представления информации с помощью языка, содержащего всего два символа алфавита - 0 и 1, широко используется в технических устройствах, в том числе и в компьютере. Эти два символа 0 и 1 принято называть двоичными цифрами или битами (от англ. bit - Binary Digit - двоичный знак).

Инженеров такой способ кодирования привлек простотой технической реализации - есть сигнал или нет сигнала. С помощью этих двух цифр можно закодировать любое сообщение.

Более крупной единицей измерения объема информации принято считать 1 байт, который состоит из 8 бит.

Принято также использовать и более крупные единицы измерения объема информации. Число 1024 (210) является множителем при переходе к более высокой единице измерения.

Килобит Кбит

Кбит = 1024 бит ≈1000 бит

Мегабит Мбит

1 Мбит = 1024 Кбит ≈ 1 000 000 бит

Гигабит Гбит

Гбит = 1024 Мбит ≈ 1 000 000 000 бит

Килобайт Кбайт (Кб)

1 Кбайт = 1024 байт ≈ 1000 байт

Мегабайт Мбайт (Мб)

1 Мбайт = 1024 Кбайт ≈ 1 000 000 байт

Гигабайт Гбайт (Гб)

1 Гбайт = 1024 Мбайт ≈ 1 000 000 000 байт

Терабайт Тбайт (Тб)

1 Тбайт = 1024 Гбайт ≈ 1 000 000 000 000 байт

Пэтабайт Пбайт (Пб)

1 Пбайт = 1024 Тбайт ≈ 1 000 000 000 000 000 байт

Эксабайт Эбайт (Эб)

1 Эбайт = 1024 Пбайт ≈ 1 000 000 000 000 000 000 байт

Зеттабайт Збайт (Зб)

1 Збайт = 1024 Эбайт ≈ 1 000 000 000 000 000 000 000 байт

Кодирование информации в компьютере

Вся информация, которую обрабатывает компьютер, должна быть представлена двоичным кодом с помощью двух цифр - 0 и 1. Эти два символа принято называть двоичными цифрами, или битами. С помощью двух цифр 1 и 0 можно закодировать любое сообщение. Это явилось причиной того, что в компьютере обязательно должно быть организовано два важных процесса:

    кодирование, которое обеспечивается устройствами ввода при преобразовании входной информации в форму, воспринимаемую компьютером, то есть в двоичный код;

    декодирование, которое обеспечивается устройствами вывода при преобразовании данных из двоичного кода в форму, понятную человеку.

С точки зрения технической реализации использование двоичной системы счисления для кодирования информации оказалось намного

более простым, чем применение других способов. Действительно, удобно кодировать информацию в виде последовательности нулей и единиц, если представить эти значения как два возможных устойчивых состояния электронного элемента:

    0 - отсутствие электрического сигнала или сигнал имеет низкий уровень;

    1 - наличие сигнала или сигнал имеет высокий уровень.

Эти состояния легко различать. Недостаток двоичного кодирования - длинные коды. Но в технике легче иметь дело с большим числом простых элементов, чем с небольшим количеством сложных.

Вам и в быту ежедневно приходится сталкиваться с устройством, которое может находиться только в двух устойчивых состояниях: включено/выключено. Конечно же, это хорошо знакомый всем выключатель. А вот придумать выключатель, который мог бы устойчиво и быстро переключаться в любое из 10 состояний, оказалось невозможным. В результате после ряда неудачных попыток разработчики пришли к выводу о невозможности построения компьютера на основе десятичной системы счисления. И в основу представления чисел в компьютере была положена именно двоичная система счисления.

В настоящее время существуют разные способы двоичного кодирования и декодирования информации в компьютере. В первую очередь это зависит от вида информации, а именно, что должно кодироваться: текст, числа, графические изображения или звук. Кроме того, при кодировании чисел важную роль играет то, как они будут использоваться: в тексте, в расчетах или в процессе ввода-вывода. Накладываются также и особенности технической реализации.

Кодирование чисел

Система счисления - совокупность приемов и правил записи чисел с помощью определенного набора символов.

Для записи чисел могут использоваться не только цифры, но и буквы (например, запись римских цифр - XXI). Одно и то же число может быть по-разному представлено в различных системах счисления.

В зависимости от способа изображения чисел системы счисления делятся на позиционные и непозиционные.

В позиционной системе счисления количественное значение каждой цифры числа зависит от того, в каком месте (позиции или разряде) записана та или иная цифра этого числа. Например, меняя позицию цифры 2 в десятичной системе счисления, можно записать разные по величине десятичные числа, например 2; 20; 2000; 0,02 и т. д.

В непозиционной системе счисления цифры не изменяют своего количественного значения при изменении их расположения (позиции) в числе. Примером непозиционной системы может служить римская система, в которой независимо от местоположения одинаковый символ имеет неизменное значение (например, символ X в числе XXV).

Количество различных символов, используемых для изображения числа в позиционной системе счисления, называется основанием системы счисления.

В компьютере наиболее подходящей и надежной оказалась двоичная система счисления, в которой для представления чисел используются последовательности цифр 0 и 1.

Кроме того, для работы с памятью компьютера оказалось удобным использовать представление информации с помощью еще двух систем счисления:

    восьмеричной (любое число представляется с помощью восьми цифр - 0, 1, 2... 7);

    шестнадцатеричной (используемые символы-цифры - 0, 1, 2... 9 и буквы - А, В, С, D, Е, F, заменяющие числа 10, 11, 12, 13, 14, 15 соответственно).

Кодирование символьной информации

Нажатие алфавитно-цифровой клавиши на клавиатуре приводит к тому, что в компьютер посылается сигнал в виде двоичного числа, представляющего собой одно из значений кодовой таблицы. Кодовая таблица - это внутреннее представление символов в компьютере. Во всем мире в качестве стандарта принята таблица ASCII (American Standart Code for Informational Interchange - американский стандартный код информационного обмена).

Для хранения двоичного кода одного символа выделен 1 байт = 8 бит. Учитывая, что каждый бит принимает значение 1 или 0, количество возможных сочетаний единиц и нулей равно 28 = 256.

Значит, с помощью 1 байта можно получить 256 разных двоичных кодовых комбинаций и отобразить с их помощью 256 различных символов. Эти коды и составляют таблицу ASCII.

Пример, при нажатии клавиши с буквой S в память компьютера записывается код 01010011. При выводе буквы 8 на экран компьютер выполняет декодирование - на основании этого двоичного кода строится изображение символа.

SUN (СОЛНЦЕ) - 01010011 010101101 01001110

Стандарт ASCII кодирует первые 128 символов от 0 до 127: цифры, буквы латинского алфавита, управляющие символы. Первые 32 символа являются управляющими и предназначены в основном для передачи команд управления. Их назначение может варьироваться в зависимости от программных и аппаратных средств. Вторая половина кодовой таблицы (от 128 до 255) американским стандартом не определена и предназначена для символов национальных алфавитов, псевдографических и некоторых математических символов. В разных странах могут использоваться различные варианты второй половины кодовой таблицы.

Обратите внимание! Цифры кодируются по стандарту ASCII записываются в двух случаях - при вводе-выводе и когда они встречаются я тексте. Если цифры участвуют в вычислениях, то осуществляется их преобразование в другой двоичный код.

Для сравнения рассмотрим число 45 для двух вариантов кодирования.

При использовании в тексте это число потребует для своего представления 2 байта, поскольку каждая цифра будет представлена своим кодом в соответствии с таблицей ASCII . В двоичной системе - 00110100 00110101.

При использовании в вычислениях код этого числа будет получен по специальным правилам перевода и представлен в виде 8-разрядного двоичного числа 00101101, на что потребуется 1 байт.

Кодирование графической информации

Создавать и хранить графические объекты в компьютере можно мя способами - как растровое или как векторное изображение. Для каждого типа изображения используется свой способ кодирования.

Растровое изображение представляет собой совокупность точек, используемых для его отображения на экране монитора. Объем растрового изображения определяется как произведение количества точек и информационного объема одной точки, который зависит от количества возможных цветов. Для черно-белого изображения информационный объем одной точки равен 1 биту, так как точка может быть либо черной, либо белой, что можно закодировать двумя цифрами - 0 или 1.

Для кодирования 8 цветов необходимо 3 бита; для 16 цветов - 4 бита; для 6 цветов - 8 битов (1 байт) и т.д.

    кодирование черно-белого рисунка

    кодирование цветного рисунка

Векторное изображение представляет собой совокупность графических примитивов. Каждый примитив состоит из элементарных отрезков кривых, параметры которых (координаты узловых точек, радиус кривизны и пр.) описываются математическими формулами. Для каждой линии указываются ее тип (сплошная, пунктирная, штрих-пунктирная), толщина и цвет, а замкнутые фигуры дополнительно характеризуются типом заливки. Кодирование векторных изображений выполняется различными способами в зависимости от прикладной среды. В частности, формулы, описывающие отрезки кривых, могут кодироваться как обычная буквенно-цифровая информация для дальнейшей обработки специальными программами.

Кодирование звуковой информации

Звук представляет собой звуковую волну с непрерывно меняющейся амплитудой и частотой. Чем больше амплитуда сигнала, тем он громче для человека, чем больше частота сигнала, тем выше тон. Для того чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть превращен в последовательность электрических импульсов (двоичных нулей и единиц).

В процессе кодирования непрерывного звукового сигнала производится его временная дискретизация. Непрерывная звуковая волна разбивается на отдельные маленькие участки, причем для каждого такого участка устанавливается определенная величина амплитуды.Таким образом, непрерывная зависимость амплитуды сигнала от времени заменяется на дискретную последовательность уровней громкости.

Современные звуковые карты обеспечивают 16-битную глубину кодирования звука. В таком случае количество уровней сигнала будет равно 65536.

При двоичном кодировании непрерывного звукового сигнала он заменяется последовательностью дискретных уровней сигнала. Качество кодирования зависит от количества измерений уровня сигнала в единицу времени, т.е. от частоты дискретизации. Чем больше количество измерений производится за 1 секунду (чем больше частота дискретизации), тем точнее процедура двоичного кодирования.

Количество измерений в секунду может лежать в диапазоне от 8000 до 48000, т.е. частота дискретизации аналогового звукового сигнала может принимать значения от 8 до 48 кГц - качество звучания аудио-CD. Следует также учитывать, что возможны как моно-, так и стерео-режимы.

Программа звукозапись Стандартная программа Windows Звукозапись играет роль цифрового магнитофона и позволяет записывать звук, т.е. дискретизировать звуковые сигналы, и сохранять их в звуковых файлах в формате wav. Также эта программа позволяет производить простейшее редактирование звуковых файлов.

Вся информация в компьютере представляется в цифровой форме. Для чисел это представление является естественным. Для нечисловой информации (например, текста) используется стандартный прием: все возможные значения нумеруются и вместо самих значений хранятся их номера (которые играют роль кодов). Так, для представлении текстовой информации используется таблица символов, содержащая все символы алфавита, которые могут встретиться в тексте, а текст, хранящийся в памяти компьютера, заменяется списком номеров символов в этой таблице. Аналогично кодируется информация других видов. В любом случае содержание представляемых нечисловых данных, хранящихся в компьютере, зависит от таблиц нумерации (называемых таблицами кодирования).

Количество двоичных разрядов, необходимых для записи одного кода при таком способе записи, зависит от общего объема таблицы. Наибольшее число, которое в двоичной системе счисления можно записать с помощью N цифр, состоит из N единиц. Это число равно 1 + 2 + 4 + ... + 2 N -1 = 2 N - 1. Например, с помощью 8 двоичных цифр можно различать 2 8 = 256 символов текста. Следовательно, для хранения кодов значений, общий объем которых равен числу M, необходимо примерно log 2 M двоичных разрядов.

Это рассуждение настолько важно для всей идеологии хранения информации в двоичном коде, что в информатике принято измерять объем данных и памяти компьютеров не в десятичной системе счисления, а в специальных единицах измерения, основанных на степенях двойки. Используя то обстоятельство, что 2 10 = 1024 не очень отличается от 10 3 = 1000, принято 1024 байта называть килобайтом (1Кб). Аналогично мегабайт (1Мб) - это 024 килобайта, а гигабайт (1Гб) - 1024 мегабайта. Количество информации в современном мире столь велико, что приходится вводить дополнительную единицу - терабайт (1Т6), равный 1024 гигабайтам. Если не нужна особая точность, то можно считать, что приблизительно 1 терабайт = 1 тыс. гигабайтов = 1 млн мегабайтов = = 1 млрд килобайтов = 1 трлн байтов.

Размерность информации За единицу информации принимают количество информации, заключенное в выборе одного из двух равновероятных событий. Эта единица называется двоичной единицей, или битом (binary digit, bit).

В информатике и вычислительной технике принята система представления данных двоичным кодом. Наименьшей единицей такого представления является бит.

Байт  это группа взаимосвязанных битов. 1 байт = 8 бит. Одним байтом кодируется один символ текстовой информации.

1 Килобайт (Кб) = 1024 байт.

Однако, повсюду, где это не принципиально, считают, что 1 Кб равен 1000 байт. Условно можно считать, что одна страница неформатированного машинописного текста равна 2 Кб.

1 Мегабайт (Мб) = 1024 Кб.

1 Гигабайт (Гб) =1024 Мб.

1 Терабайт (Тб) = 1024 Гб.

Уже говорилось, что логически оперативная память компьютера представляет собой линейную последовательность байтов. Длина этой последовательности в современных персональных компьютерах достигает десятков и сотен мегабайтов. Еще больше память суперкомпьютеров.

Для хранения чисел в зависимости от их величины и точности выделяется несколько байтов памяти (от 1 до 10). Различают две основные формы представления числа в памяти компьютера. При первом способе все разряды выделенных для хранения числа байтов памяти последовательно нумеруются и двоичные цифры числа непосредственно записываются в соответствующие биты памяти. Один бит выделяется для представления знака числа (0 - плюс, 1 - минус). При втором способе число представляется в так называемой нормализованной (или экспоненциальной) форме: Х= М 10 n , где число М (называемое мантиссой) заключено от 1 до 10, число п (называемое порядком) - целое.

Используется несколько форматов представления целых и нормализованных чисел, которые отличаются объемом и наличием или отсутствием знакового бита. От этого зависит диапазон чисел, которые могут быть представлены в данном формате. Например, если заранее известно, что какая-то целая величина положительна и не может быть больше 255, то для ее хранения достаточно 1 байта. Для хранения величин, изменяющихся в диапазоне от -2 15 = -32 768 до 2 15 - 1 = 32 767, выделяется 2 байта. Если целое число не вмещается в этот диапазон, то для его хранения выделяется 4 байта (диапазон от -2 31 до 2 31 - 1).

В принципе, подобный подход годится и для дробных чисел. L память компьютера заносятся цифры числа, но при этом считается, что на определенном месте этой записи стоит десятичная точка. Такая форма записи называется представлением числа с фиксированной точкой. Максимальное число цифр в числе и конкретное положение запятой определяются форматом числа. Предусмотрено несколько вариантов формата представления чисел с фиксированной точкой в памяти компьютера.

Представление нормализованных чисел называется представ лением числа с плавающей точкой . Оно используется для хранения величин, которые могут принимать значения в очень большом диапазоне. В памяти компьютера порядок и мантисса хранятся отдельно в форме двоичных целых чисел со знаком. В современных компьютерах используется несколько форматов представления чисел с плавающей точкой, которые отличаются общим объемом представления чисел (6, 8 или 10 байтов), а также размерами памяти, отводимой отдельно для мантиссы и порядка. От этого зависят общий диапазон возможных значений числовой величины в компьютере и минимальная ошибка в вычислениях, проистекающая из-за невозможности запоминать в компьютере большее количество знаков после десятичной точки.

В действительности информация разнородна. Обычно делят данные на числовую, текстовую и логическую информацию. Под текстовой информацией понимается линейная последовательность символов. Для представления символа в памяти компьютера используется следующая схема: фиксируется множество допустимых символов текста (обычно их 2 8 = 256 символов), и каждому символу присваивается номер (от 0 до 255), который служит кодом символа. После этого последовательность символов заменяется на последовательность кодов, которые в памяти компьютера записываются в виде целых двоичных чисел (без знака). Код одного символа помещается в 1 байте памяти (именно поэтому исторически сложилось разбиение памяти на группы по 8 битов, так как оказалось, что оптимальное количество символов - 2 8 , а не, например, 2 9).

Множество допустимых символов и их кодов составляют таблицу кодирования символов. Естественно, эта таблица не должна зависеть от произвола программиста или производителя компьютеров, поскольку обмен информацией в этом случае будет сильно затруднен. В настоя шее время существует стандарт ASC / f (American Standard Code for Informational Interchange ), содержащий 128 основных символов (коды от 0 до 127) и 128 расширенных символов (коды от 128 до 255). Поскольку в этот стандарт не входят символы национальных алфавитов, в каждой стране 128 кодов расширенных символов (от 128 до 255) заменяются символами национального алфавита. Другими словами, каждый язык с алфавитом, отличным от английского, устанавливает свой стандарт. Осмысленный текст на одном языке будет бессмысленным на другом. Таким образом, для правильной работы с текстом важна не только сама информация, но и ее интерпретация. Программа, которая правильно интерпретирует коды символов в соответствии с таблицей кодирования в определенном алфавите, называется текстовым драйвером

Логическая величина - это величина, которая может принимать всего два значения: true и false («истина» и «ложь» ). Для хранения значения логической переменной достаточно 1 бита. Обычно значение «единица» бита памяти ассоциируется с истиной, значение «ноль» - с ложью.

Для хранения в памяти компьютера более сложных объектов, таких, как видеоизображения или звуки, описания этих объектов преобразуются в числовую форму. Существует достаточно много способов кодирования такого вида информации, но в итоге изображение или звук представляются в виде последовательности нулей и единиц, которые размещаются в битах памяти компьютера и при необходимости извлекаются оттуда и интерпретируются определенным образом.

Логическое и физическое представление данных

Работая с СУБД пользователь имеет дело с логическим представлением данных и может вообще не знать о том, как физически организовано представление данных в памяти ЭВМ. Однако, от способа физического размещения данных во многом зависит эффективность работы приложений, использующих базы данных.

Физическая организация данных зависит от типа используемой ЭВМ и конкретной СУБД. Разные СУБД используют разные методы размещения данных в памяти и средства доступа к ним. Поэтому при выборе СУБД на этапе проектирования важно знать и понимать особенности физического способа хранения данных. Главным критерием выбора является эффективность доступа к данным .

Если основными понятиями логической модели данных являются логическое поле , логическая запись и логический файл , то для физической модели есть аналогичные основные понятия - физическое поле , физическая запись , физический файл .

Замечание 1

При некоторых способах организации доступа одно логическое поле может отображаться непосредственно в одно физическое поле, одна логическая запись в одну физическую запись, а один логический файл в один физический файл. Но в общем случае такого взаимнооднозначного соответствия нет.

Схема работы процессора с памятью

В ЭВМ существует два вида памяти - оперативная и внешняя . При этом процессор напрямую обращается только к оперативной памяти. Базы данных предназначены для постоянного хранения больших объемов информации, следовательно они хранятся во внешней памяти. Поэтому организация доступа к данным должна учитывать особенности обои видов памяти и их взаимодействия.

Основные свойства оперативной памяти:

  • Минимальная адресуемая единица информации – 1 байт.
  • Каждый байт имеет свой уникальный адрес, то есть память прямоадресуема.
  • Для выбора данных процессор обращается непосредственно к последовательности байтов, содержащей нужные данные.

Основные свойства внешней памяти:

  • Минимальная адресуемая единица информации – физическая запись.
  • Для обработки процессором физическая запись должна быть считана в оперативную память.
  • Считывание может осуществляться только небольшими блоками, так как всю базу разместить в оперативной памяти невозможно.

Взаимодействие видов памяти

Последовательность логических полей определенной логической записи отображается на последовательность прямоадресуемых байтов в оперативной памяти. Прямая адресация позволяет процессору обращаться к нужному полю. Для такого представления необходимо, чтобы все записи имели фиксированную длину, тогда длина записи будет равна сумме длин ее полей. Если длина поля не фиксирована, то становится невозможным использование прямой адресации.

Проблема может возникнуть в ситуации, когда нужно хранить большой фрагмент текста, длина которого у разных записей может варьировать. В этом случае текст размещается во внешней памяти, а поле хранит ссылку на эту область памяти. Именно так организовано поле типа МЕМО в некоторых СУБД.

При одном обращении оперативной памяти к внешней памяти происходит либо чтение, либо записывание одной физической записи. Каждое обращение к внешней памяти занимает определенное время, которое существенно влияет на скорость работы всей системы. Поэтому, чтобы минимизировать количество обращений к внешней памяти, в некоторых СУБД физическую запись удлиняют за счет включения в нее нескольких логических записей.

Другим способом минимизации числа обращений является использование физических записей фиксированной длины, которые не зависят от длины логических записей. Такие физические записи называются страницами . Если оказывается, что в страницу укладывается нецелое количество логических записей, то последняя неполная запись отбрасывается, и страница остается заполнена не до конца. Именно такой метод используется в MS SQL SERVER.

© 2024 ermake.ru -- Про ремонт ПК - Информационный портал