Representação de informações na memória do computador de uma unidade de medida. Representação de dados na memória do computador Representação de informações na memória do computador

Lar / Dispositivos móveis

Máquinas eletrônicas inteligentes estão firmemente estabelecidas em vida diária pessoa. Mas, apesar disso, seu dispositivo ainda levanta questões básicas entre muitos usuários. Por exemplo, nem todo mundo sabe que tipos de memória existem. Mas aqui nem tudo é tão complicado, embora não seja totalmente simples. Existem dois tipos principais - memória interna e externa, que, por sua vez, possuem gradação própria.

Tipos de memória interna do computador

A memória interna é assim chamada porque está embutida nas unidades principais do computador e é parte integrante do sistema, garantindo sua funcionalidade. É impossível removê-lo ou extraí-lo sem consequências negativas. Os seguintes tipos são diferenciados:

operacional – é um conjunto de programas e algoritmos necessários ao funcionamento do microprocessador;
memória cache - este é um tipo de buffer entre a RAM e o processador, que fornece velocidade ideal execução programas do sistema;
constante – previsto na fabricação do computador na fábrica, inclui ferramentas para monitorar o estado do PC a cada inicialização; programas responsáveis por iniciar o sistema e realizar ações básicas; programas de configuração do sistema;
semipermanente – contém dados sobre as configurações de um PC específico;
memória de vídeo – armazena fragmentos de vídeo que devem ser exibidos na tela; faz parte do controlador de vídeo;

Tipos de RAM do computador

O desempenho e o “nível intelectual” de um computador são em grande parte determinados pela sua RAM. Ele armazena dados usados durante trabalho ativo máquina eletrônica. Também pode ser de diferentes tipos, mas os blocos mais utilizados são DDR, DDR2, DDR3. Eles diferem no número de contatos e nas características de velocidade.

Tipos de memória externa do computador

A memória externa do computador é representada por vários tipos de mídia de armazenamento removível. Hoje, os principais são discos rígidos, unidades USB ou pen drives e cartões de memória. Laserdiscs e disquetes são considerados obsoletos. Mas, embora seja removível, ainda é usado como unidade de armazenamento de memória permanente e o computador não funcionará sem ele. No entanto, pode ser retirado livremente e movido para outro unidade do sistema, por isso é classificado como dispositivos externos memória.

Representação de dados na memória computador pessoal

(números, símbolos, gráficos, som).

Forma e idioma de apresentação das informações

Percebendo a informação com a ajuda dos sentidos, a pessoa se esforça para registrá-la para que se torne compreensível para os outros, apresentando-a de uma forma ou de outra.

O compositor pode tocar o tema musical no piano e depois anotá-lo por meio de notas. Imagens inspiradas na mesma melodia podem ser incorporadas por um poeta na forma de um poema, um coreógrafo pode expressá-las na dança e um artista pode expressá-las numa pintura.

Uma pessoa expressa seus pensamentos na forma de frases compostas de palavras. As palavras, por sua vez, são compostas por letras. Esta é uma apresentação alfabética de informações.

A forma de apresentação da mesma informação pode ser diferente. Depende do objetivo que você estabeleceu para si mesmo. Você encontra operações semelhantes nas aulas de matemática e física, quando apresenta uma solução de diferentes formas. Por exemplo, a solução para o problema: “Encontre o valor de uma expressão matemática...” pode ser apresentada em forma tabular ou gráfica. Para isso, utiliza-se meios visuais de apresentação de informações: números, tabelas, desenhos.

Assim, as informações podem ser apresentadas de diversas formas:

sinal escrito, constituído por vários sinais, entre os quais se costuma distinguir

simbólico na forma de texto, números, caracteres especiais (por exemplo, texto de livro didático);

gráfico (por exemplo, um mapa geográfico);

tabular (por exemplo, uma tabela que registra o progresso de um experimento físico);

na forma de gestos ou sinais (por exemplo, sinais de controle de tráfego);

oral verbal (por exemplo, conversa).

A forma como a informação é apresentada é muito importante na sua transmissão: se uma pessoa tem deficiência auditiva, a informação não lhe pode ser transmitida em formato de áudio; se um cão tiver um olfato pouco desenvolvido, ele não poderá trabalhar no serviço de busca. Em diferentes momentos, as pessoas transmitiram informações de diversas formas por meio de: fala, fumaça, tambores, toque de sinos, escrita, telégrafo, rádio, telefone, fax.

Independentemente da forma de apresentação e do método de transmissão da informação, ela é sempre transmitida por meio de algum tipo de linguagem.

Nas aulas de matemática você usa uma linguagem especial baseada em números, operações aritméticas e relações. Eles formam o alfabeto da linguagem da matemática.

Nas aulas de física, ao considerar qualquer fenômeno físico, você usa características desta língua caracteres especiais, a partir do qual você cria fórmulas. Uma fórmula é uma palavra na linguagem da física.

Nas aulas de química, você também usa certos símbolos e sinais, combinando-os em “palavras” de um determinado idioma.

Existe uma linguagem para surdos e mudos, onde os símbolos da língua são certos sinais expressos por expressões faciais e movimentos das mãos.

A base de qualquer idioma é o alfabeto - um conjunto de sinais (símbolos) exclusivamente definidos a partir dos quais uma mensagem é formada.

As línguas são divididas em naturais (faladas) e formais. O alfabeto das línguas naturais depende das tradições nacionais. As linguagens formais são encontradas em áreas especiais da atividade humana (matemática, física, química, etc.). Existem cerca de 10.000 no mundo idiomas diferentes, dialetos, advérbios. Muitas línguas faladas descendem da mesma língua. Por exemplo, francês, espanhol, italiano e outras línguas foram formadas a partir da língua latina.

Informações de codificação

Com o advento da linguagem e depois dos sistemas de sinais, as possibilidades de comunicação entre as pessoas se expandiram. Isso possibilitou armazenar ideias, conhecimentos adquiridos e quaisquer dados e transferi-los de várias maneirasà distância e noutros momentos - não só aos seus contemporâneos, mas também às gerações futuras. Até hoje sobreviveram as criações dos nossos antepassados, que, com a ajuda de vários símbolos, imortalizaram a si próprios e aos seus feitos em monumentos e inscrições. Pinturas rupestres (petroglifos) ainda são um mistério para os cientistas. Talvez desta forma os povos antigos quisessem entrar em contato conosco, os futuros habitantes do planeta, e relatar os acontecimentos de suas vidas.

Cada nação possui seu próprio idioma, composto por um conjunto de caracteres (letras): russo, inglês, japonês e muitos outros. Você já se familiarizou com a linguagem da matemática, da física e da química.

Representar informações usando uma linguagem costuma ser chamado de codificação.

Código é um conjunto de símbolos (símbolos) para representar informações. Codificação é o processo de representação de informações na forma de código.

O motorista transmite o sinal usando uma buzina ou faróis piscando. O código é a presença ou ausência de buzina e, no caso de alarme luminoso, o piscar dos faróis ou sua ausência.

Você encontra codificação de informações ao atravessar a estrada seguindo os semáforos. O código é determinado pelas cores do semáforo - vermelho, amarelo, verde.

A linguagem natural na qual as pessoas se comunicam também é baseada em código. Somente neste caso é chamado de alfabeto. Ao falar, esse código é transmitido por sons, ao escrever - por letras. A mesma informação pode ser representada usando códigos diferentes. Por exemplo, a gravação de uma conversa pode ser gravada usando letras russas ou símbolos abreviados especiais.

À medida que a tecnologia se desenvolveu, surgiram maneiras diferentes codificação de informações. Na segunda metade do século 19, o inventor americano Samuel Morse inventou um código incrível que ainda hoje serve à humanidade. A informação é codificada em três “letras”: um sinal longo (traço), sinal curto(ponto) e nenhum sinal (pausa) para separar letras. Assim, a codificação se resume ao uso de um conjunto de caracteres organizados em uma ordem estritamente definida.

As pessoas sempre procuraram maneiras de se comunicar rapidamente. Para isso, foram enviados mensageiros e utilizados pombos-correio. Os povos tinham várias formas de alertar sobre o perigo iminente: tambores, fumaça de fogueiras, bandeiras, etc. Porém, o uso de tal apresentação de informações requer um acordo prévio sobre a compreensão da mensagem recebida.

O famoso cientista alemão Gottfried Wilhelm Leibniz propôs um método único e sistema simples representação de números. “O cálculo usando dois... é fundamental para a ciência e dá origem a novas descobertas... quando os números são reduzidos aos princípios mais simples, que são 0 e 1, uma ordem maravilhosa aparece em todos os lugares.”

Hoje, esse método de apresentação de informações em uma linguagem contendo apenas dois caracteres alfabéticos - 0 e 1 - é amplamente utilizado em dispositivos técnicos, inclusive no computador. Esses dois caracteres 0 e 1 são geralmente chamados de dígitos ou bits binários (do inglês bit - Binary Digit - sinal binário).

Os engenheiros foram atraídos por este método de codificação pela simplicidade de sua implementação técnica - haja sinal ou não. Usando esses dois números você pode codificar qualquer mensagem.

Uma unidade de medida maior para a quantidade de informação é considerada 1 byte, que consiste em 8 bits.

Também é habitual utilizar unidades de medida maiores do volume de informação. O número 1024 (210) é um multiplicador ao passar para uma unidade de medida superior.

Quilobit Kbit

Kbit = 1024 bits ≈1000 bits

Megabit Mbit

1 Mbit = 1024 Kbit ≈ 1.000.000 bits

Gigabit Gbit

Gbit = 1024 Mbit ≈ 1.000.000.000 bits

Quilobyte KB (KB)

1 KB = 1.024 bytes ≈ 1.000 bytes

Megabyte MB (MB)

1 MB = 1.024 KB ≈ 1.000.000 bytes

Gigabyte GB (GB)

1 GB = 1.024 MB ≈ 1.000.000.000 bytes

Terabyte TB (TB)

1 TB = 1.024 GB ≈ 1.000.000.000.000 bytes

Petabyte Pbyte (Pb)

1 PB = 1.024 TB ≈ 1.000.000.000.000.000 bytes

Exabyte Ebyte (Eb)

1 EB = 1.024 PB ≈ 1.000.000.000.000.000.000 bytes

Zettabyte Zbyte (Zb)

1 Zbyte = 1024 Ebyte ≈ 1.000.000.000.000.000.000.000 bytes

Codificando informações em um computador

Todas as informações que um computador processa devem ser representadas em código binário usando dois dígitos - 0 e 1. Esses dois caracteres são geralmente chamados de dígitos binários ou bits. Usando dois números 1 e 0 você pode codificar qualquer mensagem. Esta foi a razão pela qual dois processos importantes devem ser organizados no computador:

codificação, que é fornecida por dispositivos de entrada ao converter informações de entrada em um formato perceptível por computador, ou seja, em código binário;

decodificação, que é fornecida por dispositivos de saída ao converter dados de código binário em um formato que pode ser compreendido por humanos.

Do ponto de vista da implementação técnica, a utilização do sistema numérico binário para codificação de informações revelou-se muito mais

mais simples do que usar outros métodos. Na verdade, é conveniente codificar a informação como uma sequência de zeros e uns se imaginarmos esses valores como dois possíveis estados estáveis de um elemento eletrônico:

0 - não há sinal elétrico ou o sinal está baixo;

1 - presença de sinal ou sinal em nível alto.

Estas condições são fáceis de distinguir. A desvantagem da codificação binária são os códigos longos. Mas em tecnologia é mais fácil lidar com um grande número elementos simples do que com um pequeno número de complexos.

Mesmo na vida cotidiana, você tem que lidar com um dispositivo que só pode estar em dois estados estáveis: ligado/desligado. Claro, esta é uma mudança familiar a todos. Mas acabou sendo impossível criar uma opção que pudesse mudar de forma estável e rápida para qualquer um dos 10 estados. Como resultado, após uma série de tentativas malsucedidas, os desenvolvedores chegaram à conclusão de que era impossível construir um computador baseado no sistema numérico decimal. E a base para representar números em um computador era o sistema numérico binário.

Atualmente, existem diferentes maneiras de codificar e decodificar informações binárias em um computador. Em primeiro lugar, depende do tipo de informação, nomeadamente, do que deve ser codificado: texto, números, imagens gráficas ou som. Além disso, ao codificar números, a forma como eles serão utilizados desempenha um papel importante: no texto, nos cálculos ou no processo de entrada-saída. Características de implementação técnica também são impostas.

Codificação de números

Um sistema numérico é um conjunto de técnicas e regras para escrever números usando um conjunto específico de símbolos.

Para escrever números, podem ser usados não apenas números, mas também letras (por exemplo, escrever algarismos romanos - XXI). O mesmo número pode ser representado de diferentes maneiras vários sistemas Acerto de contas.

Dependendo da forma como os números são representados, os sistemas numéricos são divididos em posicionais e não posicionais.

Em um sistema numérico posicional, o valor quantitativo de cada dígito de um número depende do local (posição ou dígito) em que um ou outro dígito desse número está escrito. Por exemplo, alterando a posição do número 2 no sistema numérico decimal, você pode escrever valores diferentes números decimais, por exemplo 2; 20; 2000; 0,02, etc.

Em um sistema numérico não posicional, os números não mudam seu valor quantitativo quando sua localização (posição) em um número muda. Um exemplo de sistema não posicional é o sistema romano, no qual o mesmo símbolo tem o mesmo significado independentemente da localização (por exemplo, o símbolo X no número XXV).

O número de símbolos diferentes usados para representar um número no sistema numérico posicional é chamado de base do sistema numérico.

Nos computadores, o sistema numérico mais adequado e confiável provou ser o sistema numérico binário, que utiliza sequências de dígitos 0 e 1 para representar números.

Além disso, para trabalhar com memória de computador revelou-se conveniente utilizar a representação de informações por meio de mais dois sistemas numéricos:

octal (qualquer número é representado por oito dígitos - 0, 1, 2... 7);

hexadecimal (os caracteres digitais utilizados são 0, 1, 2... 9 e letras - A, B, C, D, E, F, substituindo os números 10, 11, 12, 13, 14, 15, respectivamente).

Codificação de informações de caracteres

Pressionar uma tecla alfanumérica do teclado faz com que um sinal seja enviado ao computador na forma de um número binário, que é um dos valores da tabela de códigos. Uma tabela de códigos é uma representação interna de símbolos em um computador. A tabela ASCII (American Standard Code for Informational Interchange) foi adotada como padrão em todo o mundo. código padrão troca de informações).

Para armazenar o código binário de um caractere, é alocado 1 byte = 8 bits. Dado que cada bit é 1 ou 0, o número de combinações possíveis de 1s e 0s é 28 = 256.

Isso significa que com 1 byte você pode obter 256 combinações diferentes de códigos binários e usá-las para exibir 256 caracteres diferentes. Esses códigos constituem a tabela ASCII.

Por exemplo, ao pressionar a tecla com a letra S, o código 01010011 é gravado na memória do computador. Quando a letra 8 é exibida na tela, o computador realiza a decodificação - com base nesse código binário, é criada uma imagem do símbolo. construído.

SOL (SOL) - 01010011 010101101 01001110

O padrão ASCII codifica os primeiros 128 caracteres de 0 a 127: números, letras do alfabeto latino, caracteres de controle. Os primeiros 32 caracteres são caracteres de controle e destinam-se principalmente à transmissão de comandos de controle. Sua finalidade pode variar dependendo do software e do hardware. A segunda metade da tabela de códigos (de 128 a 255) não é definida pelo padrão americano e é destinada a caracteres de alfabetos nacionais, pseudográficos e alguns símbolos matemáticos. Pode ser usado em diferentes países várias opções a segunda metade da tabela de códigos.

Prestar atenção! Os números são codificados de acordo com o padrão ASCII e são escritos em dois casos - durante a entrada/saída e quando aparecem no texto. Se os números estiverem envolvidos nos cálculos, eles serão convertidos em outro código binário.

Para efeito de comparação, considere o número 45 para duas opções de codificação.

Quando utilizado em texto, este número necessitará de 2 bytes para sua representação, pois cada dígito será representado por seu próprio código de acordo com a tabela ASCII. No sistema binário - 00110100 00110101.

Quando utilizado em cálculos, o código deste número será obtido de acordo com regras especiais de tradução e apresentado como um número binário de 8 bits 00101101, que requer 1 byte.

Codificando informações gráficas

Você pode criar e armazenar objetos gráficos em seu computador de duas maneiras - como uma imagem raster ou como uma imagem vetorial. Cada tipo de imagem usa seu próprio método de codificação.

Uma imagem raster é uma coleção de pontos usados para exibi-la na tela de um monitor. Volume bitmapé definido como o produto do número de pontos pelo volume de informação de um ponto, que depende do número de cores possíveis. Para uma imagem em preto e branco, o volume de informação de um ponto é de 1 bit, pois um ponto pode ser preto ou branco, que pode ser codificado com dois dígitos - 0 ou 1.

Para codificar 8 cores, são necessários 3 bits; para 16 cores - 4 bits; para 6 cores - 8 bits (1 byte), etc.

codificação de desenho em preto e branco

codificação de padrão de cores

Uma imagem vetorial é uma coleção de primitivas gráficas. Cada primitiva consiste em segmentos elementares de curva, cujos parâmetros (coordenadas dos pontos nodais, raio de curvatura, etc.) são descritos por fórmulas matemáticas. Para cada linha são indicados seu tipo (sólido, pontilhado, tracejado), espessura e cor, e as figuras fechadas são caracterizadas adicionalmente pelo tipo de preenchimento. Codificação imagens vetoriais executada de diferentes maneiras dependendo do ambiente da aplicação. Em particular, as fórmulas que descrevem segmentos de curvas podem ser codificadas como informação alfanumérica comum para processamento posterior. programas especiais.

Codificação de informações de áudio

O som é uma onda sonora com amplitude e frequência continuamente variáveis. Quanto maior a amplitude do sinal, mais alto ele será para uma pessoa; quanto maior a frequência do sinal, mais alto será o tom; Para que um computador processe som, um sinal de áudio contínuo deve ser convertido em uma sequência de pulsos elétricos (binários uns e zeros).

No processo de codificação de um sinal de áudio contínuo, é realizada sua amostragem temporal. Uma onda sonora contínua é dividida em pequenas seções separadas e, para cada seção, um determinado valor de amplitude é definido. Assim, a dependência contínua da amplitude do sinal no tempo é substituída por uma sequência discreta de níveis de volume.

Moderno placas de som fornece profundidade de codificação de áudio de 16 bits. Neste caso, o número de níveis de sinal será 65536.

Ao codificar binariamente um sinal de áudio contínuo, ele é substituído por uma sequência de níveis de sinal discretos. A qualidade da codificação depende do número de medições de nível de sinal por unidade de tempo, ou seja, na frequência de amostragem. Quanto maior o número de medições realizadas em 1 segundo (quanto maior a frequência de amostragem), mais preciso será o procedimento de codificação binária.

O número de medições por segundo pode variar de 8.000 a 48.000, ou seja, A frequência de amostragem de um sinal de áudio analógico pode assumir valores de 8 a 48 kHz - qualidade de som de CD de áudio. Também deve ser levado em consideração que os modos mono e estéreo são possíveis.

Programa de gravação de som Programa padrão Gravador de som do Windows desempenha o papel de um gravador digital e permite gravar som, ou seja, discretizar sinais sonoros e salve-os em arquivos de som em formato wav. Este programa também permite realizar edições simples de arquivos de som.

Todas as informações em um computador são apresentadas em formato digital. Para números esta representação é natural. Para informações não numéricas (por exemplo, texto), é utilizada uma técnica padrão: todos os valores possíveis são numerados e, em vez dos próprios valores, são armazenados seus números (que desempenham o papel de códigos). Assim, para representar a informação do texto, é utilizada uma tabela de símbolos, contendo todos os caracteres do alfabeto que podem aparecer no texto, e o texto armazenado na memória do computador é substituído por uma lista de números de símbolos nesta tabela. Informações de outros tipos são codificadas de forma semelhante. Em qualquer caso, o conteúdo dos dados não numéricos representados armazenados no computador depende de tabelas de numeração (chamadas tabelas de codificação).

O número de dígitos binários necessários para gravar um código usando este método de gravação depende do tamanho total da tabela. O maior número que pode ser escrito em binário usando N dígitos consiste em N unidades. Este número é 1 + 2 + 4 + ... + 2 N -1 = 2 N- 1. Por exemplo, usando 8 dígitos binários você pode distinguir 2 8 = 256 caracteres de texto. Conseqüentemente, aproximadamente log 2 M dígitos binários são necessários para armazenar códigos de valor cujo tamanho total é igual ao número M.

Esse raciocínio é tão importante para toda a ideologia de armazenamento de informações em código binário que na ciência da computação é costume medir a quantidade de dados e memória do computador não no sistema numérico decimal, mas em unidades de medida especiais baseadas em potências de dois. Usando o fato de que 2 10 = 1024 não é muito diferente de 10 3 = 1000, é comum chamar 1024 bytes de quilobyte (1Kb). Da mesma forma, um megabyte (1 MB) equivale a 024 quilobytes e um gigabyte (1 GB) equivale a 1.024 megabytes. Quantidade de informações em mundo moderno tão grande que é necessária a introdução de uma unidade adicional - um terabyte (1T6), igual a 1.024 gigabytes. Se não for necessária precisão especial, podemos assumir que aproximadamente 1 terabyte = 1 mil gigabytes = 1 milhão de megabytes = 1 bilhão de quilobytes = 1 trilhão de bytes.

Dimensão da informação Para pedaço de informação considere a quantidade de informações contidas na escolha de um dos dois eventos igualmente prováveis. Esta unidade é chamada de dígito binário ou bit.

Na ciência da computação e na tecnologia da computação, foi adotado um sistema de representação de dados em código binário. A menor unidade desta representação é o bit.

Byte  É um grupo de bits interligados. 1 byte = 8 bits. Um byte codifica um caractere de informação de texto.

1 quilobyte (KB) = 1024 bytes.

Porém, em todos os lugares onde isso não é importante, consideram que 1 KB é igual a 1000 bytes. Convencionalmente, podemos assumir que uma página de texto datilografado não formatado equivale a 2 KB.

1 Megabyte (MB) = 1.024 KB.

1 Gigabyte (GB) = 1024 MB.

1 Terabyte (TB) = 1024 GB.

Já foi dito que logicamente a RAM do computador é uma sequência linear de bytes. O comprimento dessa sequência nos computadores pessoais modernos chega a dezenas e centenas de megabytes. Os supercomputadores têm ainda mais memória.

Para armazenar números, dependendo de seu tamanho e precisão, são alocados vários bytes de memória (de 1 a 10). Existem duas formas principais de representar um número na memória do computador. No primeiro método, todos os bits dos bytes de memória alocados para armazenar um número são numerados sequencialmente e os dígitos binários do número são gravados diretamente nos bits de memória correspondentes. Um bit é alocado para representar o sinal do número (0 é mais, 1 é menos). No segundo método, o número é representado na chamada forma normalizada (ou exponencial): X = M 10 n , onde o número M(chamada mantissa) entre 1 e 10, o número n(chamado ordem) - inteiro.

Vários formatos são usados para representar inteiros e números normalizados, que diferem em tamanho e na presença ou ausência de um bit de sinal. Isso determina o intervalo de números que pode ser representado em um determinado formato. Por exemplo, se for conhecido antecipadamente que algum valor inteiro é positivo e não pode ser maior que 255, então 1 byte é suficiente para armazená-lo. Para armazenar valores que variam no intervalo de -2 15 = -32.768 a 2 15 - 1 = 32.767, são alocados 2 bytes. Se um número inteiro não couber nesse intervalo, serão alocados 4 bytes para armazená-lo (intervalo -2 31 a 2 31 - 1).

Em princípio, uma abordagem semelhante também é adequada para números fracionários. Os dígitos de um número são inseridos na memória do computador, mas presume-se que haja um ponto decimal em um determinado local dessa entrada. Esta forma de gravação é chamada representação de um número com ponto fixo. O número máximo de dígitos em um número e a posição específica da vírgula decimal são determinados pelo formato do número. Existem várias opções de formato para representação de números de ponto fixo na memória do computador.

A representação de números normalizados é chamada apresentando convertendo um número de ponto flutuante . É usado para armazenar quantidades que podem ter valores em uma faixa muito grande. Na memória do computador, o expoente e a mantissa são armazenados separadamente na forma de inteiros binários assinados. Os computadores modernos utilizam diversos formatos para representação de números de ponto flutuante, que diferem no tamanho total da representação numérica (6, 8 ou 10 bytes), bem como no tamanho da memória alocada separadamente para a mantissa e a ordem. Isso determina a faixa geral de valores possíveis de um valor numérico em um computador e o erro mínimo nos cálculos resultante da incapacidade do computador de armazenar mais dígitos após a vírgula decimal.

Na realidade, as informações são heterogêneas. Os dados geralmente são divididos em informações numéricas, textuais e lógicas. A informação textual é entendida como uma sequência linear de caracteres. Para representar um caractere na memória do computador, o seguinte esquema é usado: um conjunto de caracteres de texto válidos é gravado (geralmente 2 8 = 256 caracteres), e a cada caractere é atribuído um número (de 0 a 255), que serve como caractere. código. Depois disso, a sequência de caracteres é substituída por uma sequência de códigos, que são escritos na memória do computador como números inteiros binários (sem sinal). O código de um caractere cabe em 1 byte de memória (é por isso que historicamente a memória foi dividida em grupos de 8 bits, pois descobriu-se que o número ideal de caracteres é 2 8, e não, por exemplo, 2 9).

O conjunto de caracteres válidos e seus códigos constituem a tabela de codificação de caracteres. Naturalmente, esta tabela não deve depender da arbitrariedade do programador ou fabricante do computador, pois a troca de informações neste caso será muito difícil. Atualmente existe um padrão A.S.C./ f (americano Padrão Código para Informativo Intercâmbio), contendo 128 caracteres básicos (códigos 0 a 127) e 128 caracteres estendidos (códigos 128 a 255). Dado que esta norma não inclui caracteres dos alfabetos nacionais, em cada país os 128 códigos de caracteres estendidos (de 128 a 255) são substituídos por caracteres do alfabeto nacional. Em outras palavras, cada idioma com um alfabeto diferente do inglês estabelece seu próprio padrão. Texto significativo em um idioma não terá sentido em outro. Assim, para operação adequada Com o texto, não só a informação em si é importante, mas também a sua interpretação. Um programa que interpreta corretamente os códigos de caracteres de acordo com a tabela de codificação em um alfabeto específico é chamado driver de texto

Um valor lógico é um valor que pode assumir apenas dois valores: verdadeiro Efalso (“verdadeiro” e “falso”). Para armazenar o valor de uma variável lógica, 1 bit é suficiente. Normalmente, o valor “um” de um bit de memória está associado a verdadeiro, o valor “zero” a falso.

Para armazenar objetos mais complexos na memória do computador, como imagens de vídeo ou sons, as descrições desses objetos são convertidas em formato numérico. Existem várias formas de codificar este tipo de informação, mas no final, uma imagem ou som é representado como uma sequência de zeros e uns, que são colocados em bits de memória do computador e, se necessário, recuperados daí e interpretados de uma certa maneira.

Representação lógica e física de dados

Ao trabalhar com um SGBD, o usuário lida com a representação lógica dos dados e pode nem saber como está organizada fisicamente a representação dos dados na memória do computador. No entanto, a eficiência dos aplicativos que utilizam bancos de dados depende em grande parte do método de colocação física dos dados.

A organização física dos dados depende do tipo de computador utilizado e do SGBD específico. Diferentes SGBDs usam métodos diferentes para armazenar dados na memória e meios de acessá-los. Portanto, ao escolher um SGBD na fase de projeto, é importante conhecer e compreender as características método físico armazenamento de dados. O principal critério de seleção é a eficiência do acesso aos dados.

Se os conceitos básicos do modelo lógico de dados forem campo booleano, entrada lógica E arquivo lógico, então para o modelo físico existem conceitos básicos semelhantes - campo físico, registro físico, arquivo físico.

Nota 1

Alguns métodos de acesso podem mapear um campo lógico diretamente para um campo físico, um registro lógico para um registro físico e um arquivo lógico para um arquivo físico. Mas em caso geral não existe essa correspondência um a um.

Esquema de operação do processador e memória

Existem dois tipos de memória em um computador - operacional E externo. Neste caso, o processador acessa diretamente apenas BATER. Os bancos de dados são projetados para armazenar permanentemente grandes quantidades de informações, portanto são armazenados em memória externa. Portanto, a organização do acesso aos dados deve levar em consideração as características de ambos os tipos de memória e sua interação.

Propriedades básicas da RAM:

A unidade mínima endereçável de informação é 1 byte.
Cada byte possui seu endereço único, ou seja, a memória é endereçável diretamente.
Para selecionar os dados, o processador acessa diretamente a sequência de bytes que contém os dados desejados.

Propriedades básicas da memória externa:

A unidade mínima endereçável de informação é um registro físico.
Para ser processado pelo processador, o registro físico deve ser lido na RAM.
A leitura só pode ser feita em pequenos blocos, pois é impossível colocar todo o banco de dados na RAM.

Interação de tipos de memória

A sequência de campos lógicos de um registro lógico específico é mapeada para uma sequência de bytes endereçáveis diretamente na RAM. O endereçamento direto permite que o processador acesse o campo desejado. Para tal representação é necessário que todos os registros tenham comprimento fixo, então o comprimento do registro será igual à soma dos comprimentos de seus campos. Se o comprimento do campo não for fixo, torna-se impossível usar o endereçamento direto.

O problema pode surgir em uma situação em que você precisa armazenar um trecho grande de texto, cujo comprimento pode variar entre os registros. Neste caso, o texto fica localizado na memória externa, e o campo armazena um link para esta área da memória. É exatamente assim que o campo do tipo MEMO é organizado em alguns SGBDs.

Cada vez que a RAM acessa a memória externa, ela lê ou grava um registro físico. Cada acesso à memória externa leva um certo tempo, o que afeta significativamente a velocidade de todo o sistema. Portanto, para minimizar o número de acessos à memória externa, em alguns SGBDs o registro físico é alongado incluindo vários registros lógicos.

Outra forma de minimizar o número de acessos é usar registros físicos de comprimento fixo que sejam independentes do comprimento dos registros lógicos. Esses registros físicos são chamados páginas. Se acontecer que um número não inteiro de registros lógicos cabe na página, o último registro incompleto será descartado e a página permanecerá preenchida de forma incompleta. Este é exatamente o método usado no MS SQL SERVER.

Tipos de memória interna do computador

Tipos de RAM do computador

Tipos de memória externa do computador

Esquema de operação do processador e memória

Interação de tipos de memória

Escolha do Editor