측정 단위에 대한 컴퓨터 메모리의 정보 표현입니다. 컴퓨터 메모리의 데이터 표현 컴퓨터 메모리의 정보 표현

/ 모바일 장치

스마트 전자 기계는 오랫동안 확고하게 자리 잡았습니다. 기와사람. 그러나 그럼에도 불구하고 그들의 장치는 여전히 많은 사용자들 사이에서 기본적인 질문을 제기하고 있습니다. 예를 들어, 모든 사람이 어떤 유형의 기억이 있는지 아는 것은 아닙니다. 그러나 여기서는 완전히 단순하지는 않지만 모든 것이 그렇게 복잡하지는 않습니다. 내부 메모리와 외부 메모리의 두 가지 주요 유형이 있으며 차례로 자체 그라데이션이 있습니다.

내부 컴퓨터 메모리 유형

내부 메모리는 컴퓨터의 기본 장치에 내장되어 있으며 시스템의 필수 요소로서 기능을 보장하기 때문에 그렇게 불립니다. 부정적인 결과 없이 제거하거나 추출하는 것은 불가능합니다. 다음 유형이 구별됩니다.

  • 운영상의 – 마이크로프로세서의 작동에 필요한 프로그램 및 알고리즘의 집합입니다.
  • 캐시 메모리 - 이것은 RAM과 프로세서 사이의 일종의 버퍼입니다. 최적의 속도실행 시스템 프로그램;
  • 끊임없는 – 컴퓨터가 공장에서 제조될 때 제공되며, 부팅할 때마다 PC 상태를 모니터링하는 도구가 포함되어 있습니다. 시스템 시작 및 기본 작업 수행을 담당하는 프로그램 시스템 설정 프로그램;
  • 반영구적 – 특정 PC의 설정에 대한 데이터가 포함되어 있습니다.
  • 비디오 메모리 – 화면에 표시되어야 하는 비디오 조각을 저장하며 비디오 컨트롤러의 일부입니다.

컴퓨터 RAM의 종류

컴퓨터의 성능과 "지적 수준"은 주로 RAM에 따라 결정됩니다. 사용되는 데이터를 저장합니다. 활동적인 일전자 기계. 유형도 다양할 수 있지만 가장 일반적으로 사용되는 블록은 DDR, DDR2, DDR3입니다. 접점 수와 속도 특성이 다릅니다.

외부 컴퓨터 메모리 유형

외부 컴퓨터 메모리는 다양한 유형의 이동식 저장 매체로 표현됩니다. 오늘날 주요 드라이브는 하드 드라이브, USB 드라이브, 플래시 드라이브 및 메모리 카드입니다. 레이저 디스크와 플로피 디스크는 더 이상 사용되지 않는 것으로 간주됩니다. 그러나 제거 가능하더라도 여전히 영구 메모리의 저장 장치로 사용되며 컴퓨터가 없으면 컴퓨터가 작동하지 않습니다. 그러나 자유롭게 꺼내어 다른 곳으로 이동할 수 있습니다. 시스템 장치, 이것이 바로 다음과 같이 분류되는 이유입니다. 외부 장치메모리.


메모리의 데이터 표현 개인용 컴퓨터

(숫자, 기호, 그래픽, 사운드).

정보 표현의 형식과 언어

사람은 감각의 도움으로 정보를 인식하여 다른 사람이 이해할 수 있도록 기록하고 어떤 형태로든 제시하려고 노력합니다.

작곡가는 음악 주제를 피아노로 연주한 후 음표를 사용하여 적을 수 있습니다. 같은 선율에서 영감을 받은 이미지를 시인은 시로 형상화할 수 있고, 안무가는 이를 춤으로 표현할 수 있으며, 예술가는 이를 그림으로 표현할 수 있다.

사람은 단어로 구성된 문장의 형태로 자신의 생각을 표현합니다. 단어는 글자로 구성됩니다. 이는 정보를 알파벳순으로 표시한 것입니다.

동일한 정보의 표시 형식이 다를 수 있습니다. 그것은 당신이 스스로 설정한 목표에 달려 있습니다. 다양한 형태로 솔루션을 제시할 때 수학 및 물리학 수업에서 유사한 작업을 접하게 됩니다. 예를 들어, "수학 표현식의 값 찾기..."라는 문제에 대한 해결책은 표 또는 그래픽 형식으로 표시할 수 있습니다. 이를 위해 숫자, 표, 그림과 같은 정보를 표시하는 시각적 수단을 사용할 수 있습니다.

따라서 정보는 다양한 형태로 제공될 수 있습니다.

    다양한 기호로 구성된 서면 기호 중 구별하는 것이 관례입니다.

    텍스트, 숫자, 특수 문자(예: 교과서 텍스트) 형태의 기호

    그래픽(예: 지리적 지도)

    표(예: 물리적 실험의 진행 상황을 기록하는 표)

    몸짓이나 신호(예: 교통 통제 신호)의 형태로,

    구두 언어(예: 대화).

정보를 전송할 때 정보가 제공되는 형식은 매우 중요합니다. 청각 장애가 있는 사람은 정보를 오디오 형식으로 전달할 수 없습니다. 개가 후각이 제대로 발달하지 않으면 검색 서비스에서 작동할 수 없습니다. 각기 다른 시간에 사람들은 연설, 연기, 북 연주, 종소리, 글쓰기, 전신, 라디오, 전화, 팩스 등을 사용하여 다양한 형태로 정보를 전달했습니다.

정보의 표현 형태와 전달 방법에 관계없이 항상 일종의 언어를 사용하여 전달됩니다.

수학 수업에서는 숫자, 산술 연산 및 관계를 기반으로 하는 특수 언어를 사용합니다. 그들은 수학 언어의 알파벳을 형성합니다.

물리학 수업에서는 물리적 현상을 고려할 때 특성을 사용합니다. 이 언어의 특수 문자, 여기에서 수식을 구성합니다. 공식은 물리학의 언어로 된 단어입니다.

화학 수업에서는 특정 기호와 기호를 사용하여 해당 언어의 "단어"로 결합합니다.

청각 장애인과 벙어리를 위한 언어가 있는데, 언어의 상징은 얼굴 표정과 손 움직임으로 표현되는 특정 기호입니다.

모든 언어의 기본은 알파벳, 즉 메시지가 형성되는 고유하게 정의된 기호(기호) 집합입니다.

언어는 자연어(구어)와 격식으로 구분됩니다. 자연어의 알파벳은 국가 전통에 따라 다릅니다. 형식 언어는 인간 활동의 특수 영역(수학, 물리학, 화학 등)에서 발견됩니다. 전 세계적으로 약 10,000개가 있다. 다른 언어, 방언, 부사. 많은 구어는 같은 언어에서 유래되었습니다. 예를 들어 프랑스어, 스페인어, 이탈리아어 및 기타 언어는 라틴어에서 형성되었습니다.

인코딩 정보

언어와 수화 시스템의 출현으로 사람들 간의 의사 소통 가능성이 확대되었습니다. 이를 통해 아이디어, 습득한 지식 및 모든 데이터를 저장하고 전송할 수 있습니다. 다양한 방법으로멀리서 그리고 때로는 동시대 사람들뿐만 아니라 미래 세대에게도. 우리 조상들의 창조물은 다양한 상징의 도움으로 기념물과 비문에서 자신과 그들의 행위를 불멸화시킨 오늘날까지 살아 남았습니다. 암벽화(암각화)는 여전히 과학자들에게 미스터리로 남아 있습니다. 아마도 이런 식으로 고대 사람들은 지구의 미래 거주자인 우리와 접촉하고 그들의 삶에서 일어난 사건에 대해 보고하기를 원했을 것입니다.

각 국가에는 러시아어, 영어, 일본어 등의 문자 집합으로 구성된 고유한 언어가 있습니다. 당신은 이미 수학, 물리학, 화학의 언어에 익숙해졌습니다.

언어를 사용하여 정보를 표현하는 것을 흔히 인코딩이라고 합니다.

코드는 정보를 표현하기 위한 기호(기호)의 집합입니다. 코딩은 정보를 코드 형태로 표현하는 과정입니다.

운전자는 경적이나 깜박이는 헤드라이트를 사용하여 신호를 전송합니다. 코드는 경적의 유무, 가벼운 경보의 경우 헤드라이트의 깜박임 또는 부재입니다.

신호등을 따라 길을 건널 때 정보 코딩이 발생합니다. 코드는 신호등의 색상(빨간색, 노란색, 녹색)에 따라 결정됩니다.

사람들이 의사소통하는 자연어 역시 코드를 기반으로 합니다. 이 경우에만 알파벳이라고 합니다. 이 코드는 말할 때 소리로, 글로 쓸 때 문자로 전송됩니다. 동일한 정보라도 다른 코드를 사용하여 표현할 수 있습니다. 예를 들어, 대화 녹음은 러시아어 문자나 특수 속기 기호를 사용하여 녹음할 수 있습니다.

기술이 발전하면서 등장한 다른 방법인코딩 정보. 19세기 후반, 미국의 발명가 사무엘 모스는 오늘날에도 여전히 인류에게 도움이 되는 놀라운 코드를 발명했습니다. 정보는 세 개의 "문자"로 인코딩됩니다: 긴 신호(대시), 짧은 신호(점) 및 신호 없음(일시 중지)으로 문자를 구분합니다. 따라서 코딩은 엄격하게 정의된 순서로 배열된 문자 집합을 사용하는 것으로 귀결됩니다.

사람들은 항상 빠르게 의사소통할 수 있는 방법을 찾고 있었습니다. 이를 위해 메신저가 파견되고 운반 비둘기가 사용되었습니다. 사람들은 드럼 연주, 모닥불 연기, 깃발 등 임박한 위험에 대해 다양한 방법으로 경고했습니다. 그러나 이러한 정보 표시를 사용하려면 수신되는 메시지를 이해하기 위한 사전 동의가 필요합니다.

독일의 유명한 과학자 고트프리트 빌헬름 라이프니츠(Gottfried Wilhelm Leibniz)는 독특하고 단식숫자의 표현. "2를 사용한 계산은... 과학의 기본이며 새로운 발견을 낳습니다... 숫자가 가장 간단한 원리인 0과 1로 줄어들면 어디에서나 놀라운 질서가 나타납니다."

오늘날에는 0과 1이라는 두 개의 알파벳 문자만 포함하는 언어를 사용하여 정보를 표현하는 방법이 널리 사용되고 있습니다. 기술 장치, 컴퓨터를 포함하여. 이 두 문자 0과 1은 일반적으로 이진수 또는 비트(영어 비트 - Binary Digit - 이진 기호)라고 합니다.

엔지니어들은 신호가 있든 없든 기술적 구현이 단순하다는 점 때문에 이 코딩 방법에 매력을 느꼈습니다. 이 두 숫자를 사용하면 모든 메시지를 인코딩할 수 있습니다.

정보량의 더 큰 측정 단위는 8비트로 구성된 1바이트로 간주됩니다.

또한 정보량에 대해 더 큰 측정 단위를 사용하는 것이 일반적입니다. 숫자 1024(210)는 더 높은 측정 단위로 이동할 때의 승수입니다.

킬로비트 Kbit

Kbit = 1024비트 ≒1000비트

메가비트 Mbit

1Mbit = 1024Kbit ≒ 1,000,000비트

기가비트 Gbit

Gbit = 1024Mbit ≒ 1,000,000,000비트

킬로바이트KB(KB)

1KB = 1024바이트 ≒ 1000바이트

메가바이트(MB)

1MB = 1024KB ≒ 1,000,000바이트

기가바이트GB(GB)

1GB = 1024MB ≒ 1,000,000,000바이트

테라바이트(TB)

1TB = 1024GB ≒ 1,000,000,000,000바이트

페타바이트 Pbyte(Pb)

1PB = 1024TB ≒ 1,000,000,000,000,000바이트

엑사바이트 Ebyte(Eb)

1EB = 1024PB ≒ 1,000,000,000,000,000,000바이트

제타바이트 Zbyte(Zb)

1Z바이트 = 1024E바이트 ≒ 1,000,000,000,000,000,000,000바이트

컴퓨터의 정보 인코딩

컴퓨터가 처리하는 모든 정보는 0과 1이라는 두 숫자를 사용하는 이진 코드로 표현되어야 합니다. 이 두 문자를 일반적으로 이진 숫자 또는 비트라고 합니다. 두 개의 숫자 1과 0을 사용하면 모든 메시지를 인코딩할 수 있습니다. 이것이 컴퓨터에 두 가지 중요한 프로세스가 구성되어야 하는 이유입니다.

    입력 정보를 컴퓨터가 인식할 수 있는 형식, 즉 이진 코드로 변환할 때 입력 장치에서 제공하는 인코딩;

    디코딩은 바이너리 코드의 데이터를 사람이 이해할 수 있는 형식으로 변환할 때 출력 장치에서 제공되는 것입니다.

기술 구현의 관점에서 정보 인코딩에 이진수 시스템을 사용하는 것이 훨씬 더 많은 것으로 나타났습니다.

다른 방법을 사용하는 것보다 간단합니다. 실제로 이러한 값을 전자 요소의 두 가지 안정적인 상태로 상상하면 정보를 0과 1의 시퀀스로 인코딩하는 것이 편리합니다.

    0 - 전기 신호가 없거나 신호가 낮습니다.

    1 - 신호가 있거나 신호가 높은 레벨입니다.

이러한 조건은 구별하기 쉽습니다. 바이너리 인코딩의 단점은 코드가 길다는 것입니다. 그러나 기술적으로는 많은 수를 처리하는 것이 더 쉽습니다. 단순한 요소소수의 복잡한 것보다.

일상생활에서도 온/오프라는 두 가지 안정적인 상태에만 있을 수 있는 장치를 다루어야 합니다. 물론 이것은 누구에게나 친숙한 스위치이다. 그러나 10가지 상태 중 하나로 안정적이고 빠르게 전환할 수 있는 스위치를 만드는 것은 불가능하다는 것이 밝혀졌습니다. 그 결과, 여러 번의 실패한 시도 끝에 개발자들은 십진수 체계를 기반으로 컴퓨터를 만드는 것이 불가능하다는 결론에 도달했습니다. 그리고 컴퓨터에서 숫자를 표현하는 기본은 이진수 체계였습니다.

현재 컴퓨터에서 정보를 이진 인코딩 및 디코딩하는 방법에는 여러 가지가 있습니다. 우선, 정보 유형, 즉 텍스트, 숫자, 인코딩해야 하는 내용에 따라 다릅니다. 그래픽 이미지또는 소리. 또한 숫자를 인코딩할 때 숫자가 사용되는 방식(텍스트, 계산 또는 입출력 프로세스)이 중요한 역할을 합니다. 기술 구현의 특징도 부과됩니다.

인코딩 번호

숫자 체계는 특정 기호 집합을 사용하여 숫자를 쓰는 일련의 기술과 규칙입니다.

숫자를 쓰려면 숫자뿐만 아니라 문자도 사용할 수 있습니다(예: 로마 숫자 쓰기 - XXI). 같은 숫자라도 다른 방식으로 표현될 수 있다 다양한 시스템계산.

숫자를 표현하는 방식에 따라 숫자 체계는 위치 체계와 비위치 체계로 구분됩니다.

위치 숫자 체계에서 숫자의 각 숫자의 양적 값은 이 숫자의 하나 또는 다른 숫자가 기록되는 위치(위치 또는 숫자)에 따라 달라집니다. 예를 들어, 십진수 체계에서 숫자 2의 위치를 ​​변경하면 다른 값을 쓸 수 있습니다. 십진수, 예를 들어 2; 20; 2000; 0.02 등

비 위치 번호 시스템에서 번호는 번호의 위치(위치)가 변경될 때 수량 값을 변경하지 않습니다. 비 위치 체계의 예로는 동일한 기호가 위치에 관계없이 동일한 의미를 갖는 로마 체계가 있습니다(예: 숫자 XXV의 기호 X).

위치 수 체계에서 숫자를 나타내는 데 사용되는 다양한 기호의 수를 수 체계의 기본이라고 합니다.

컴퓨터에서 가장 적합하고 신뢰할 수 있는 숫자 체계는 숫자 0과 1의 시퀀스를 사용하여 숫자를 나타내는 이진수 체계임이 입증되었습니다.

또한 컴퓨터 메모리를 사용하려면 두 가지 숫자 체계를 더 사용하여 정보 표현을 사용하는 것이 편리한 것으로 나타났습니다.

    8진수(모든 숫자는 0, 1, 2...7의 8자리 숫자를 사용하여 표시됩니다)

    16진수(사용되는 디지털 문자는 0, 1, 2...9이고 문자는 각각 숫자 10, 11, 12, 13, 14, 15를 대체하는 A, B, C, D, E, F입니다.)

문자 정보의 인코딩

키보드의 영숫자 키를 누르면 신호가 코드표의 값 중 하나인 이진수 형태로 컴퓨터에 전송됩니다. 코드 테이블은 컴퓨터의 기호를 내부적으로 표현한 것입니다. ASCII 테이블(American Standard Code for Informational Interchange)은 전 세계적으로 표준으로 채택되었습니다. 표준 코드정보 교환).

한 문자의 바이너리 코드를 저장하기 위해 1바이트 = 8비트가 할당된다. 각 비트가 1 또는 0이라고 가정할 때 1과 0의 가능한 조합 수는 28 = 256입니다.

즉, 1바이트로 256개의 서로 다른 이진 코드 조합을 얻을 수 있고 이를 사용하여 256개의 서로 다른 문자를 표시할 수 있습니다. 이 코드는 ASCII 테이블을 구성합니다.

예를 들어 문자 S가 있는 키를 누르면 코드 01010011이 컴퓨터 메모리에 기록됩니다. 문자 8이 화면에 표시되면 컴퓨터는 이 이진 코드를 기반으로 기호 이미지를 디코딩합니다. 세워짐.

일 (일) - 01010011 010101101 01001110

ASCII 표준은 숫자, 라틴 알파벳 문자, 제어 문자 등 0부터 127까지 처음 128자를 인코딩합니다. 처음 32자는 제어 문자이며 주로 제어 명령을 전송하는 데 사용됩니다. 그 목적은 소프트웨어와 하드웨어에 따라 다를 수 있습니다. 코드 테이블의 후반부(128에서 255까지)는 미국 표준에 의해 정의되지 않으며 국가 알파벳, 의사 문자 및 일부 문자에 사용됩니다. 수학 기호. 다양한 국가에서 사용할 수 있습니다. 다양한 옵션코드 테이블의 후반부.

주의하세요! 숫자는 ASCII 표준에 따라 인코딩되며 입력/출력 중과 텍스트에 나타날 때의 두 가지 경우에 기록됩니다. 계산에 숫자가 포함되면 다른 이진 코드로 변환됩니다.

비교를 위해 두 가지 인코딩 옵션에 대해 숫자 45를 고려하십시오.

텍스트에 사용될 때 이 숫자는 표현을 위해 2바이트가 필요합니다. 각 숫자는 ASCII 표에 따라 자체 코드로 표시되기 때문입니다. 바이너리 시스템 - 00110100 00110101.

계산에 사용될 때 이 숫자에 대한 코드는 특별한 변환 규칙에 따라 얻어지며 1바이트가 필요한 8비트 이진수 00101101로 표시됩니다.

그래픽 정보 인코딩

래스터 이미지 또는 벡터 이미지라는 두 가지 방법으로 컴퓨터에 그래픽 개체를 만들고 저장할 수 있습니다. 각 이미지 유형은 고유한 인코딩 방법을 사용합니다.

래스터 이미지는 모니터 화면에 표시하는 데 사용되는 점 모음입니다. 용량 비트맵가능한 색상의 수에 따라 포인트 수와 한 포인트의 정보량을 곱한 것으로 정의됩니다. 흑백 이미지의 경우 한 포인트의 정보량은 1비트입니다. 포인트는 흑백일 수 있고 두 자리 숫자(0 또는 1)로 인코딩될 수 있기 때문입니다.

8가지 색상을 인코딩하려면 3비트가 필요합니다. 16가지 색상 - 4비트; 6가지 색상 - 8비트(1바이트) 등

    흑백 그림 인코딩

    색상 패턴 코딩

벡터 이미지는 그래픽 기본 요소의 모음입니다. 각 프리미티브는 기본 곡선 세그먼트로 구성되며, 그 매개변수(절점 좌표, 곡률 반경 등)는 수학 공식으로 설명됩니다. 각 선에는 유형(실선, 점선, 점선), 두께 및 색상이 표시되며 닫힌 그림은 채우기 유형에 따라 추가로 특성화됩니다. 코딩 벡터 이미지응용 프로그램 환경에 따라 다른 방식으로 수행됩니다. 특히, 곡선 세그먼트를 설명하는 공식은 추가 처리를 위해 일반 영숫자 정보로 인코딩될 수 있습니다. 특별 프로그램.

오디오 정보 인코딩

소리는 진폭과 주파수가 지속적으로 변하는 음파입니다. 신호의 진폭이 클수록 사람에게는 더 큰 소리가 들립니다. 신호의 주파수가 높을수록 톤도 높아집니다. 컴퓨터가 소리를 처리하려면 연속적인 오디오 신호를 일련의 전기 펄스(이진수 1과 0)로 변환해야 합니다.

연속적인 오디오 신호를 인코딩하는 과정에서 타임 샘플링이 수행됩니다. 연속 음파는 별도의 작은 섹션으로 나뉘며 각 섹션에 대해 특정 진폭 값이 설정됩니다. 따라서 시간에 대한 신호 진폭의 연속 의존성은 이산적인 볼륨 레벨 시퀀스로 대체됩니다.

현대의 사운드 카드 16비트 오디오 인코딩 깊이를 제공합니다. 이 경우 신호 레벨의 수는 65536이 됩니다.

연속 오디오 신호를 이진 코딩하면 일련의 개별 신호 레벨로 대체됩니다. 인코딩 품질은 단위 시간당 신호 레벨 측정 횟수에 따라 달라집니다. 샘플링 주파수에 대해 1초 동안 측정한 횟수가 많을수록(샘플링 빈도가 높을수록) 이진 코딩 절차가 더 정확해집니다.

초당 측정 횟수의 범위는 8000~48000입니다. 아날로그 오디오 신호의 샘플링 주파수는 8~48kHz(오디오 CD 음질)의 값을 가질 수 있습니다. 모노와 스테레오 모드가 모두 가능하다는 점도 고려해야 합니다.

녹음 프로그램 표준 프로그램 Windows 녹음기디지털 테이프 레코더 역할을 하며 소리를 녹음할 수 있습니다. 이산화하다 소리 신호, 다음 위치에 저장하세요. 사운드 파일 wav 형식으로. 이 프로그램을 사용하면 사운드 파일을 간단하게 편집할 수도 있습니다.

컴퓨터의 모든 정보는 디지털 형식으로 제공됩니다. 숫자의 경우 이러한 표현은 자연스럽습니다. 숫자가 아닌 정보(예: 텍스트)의 경우 표준 기술이 사용됩니다. 가능한 모든 값에 번호가 매겨지고 값 자체 대신 코드 역할을 하는 해당 숫자가 저장됩니다. 따라서 텍스트 정보를 표현하기 위해 텍스트에 나타날 수 있는 모든 알파벳 문자를 포함하는 기호 표가 사용되며, 컴퓨터 메모리에 저장된 텍스트는 이 표의 기호 번호 목록으로 대체됩니다. 다른 유형의 정보도 유사하게 인코딩됩니다. 어떤 경우든 컴퓨터에 저장된 표현된 비숫자 데이터의 내용은 번호 매기기 테이블(인코딩 테이블이라고 함)에 따라 다릅니다.

이 기록 방법을 사용하여 하나의 코드를 기록하는 데 필요한 이진수 수는 테이블의 전체 크기에 따라 다릅니다. N자리를 사용하여 이진수로 쓸 수 있는 가장 큰 수는 N개의 1로 구성됩니다. 이 숫자는 1 + 2 + 4 + ... + 2 N -1 = 2 N- 1. 예를 들어 8개의 이진수를 사용하면 2 8 = 256개의 텍스트 문자를 구분할 수 있습니다. 결과적으로 전체 크기가 숫자 M과 동일한 값 코드를 저장하려면 약 log 2M 이진수가 필요합니다.

이 추론은 정보를 이진 코드로 저장하는 전체 이념에 매우 중요하므로 컴퓨터 과학에서는 데이터와 컴퓨터 메모리의 양을 십진수 체계가 아닌 2의 거듭제곱을 기반으로 한 특수 측정 단위로 측정하는 것이 일반적입니다. 2 10 = 1024가 10 3 = 1000과 크게 다르지 않다는 사실을 이용하여 킬로바이트(1Kb)당 1024바이트를 호출하는 것이 일반적입니다. 마찬가지로 1메가바이트(1MB)는 024킬로바이트이고 1기가바이트(1GB)는 1024메가바이트입니다. 정보의 양 현대 세계너무 커서 추가 단위(1024GB에 해당하는 테라바이트(1T6))를 도입해야 합니다. 특별한 정밀도가 필요하지 않은 경우 대략 1테라바이트 = 1000기가바이트 = 100만 메가바이트 = 10억 킬로바이트 = 1조 바이트라고 가정할 수 있습니다.

정보의 차원을 위한 정보 똑같이 일어날 수 있는 두 가지 사건 중 하나를 선택하는 데 포함된 정보의 양을 취합니다. 이 단위를 이진수 또는 비트라고 합니다.

컴퓨터 과학 및 컴퓨터 기술에서는 데이터를 이진 코드로 표현하는 시스템이 채택되었습니다. 이 표현의 가장 작은 단위는 비트입니다.

바이트  서로 연결된 비트들의 집합이다. 1바이트 = 8비트. 1바이트는 텍스트 정보의 한 문자를 인코딩합니다.

1킬로바이트(KB) = 1024바이트.

그러나 이것이 중요하지 않은 곳에서는 1KB가 1000바이트와 동일하다고 간주됩니다. 일반적으로 서식이 지정되지 않은 타이핑 텍스트의 한 페이지는 2KB와 같다고 가정할 수 있습니다.

1메가바이트(MB) = 1024KB.

1기가바이트(GB) = 1024MB.

1테라바이트(TB) = 1024GB.

논리적으로 컴퓨터의 RAM은 선형 바이트 시퀀스라고 이미 말한 바 있습니다. 현대 개인용 컴퓨터에서 이 시퀀스의 길이는 수십, 수백 메가바이트에 이릅니다. 슈퍼컴퓨터에는 더 많은 메모리가 있습니다.

숫자를 저장하기 위해 크기와 정확성에 따라 몇 바이트의 메모리가 할당됩니다(1에서 10까지). 컴퓨터 메모리에 숫자를 표시하는 데에는 두 가지 주요 형태가 있습니다. 첫 번째 방법은 숫자를 저장하기 위해 할당된 메모리 바이트의 모든 비트를 순차적으로 번호를 매기고 해당 숫자의 이진수를 해당 메모리 비트에 직접 쓰는 방법입니다. 숫자의 부호를 나타내기 위해 1비트가 할당됩니다(0은 플러스, 1은 마이너스). 두 번째 방법에서는 숫자가 소위 정규화된(또는 지수) 형식으로 표시됩니다. X=엠 10n , 여기서 숫자는 (가수라고 함) 1부터 10까지의 숫자 N(주문이라고 함) - 전체.

크기와 부호 비트의 유무가 다른 정수와 정규화된 숫자를 나타내는 데 여러 가지 형식이 사용됩니다. 이는 주어진 형식으로 표현할 수 있는 숫자의 범위를 결정합니다. 예를 들어, 일부 정수 값이 양수이고 255보다 클 수 없다는 것이 미리 알려진 경우 이를 저장하는 데 1바이트이면 충분합니다. -2 15 = -32,768부터 2 15 - 1 = 32,767까지의 범위에서 변화하는 값을 저장하기 위해 2바이트가 할당된다. 정수가 이 범위에 맞지 않으면 이를 저장하기 위해 4바이트가 할당됩니다(범위 -2 31 ~ 2 31 - 1).

원칙적으로 유사한 접근 방식이 분수에도 적합합니다. 숫자의 숫자는 컴퓨터 메모리에 입력되는데, 이 항목의 특정 위치에 소수점이 있는 것으로 가정됩니다. 이런 형태의 녹음을 녹음이라고 합니다. 숫자로 표현하기 고정점. 숫자의 최대 자릿수와 소수점의 구체적인 위치는 숫자 형식에 따라 결정됩니다. 컴퓨터 메모리에 고정 소수점 숫자를 표시하는 형식에는 여러 가지 옵션이 있습니다.

정규화된 숫자의 표현은 다음과 같습니다. 소개 부동 소수점 숫자 변환 . 매우 넓은 범위에 걸쳐 값을 가질 수 있는 수량을 저장하는 데 사용됩니다. 컴퓨터 메모리에는 지수와 가수가 부호 있는 이진 정수 형태로 별도로 저장됩니다. 최신 컴퓨터는 부동 소수점 숫자를 표현하기 위해 여러 가지 형식을 사용하는데, 이는 숫자 표현의 전체 크기(6, 8 또는 10바이트)뿐만 아니라 가수와 순서에 별도로 할당된 메모리 크기도 다릅니다. 이는 컴퓨터에서 가능한 숫자 값의 전체 범위와 컴퓨터가 소수점 이하 자릿수를 더 이상 저장할 수 없어 발생하는 계산의 최소 오류를 결정합니다.

실제로 정보는 이질적입니다. 데이터는 일반적으로 숫자, 텍스트, 논리 정보로 구분됩니다. 텍스트 정보는 문자의 선형 순서로 이해됩니다. 컴퓨터 메모리에 문자를 표시하기 위해 다음 구성표가 사용됩니다. 유효한 텍스트 문자 세트가 기록되고(보통 2 8 = 256자) 각 문자에는 문자 역할을 하는 숫자(0~255)가 할당됩니다. 암호. 그 후, 일련의 문자는 컴퓨터 메모리에 이진 정수(부호 없음)로 기록되는 일련의 코드로 대체됩니다. 한 문자의 코드는 1바이트 메모리에 맞습니다(이것이 최적의 문자 수가 예를 들어 2 9가 아니라 2 8이라는 것이 밝혀졌기 때문에 메모리가 역사적으로 8비트 그룹으로 나누어진 이유입니다).

유효한 문자 세트와 해당 코드가 문자 인코딩 테이블을 구성합니다. 당연히 이 테이블은 프로그래머나 컴퓨터 제조업체의 임의성에 의존해서는 안 됩니다. 이 경우 정보 교환이 매우 어려울 것이기 때문입니다. 현재 표준이 있습니다. A.S.C./ 에프 (미국 사람 기준 암호 ~을 위한 정보 제공 교환), 128개의 기본 문자(코드 0~127)와 128개의 확장 문자(코드 128~255)를 포함합니다. 이 표준에는 자국어 문자가 포함되어 있지 않으므로 각 국가에서 128개의 확장 문자 코드(128~255)가 자국어 문자로 대체됩니다. 즉, 영어와 다른 알파벳을 사용하는 모든 언어에는 고유한 표준이 있습니다. 한 언어의 의미 있는 텍스트는 다른 언어에서는 의미가 없습니다. 따라서 올바른 작동텍스트에서는 정보 자체도 중요할 뿐만 아니라 정보의 해석도 중요합니다. 특정 알파벳의 인코딩 테이블에 따라 문자 코드를 올바르게 해석하는 프로그램을 호출합니다. 텍스트 드라이버

논리값은 다음 두 가지 값만 사용할 수 있는 값입니다. 진실 그리고거짓 ('참'과 '거짓'). 논리 변수의 값을 저장하려면 1비트이면 충분합니다. 일반적으로 메모리 비트의 "1" 값은 true와 연관되고 "0" 값은 false와 연관됩니다.

비디오 이미지나 사운드와 같은 보다 복잡한 개체를 컴퓨터 메모리에 저장하기 위해 이러한 개체에 대한 설명이 숫자 형식으로 변환됩니다. 이러한 유형의 정보를 인코딩하는 방법에는 여러 가지가 있지만 결국 이미지나 사운드는 0과 1의 시퀀스로 표현되며, 이는 컴퓨터 메모리의 비트에 배치되고 필요한 경우 거기에서 검색되어 해석됩니다. 특정한 방식으로.

데이터의 논리적, 물리적 표현

DBMS로 작업할 때 사용자는 데이터의 논리적 표현을 다루며 컴퓨터 메모리의 데이터 표현이 물리적으로 어떻게 구성되어 있는지조차 알지 못할 수도 있습니다. 그러나 데이터베이스를 사용하는 애플리케이션의 효율성은 데이터의 물리적 배치 방법에 따라 크게 달라집니다.

데이터의 물리적 구성은 사용되는 컴퓨터 유형과 특정 DBMS에 따라 다릅니다. DBMS마다 데이터를 메모리에 저장하는 방법과 이에 액세스하는 방법이 다릅니다. 따라서 설계단계에서 DBMS를 선택할 때에는 특징을 알고 이해하는 것이 중요하다. 물리적 방법데이터 저장. 주요 선택 기준은 데이터 액세스의 효율성입니다.

논리적 데이터 모델의 기본 개념을 정리하면 부울 필드, 논리적 항목그리고 논리 파일, 물리적 모델의 경우 유사한 기본 개념이 있습니다. 물리적 장, 물리적 기록, 실제 파일.

참고 1

일부 액세스 방법은 하나의 논리 필드를 하나의 물리적 필드에 직접 매핑하고, 하나의 논리 레코드를 하나의 물리적 레코드에, 하나의 논리 파일을 하나의 물리적 파일에 직접 매핑할 수 있습니다. 하지만 일반적인 경우그런 일대일 대응은 없습니다.

프로세서 및 메모리 작동 방식

컴퓨터에는 두 가지 유형의 메모리가 있습니다. 운영상의그리고 외부. 이 경우 프로세서는 직접 액세스만 합니다. 숫양. 데이터베이스는 많은 양의 정보를 영구적으로 저장하도록 설계되었으므로 외부 메모리. 따라서 데이터 액세스 구성에서는 두 가지 유형의 메모리 특성과 상호 작용을 모두 고려해야 합니다.

RAM의 기본 속성:

  • 주소를 지정할 수 있는 최소 정보 단위는 1바이트입니다.
  • 각 바이트에는 고유한 주소가 있습니다. 즉, 메모리에 직접 주소를 지정할 수 있습니다.
  • 데이터를 선택하기 위해 프로세서는 원하는 데이터가 포함된 바이트 시퀀스에 직접 액세스합니다.

외부 메모리의 기본 속성:

  • 주소를 지정할 수 있는 최소 정보 단위는 물리적 레코드입니다.
  • 프로세서에서 처리하려면 물리적 레코드를 RAM으로 읽어야 합니다.
  • 전체 데이터베이스를 RAM에 배치하는 것은 불가능하기 때문에 읽기는 작은 블록에서만 수행될 수 있습니다.

기억 유형의 상호 작용

특정 논리 레코드의 논리 필드 시퀀스는 RAM에서 직접 주소를 지정할 수 있는 바이트 시퀀스에 매핑됩니다. 직접 주소 지정을 통해 프로세서는 원하는 필드에 액세스할 수 있습니다. 이러한 표현을 위해서는 모든 레코드의 길이가 고정되어 있어야 하며, 그러면 레코드의 길이는 해당 필드 길이의 합과 같아야 합니다. 필드 길이가 고정되어 있지 않으면 직접 주소 지정을 사용할 수 없습니다.

레코드마다 길이가 다를 수 있는 큰 텍스트를 저장해야 하는 상황에서 문제가 발생할 수 있습니다. 이 경우 텍스트는 외부 메모리에 위치하며 필드에는 이 메모리 영역에 대한 링크가 저장됩니다. 이것이 바로 일부 DBMS에서 MEMO 유형 필드가 구성되는 방식입니다.

RAM은 외부 메모리에 액세스할 때마다 하나의 물리적 레코드를 읽거나 씁니다. 외부 메모리에 액세스할 때마다 일정 시간이 걸리며 이는 전체 시스템 속도에 큰 영향을 미칩니다. 따라서 외부 메모리에 대한 접근 횟수를 최소화하기 위해 일부 DBMS에서는 여러 개의 논리적 레코드를 포함시켜 물리적 레코드를 늘리는 경우도 있다.

액세스 횟수를 최소화하는 또 다른 방법은 논리적 레코드의 길이와 무관한 고정 길이의 물리적 레코드를 사용하는 것입니다. 이러한 물리적 기록을 페이지. 정수가 아닌 수의 논리적 레코드가 페이지에 맞는 것으로 밝혀지면 마지막 불완전한 레코드가 삭제되고 페이지는 불완전하게 채워진 상태로 유지됩니다. 이것이 바로 MS SQL SERVER에서 사용되는 방법입니다.

© 2024 ermake.ru - PC 수리 정보 - 정보 포털