Главная / Информатика / Презентация по архитектуре компьютерных систем на тему «Кодирование символьной информации»

Презентация по архитектуре компьютерных систем на тему «Кодирование символьной информации»

Презентация по архитектуре компьютерных систем на тему: «Кодирование символьн...
Для обработки текстовой информации на компьютере необходимо представить ее в ...
ASCII — базовая кодировка текста для латиницы Первоначально для персональных...
КОИ-8 Хронологически одним из первых стандартов кодирования русских букв на к...
2. CP 866 Для работы в среде операционной системы MS-DOS используется «альтер...
3. Windows-1251 Windows-1251 (CP 1251 («CP» означает «Code Page»). Все Window...
4. MacCyrillic (MAC) Кодировка MacCyrillic используется только на компьютерах...
5. ISO 8859-5 Международная организация по стандартизации (International Stan...
6. UNICODE Юникод (Unicode) — стандарт кодирования символов, позволяющий пред...
РАЗЛИЧНЫЕ ФОРМАТЫ ТЕКСТОВЫХ ФАЙЛОВ Формат файла или тип файла определяет спос...
ОСНОВНЫЕ ФОРМАТЫ ТЕКСТОВЫХ ФАЙЛОВ TXT (Text Only). Текст без форматирования (...
Спасибо за внимание!
1 из 12

Описание презентации по отдельным слайдам:

№ слайда 1 Презентация по архитектуре компьютерных систем на тему: «Кодирование символьной
Описание слайда:

Презентация по архитектуре компьютерных систем на тему: «Кодирование символьной информации» Разработал преподаватель информатики Южно-Уральского многопрофильного колледжа, Кранцевич Д.В.

№ слайда 2 Для обработки текстовой информации на компьютере необходимо представить ее в дво
Описание слайда:

Для обработки текстовой информации на компьютере необходимо представить ее в двоичной знаковой системе. Для кодирования каждого знака требуется количество информации, равное 8 битам, т. е. длина двоичного кода знака составляет восемь двоичных знаков. Каждому знаку необходимо поставить в соответствие уникальный двоичный код из интервала от 00000000 до 11111111 (в десятичном коде от 0 до 255 Человек различает знаки по их начертанию, а компьютер - по их двоичным кодам. При вводе в компьютер текстовой информации происходит ее двоичное кодирование, изображение знака преобразуется в его двоичный код. Пользователь нажимает на клавиатуре клавишу со знаком, и в компьютер поступает определенная последовательность из восьми электрических импульсов (двоичный код знака). Код знака хранится в оперативной памяти компьютера, где занимает одну ячейку. В процессе вывода знака на экран компьютера производится обратное перекодирование, т. е. преобразование двоичного кода знака в его изображение. Различные кодировки знаков. Присваивание знаку конкретного двоичного кода - это вопрос соглашения, которое фиксируется в кодовой таблице. В существующих кодовых таблицах первые 33 кода (десятичные коды с 0 по 32) соответствуют не знакам, а операциям (перевод строки, ввод пробела и т. д.).

№ слайда 3 ASCII — базовая кодировка текста для латиницы Первоначально для персональных ко
Описание слайда:

ASCII — базовая кодировка текста для латиницы Первоначально для персональных компьютеров был взят за основу так называемый ASCII-код разработанный и стандартизированный в США в 1963 г. (American Standard Code for Information Interchange). Этот код содержит 7 бит информации и в нем можно представить 128 различных комбинаций для кодирования символов. Этого вполне достаточно для того, чтобы закодировать заглавные и строчные буквы латинского алфавита, цифры, знаки препинания и ряд специальных и управляющих символов. Информация в Internet до сих пор передается в 7 битном коде. Затем к 7-ми битному добавили еще один – восьмой бит, что позволило закодировать еще 128 символов (всего 256), которые предназначались для символов псевдографики и национальных шрифтов, которые опять-таки могут иметь в своей основе латиницу, кириллицу (напр. Болгарский, Русский) или другое (напр. Греческое) начертание символов – расширенный ASCII-код. Присвоение символу конкретного двоичного кода – это вопрос соглашения, которое фиксируется в кодовой таблице. Первые 32 кода (с 0 до 31) Символы с номерами от 0 до 31 принято называть управляющими. Их функция – управление процессом вывода текста на экран или печать, подача звукового сигнала, разметка текста и т.п. Коды от 32 до 127. Стандартная часть таблицы (английский). Сюда входят строчные и прописные буквы латинского алфавита, десятичные цифры, знаки препинания, всевозможные скобки, коммерческие и другие символы. Символ 32 - пробел, т.е. пустая позиция в тексте. Все остальные отражаются определенными знаками. Коды с 128 по 255 являются национальными, т.е. в национальных кодировках одному и тому же коду соответствуют различные символы. Кодовая страница в первую очередь используется для размещения национальных алфавитов, отличных от латинского. В русских национальных кодировках в этой части таблицы размещаются символы русского алфавита. К сожалению, в настоящее время существует более 6 различных кодовых таблиц для русских букв, поэтому тексты созданные в одной кодировке, не будут правильно отображаться в другой.

№ слайда 4 КОИ-8 Хронологически одним из первых стандартов кодирования русских букв на комп
Описание слайда:

КОИ-8 Хронологически одним из первых стандартов кодирования русских букв на компьютерах был код КОИ – 8 («Код обмена информационный – 8 битный»). KOI-8 — это восьмибитная кодовая страница, совместимая с ASCII. Разработана для кодирования букв кириллических алфавитов. Была широко распространена как основная русская кодировка в Unix-совместимых ОС и в электронной почте, однако к концу 2010 г. с распространением Юникода, постепенно вышла из употребления.

№ слайда 5 2. CP 866 Для работы в среде операционной системы MS-DOS используется «альтернат
Описание слайда:

2. CP 866 Для работы в среде операционной системы MS-DOS используется «альтернативная» кодировка, в терминологии фирмы Microsoft – кодировка CP 866. (Code Page 866) Является расширением кодировки ASCII

№ слайда 6 3. Windows-1251 Windows-1251 (CP 1251 («CP» означает «Code Page»). Все Windows –
Описание слайда:

3. Windows-1251 Windows-1251 (CP 1251 («CP» означает «Code Page»). Все Windows – приложения, работающие с русским языком, поддерживают эту кодировку. Представляет собой набор символов и кодов, является стандартной 8-битной кодировкой для русских версий Microsoft Windows до 10-й версии. В прошлом пользовалась довольно большой популярностью. Была создана на базе кодировок, использовавшихся в ранних «самопальных» русификаторах Windows в 1990—1991 гг. совместно представителями «Параграфа», «Диалога» и российского отделения Microsoft. Первоначальный вариант кодировки сильно отличался от представленного ниже в таблице (в частности, там было значительное число «белых пятен»). В современных приложениях отдается предпочтение Юникоду (UTF-8). На 7 июля 2016 лишь на 1.8% всех веб-страниц используется Windows-1251.

№ слайда 7 4. MacCyrillic (MAC) Кодировка MacCyrillic используется только на компьютерах "М
Описание слайда:

4. MacCyrillic (MAC) Кодировка MacCyrillic используется только на компьютерах "Макинтош". Благодаря отсутствию псевдографики и "верхних" управляющих символов эта кодировка включает довольно много полезных символов; кроме того, присутствуют все дополнительные буквы, необходимые для записи украинского, белорусского, македонского и сербского языков. Возможно, просмотр некоторых символов у Вас будут отображаться не правильно. Зависит это от используемого шрифта, лучше установить шрифт Arial Unicode MS.

№ слайда 8 5. ISO 8859-5 Международная организация по стандартизации (International Standar
Описание слайда:

5. ISO 8859-5 Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку под названием ISO 8859 – 5. ISO 8859-5 — 8-битная кодовая страница из семейства кодовых страниц стандарта ISO-8859 для представления кириллицы. Имеются буквы многих языков, использующих кириллицу, однако в целом ISO 8859-5 — не очень удобная кодировка, поскольку в ней отсутствуют многие нужные символы, такие как тире (—), кавычки-ёлочки («»), градус (°) и др. Порядок символов этой кодовой страницы использовался при размещении букв кириллицы в наборе символов Unicode (со сдвигом вверх на 864 позиции). Применение ISO 8859-5 широко применяется в Сербии и иногда в Болгарии на юниксоподобных системах.

№ слайда 9 6. UNICODE Юникод (Unicode) — стандарт кодирования символов, позволяющий предста
Описание слайда:

6. UNICODE Юникод (Unicode) — стандарт кодирования символов, позволяющий представить знаки почти всех письменных языков. Стандарт предложен в 1991 году некоммерческой организацией «Консорциум Юникода» (Unicode Consortium, Unicode Inc.). Стандарт отводит на каждый символ не один байт, а два, и поэтому с его помощью можно закодировать не 256 символов, 216=65 536 различных символов. Эту кодировку поддерживает платформа Microsoft Windows и Microsoft Office. (Например вставка символов) Применение этого стандарта позволяет закодировать очень большое число символов из разных письменностей: в документах Unicode могут соседствовать китайские иероглифы, математические символы, буквы греческого алфавита, латиницы и кириллицы, при этом становится ненужным переключение кодовых страниц. Стандарт состоит из двух основных разделов: 1. универсальный набор символов (UCS, universal character set) 2. семейство кодировок (UTF, Unicode transformation format). Универсальный набор символов задаёт однозначное соответствие символов кодам — элементам кодового пространства, представляющим неотрицательные целые числа. Семейство кодировок определяет машинное представление последовательности кодов UCS.

№ слайда 10 РАЗЛИЧНЫЕ ФОРМАТЫ ТЕКСТОВЫХ ФАЙЛОВ Формат файла или тип файла определяет способ
Описание слайда:

РАЗЛИЧНЫЕ ФОРМАТЫ ТЕКСТОВЫХ ФАЙЛОВ Формат файла или тип файла определяет способ кодирования информации в файле (перевода в двоичный код). В текстовом файле помимо кодировки символов кодируются операции, обеспечивающие форматирование текста. В различных текстовых редакторах символы форматирования кодируются по разному, документы различных текстовых редакторов имеют разный формат (тип).

№ слайда 11 ОСНОВНЫЕ ФОРМАТЫ ТЕКСТОВЫХ ФАЙЛОВ TXT (Text Only). Текст без форматирования (тол
Описание слайда:

ОСНОВНЫЕ ФОРМАТЫ ТЕКСТОВЫХ ФАЙЛОВ TXT (Text Only). Текст без форматирования (только символ конца абзаца). Формат редактора Блокнот. DOC (Document) Формат редактора Word Office 2003. Использует кодировку UNICODE. RTF (Rich Text Format). Универсальный формат, сохраняющий все форматирование. HTM, HTML (Hyper Text Markup Language). Формат разметки Web-страниц. Содержит управляющие коды (тэги) языка разметки гипертекста. DOCX Формат редактора Microsoft Office 2007 и следующих версиях.

№ слайда 12 Спасибо за внимание!
Описание слайда:

Спасибо за внимание!

Презентация по архитектуре компьютерных систем на тему «Кодирование символьной информации»
  • Информатика
Описание:

Данная презентация содержит описание основных принципов кодирования текстовой информации в компьютере, а также особенности таких текстовых кодировок как КОИ-8, CP866, Windows-1251, Maccyrrilic (MAC), ISO 8859-5, а также самой прогрессивной 16-битной кодировки Unicode. Также в данной презентации рассмотрены наиболее распространённые форматы различных текстовых документов, таких как TXT, DOC, RTF, HTML, HTM, DOCX. Представленная презентация будет полезна при изучении студентами таких дисциплин как "Информатика", "Информатика и ИКТ", "Архитектура компьютерных систем" и др.

Автор Кранцевич Дмитрий Владимирович
Дата добавления 13.11.2016
Раздел Информатика
Подраздел Презентации
Просмотров 46
Номер материала MA-068513
Скачать свидетельство о публикации

Оставьте свой комментарий:

Введите символы, которые изображены на картинке:

Получить новый код
* Обязательные для заполнения.


Комментарии:

↓ Показать еще коментарии ↓