Рабочие листы
к вашим урокам
Скачать
1 слайд
Презентация по архитектуре компьютерных систем на тему: «Кодирование символьной информации»
Разработал преподаватель информатики Южно-Уральского многопрофильного колледжа, Кранцевич Д.В.
2 слайд
Для обработки текстовой информации на компьютере необходимо представить ее в двоичной знаковой системе.
Для кодирования каждого знака требуется количество информации, равное 8 битам, т. е. длина двоичного кода знака составляет восемь двоичных знаков.
Каждому знаку необходимо поставить в соответствие уникальный двоичный код из интервала от 00000000 до 11111111 (в десятичном коде от 0 до 255
Человек различает знаки по их начертанию, а компьютер - по их двоичным кодам. При вводе в компьютер текстовой информации происходит ее двоичное кодирование, изображение знака преобразуется в его двоичный код.
Пользователь нажимает на клавиатуре клавишу со знаком, и в компьютер поступает определенная последовательность из восьми электрических импульсов (двоичный код знака).
Код знака хранится в оперативной памяти компьютера, где занимает одну ячейку.
В процессе вывода знака на экран компьютера производится обратное перекодирование, т. е. преобразование двоичного кода знака в его изображение.
Различные кодировки знаков. Присваивание знаку конкретного двоичного кода - это вопрос соглашения, которое фиксируется в кодовой таблице. В существующих кодовых таблицах первые 33 кода (десятичные коды с 0 по 32) соответствуют не знакам, а операциям (перевод строки, ввод пробела и т. д.).
3 слайд
ASCII — базовая кодировка текста для латиницы
Первоначально для персональных компьютеров был взят за основу так называемый ASCII-код разработанный и стандартизированный в США в 1963 г. (American Standard Code for Information Interchange).
Этот код содержит 7 бит информации и в нем можно представить 128 различных комбинаций для кодирования символов. Этого вполне достаточно для того, чтобы закодировать заглавные и строчные буквы латинского алфавита, цифры, знаки препинания и ряд специальных и управляющих символов.
Информация в Internet до сих пор передается в 7 битном коде. Затем к 7-ми битному добавили еще один – восьмой бит, что позволило закодировать еще 128 символов (всего 256), которые предназначались для символов псевдографики и национальных шрифтов, которые опять-таки могут иметь в своей основе латиницу, кириллицу (напр. Болгарский, Русский) или другое (напр. Греческое) начертание символов – расширенный ASCII-код.
Присвоение символу конкретного двоичного кода – это вопрос соглашения, которое фиксируется в кодовой таблице.
Первые 32 кода (с 0 до 31) Символы с номерами от 0 до 31 принято называть управляющими. Их функция – управление процессом вывода текста на экран или печать, подача звукового сигнала, разметка текста и т.п.
Коды от 32 до 127. Стандартная часть таблицы (английский). Сюда входят строчные и прописные буквы латинского алфавита, десятичные цифры, знаки препинания, всевозможные скобки, коммерческие и другие символы. Символ 32 - пробел, т.е. пустая позиция в тексте. Все остальные отражаются определенными знаками.
Коды с 128 по 255 являются национальными, т.е. в национальных кодировках одному и тому же коду соответствуют различные символы. Кодовая страница в первую очередь используется для размещения национальных алфавитов, отличных от латинского. В русских национальных кодировках в этой части таблицы размещаются символы русского алфавита.
К сожалению, в настоящее время существует более 6 различных кодовых таблиц для русских букв, поэтому тексты созданные в одной кодировке, не будут правильно отображаться в другой.
4 слайд
КОИ-8
Хронологически одним из первых стандартов кодирования русских букв на компьютерах был код КОИ – 8 («Код обмена информационный – 8 битный»).
KOI-8 — это восьмибитная кодовая страница, совместимая с ASCII. Разработана для кодирования букв кириллических алфавитов.
Была широко распространена как основная русская кодировка в Unix-совместимых ОС и в электронной почте, однако к концу 2010 г. с распространением Юникода, постепенно вышла из употребления.
5 слайд
2. CP 866
Для работы в среде операционной системы MS-DOS используется «альтернативная» кодировка, в терминологии фирмы Microsoft – кодировка CP 866. (Code Page 866)
Является расширением кодировки ASCII
6 слайд
3. Windows-1251
Windows-1251 (CP 1251 («CP» означает «Code Page»). Все Windows – приложения, работающие с русским языком, поддерживают эту кодировку.
Представляет собой набор символов и кодов, является стандартной 8-битной кодировкой для русских версий Microsoft Windows до 10-й версии.
В прошлом пользовалась довольно большой популярностью. Была создана на базе кодировок, использовавшихся в ранних «самопальных» русификаторах Windows в 1990—1991 гг. совместно представителями «Параграфа», «Диалога» и российского отделения Microsoft.
Первоначальный вариант кодировки сильно отличался от представленного ниже в таблице (в частности, там было значительное число «белых пятен»).
В современных приложениях отдается предпочтение Юникоду (UTF-8). На 7 июля 2016 лишь на 1.8% всех веб-страниц используется Windows-1251.
7 слайд
4. MacCyrillic (MAC)
Кодировка MacCyrillic используется только на компьютерах "Макинтош".
Благодаря отсутствию псевдографики и "верхних" управляющих символов эта кодировка включает довольно много полезных символов; кроме того, присутствуют все дополнительные буквы, необходимые для записи украинского, белорусского, македонского и сербского языков.
Возможно, просмотр некоторых символов у Вас будут отображаться не правильно.
Зависит это от используемого шрифта, лучше установить шрифт Arial Unicode MS.
8 слайд
5. ISO 8859-5
Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку под названием ISO 8859 – 5.
ISO 8859-5 — 8-битная кодовая страница из семейства кодовых страниц стандарта ISO-8859 для представления кириллицы.
Имеются буквы многих языков, использующих кириллицу, однако в целом ISO 8859-5 — не очень удобная кодировка, поскольку в ней отсутствуют многие нужные символы, такие как тире (—), кавычки-ёлочки («»), градус (°) и др.
Порядок символов этой кодовой страницы использовался при размещении букв кириллицы в наборе символов Unicode (со сдвигом вверх на 864 позиции).
Применение
ISO 8859-5 широко применяется в Сербии и иногда в Болгарии на юниксоподобных системах.
9 слайд
6. UNICODE
Юникод (Unicode) — стандарт кодирования символов, позволяющий представить знаки почти всех письменных языков.
Стандарт предложен в 1991 году некоммерческой организацией «Консорциум Юникода» (Unicode Consortium, Unicode Inc.).
Стандарт отводит на каждый символ не один байт, а два, и поэтому с его помощью можно закодировать не 256 символов, 216=65 536 различных символов. Эту кодировку поддерживает платформа Microsoft Windows и Microsoft Office. (Например вставка символов)
Применение этого стандарта позволяет закодировать очень большое число символов из разных письменностей: в документах Unicode могут соседствовать китайские иероглифы, математические символы, буквы греческого алфавита, латиницы и кириллицы, при этом становится ненужным переключение кодовых страниц.
Стандарт состоит из двух основных разделов:
1. универсальный набор символов (UCS, universal character set)
2. семейство кодировок (UTF, Unicode transformation format).
Универсальный набор символов задаёт однозначное соответствие символов кодам — элементам кодового пространства, представляющим неотрицательные целые числа.
Семейство кодировок определяет машинное представление последовательности кодов UCS.
10 слайд
РАЗЛИЧНЫЕ ФОРМАТЫ ТЕКСТОВЫХ ФАЙЛОВ
Формат файла или тип файла определяет способ кодирования информации в файле (перевода в двоичный код).
В текстовом файле помимо кодировки символов кодируются операции, обеспечивающие форматирование текста.
В различных текстовых редакторах символы форматирования кодируются по разному, документы различных текстовых редакторов имеют разный формат (тип).
11 слайд
ОСНОВНЫЕ ФОРМАТЫ ТЕКСТОВЫХ ФАЙЛОВ
TXT (Text Only). Текст без форматирования (только символ конца абзаца). Формат редактора Блокнот.
DOC (Document) Формат редактора Word Office 2003. Использует кодировку UNICODE.
RTF (Rich Text Format). Универсальный формат, сохраняющий все форматирование.
HTM, HTML (Hyper Text Markup Language). Формат разметки Web-страниц. Содержит управляющие коды (тэги) языка разметки гипертекста.
DOCX Формат редактора Microsoft Office 2007 и следующих версиях.
12 слайд
Спасибо за внимание!
Рабочие листы
к вашим урокам
Скачать
Данная презентация содержит описание основных принципов кодирования текстовой информации в компьютере, а также особенности таких текстовых кодировок как КОИ-8, CP866, Windows-1251, Maccyrrilic (MAC), ISO 8859-5, а также самой прогрессивной 16-битной кодировки Unicode. Также в данной презентации рассмотрены наиболее распространённые форматы различных текстовых документов, таких как TXT, DOC, RTF, HTML, HTM, DOCX. Представленная презентация будет полезна при изучении студентами таких дисциплин как "Информатика", "Информатика и ИКТ", "Архитектура компьютерных систем" и др.
6 665 052 материала в базе
Настоящий материал опубликован пользователем Чухиль Наталья Григорьевна. Инфоурок является информационным посредником и предоставляет пользователям возможность размещать на сайте методические материалы. Всю ответственность за опубликованные материалы, содержащиеся в них сведения, а также за соблюдение авторских прав несут пользователи, загрузившие материал на сайт
Если Вы считаете, что материал нарушает авторские права либо по каким-то другим причинам должен быть удален с сайта, Вы можете оставить жалобу на материал.
Удалить материалВаша скидка на курсы
40%Курс профессиональной переподготовки
300 ч. — 1200 ч.
Курс профессиональной переподготовки
300/600 ч.
Курс профессиональной переподготовки
500/1000 ч.
Оставьте свой комментарий
Авторизуйтесь, чтобы задавать вопросы.