Кодирование текстовой (символьной) информации

Разделы: Информатика


План-конспект урока

Предмет: Информатика.

Класс: 10

Тема урока: “Кодирование текстовой (символьной) информации”.

Тип урока: Обучающий.

Цели урока:

  • Познакомить учащихся со способами кодирования информации в компьютере;
  • Рассмотреть примеры решения задач;
  • Способствовать развитию познавательных интересов учащихся.
  • Воспитывать выдержку и терпение в работе, чувства товарищества и взаимопонимания.

Задачи урока:

  • Формировать знания учащихся по теме “Кодирование текстовой (символьной) информации”;
  • Содействовать формированию у школьников образного мышления;
  • Развить навыки анализа и самоанализа;
  • Формировать умения планировать свою деятельность.

Оборудование:

  • рабочие места учеников (персональный компьютер),
  • рабочее место учителя,
  • интерактивная доска,
  • практикум по информатике и информационным технологиям (авторы: Н. Угринович, Л. Босова, И. Михайлова),
  • мультимедийный проектор,
  • мультимедийная презентация,
  • электронные карточки zadachi.htm, kart_1(2,3).exe.

Ход урока

Презентация

I. Организационный момент.

На интерактивной доске первый слайд мультимедийной презентации с темой урока.

Учитель: Здравствуйте, ребята. Садитесь. Дежурный, доложите об отсутствующих. (Доклад дежурного). Спасибо.

II. Работа над темой урока.

1. Объяснение нового материала.

Объяснение нового материала проходит в форме эвристической беседы с одновременным показом мультимедийной презентации на интерактивной доске (Приложение 1).

Учитель: Кодирование какой информации мы изучали на предыдущих занятиях?

Ответ: Кодирование числовой информации и представление чисел в компьютере.

Учитель: Перейдём к изучению нового материала. Запишите тему урока “Кодирование текстовой информации” (слайд 1). Рассматриваемые вопросы (слайд 2):

- исторический экскурс;

- двоичное кодирование текстовой информации;

- расчет количества текстовой информации.

Исторический экскурс

Человечество использует шифрование (кодировку) текста с того самого момента, когда появилась первая секретная информация. Перед вами несколько приёмов кодирования текста, которые были изобретены на различных этапах развития человеческой мысли (слайд 3) [4]:

- криптография – это тайнопись, система изменения письма с целью сделать текст непонятным для непосвященных лиц;

- азбука Морзе или неравномерный телеграфный код, в котором каждая буква или знак представлены своей комбинацией коротких элементарных посылок электрического тока (точек) и элементарных посылок утроенной продолжительности (тире);

- сурдожесты – язык жестов, используемый людьми с нарушениями слуха.

Вопрос: Какие примеры кодирования текстовой информации можно привести еще?

Учащиеся приводят примеры.

Учитель: (Показ слайда 4). Один из самых первых известных методов шифрования носит имя римского императора Юлия Цезаря (I век до н.э.) [4]. Этот метод основан на замене каждой буквы шифруемого текста, на другую, путем смещения в алфавите от исходной буквы на фиксированное количество символов, причем алфавит читается по кругу, то есть после буквы я рассматривается а. Так слово байт при смещении на два символа вправо кодируется словом гвлф. Обратный процесс расшифровки данного слова – необходимо заменять каждую зашифрованную букву, на вторую слева от неё.

(Показ слайда 5) Расшифруйте фразу персидского поэта Джалаледдина Руми “кгнусм ёогкг фесл тцфхя фзужщз фхгрзх ёогксп”, закодированную с помощью шифра Цезаря. Известно, что каждая буква исходного текста заменяется третьей после нее буквой. В качестве опоры используйте буквы русского алфавита, расположенные на слайде.

Вопрос: Что у вас получилось?

Ответ учащихся:

Закрой глаза свои пусть сердце станет глазом

Ответ сравнивается с появившемся на слайде 5 правильным ответом.

Двоичное кодирование текстовой информации

Вопрос: В каком из перечисленных приёмов кодирования используется двоичный принцип кодирования информации?

Ответ учащихся: В азбуке Морзе.

Учитель: В компьютере также используют принцип двоичного кодирования информации. Только вместо точки и тире используют 0 и 1 (слайд 6) [1].

Традиционно для кодирования одного символа используется 1 байт информации.

Вопрос: Какое количество различных символов можно закодировать?

Ответ учащихся: N = 2I = 28 = 256.

Учитель: Верно. Достаточно ли этого для представления текстовой информации, включая прописные и строчные буквы русского и латинского алфавита, цифры и другие символы?

Дети подсчитывают количество различных символов:

- 33 строчные буквы русского алфавита + 33 прописные буквы = 66;

- для английского алфавита 26 + 26 = 52;

- цифры от 0 до 9 и т.д.

Учитель: Ваш вывод?

Вывод учащихся: Получается, что нужно 127 символов. Остается еще 129 значений, которые можно использовать для обозначения знаков препинания, арифметических знаков, служебных операций (перевод строки, пробел и т.д.. Следовательно, одного байта вполне хватает, чтобы закодировать необходимые символы для кодирования текстовой информации.

Учитель: В компьютере каждый символ кодируется уникальным кодом.

Принято интернациональное соглашение о присвоении каждому символу своего уникального кода. В качестве международного стандарта принята кодовая таблица ASCII (American Standard Code for Information Interchange) (слайд 7).

В этой таблице представлены коды от 0 до 127 (буквы английского алфавита, знаки математических операций, служебные символы и т.д.), причем коды от 0 до 32 отведены не символам, а функциональным клавишам. Запишите название этой кодовой таблицы и диапазон кодируемых символов.

Коды с 128 по 255 выделены для национальных стандартов каждой страны. Этого достаточно для большинства развитых стран.

Для России были введены несколько различных стандартов кодовой таблицы (коды с 128 по 255).

Вот некоторые из них (слайд 8-9). Рассмотрим и запишем их названия:

КОИ8-Р, СР1251, СР866, Мас, ISO.

Откройте практикум по информатике на стр. 65-66 и прочитайте про эти кодировочные таблицы.

Учитель задает вопросы по прочитанному материалу. Формулировки вопросов можно варьировать по усмотрению преподавателя.

Например:

- какой стандарт был применён первым для кодировки русскоязычных букв?

- какой стандарт кодировки наиболее распространен в настоящее время?

- что означает сочетание букв “СР” в кодировках СР1251, СР866?

Ученики отвечают на поставленные вопросы.

Учитель: В текстовом редакторе MS Word чтобы вывести на экране символ по его номеру кода, необходимо удерживая на клавиатуре клавишу “ALT” набрать код символа на дополнительной цифровой клавиатуре.

Запустите текстовый редактор MS Word. Удерживая клавишу “ALT”, наберите коды на дополнительной цифровой клавиатуре (слайд 10):

133 232 242

Какое слово получили?

Ответ: бит.

Учитель: Закройте файл без сохранения.

Понятие кодировки Unicode

(слайд 11) В мире существует примерно 6800 различных языков. Если прочитать текст, напечатанный в Японии на компьютере в России или США, то понять его будет нельзя. Чтобы буквы любой страны можно было читать на любом компьютере, для их кодировки стали использовать два байта (16 бит).

Вопрос: Сколько символов можно закодировать двумя байтами? (Для слабоуспевающих учащихся можно предложить им воспользоваться инженерным калькулятором).

Ответ учащихся: 65536

Такая кодировка называется Unicode и обозначается как UCS-2. Этот код включает в себя все существующие алфавиты мира, а также множество математических, музыкальных, химических символов и многое другое. Существует кодировка и UCS-4, где для кодирования используют 4 байта, то есть можно кодировать более 4 млрд. символов.

Расчет количества текстовой информации

Так как каждый символ кодируется 1 байтом, то информационный объем текста можно узнать, умножив количество символов в тексте на 1 байт.

Проверим это на практике. Включите монитор, создайте текстовый документ в редакторе Блокнот и напечатайте в нём пословицу (слайд 12): “Ученье – атаман, а неученье – комар”. [3]. Сколько в ней символов?

Ответ: 36

Учитель: Сохраните и закройте файл. Определите его объем в байтах. Каков он?

Ответ: 36 байт.

Учитель: Ваш вывод?

Ученики обсуждают и делают выводы.

2. Разбор и решение задач

Переход с режима просмотра презентации на интерактивный режим доски.

Учитель (работа у доски): Рассмотрим пример кодировки текста в различных кодировочных таблицах. Откройте стр. 66 практикума по информатике и информационным технологиям. В качестве справочного материала будем использовать представленные на рис. 2.4 и 2.5 таблицы кодировок КОИ8-Р и CP1251. (На интерактивной доске размещаются при помощи галереи рисунков и фото изображения этих же таблиц кодировок). Закодируем слово “Рим” <Рисунок 1>:

СР1251: 208  232 236

КОИ8-Р:242 201 205

Переведем с помощью инженерного калькулятора последовательности кодов из десятичной системы счисления в шестнадцатеричную. Получим:

СР1251: D0 E8 EC

КОИ8-Р: F2 C9 CD

(Переход на режим просмотра презентации).

Работа в парах. (Класс делится на пары).

Учитель: Закодируем при помощи этих же таблиц кодировки слова, предложенные вам на карточках.

Прочитайте внимательно задание на слайде (слайд 13).

Задание: Все понятия употребляются в информатике или связаны с ней. Определите эти понятия и закодируйте их при помощи таблиц КОИ8-Р или CP1251. Переведите с помощью инженерного калькулятора последовательности кодов из десятичной системы счисления в шестнадцатеричную. Занесите полученный шестнадцатеричный код без пробелов в соответствующее Поле ввода. Нажмите кнопку Проверить и убедитесь в правильности решения. Понятия записывать заглавными буквами, кроме географических названий.

Карточка 1 Карточка 2 Карточка 3
Каким понятиям соответствуют приведенные ниже комментарии.

1. И в дневнике ученика, и в таблице базы банных.

2. И медицинская, и в компьютерной программе.

Перечисленные географические названия используются в понятиях, употребляемых в информатике, или связаны с ними.

1. Государство, столица которого Каир

2. Город в Узбекистане, с названием которого связано понятие “алгоритм”

Термины, соответствующие определениям, употребляются также в контексте устройства и работы автомобиля.

1. Часть двигателя внутреннего сгорания

2. Устройство в автомобиле для очистки топлива

Ответы

запись

процедура

Египет (египетский треугольник)

Хорезм (алгоритм от фамилии среднеазиатского математика аль-Хорезми)

цилиндр (совокупность дорожек с одинаковым номером на магнитных дисках)

фильтр (условие, по которому производится отбор записей в базе банных)

Коды
запись

СР1251: 231 224 239 232 241 252

E7 E0 EF E8 F1 FC

Египет

СР1251:

197 227 232 239 229 242

C5 E3 E8 EF E5 F2

цилиндр

СР1251:

246 232 235 232 237 228 240

F6 E8 EB E8 ED E4 F0

процедура

КОИ8-Р:

208 210 207 195 197 196 213 210 193

D0 D2 СF C3 C5 C4 D5 D2 C1

Хорезм

КОИ8-Р:

232 207 210 197 218 205

E8 CF D2 C5 DA CD

фильтр

КОИ8-Р:

198 201 204 216 212 210

C6 C9 CC D8 D4 D2

Учащиеся открывают карточки согласно номеру, названному учителем для каждой пары учащихся. (Приложение 2, Приложение 3, Приложение 4)

(При подготовке электронных карточек следует учесть уровень сложности для различных групп учащихся).

Учитель: Назовите задуманные термины или понятия. Кто получил правильный код? У кого не получилось? В чем ваша ошибка, как вы считаете?

Учащиеся отвечают на вопросы в форме обсуждения.

(Переход на интерактивный режим работы доски).

Учитель: Теперь переходим к решению задач на количество текстовой информации и величин, связанных с определением количества текстовой информации.

Запишите условие задачи № 1. (На интерактивной доске – условие задачи № 1.) [5] Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения:

“Мой дядя самых честных правил, Когда не в шутку занемог, Он уважать себя заставил И лучше выдумать не мог.” <Рисунок 2>

Решение: В данной фразе 108 символов, учитывая знаки препинания, кавычки и пробелы. Умножаем это количество на 8 бит. Получаем 108*8=864 бита. Есть ли вопросы по решению?

Учащиеся задают вопросы, если они возникают.

Учитель отвечает на вопросы или один ученик отвечает на вопрос другого.

Учитель: Рассмотрим задачу № 2. (Условие выводится на интерактивной доске).<Рисунок 3> Запишите её условие: Лазерный принтер Canon LBP печатает со скоростью в среднем 6,3 Кбит в секунду. Сколько времени понадобится для распечатки 8-ми страничного документа, если известно, что на одной странице в среднем по 45 строк, в строке 70 символов (1 символ – 1 байт) (см. рис. 2).

Решение:

1) Находим количество информации, содержащейся на 1 странице:

45 * 70 * 8 бит = 25200 бит

2) Находим количество информации на 8 страницах:

25200 * 8 = 201600 бит

3) Приводим к единым единицам измерения. Для этого Мбиты переводим в биты:

6,3*1024=6451,2 бит/сек.

4) Находим время печати: 201600: 6451,2 ? 31 секунда.

Ваши вопросы.

Учащиеся задают вопросы, если они возникают.

Учитель отвечает на вопросы или один учащийся отвечает на вопрос другого.

Учитель: Теперь решим задачи на электронных карточках. Откройте файл zadachi.htm. (Приложение 5) (Учитель называет номер карточки, для каждого учащегося. Один ученик решает задачи у доски). Решите задачи и запишите ответ в соответствующее поле ввода.

В ходе выполнения задания учитель проверяет ответы учащихся.

III. Обобщение

Вопросы учителя (слайд 14):

1. Какой принцип кодирования текстовой информации используется в компьютере?

2. Как называется международная таблица кодировки символов?

3. Перечислите названия таблиц кодировок для русскоязычных символов.

4. В какой системе счисления представлены коды в перечисленных вами таблицах кодировок?

IV. Домашнее задание

(Слайд 15) По учебнику Угриновича § 2.10, практикум по информатике и информационным технологиям § 2.7, задания для самостоятельного выполнения 2.58-2.63 (для учащихся со слабой мотивацией к обучению) (2.58-2.66 для остальных учащихся).

Учитель подводит итог урока, выставляет оценки.

До свидания, спасибо за урок.

Список используемой литературы:

  1. Информатика и информационные технологии. Учебник для 10-11 классов/Н.Д. Угринович. – М. БИНОМ. Лаборатория знаний, 2005. – 512 с.: ил.
  2. Практикум по информатике и информационным технологиям. Учебное пособие для общеобразовательных учреждений/Н.Д. Угринович, Л.Л. Босова, Н.И. Михайлова. – 3-е изд. – М. БИНОМ. Лаборатория знаний, 2005. – 394 с.: ил.
  3. Словарь русских пословиц и поговорок. – М.: Терра, 1997 – 350 с.
  4. Простейшие методы шифрования текста/ Д.М. Златопольский. – М.: Чистые пруды, 2007 – 32 с.
  5. Тексты демонстрационных тестов по информатике в форме и по материалам ЕГЭ 2004-2007 г.г.