В информатике текстом считают последовательность любых символов. Сейчас компьютеры в основном пользуются алфавитами, содержащими 256 знаков1. Каждому из символов соответствует свой восьмиразрядный двоичный код. Таким образом любой символ текста, включая пробелы, занимает 8 бит (1 байт) в памяти компьютера. Зная это, можно легко оценить объем памяти, необходимый для хранения того или иного текстового документа.
Вспомним, как связано количество бит в коде с тем, сколько требуется различных кодов.
Один бит (двоичная цифра) может принимать два значения, добавление каждого разряда в код удваивает количество получаемых комбинаций: двухбитовый код -- четыре варианта, трехбитовый -- восемь, четырехбитовый -- шестнадцать и т. д.
Рассмотрим пример. Машинописная страница стандартного формата (А4) содержит около 55 строк. На каждой строке помещается в среднем 60 символов2. Подсчитаем количество текстовой информации на такой странице. Каждый символ -- 1 байт информации, а всего символов -- 60*55=3300. Значит, на странице 3300 байт (около 3 Кбайт). Как связаны двоичные коды и соответствующие им символы? Это определяется таблицей кодировки. Все используемые на персональных компьютерах таблицы3 основаны на американском стандарте ASCII4. Он определяет первые 128 кодов: для латинских букв, цифр, основных знаков препинания и математических операций. Остальные 128 кодов используются для специальных символов и букв национальных алфавитов (в том числе, русского). И, поскольку общепринятого стандарта для этого не было, возникло много различных кодировок, в том числе, несколько -- для кириллицы5. Именно поэтому, получив от кого-нибудь текст и попытавшись прочесть его на своем компьютере, мы зачастую видим на экране набор непонятных "закорючек".
код |
CP866 |
CP1251 |
KOI-8R |
Mac |
01011010 |
Z |
Z |
Z |
Z |
10001111 |
П |
|
|
П |
11111101 |
$ |
э |
Щ |
э |
В такой ситуации на помощь приходят программы-конверторы6. Они заменяют двоичный код каждого символа на код, которым такой символ представляется в другой кодировке. Это соответствие определяется таблицей перекодировки. Обычно пользователь должен указать, из какой кодировки в какую идет преобразование, однако появились и программы, умеющие автоматически определять кодировку исходного текста.
Стремление упростить работу с различными текстами (сперва текстами программ, затем служебными документами, газетами, журналами, книгами и т.д.) привело к созданию множества программ, специально ориентированных на это -- текстовых редакторов (или текстовых процессоров).
Какими же данными оперируют эти программы? Очевидно, что наименьшим объектом будет символ. Однако можно работать не только с отдельными символами, но и со словами, строками, абзацами, произвольными фрагментами и текстом в целом. Некоторые действия можно выполнить с любой из этих структур, другие -- только с какй-то определенной. Обрабатываемый текст представляется как бы в виде рулона "бумаги", который можно прокручивать на экране вперед и назад. Большинство современных программ позволяет одновременно работать с несколькими текстами, каждый из которых выводится в отдельное окно. Кроме основных "листов" текстовый процессор, как и другие программы использует "конверт" (или "карман"), в котором можно временно хранить фрагмент текста при его копировании или перемещении.
Текстовый процессор -- не просто заменитель пишущей машинки, а универсальное средство для работы с текстами. Он предоставляет очень широкие возможности манипулирования текстовыми документами. Кроме таких очевидных операций как набор текста, удаление, копирование и перемещение его фрагментов, а также сохранение на диск и печать, имеется возможность изменять шрифт, его начертание, цвет и размер. Текстовый процессор может автоматически форматировать текст (включая установку абзацного отступа и выравнивание). Можно сразу во всем тексте заменить одно заданное слово на другое. Например, поменять "ЭВМ" на "компьютер". Многие редакторы умеют проверять орфографию: компьютер ищет каждое слово в своем словаре и, если не находит, сообщает об этом пользователю, предлагая возможные варианты исправления.
Примечания
Новый стандарт Unicode, на который осуществляется постепенный переход, позволяет использовать 216=65536 (а в последней версии -- 232) символов. Текст в такой кодировке будет занимать существенно (в среднем -- вдвое) больше памяти. [Примечание к примечанию: реальные системы используют не непосредственно Unicode (UTF-32), а представления UTF-8 и UTF-16. В первом из них символ может занимать от 1 до 6 байт, во втором -- 2 или 4 байта]
Это -- примерные значения для русской пишущей машинки. В англоязычных странах обычно используют более мелкий шрифт.
Речь идет о "стандартных" шрифтах. Кроме них существуют также шрифты, содержащие (вместо букв и цифр) специальные, например декоративные, символы.
American Standard Code for Information Interchange -- Американскийстандартныйкодобменаинформацией.
В России широко используются в настоящее время четыре кодировки:
CP866 ("DOS-альтернативная". Для PC-совместимых компьютеров под MS-DOS и OS/2, а также в любительской компьютерной сети Fido);
CP1251 (Для PC-совместимых компьютеров под Windows, а также на большинстве сайтов WWW);
KOI-8R (Компьютеры под UNIX, электронная почта и конференции Internet);
Mac-Cyrillic (Макинтош-совместимые компьютеры).
Converter (англ.) -- преобразователь.
Другие работы по теме:
Оценка качества труда
КОНТРОЛЬНОЕ ЗАДАНИЕ № 1 Тема: ОЦЕНКА КАЧЕСТВА ТРУДА ОПЕРАТОРА ЭВМ 1.ОБЪЕКТ ОЦЕНКИ. Оператор ЭВМ 2.ИСХОДНАЯ ИНФОРМАЦИЯ. А) Должностная инструкция оператора ЭВМ.
Сочинения на свободную тему - Компьютер в xxi веке 3
Еще лет десять-двадцать назад казалось, что развитие компьютерных технологий приведет к полному отказу человечества от книг. Но сегодня мы наблюдаем обратное: книги вновь обретают популярность. Появляются новые интересные авторы, читатели возвращаются к отечественной и зарубежной классике, а значит, книга остается с нами.
Быть или не быть книге (интернет против книг)
Сочинение Вознесенского Руслана Город Одесса Школа № 73 9-А класс Быть или не быть книге? В наш цифровой XXI век, многие земляне задаются вопросом: кто победит компьютер или книга? На этот сложный вопрос я попытаюсь ответить, или хотя бы привести аргументы в одну и другую сторону.
Заменит ли компьютер книгу
Автор: Сочинения на свободную тему Современный мир и нынешнее общество сделали серьёзный шаг вперёд. Невольно оставляя традиции и ценности позади себя. Так ли это? Спорить можно до изнеможения. Чтобы хоть немного разобраться в этом, рассмотрим весьма актуальный вопрос, а именно : «Заменит ли компьютер книгу?»
Гимн США
The Star-Spangled Banner (русск. Знамя, усыпанное звёздами) — национальный гимн Соединённых Штатов Америки. Его текст был взят из поэмы «Оборона Форта Макгенри», написанной в 1814 году Фрэнсисом Скоттом Ки. Автор, 35-летний адвокат и по совместительству поэт-любитель, написал этот текст после того, как стал свидетелем обстрела Форта Макгенри в Балтиморе британскими кораблями в период войны 1812 года.
Российская еврейская энциклопедия
(РЕЭ) — созданное в Москве в 1994 году энциклопедическое издание, дающее всестороннюю объективную картину жизни и деятельности евреев России, СССР и СНГ с момента их появления на территории страны по настоящее время.
Работа с регулярными выражениями в SQL Server
В SQL Server 7/2000 нет встроенной поддержки работы с регулярными выражениями. Но SQL Server похволяет работать с COM-объектами. В VBScript (библиотека vbscript.dll) есть специальный объект для работы с регулярными выражениями - RegExp.
Команды системного администратора
В этой статье собраны основные команды прописываемые в командной строке Windows NT/2000/XP для выполнения определенной сетевой функции.
Применение ЭВМ в жизнедеятельности человека
Доклад на тему Применение ЭВМ в жизнедеятельности человека Когда наш предок впервые взял палку, чтобы сбить плод с дерева, он удлинил свою руку. Когда человек придумал рычаг, чтобы сдвинуть тяжелый камень, он увеличил свою физическуую силу. Подзорная труба увеличилла зоркость человека, а велосипед увеличил его скорость.
Создание графических объектов с помощью псевдографики
Основы работы на языке высокого уровня Turbo Pascal. Основное оборудование и программное обеспечение. Операторы, необходимы для работы в графической среде Turbo Pascal. Запуск графического режима. Текст программы в графической среде Turbo Pascal.
Введение в программирование
Сущность отладки, условия ее выполнения. Ошибки при компиляции программы, создание и изменение исходных символьных файлов. Процесс преобразования кода в машинный. Первый программист, виды трансляторов, классификация и уровни языков программирования.
Логические операторы VB
В Visual Basic можно выделить пять основных и важных логических операторов: And, Or, Not, Xor и Eqv.
Устройства памяти
Text Graphics Презентацию выполняли Корепанова А Макрушина Т Graphics Устройства Памяти Устройства Памяти - устройства памяти данных, которые используются в компьютерах, чтобы хранить данные. Компьютер имеет много типов устройств памяти данных. Некоторые из них могут быть тематическими категориями как сменные Устройства Памяти данных и другие как не сменные Устройства Памяти данных.
Тесты по информатике с ответами Вариант 5
1) Чему равен 1 Кбайт? 1. 210 байт 2. 103 байт 3. 1000 бит 4. 1000 байт 2) Какое устройство обладает наименьшей скоростью обмена информацией? 1. CD-ROM дисковод 2. жесткий диск
Тесты по информатике с ответами Вариант 6
1) Чему равен 1 Гбайт? 1. 210 Мбайт 2. 103 Мбайт 3. 1000 Мбайт 4. 1000 000 Кбайт 2) Процессор обрабатывает информацию… 1. в десятичной системе счисления 2. в двоичном коде
Тесты по информатике с ответами Вариант 4
1) Чему равен 1 Мбайт? 1. 1000000 бит 2. 1000000 байт 3. 1024 Кбайт 4. 1024 байт 2) Запись и считывание информации в дисководах для гибких дисков осуществляется с помощью…
Оптимальный домашний компьютер
Кировский экономико-правовой лицей Кафедра математики и информатики Оптимальный домашний компьютер Выполнил ученик 9В класса Чумаченко Тарас Научный руководитель:
Команды системного администратора
В этой статье собраны основные команды прописываемые в командной строке Windows NT/2000/XP для выполнения определенной сетевой функции. Пример вида <имя> ,практически пишется как имя. Чтобы запустить командную строку необходимо нажать Пуск - Выполнить ввести "cmd" Enter или OK.
Тесты по информатике с ответами Вариант 1
Тесты по информатике с ответами Вариант 1 1) За единицу измерения количества информации принят… 1. 1 бод 2. 1 бит 3. 1 байт 4. 1 Кбайт 2) Производительность работы компьютера (быстрота выполнения операций) зависит от…
Преимущества и недостатки цифровой печати
Цифровая печать – это технология получения оттисков с использованием переменной печатной формы. Изменениями в печатной машине на каждом этапе управляет компьютер издательской системы.
Уильямс Фредерик
Английский инженер-электротехник. Изобрел запоминающее устройство на катодно-лучевых индикаторных трубках, которое ознаменовало собой начало компьютерной эры.
Возняк Стив (Wozniak Stephen)
Возняк Стив (Wozniak Stephen) (р. 1950, шт. Калифорния), американский дизайнер в области компьютеров, соучредитель фирмы Apple.
Кей (Cay) Алан
Кей (Cay) Алан, американский инженер-электронщик. Разработал принципы создания персонального компьютера.