Постоянные читатели

среда, 1 марта 2023 г.

 

Тема 17. «Обработка текстовой информации»

1.     Обработка текстовой информации

2.     Функции и возможности текстовых редакторов.

 1.   Обработка текстовой информации

Технологии обработки текстов являются одними из наиболее распространенных технологий обработки информации. Текст – любая последовательность символов, к которым относятся буквы, пробел, знаки препинания, цифры, знаки арифметических операций и т.п. Текст можно создать карандашом, пером, авторучкой, на пишущей машинке, наконец, на компьютере.

К аппаратным средствам компьютера для ввода текстового документа относится клавиатура, световой карандаш со специальным планшетом, сканер.

К программным средствам, предназначенным для работы с текстами, относятся:

· электронные блокноты;

· текстовые редакторы;

· текстовые процессоры;

· редакционно-издательские системы;

· программы-переводчики;

· лингвистические корректоры;

· системы, осуществляющие интеллектуальный поиск и интеллектуальную обработку текстов, размещенных в сетях.

Текстовый редактор – программное средство, предназначенное для создания (ввода, набора), редактирования и оформления текстов. Примеры: «Лексикон», «Слово и дело», «Edit», «Ched», «Note Pad», «Write».

Текстовый процессор отличается от текстового редактора более широкими функциональными возможностями:

· настраиваемое пользователем меню;

· использование контекстного меню;

· сопровождение текста таблицами и проведение в них простейших расчетов;

· вставка графических объектов (рисунков, диаграмм, заголовков и пр.) или создание рисунков с помощью встроенных инструментов;

· вставка формул, графиков, диаграмм;

· оформление текста списками, буквицами;

· использование инструмента автокоррекции текста и его автореферирования;

· создание и использование макросов;

· фоновая проверка орфографии, синтаксиса и др.

Примеры: Word (Microsoft Office), Word Pro (Lotus Smart Suite), Word perfect (Perfect Office), Accent, Word Pad.

Редакционно-издательские системы должны обеспечить все функции текстового процессора, а также:

· воспринимать тексты, созданные в различных текстовых редакторах;

· воспринимать отсканированные или нарисованные в графических редакторах иллюстрации, созданные на ПК разных платформ, и корректировать их цвета;

· иметь большой набор шрифтов и возможность их графического преобразования;

· иметь возможность для различного «обтекания» рисунка текстом;

· обеспечивать автоматическое оптимальное размещение текста на странице, автоматическую нумерацию страниц;

· обеспечивать адаптацию к различным печатающим устройствам и т.п.

Программы-переводчики или компьютерные словари содержат переводы на разные языки сотен тысяч слов и словосочетаний. Их возможности, предоставляемые пользователю, заключаются в следующем:

· выбор языка и направления перевода;

· предоставление не только общеупотребительных, но и специализированных слов;

· обеспечение быстрого поиска словарных статей;

· предоставление мультимедийных услуг – прослушивание слов в исполнении дикторов.

Основные элементы текстового документа:

-                символ - минимальная единица текстовой информации;

-                слово - произвольная последовательность букв и цифр, ограниченная с двух сторон служебными символами;

-                строка - произвольная последовательность символов между левой и правой границами абзаца;

-                предложение - произвольная последовательность слов, завершающаяся точкой;

-                абзац - часть текста, которая завершается специальным символом конца абзаца, при этом допускаются пустые абзацы;

-                страницу составляют строки и абзацы, таблицы и внедренные в документ объекты;

-                наиболее крупной единицей является собственно документ , где все составляющие его абзацы определенным образом структурированы, снабжены при необходимости заголовками, выстроена иерархия структурных разделов.

Рассматривая технологию создания текста, необходимо знать определение таких понятий как шрифт, графема, сериф, кегль, а также пагинация, выключка, кернинг, интерлиньяж.

Графема – единица письменного знака, выступающая в различных вариантах в зависимости от стиля письма, места в предложении и т.д.

Шрифт – выполненные в едином стиле графемы букв, используемых для письма.

Сериф – завиток (росчерк, засечка), образующий окончание линии, которой изображена буква или знак (литера).

Кегль – размер шрифта, определяемый литерой.

Выключка – выравнивание длины печатных строк по заданному размеру путем увеличения промежутков между словами.

Пагинация (от английского page – страница) – разбивка на страницы.

Кернинг – уменьшение расстояния между буквами для более удобного и комфортного восприятия текста глазом.

Интерлиньяж – регулировка промежутка между строками.

Формат файла определяет способ хранения текста в файле. Простейший формат текстового файла содержит только символы (числовые коды символов), другие же форматы содержат дополнительные управляющие числовые коды, которые обеспечивают форматирование текста.

Существуют универсальные форматы текстовых файлов, которые могут быть прочитаны большинством текстовых редакторов, и оригинальные форматы, которые используются отдельными текстовыми редакторами. Для преобразования текстового файла из одного формата в другой используются специальные программы – программы-конверторы.

Рассмотрим некоторые наиболее распространенные форматы текстовых файлов.

Только текст (Text Only) (TXT). Наиболее универсальный формат. Сохраняет текст без форматирования, в текст вставляются только управляющие символы конца абзаца. Применяют этот формат для хранения документов, которые должны быть прочитаны в приложениях, работающих в различных операционных системах.

Текст в формате RTF (Rich Text Format) (RTF). Универсальный формат, который сохраняет все форматирование. Преобразует управляющие коды в команды, которые могут быть прочитаны и интерпретированы многими приложениями, в результате информационный объем файла существенно возрастает.

Документ Word (DOC). Оригинальный формат используемой в настоящее время версии Word. Полностью сохраняет форматирование. Использует 16-битную кодировку символов, что требует использование шрифтов Unicode.

Документ Word 2.0, Word 6.0/95 (DOC). Оригинальные форматы предыдущих версий редактора Word. При преобразовании из формата Word 97/2000/2003 форматирование сохраняется не полностью.

Works 4.0 для Windows (WPS). Оригинальный формат интегрированной системы Works 4.0. При преобразовании из формата Word форматирование сохраняется не полностью.

HTML-документ (HTM, HTML). Формат хранения Web-страниц. Содержит управляющие коды (тэги) языка разметки гипертекста.

Выбор требуемого формата текстового документа или его преобразование производится в процессе сохранения файла

 2. Функции и возможности текстовых редакторов.

 Текстовые процессоры представляют систему подготовки текстов (Word Processor). Наибольшей популярностью среди них пользуется программа MS Word. Технология обработки текстовой информации с помощью таких программ обычно включает следующие этапы:

1) создание файла для хранения текстовой информации;

2) ввод и (или) копирование текстовой информации в компьютер;

3) сохранение текста, представленного в электронной форме;

4) открытие файла, хранящего текстовую информацию;

5) редактирование электронной текстовой информации;

6) форматирование текста, хранящегося в электронной форме;

7) создание текстовых файлов на основе встроенных в текстовый редактор стилей оформления;

8) автоматическое формирование оглавления к тексту и алфавитного справочника;

9) автоматическая проверка орфографии и грамматики;

10) встраивание в текст различных элементов и объектов;

11) объединение документов;

12) печать текста.

К основным операциям редактирования относят: добавление; удаление; перемещение; копирование фрагмента текста, а также поиска и контекстной замены. Если создаваемый текст представляет многостраничный документ, то можно применять форматирование страниц или разделов. При этом в тексте появятся такие структурные элементы, как: закладки, сноски, перекрестные ссылки и колонтитулы.

Большинство текстовых процессоров поддерживает концепцию составного документа – контейнера, включающего различные объекты. Она позволяет вставлять в текст документа рисунки, таблицы, графические изображения, подготовленные в других программных средах. Используемая при этом технология связи и внедрения объектов называется OLE (Object Linking and Embedding – связь и внедрение объектов).

Непосредственно ввод текста с клавиатуры особых сложностей не вызывает, следует лишь быть внимательным и набирать символы в правильном порядке. Каждый символ в Word имеет свой код, которым он представлен в электронных документах.

При редактировании (верстке) документов рекомендуется работать в режиме отображения непечатаемых символов. Так называемые непечатаемые символы видны на экране монитора только в режиме их отображения на экране с помощью кнопки Непечатаемые знаки на вкладке Главная. Символы и значения непечатаемых символов приведены в табл. Программа Word запоминает производимые с документом действия и предоставляет возможность отказаться от них или последующего возврата к ним. Отмена действий осуществляется кнопкой   Отменить либо сочетанием клавиш Ctrl + Z. Возврат действия выполняется там же кнопкой Вернуть.

Форматирование текста

Форматирование текста (разметка) — операции и результат оформления текста, шрифта, абзацев, заголовков, сносок, разделов и других признаков, изменяющих внешний вид, но не содержание. Форматированный текст сохраняется в документах.

Форматирование в программе Word применяется к разным объектам: отдельным буквам и словам, абзацам, спискам, таблицам, графическим изображениям, страницам. Фрагмент текста, который подлежит форматированию, следует выделить и применить команды форматирования из вкладки Главная в группах Шрифт, Абзац или вызвать контекстное меню.

Комментариев нет:

Отправить комментарий

Информатика 23-24г Объекты и классы. Свойства и методы объектов.

  Объекты и классы. Свойства и методы объектов. Итак, определяющим понятием ООП является  объект  – некая совокупность, объединяющая свойс...