(Вводные замечания к теме)
Владимир Литвинов
Введение
Настоящие заметки посвящены теме, которая меня давно интересует: что такое текст (по преимуществу речь пойдет о тексте поэтическом) и каким образом можем мы помещать в Интернете тексты так, чтобы не просто получить еще одну копию известного текста (с этим может справиться и ксерокс, продукт деятельности которого может быть отправлен экспресс-почтой), но уяснить те аспекты его устройства, которые обычно остаются как бы подразумеваемыми (кем, когда и в каком объеме?) и поэтому ускользают от внимания или же отдаются на откуп специалистам, обладающим доступом ко всей необходимой информации. Речь пойдет о текстах по преимуществу т.н. "классических", т.е. бытующих сравнительно большой промежуток времени и неоднократно рассматривавшихся. Сочинение носит характер прагматико-эссеистический и на научность не претендует.
1. Текст как объект
Текст в первом его рассмотрении является объектом, отделенным от других объектов: когда мы видим стихотворение, мы видим его в первую очередь как нечто отдельное от других вещей, состоящих из слов. Каждый текст обладает своей уникальной структурой, заслуживающей отдельного изучения. На языке рабочего подхода к представлению литературного текста в Паутине это выразится в том, что каждый текст, объем которого технически позволяет передавать его по Сети, должен существовать и в качестве отдельного файла. Тексты объема большего, чем подходящий для передачи по Сети, должны превращаться в гипертекст, т.е. состоять из фрагментов необходимого размера и механизмов навигации, обеспечивающих гипертекстовое единство фрагментов. Внутреннее строение этого объекта можно охарактеризовать как имеющее разноуровневую сегментацию, которая зрительно представляется следующим образом: слово / строка / стихотворная строка (задается принудительной разбивкой; для прозаического текста это не релевантно) / абзац / более крупные единства. Это означает, что мы должны иметь какие-то инструменты для отражения этой сегментации, т.е. текст должен иметь возможность проявляться (быть показанным) в соответствии с этой сегментацией. Соответственно, каждый из таких сегментов должен иметь некий адрес в пределах границ текста, то есть, поскольку мы говорим о тексте в Сети, некий (относительный?) адрес в пределах данного файла. Предлагаемый вариант: установка при помощи соответствующего инструментария индивидуальных закладок на каждом слове, строке и более крупных сегментах. Кроме того, текст должен иметь описание не только компьютерное (URL), но и "человеческое", т.е. должен эксплицитно содержать указание на свое происхождение (на книгу, свое место в составе книги и того, кто перевел его из книги в Сеть). Фрагменты гипертекста, изначально бывшие едиными книгами (большими текстами), должны также лежать в виде архивов (самораскрывающихся) на FTP-сервере, чтобы пользователи могли организовывать свои путешествия внутри этого текста (см. ниже).
2. Текст как отношение
Во-первых, идеальные в текстологическом аспекте тексты крайне редки. Существует рукопись, в принципе представимая как графический файл (файлы), существуют разные редакции, черновики и отброшенные фрагменты. Существуют ошибки (ошибки при вводе текста в больших количествах практически неизбежны), опечатки, разночтения и пр. Поэтому кроме механизмов разнообразного представления одного текста нужны механизмы представления текста как вариативной структуры и возможности одновременного просмотра разных вариантов этой структуры. С другой стороны, тексты существуют и как взаимодействие различных интерпретаций, в простейшем виде как текст и набор комментариев к нему. Публиковать тексты без комментариев представляется недостаточным, а гипертекст в данном случае становится насущной необходимостью. Фреймовые структуры представляются весьма уместными для показа комментариев и другой справочной информации (индексов, конкордансов и пр. - см. ниже). Впрочем, системный администратор или же веб-мастер, монопольно владеющий истиной по поводу предпочтительного комментария и написания текста - картина достаточно гротескная. Поэтому публикация текста перерастает в процесс диалога и постепенного уяснения предпочтений, что делает публикацию текста не единовременным актом, а интерактивным процессом, включающим многие действующие лица. Сеть в этом случае действительно станет не игрушкой или высоким ремеслом для избранных, но механизмом, задействованным по принципам, присущим и внесетевой культуре, но, хочется верить, упрощающим механизмы обмена релевантной информацией.
3. Математическая обработка. Индексы по тексту как средство навигации
Когда мы сталкиваемся с новым текстом, мы volens nolens ставим его в отношение к другим текстам других авторов. Этим заниматься тем удобнее, чем больше авторов вводится в наше рассмотрение и чем они лучше описаны. Самый полный и самый реальный вариант описания текста - построение конкорданса к тексту с отсылками в места употреблений (упомянутые выше закладки) на всех введенных авторов. При этом традиционные средства поиска могут оказаться неадекватными в связи с индивидуальным (иной раз резко индивидуальным) словоупотреблением, и лучше иметь полное описание лексики текста или возможность по запросу (причем запрос может включать как лексемы, так и отдельные форманты) получать отсылки на конкретные тексты, а также возможность получить количественное отношение к другим аналогичным элементам текста. То есть элементы лингвистического анализа текста можно совместить с механизмами навигации и предоставить всем желающим. Первым шагом в этом направлении является программа Word Tabulator, разработанная Сергеем Логичевым (г. Снежинск) (кр. описание). Одна техническая оговорка: для того чтобы выходные индексы были упорядочены с точки зрения последовательности ссылок, тексты в анализируемых гипертекстах лучше иметь с цифровыми именами, при этом порядок должен быть правильным с точки зрения и компьютера, и человека. Текст, идущий в книге первым, с точки зрения человека должен иметь имя "1" (далее "2" и т.д.). С точки зрения операционной системы за "1" идет не "2", а "10", поэтому если текстов много , то первый текст должен иметь имя "001", второй - "002", десятый - "010", а сотый - "100", и в этом случае при математической обработке тексты будут обрабатываться в заданной последовательности. Другой важный аспект рассматриваемого аспекта функционирования текста в Сети - потенциальная возможность сравнения конкретного словоупотребления в данном тексте с общеязыковым словоупотреблением того временного среза, к которому относится рассматриваемый текст. Почему потенциальные: существуют словарные базы данных (см. Бюллетень машинного фонда ИРЯ (cfrl0@cfrl.synapse, cfrl1@cfrl.synapse, cfrl2@cfrl.synapse), которые могут быть сделаны доступными через Интернет и снабжены поисковым механизмом (если это будет сделано - большой прогресс, но это дело связано с немалыми затратами).
4. Старая орфография и иноязычные цитаты
При публикации текстов в Интернете и разработке технологии для публикации большого количества текстов встает интригующий вопрос: что делать с текстами, которые не переиздавались после 1918 года, то есть после реформы орфографии, которая произошла в этом году. Как известно, до реформы русская графика включала знаки "i", ижицу, фиту и ять, причем последний был в старой орфографии весьма частотным и значимым, но в настоящее время не входит в кодовую страницу для кириллицы и занимает самые разные места в таблицах шрифтов. Что-то нужно придумывать: или писать утилиту, которая автоматически преобразовывает старую орфографию в новую, или заводить ять в кодовую таблицу, или приписывать этому знаку обозначение, как это сделано для европейской графики с диакритикой и греческих символов ( в том числе для ижицы и фиты) в ISO 8859-1, или еще что-то.
5. Ориентация на пользователя
Предлагаемый вариант осуществления публикации литературных текстов должен удовлетворять требованиям двух категорий пользователей: специалистов и неспециалистов. Специалисты получают текст, которым можно пользоваться в своих работах, и новые инструменты анализа текста, а неспециалисты получают текст, который удобно читать: щелк мыши дает возможность увидеть комментарий (если это интересно), а нет желания - и пропустить этот комментарий и по второму щёлку вернуться в исходный текст, не тратя времени на нахождение комментария в примечаниях и нахождение того места, которое было последним прочитанным.
6. Стоимость бумажного и сетевого издательства
При нынешней восхитительной анархии в издательском деле очень трудно рассчитывать на появление в необходимом количестве изданий русской литературы, удовлетворяющих как специалистов, так и неспециалистов. Сетевое издательство, представляющееся менее дорогостоящим, достаточно доступным и легко осуществимым, смогло бы открыть новый этап освоения русской литературы. Возможности математической обработки текстов он-лайн также представляются осуществимыми и весьма привлекательными. При сетевом издании литературных текстов можно договориться о единых стандартах и распределить области вводимой литературы с конечной целью создания единого ГИПЕРТЕКСТА, включающего все, что должно быть включено.
Другие работы по теме:
Давыдов Иван Иванович
Давыдов пытается обосновать "философию слова" (формирование языка связывает с историческими особенностями национального бытия и законами человеческого мышления), определяет ряд эстетических категорий и специфику литературных родов и жанров.
Компьютерные технологии в социологии
Содержание: Введение …………………………………………………………………………3 Этап 1.Традиционные и компьютерные технологии в социологическом исследовании: достоинства и недостатки………………………………4
Оценка эффективности рекламной кампании в интернете
Зачем затеваются рекламные войны? В книгах по военной истории написано, что цель любой войны – достижение лучшего устройства мира, чем до неё. Прежде, чем затевать рекламную кампанию следует задаться вопросом о том, что вы в результате хотите получить.
Можно ли научиться лидерству
Я уверен, что лидерство – не статичная величина и, безусловно, можно научиться быть ведущим, а не ведомым, т.е. развить в себе качества лидера. В газетных объявлениях, интернете, других СМИ можно не редко заметить о множестве проходящих тренингов, обучающих программ и прочих мероприятий, где люди узнают много нового о потенциале человека, о своих возможностях.
Минимальные ставки
Использование произведений в книгоиздании, получение прав на перевод текстов либо на аранжировку музыкального произведения и т.д. осуществляются по согласованию сторон, и вмешательство государства в волю сторон недопустимо.
Тема Кол-во страниц
Межъязыковая коммуникация и прагматический потенциал перевода рекламных текстов
работа на тему: «сленг в интернете»
Аминова Л. В. Структурно-семантические особенности молодежного сленга в английском и французском языках : автореф дис канд филол наук / Л. В. Аминова; [Башк гос ун-т]. – Уфа, 2004. 18 с. Библиогр.: с. 18 (5 назв.). Шифр рнб: 2004-4/36970
Пелевин Виктор
(1962 - ...) Родился в 1962 году. В 1979 году окончил московскую среднюю школу № 31 (сейчас гимназия им. Капцовых № 1520). В 1984 окончил Московский энергетический институт (МЭИ), учился в Литературном институте им. Горького. Работал в одном из первых в стране небольших частных издательств, участвовал в издании текстов Карлоса Кастанеды, древнекитайских буддистов.
Герои поэмы Гоголя Мёртвые души
Автор: Гоголь Н.В. Среди иллюстраторов Гоголя первое место в 40-е годы занимает, бесспорно, А. А. Агин, автор классических «ста рисунков» к «Мёртвым душам». Он приступил к изданию этих иллюстраций в 1846 году. «Браться за типы, созданные этим великим мастером, страшно»,— писал об иллюстрировании Гоголя И.
Принцип аналогии в морфологии
В работе Белоногова Г. Г. и Зеленкова Ю. Г. описывается принцип построения алгоритма морфологического анализа текстов на основе принципа аналогии. Данный принцип используется в системах орфографического контроля русских текстов.
Билеты по литературе (2 курс 2 семестр, 2004г.)
Билеты по литературе 2 курс 2 семестр Основные мотивы стихов о Прекрасной Даме Бальмонт и символизм Поэтика символического романа («Петербург») Общая характеристика литературных направлений и течений начала ХХ века
Стоит ли читать книги
Автор: Сочинения на свободную тему Книга. Жила-была Книга. Очень умная и мудрая вещь, но многими позабытая. И вот однажды встретился я с Нею: - Здравствуй!
The New York Times
Введение 1 История 2 Интересные факты Список литературы The New York Times Введение The New York Times (русск. Нью-Йо́рк та́ймс) — третья по популярности (после The Wall Street Journal и USA Today) газета США. Как и основная часть американских газет, The New York Times создана как региональное издание.
Чёрный список
Введение 1 В Интернете 2 В экономике 3 В международном праве 4 В телефонии Список литературы Введение Чёрный список — список лиц или других сущностей, которые по каким-либо причинам признаны недружественными по отношению к субъекту (составителю). В более узком смысле — список лиц или других сущностей, которым отказано в конкретном праве, привилегии или действии.
The Atlantic Monthly
Введение 1 История Список литературы The Atlantic Monthly Введение The Atlantic (ранее The Atlantic Monthly) — один из старейших и наиболее респектабельных литературных журналов США.[1] Основан в 1857 году в Бостоне. Среди первых сотрудников были виднейшие литераторы Новой Англии — Джеймс Расселл Лоуэлл, Ральф Уолдо Эмерсон, Лонгфелло, О.
Начало журнал
Начало, нелегальное издание — революционное печатное издание, выходившее нелегально в России с марта по май 1878 г. Вышло 4 номера. Начало ставило своей задачей «заниматься преимущественно не теоретической разработкой принципиальных вопросов, а критикой явлений существующего общественного строя и освещения с точки зрения принципов социализма фактов текущей жизни».
Апсолон, Андрей Николаевич
Введение 1 Биография 2 Фильмография 2.1 Режиссёрские работы 2.2 Автор сценариев 2.3 Автор текстов песен 2.4 Актёрские работы Введение Андрей Николаевич Апсолон (13 (26) марта 1908, Псков — 26 февраля 1994, Санкт-Петербург) — советский актёр театра и кино, Заслуженный артист РСФСР (1933).
Восточная литература сайт
Введение 1 Хронологические рамки первоисточников 2 История развития сайта 3 Участники проекта Восточная литература (сайт) Введение Восто́чная литерату́ра — некоммерческий сайт, содержащий публикации на русском языке первоисточников — летописей, хроник, мемуаров, документов, описаний путешествий и др.
Военно-исторический журнал
«Военно-исторический журнал» — ежемесячное издание Министерства обороны РФ. Первый номер ВИЖ вышел в свет 29 августа 1939 года. В 1939—40 журнал издавался как орган Народного комиссариата обороны СССР, в период с января по июль 1941 года как орган Генштаба РККА. С началом Великой Отечественной войны издание было прекращено и возобновлено в 1959 году.
История дипломатии
Введение 1 Первое издание 1.1 Разделы 2 Второе издание Введение История дипломатии - многотомный труд советских историографов, проведших анализ международных отношений в последовательно сменявшиеся эпохи; краткая история дипломатии от древних времен до нашего времени. Под редакцией В. П. Потемкина.
Интернет-культура
Содержание 1 Частные случаи интернет-культуры Интернет-культура (англ. Internet culture) — это культура подачи информации и культура общения пользователей в Интернете. Как глобальный феномен интернет-культура (киберкультура пользователей Интернета) возникла благодаря Интернету и приобрела признаки обособленного общественного явления в рамках человеческой цивилизации.
Второе издание крепостничества
Введение 1 Название 2 Распространение 3 Особенности 4 Причины возникновения 5 Отмена Список литературы Введение Второе издание крепостничества — появление либо усиление крепостного права в странах Восточной Европы в XVI—XIX веках.
Хроника Эрика
План Введение 1 Название 2 Списки 4 Текст Введение Хроника Эрика (швед. Erikskrцnikan) — рифмованная хроника, один из древнейших шведских литературных памятников. Она была составлена в 1320-е годы неизвестным автором. В основу хроники положена история династии шведских конунгов — Фольгунгов — с момента её основания в середине XIII века до вступления на трон Магнуса Эрикссона в 1319 году.
Перепись населения Латвии 2011
Перепись населения Латвии проходит с 1 марта по 31 мая 2011 года. Первая перепись населения с момента вступления страны в Европейский союз в 2004 году. Также первая перепись населения, где анкеты можно будет заполнить по интернету.[1] Заполнение анкеты по интернету можно произвести с 1 по 12 марта[2]. 2 марта возможность участвовать в переписи в интернете, введя номер паспорта и персональный код, была отменена из-за недостаточной защиты личных данных; остается возможность участвовать в переписи в интернете посредством электронной подписи или интернет-банка.[3].
Словарь античности
«Словарь античности» (нем. Lexikon der Antike) — краткий энциклопедический словарь, посвящённый культуре и истории античного общества. Первый такой словарь был создан выдающимся немецким филологом и педгогом Фридрихом Любкером (первое издание — 1854). В XIX веке этот словарь выдержал несколько переизданий.
Николай Михайлович Карамзин 1766 – 1826 гг
Николай Михайлович Карамзин 1766 – 1826 гг. Доклад "ИСТОРИЯ ГОСУДАРСТВА РОССИЙСКОГО" Подболотов Александр 9 "А" "История государства Российского" Н. М. Карамзина – последний и наиболее значительный в его творчестве труд. Этот выдающийся памятник русской культуры представляет собой уникальный сплав исторической и общественно-политической мысли, литературных и языковых исканий конца XVІІІ - первой четверти XІX века. "История государства Российского" – крупнейшее для своего времени достижение русской и мировой исторической науки, первое монографическое описание русской истории с древнейших времен по начало XVІІ в., опирающееся на огромный круг исторических источников.
Билеты по литературе 2 курс 2 семестр 2004г
Билеты по литературе 2 курс 2 семестр Основные мотивы стихов о Прекрасной Даме Бальмонт и символизм Поэтика символического романа («Петербург») Общая характеристика литературных направлений и течений начала ХХ века
Ванг Ан (Wang An)
Ванг Ан (Wang An) (7 февраля 1920, Шанхай, Китай - 24 марта 1990, Бостон, Массачусетс), американский инженер-электронщик и предприниматель китайского происхождения. Основатель Wang Laboratories.