Реферат: Синтаксический анализ - Refy.ru - Сайт рефератов, докладов, сочинений, дипломных и курсовых работ

Синтаксический анализ

Рефераты по информатике » Синтаксический анализ

(парсинг)


В информатике, синтаксический анализ— это процесс сопоставления линейной последовательности лексем (слов, токенов) языка с его формальной грамматикой. Результатом обычно является дерево разбора (синтаксическое дерево). Обычно применяется совместно с лексическим анализом. Синтаксический анализатор (парсер) — это программа или часть программы, выполняющая синтаксический анализ.

При парсинге исходный текст преобразуется в структуру данных, обычно — в дерево, которое отражает синтаксическую структуру входной последовательности и хорошо подходит для дальнейшей обработки.

Как правило, результатом синтаксического анализа является синтаксическая структура предложения, представленная либо в виде дерева зависимостей, либо в виде дерева составляющих, либо в виде некоторой комбинации первого и второго способов представления.

Всё что угодно, имеющее «синтаксис», поддается автоматическому анализу.

языки программирования  — разбор исходного кода языков программирования, в процессе трансляции (компиляции или интерпретации);

структурированные данные  — данные, языки их описания, оформления и т. д. Например, XML, HTML, CSS, ini-файлы, специализированные конфигурационные файлы и т.п.;

SQL-запросы (DSL-язык);

математические выражения;

регулярные выражения (которые, в свою очередь, могут использоваться для автоматизации лексического анализа);

формальные грамматики;

лингвистика — человеческие языки. Например, машинный перевод и другие генераторы текстов;

При поиске способов парсинга XML на PHP, было обнаружено несколько способов решения данной задачи. Первый способ простой набор функций в PHP для работы с XML-файлами, который называется «XML Parser Functions».Второй способ основан на использовании расширения SimpleXML, которое доступно в PHP начиная с версии 5. Для решения данной задачи был выбран второй метод, так как он оказался проще в реализации и более гибким.