27.08.2013 Новости, Открытый код/LinuxGoogle предложила разработчикам еще один инструмент с открытым исходным кодом — свой HTML-парсер Gumbo, представляющий собой реализацию алгоритма HTML5-парсинга на языке Си. Компания представила это свободное ПО в блоге Google Open Source Blog сообщением Джонатана Танга из группы Search Features. По его словам, “одним из важных аспектов стандарта HTML5 стала стандартизация алгоритма HTML-парсинга, благодаря чему HTML-документ одинаково представляется всеми браузерами. Ранее большинство реализаций этого алгоритма было либо привязано к конкретным браузерам или движкам рендеринга, либо написано на специфических скриптовых языках. И если вы не работаете в языке, уже имеющем HTML5-совместимую библиотеку парсинга, приходилось писать узкоспециальные средства для разбора и упорядочения кода HTML, что требует труда и времени”. Именно здесь пригодится Gumbo, поскольку инструмент предоставляет разработчикам “простую библиотеку, которая может послужить базой при создании средств для проверки корректности и реорганизации кода, шаблонизаторов, средств анализа страниц и других небольших программ, необходимых при обработке HTML, — пишет Танг. — Он написан на чистом Си, что упрощает интерфейс с другими языками, и не имеет внешних зависимостей. Gumbo изначально ориентирован на отслеживание позиций в исходном коде и корреляцию узлов в иерархическом дереве парсинга с местонахождением в оригинальном тексте”. Дополнительные сведения об инсталляции и ...
читать далее.