Opera сделала мета-поисковик MAMA.

Компания Opera стала основателем известного одноименного продукта. Недавно Opera раскрыла свой новый поисковик MAMA (сокращенно от Metadata Analysis and Mining Application ). Этот механизм был сделан на базе Perl с добавлением СУБД MySQL. Он не только индексирует содержимое сайта, но и фиксирует его архитектуру и используемые веб-технологии. Это поможет найти веб-ресурсы как по их содержимому, так и по архитектуре. MAMA дает возможность, к примеру, выделить сайты с не менее чем тысячью ссылок. Благодаря мета-поисковику МАМА можно определить статистику использования флеша в сети Интернет. Или вычислить сумму ошибок разметки для обычного среднего интернет-ресурса, например. Поисковая система поможет организациям по стандартизации выяснить, как на деле работают их рекомендации. Сумеют точнее учитывать технические интересы пользователей и текущие возможности Сети разработчики веб-приложений. MAMA пока не введен в использование, однако базу с 3-мя миллионами изученных сайтов он уже содержит. Интересную статистику показала Opera на основе этой базы. Так, свободный веб-сервер Apache используется в качестве основы у 67, 7% сайтов, а сервер IIS от Microsoft – в 25, 9%. 16, 4 тысяч символов – веб-страницы имеют обычный размер. Десятку самых распространенных меток составили HEAD, TITLE, HTML, BODY, A, META, IMG, TABLE, TD, TR. Было выяснено, что всем требованиям консорциума по интернет-стандартизации W3C отвечают лишь 4, 13% веб-сайтов.

Оставить комментарий