Разделы

Интернет Веб-сервисы

Пионеры семантического веба выходят "из сумрака"

В следующем году будет выпущено несколько коммерческих продуктов, реализующих концепцию семантического веба. Эксперты неоднозначно оценивают как их выход, так и перспективы самой концепции.
Софтверная компания Radar Networks разрабатывает семантическую платформу и онлайновый сервис для групповых коммуникаций и совместной работы. На сайте компании говорится, что пока она работает в режиме секретности, и ее первые коммерческие продукты должны появиться в 2007 г. Возможно, это будут СУБД, позволяющие устанавливать глубокие ассоциативные связи между разными частями информации.

В Radar Networks заявляют, что ее продукты катализируют развитие «нового измерения» веба, которое станет следующим рубежом для интернет-поиска, рекламы и электронной коммерции. По некоторым данным, разработки Radar Networks базируются на технологиях американских военных и разведчиков. Компанию основал в 2003 г. г-н Нова Спивак (Nova Spivack), она финансируется Vulcan Capital и Leapfrog Ventures, имеет штаб-квартиру в Сан-Франциско.

Базирующаяся тоже в Сан-Франциско Metaweb Technologies также специализируется в области семантического веба. Компания финансируется Benchmark Capital, Millennium Technology Ventures, Omidyar Network и другими инвесторами. Что компания разрабатывает — держится в режиме секретности, возможно, первые ее продукты появятся в 2007 г.

К выходу готовится продукт еще одного стартапа в области семантического веба — Powerset. Это поисковик одноименной компании в Силиконовой долине, который будет использовать так называемый «натуральный язык», например, понимать разницу между поиском «книг о детях» и «книг для детей».

Эксперты неоднозначно оценивают выход на рынок указанных «пионеров». Ричард Макманус (Richard MacManus) и его соавторы пишут в статье «2007 Web Predictions», что появление продуктов Metaweb и Radar Network в следующем году окажет положительный эффект на развитие семантического веба. Российские эксперты оценивают его более скептически. «Для обработки обычных документов такие разработки идут давно по всему миру. Эти „секретные“ технологии доступны и другим странам. Так что революции тут никакой нет», — заявляет Джан Хан-Магомедов, исполнительный директор Регионального общественного центра интернет-технологий.

"Термин «семантический веб» — пока не больше чем маркетинговая уловка, как и Web 2.0, под которым каждый понимает свое, но большинство — просто рекламный трюк, ориентированный в первую очередь на инвесторов", — считает Евгений Альтовский, эксперт МОО ВПП ЮНЕСКО "Информация для всех". «Когда говорится, что технологии обкатываются „в скрытом режиме“ и о них мало что известно, сразу вспоминается стык тысячелетий, когда даже коврики для мыши продавались под девизом web-enabled и Internet-ready, — говорит г-н Альтовский. — А еще вспоминается „мыльный пузырь“ DotCom’ов, после которого выжили лишь единицы — те, кто вкладывался не столько в рекламу, сколько в реальные разработки. Когда эти разработки были приняты рынком, никто уже и не вспоминает, что они должны были перевернуть мир, — их просто используют, потому, что они нужны и удобны, а не из-за их абстрактной революционности».

Как в России сэкономили сотни миллиардов рублей на финансировании разработок в сфере цифровых технологий
Цифровизация

У семантического веба есть такая проблема, как необходимость массового изменения кода веб-страниц для того, чтобы новые поисковики стали эффективными. Известно, как много времени требуется для внедрения стандартов веб-дизайна. Многие сайты крупных корпораций еще даже не перешли на XHTML, не говоря об XML, дающем возможность структурирования информации веб-страниц вместо простого форматирования HTML. «Программистам работы будет много. Далеко не сразу и далеко не все перейдут на эту технологию, пройдет немало лет, — говорит Джан Хан-Магомедов. — Возможно, появятся средства полуавтоматической конвертации, разумеется, с кучей ошибок. А пользователь получит, конечно, совсем иной сервис — умный поиск».

Есть и проблема недобросовестных владельцев сайтов, которые, конечно, воспользуются возможностями семантического веба для рекламы и мошенничества.

Основная идея семантического веба — научить компьютеры лучше «понимать» информацию. Используя язык RDF (Resource Description Framework), можно ввести семантические подсказки в разметку веб-страниц, позволяющие сделать поиск более осмысленным. RDF основан на синтаксисе расширяемого формата XML, который лучше подходит для представления отношений между данными. Семантику данных такого «продвинутого» веба можно определять и с помощью языка OWL, доступ к ним производить с использованием языка запросов SPARQL.

В конце концов семантический веб должен превратиться в обширную и децентрализованную базу данных. Поэтому важной его проблемой является онтология, то есть наиболее общие описания. Возникает вопрос, можно ли будет покрыть такими описаниями все многообразие данных в Сети.