<<<предыдущий список следующий>>>

Это - копия документа, находившегося на http://dz.ru. Авторские права, если не указано иначе, принадлежат Дмитрию Завалишину и/или Евгении Завалишиной. Все изменения, внесенные мной, находятся в этой рамочке.Пожалуйста, прочитайте disclaimer.


14 марта

Сайт Национальной Электронной Библиотеки не очень рекламируется и вообще как-то не на слуху, хоть и существует уж много лет. Между тем сайт уникальный, уже хотя бы в силу уникальности стоящей за ним системы мониторинга. Процитирую: "На сегодняшний день Национальная Электронная Библиотека - самый крупный в мире электронный архив русскоязычных средств массовой информации. В Фондах НЭБ собраны публикации прессы, сообщения информагентств, транскрипты теле- и радиопрограмм, аналитические материалы - всего более 2.5 тысяч информационных источников из Москвы, регионов России, стран СНГ и Балтии. Все материалы помещаются в базу в полном объеме и не редактируются. Ежедневно в НЭБ поступает свыше 6.5 тысяч новых документов из 300 источников. В едином поисковом пространстве находится более 4 млн. документов."

Фото

В один присест сканируется разворот газеты.

"Поступает" - это мягко сказано. В НЭБ есть, как я бы это назвал, цех промышленного сканирования - место, в котором ежедневно сканируются и OCR-ятся газеты - буквально мешками. Всё насканированное плюс статьи, поступающие в эелектронном виде помещаются в базу полнотекстового поиска. Целиком, без обработки - как архивные материалы.

Это интересно и само по себе, но сегодня я хотел сказать пару слов об инструменте, надстроенном над этой ужасающей горой архивных документов. Это пресс-индекс. Бесплатно доступный на сайте инструмент, увы, не предоставляет всех своих возможностей посетителю, но и урезанная версия интересна. Она позволяет оценить в заданном вами промежутке времени, сколь часто встречалось то или иное слово в прессе, причём оценивать можно отдельно по регионам и Москве, что даёт дополнительную пищу для мыслей.

Фото

Система "массового" распознавания на базе спец-версии Finereader.

Как и всякий инструмент, пресс индекс требует от пользователя умения. Но даже если просто ввести слово (напр. "интернет":), указать временные рамки и включить показ Москвы и регионов, можно составить мнение о том, насколько далеко в гробу видали Интернет за пределами столицы. :-) Введя слово "Путин" легко убедиться в том, что этот политик возник из ничего такого-то числа такого-то месяца.

Интереснее другое. Можно задавать несколько слов (или групп слов в фигурных скобках) и сравнивать их популярность. Например, запрос "факс интернет" на периоде от января 98-го до марта 2000-го показывает, что до января 99-го факс звучал шире Интернета и лишь с Августа 99-го Интернет однозначно побеждает...

Короче говоря: инструмент. Рекомендую.

Реклама
   

Надежная защита и твердая платформа для Вашего бизнеса -- Microsoft Windows 2000 уже в России!

 

   

Удача не улыбнулась. Иридиум будет уничтожен. Буквально. Спутники переведут на более низкие орбиты и они сгорят в атмосфере Земли. Кстати, даже гореть они будут ещё целых два года. Словно салют безумству храбрых, покусившихся на создание нового чуда света. И даже создавших его. Не получилось лишь удержать в руках.

Обидно. Идиотизм происходящего очевиден: горят миллиарды долларов, горит система, которая всё равно рано или поздно будет создана заново, в том или ином виде. И никто не нашёл возможности её поддержать.

Эппл переходит на Mac OS X. Переход этот ставит перед компанией нетривиальную задачу. Дело в том, что Mac OS X - вовсе не Mac OS. Это переносимая система, которую, в принципе, ничто не мешает выпускать и для PC. То есть технически это совсем несложно, но вот вопрос - нужно ли это самому Эпплу. Не составит ли PC под OS X конкуренции Макинтошам? И если составит, то в какой степени? Может быть, в конце концов, вообще забить со временем на свою аппаратную платформу вообще? Или просто соскочить с процессоров Power PC на Intel, выпуская Макинтоши же, но на Интеловском процессоре? Или продолжать гнуть старую линию?

Вариантов развития чрезвычайно много. И, боюсь, не попробовав - не узнать, где правильный путь. Это означает, мне кажется, что хотя бы эксперимент по выпуску Mac OS X в мир PC компания Apple сделать должна.