Целевое множество
Каждое научное учреждение, рассматриваемое как субъект ранжирования в рамках проекта, имеет собственное веб-пространство, под которым понимается множество веб-сайтов данного учреждения, как правило, связанное посредством гиперссылок.
В состав веб-пространства учреждения, как минимум, входит официальный сайт, идентифицируемый по его доменному имени, и другие сайты учреждения (лабораторий, конференций, персональные сайты сотрудников и т.д.), если они есть.
Научное учреждение может иметь несколько доменных имен одного и того же официального сайта (или иногда даже несколько сайтов). В этом случае в качестве официального сайта принимается тот из них, который удовлетворяет одному из следующих условий (приоритет сверху вниз):
включен в перечень информационных систем научных учреждений РАН [источник - Информационные системы научных учреждений Российской академии наук];указан в соответствующем перечне на сайте регионального отделения или регионального научного центра;указан в соответствующем перечне на сайте научного центра регионального отделения;на самом сайте сказано, что он является официальным сайтом учреждения.
Формирование множества других сайтов научного учреждения, входящих в состав его веб-пространства, является нетривиальной задачей. Эти сайты можно разделить на два подмножества, так называемые прямую и скрытую окрестности официального сайта. В первое из них входят сайты, доменные имена которых ассоциируемы с доменным именем официального сайта, а во второе - сайты, не ассоциируемые с ним.
Пример для Института проблем управления РАН (официальный сайт – www.ipu.ru):
сайт прямой окрестности – «3-я Российская конференция с международным участием «Технические и программные средства систем управления, контроля и измерения»» с доменным именем cmm.ipu.ru;сайт скрытой окрестности – «Теория управления организационными системами» с доменным именем www.mtas.ru.
С доменным именем головного сайта некоторого учреждения может ассоциироваться доменное имя головного сайта другого учреждения. Такие сайты не должны быть включены в единицу анализа.
Пример: у Карельского научного центра РАН (КарНЦ РАН) официальный сайт www.krc.karelia.ru, а у Института биологии КарНЦ РАН – ib.krc.karelia.ru. И хотя домен ib.krc.karelia.ru является поддоменом домена www.krc.karelia.ru, сайт Института биологии не должен входить в веб-пространство КарНЦ РАН, поскольку принадлежит самостоятельному научному учреждению.
Единицей анализа называется множество веб-сайтов информационного веб-пространства научного учреждения РАН, рассматриваемых как единое целое, идентифицируемое по названию научного учреждения.
Для краткости веб-пространство организации иногда будем называть термином «пучок» (от англ. bunch).
Целевым множеством проекта является множество единиц анализа научных учреждений.
Основные сформированные множества по состоянию на 20 мая 2014 г.:
1.
Множество официальных сайтов РАН
2.
Множество других сайтов РАН 2014
3.
Множество единиц анализа РАН 2014