Поиск научных
учреждений
Региональные научные центры РАН
Нижегородский научный центр РАН (4)
Самарский научный центр РАН (3)
Владикавказский научный центр РАН и Правительства РСО-А (1)
Дагестанский научный центр РАН (3)
Кабардино-Балкарский научный центр РАН (4)
Карельский научный центр РАН (7)
Кольский научный центр РАН (4)
Санкт-Петербургский научный центр РАН (18)
Уфимский научный центр РАН (2)
Южный научный центр РАН (1)
Казанский научный центр РАН (4)
Научный центр РАН в Черноголовке (7)
Пущинский научный центр РАН (6)
Троицкий научный центр РАН (3)



Методика 2013 г.

Единицы анализа

На данном этапе для построения вебометрического рейтинга научных учреждений используются только официальные сайты учреждений. Множество единиц анализа, включающее и другие сайты каждого учреждения, находится в стадии формирования. Для некоторых учреждений эти данные уже можно посмотреть на сайте (например, для Института механики сплошных сред ПНЦ УрО РАН).

Индикаторы и способы измерений

S-Y – количество страниц, индексируемых Яндексом на заданном сайте.
Способ измерения вручную: на странице webmaster.yandex.ru/check.xml в поисковой строке ввести ДИС (Доменное Имя Сайта – без http:// и зарывающего слэша /).

S-G – количество страниц, обнаруживаемое Google на заданном сайте.
Способ измерения вручную: на основной странице Google в поисковой строке ввести site:ДИС.

S-B - количество страниц, обнаруживаемое краулером BeeCrawler на первых восьми уровнях сайта (ubs.mtas.ru/archive/search_results_new.php?publication_id=18755).

V-G - количество гипертекстовых ссылок с других веб-ресурсов на заданный сайт, обнаруживаемое Google. Способ измерения вручную: на основной странице Google в поисковой строке ввести link:ДИС.

V-B(links) – количество гипертекстовых ссылок, на заданный сайт с других сайтов целевого множества, обнаруживаемых краулером BeeCrawler.

V-B(sites) - количество сайтов целевого множества, с которых сделаны гипертекстовые ссылки, на заданный сайт, обнаруживаемое краулером BeeCrawler.

R-Y - суммарное количество файлов с расширениями pdf, doc, ps и др., обнаруживаемое Яндексом на заданном сайте. Способ измерения вручную: на странице yandex.ru/search/advanced в разделе «На сайте:» ввести ДИС, в разделе «Формат:» отметить требуемые форматы.

R-G - суммарное количество файлов с расширениями PDF, DOC, PS и др., обнаруживаемое Google на заданном сайте. Способ измерения вручную: на основной странице Google в поисковой строке ввести site:ДИС filetype:pdf OR filetype:ppt OR filetype:doc и т.д. с перечислением требуемых расширений файлов.

Sc-GS - количество ссылок на сайт, обнаруживаемых Google Scholar. Способ измерения вручную: на основной странице Google Scholar в поисковой строке ввести site:ДИС.

Автоматизация измерений индикаторов

Для автоматизации сбора индикаторов используется инструментарий, описанный в разделе "Инструменты".

Сглаживание ошибок измерений

Сглаживанием ошибок поисковых систем будем называть процедуру вычисления правдоподобных значений индикаторов «размер сайта» вместо измеренных и представляющихся ошибочными значений с использованием данных о количестве страниц сайта, обнаруживаемых BeeCrawler. Методы сглаживания ошибок измерений для S-Y и S-G подробно описаны в работе «Об измерениях вебометрических индикаторов»

Интегральный вебометрический показатель

Интегральный вебометрический показатель единицы анализа (в настоящее время – официального сайта) каждого учреждения основывается на значениях семи параметров Ind1 - Ind7, вычисляемых указанным ниже образом.

Ind1, Ind2 – параметры, характеризующие общий объем сайта.
Учитывая предложенную процедуру сглаживания, используемую для S-Y и S-G, процедура вычисления Ind1 и Ind2 выглядит следующим образом:
Вычисляются порядковые номера для S-Y и S-G в упорядоченных по убыванию соответствующих векторах.
Ind1, Ind2 присваиваются значения, вычисляемые как арифметическое выражение (N - порядковый номер) для тех двух из трех индикаторов S-Y, S-G и S-B евклидово расстояние между номерами которых наименьшее (N – количество учреждений, участвующих в ранжировании).

Ind3, Ind4 – параметры, характеризующие ссылочную популярность сайта.
Ind3 := V-G, Ind4 := V-B(links)*V-B(sites).

Ind5, Ind6 – параметры, характеризующие объем полнотекстовых файлов, размещенных на сайте.
Ind5 := R-Y, Ind6 := R-G.

Ind7 – параметр, характеризующий научность сайта.
Ind7 := Sc-GS.

Интегральный вебометрический показатель
Далее, каждый из семи векторов, состоящих из значений соответствующих параметров Ind1 - Ind7, упорядочивается по убыванию значений и для каждого сайта вычисляется сумма индексов его параметров в упорядоченных векторах.
Затем вектор сумм индексов, в свою очередь, упорядочивается по возрастанию значений, и сайт с минимальной суммой индексов получает значение интегрального вебометрического показателя, равное единице, сайт со следующей по значению суммой индексов, – два, и т.д.

 

"Информационная система вебометрического ранжирования веб-ресурсов научных учреждений России", Проект №12-03-12001.

При поддержке
Российского гуманитарного
научного фонда