Методика 2013 г.
Единицы анализа
На данном этапе для построения вебометрического рейтинга научных учреждений используются только
официальные сайты учреждений. Множество единиц анализа, включающее и другие сайты каждого учреждения, находится в стадии формирования. Для некоторых учреждений эти данные уже можно посмотреть на сайте (например, для
Института механики сплошных сред ПНЦ УрО РАН).
Индикаторы и способы измерений
S-Y – количество страниц, индексируемых Яндексом на заданном сайте.
Способ измерения вручную: на странице
webmaster.yandex.ru/check.xml в поисковой строке ввести ДИС (Доменное Имя Сайта – без http:// и зарывающего слэша /).
S-G – количество страниц, обнаруживаемое Google на заданном сайте.
Способ измерения вручную: на основной странице Google в поисковой строке ввести site:ДИС.
S-B - количество страниц, обнаруживаемое краулером BeeCrawler на первых восьми уровнях сайта (
ubs.mtas.ru/archive/search_results_new.php?publication_id=18755).
V-G - количество гипертекстовых ссылок с других веб-ресурсов на заданный сайт, обнаруживаемое Google. Способ измерения вручную: на основной странице Google в поисковой строке ввести link:ДИС.
V-B(links) – количество гипертекстовых ссылок, на заданный сайт с других сайтов целевого множества, обнаруживаемых краулером BeeCrawler.
V-B(sites) - количество сайтов целевого множества, с которых сделаны гипертекстовые ссылки, на заданный сайт, обнаруживаемое краулером BeeCrawler.
R-Y - суммарное количество файлов с расширениями pdf, doc, ps и др., обнаруживаемое Яндексом на заданном сайте. Способ измерения вручную: на странице
yandex.ru/search/advanced в разделе «На сайте:» ввести ДИС, в разделе «Формат:» отметить требуемые форматы.
R-G - суммарное количество файлов с расширениями PDF, DOC, PS и др., обнаруживаемое Google на заданном сайте. Способ измерения вручную: на основной странице Google в поисковой строке ввести site:ДИС filetype:pdf OR filetype:ppt OR filetype:doc и т.д. с перечислением требуемых расширений файлов.
Sc-GS - количество ссылок на сайт, обнаруживаемых Google Scholar. Способ измерения вручную: на основной странице Google Scholar в поисковой строке ввести site:ДИС.
Автоматизация измерений индикаторов
Для автоматизации сбора индикаторов используется инструментарий, описанный в разделе
"Инструменты".
Сглаживание ошибок измерений
Сглаживанием ошибок поисковых систем будем называть процедуру вычисления правдоподобных значений индикаторов «размер сайта» вместо измеренных и представляющихся ошибочными значений с использованием данных о количестве страниц сайта, обнаруживаемых BeeCrawler. Методы сглаживания ошибок измерений для
S-Y и
S-G подробно описаны в работе
«Об измерениях вебометрических индикаторов»
Интегральный вебометрический показатель
Интегральный вебометрический показатель единицы анализа (в настоящее время – официального сайта) каждого учреждения основывается на значениях семи параметров Ind1 - Ind7, вычисляемых указанным ниже образом.
Ind1, Ind2 – параметры, характеризующие общий объем сайта.
Учитывая предложенную процедуру сглаживания, используемую для
S-Y и
S-G, процедура вычисления Ind1 и Ind2 выглядит следующим образом:
Вычисляются порядковые номера для
S-Y и
S-G в упорядоченных по убыванию соответствующих векторах.
Ind1, Ind2 присваиваются значения, вычисляемые как арифметическое выражение (N - порядковый номер) для тех двух из трех индикаторов
S-Y,
S-G и
S-B евклидово расстояние между номерами которых наименьшее (N – количество учреждений, участвующих в ранжировании).
Ind3, Ind4 – параметры, характеризующие ссылочную популярность сайта.
Ind3 := V-G, Ind4 := V-B(links)*V-B(sites).
Ind5, Ind6 – параметры, характеризующие объем полнотекстовых файлов, размещенных на сайте.
Ind5 := R-Y, Ind6 := R-G.
Ind7 – параметр, характеризующий научность сайта.
Ind7 := Sc-GS.
Интегральный вебометрический показатель
Далее, каждый из семи векторов, состоящих из значений соответствующих параметров Ind1 - Ind7, упорядочивается по убыванию значений и для каждого сайта вычисляется сумма индексов его параметров в упорядоченных векторах.
Затем вектор сумм индексов, в свою очередь, упорядочивается по возрастанию значений, и сайт с минимальной суммой индексов получает значение интегрального вебометрического показателя, равное единице, сайт со следующей по значению суммой индексов, – два, и т.д.