Методология


Нас вдохновил Р-индекс журнала «Экономист» (показывает частоту упоминания слова «Рецессия» в финансовых журналах и газетах) и Индекса Цен Google, Google Price Index, GPI (аналог Consumer Price Index, CPI; GPI показывает уровень цен на товары в системе электронной коммерции).

Мы решили создать индекс, показывающий уровень финансовых ожиданий ключевых стран мира и банков Российской Федерации на основе публикуемой в сети информации.

Мы предлагаем три варианта индексации: «Негативный» (Negative Index), «Позитивный/Негативный» (Positive/Negative Index) и «Нейтральный» (Neutral Index) рассчитываемые по следующим формулам:

Negative Index = Negative Keywords / Main Keyword

Positive/Negative Index = Positive Keywords / Negative Keywords

Neutral Index = ABS(Positive Keywords – Negative Keywords) / ABS(Main Keyword – Positive Keywords – Negative Keywords)

где, Main Keyword – количество упоминаний страны/банка (название) в поисковых системах;
Positive Keywords – количество упоминаний в поисковых системах ключевых слов о стране/банке в положительном контексте;
Negative Keywords – количество упоминаний в поисковых системах ключевых слов о стране/банке в негативном контексте.

В нижеприведенной таблице представлен набор ключевых слов, используемых в запросах поисковых систем. Ключевые слова Main Keyword дают количество всех упоминаний в выбранной сфере наблюдения. Представленные ключевые слова Negative Keywords и Positive Keywords наиболее точно отражают ситуацию с банком/страной в негативном и в позитивном ключе соответственно.

Индекс слухов по странам Индекс слухов по банкам
Main Keyword Экономика Название банка
Negative Keywords Экономика спад;
Экономика рецессия
Название банка проблема
Positive Keywords Экономика бум;
Экономика восстановление
Название банка прибыль

Для индекса по странам в целях получения более релевантного результата, возвращаемого поисковыми системами, ключевые слова «рецессия», «спад», «восстановление» и «бум» в запросе пишутся на языке выбранной страны. Дополнительно в настройках поисковых систем указываются страна-регион поиска. При этом необходимо отметить, что данные ключевые слова имеют несколько лексических значений и употребляются не только в области экономики. Поэтому для получения данных, соответствующих сфере наблюдения, мы в строке запроса поисковой системы вместе с ключевым словом включаем слово «Экономика» на языке выбранной страны: «спад»+«экономика», «рецессия»+«экономика» и т.д.

Значения индексов по странам делятся на их максимальные значения внутри страны или всех стран за всю историю (с 2001 года по н. в.). Дополнительно в индексе по странам включены две базы сравнения для каждого варианта индексации: «Внутри страны» и «По всем странам». «Внутри страны» позволяет пользователю отслеживать динамику финансовых ожиданий соответствующего варианта индексации в пределах одной страны. «По всем странам» – на фоне мирового показателя.

Агрегирование данных производится ежемесячно. В начале каждого месяца запрашиваются данные за прошедший месяц. Расчёт индексов всех вариаций производится по ежемесячным и ежегодным кварталам.

Необходимо отметить о наличии возможных погрешностей некоторых результатов, выдаваемых поисковыми системами, поскольку обрабатывается огромный массив, практически неструктурированных, данных (на некоторых сайтах не помечаются даты публикации материалов). И все же, мы запустили проект, регулярно собираем данные и делаем все возможное, чтобы улучшить нашу методологию и согласованность временного ряда.