Этот репозиторий воспроизводит результаты работы "Социальные связи и взгляды в Европе". Все интересующие вопросы можно задать авторам работы: Семен Жижерин ([email protected]), Данила Кочнев ([email protected]).
Наше исследование существенным образом опирается на статью Bailey et al. (2020) The Determinants of Social Connectedness in Europe. Мы используем данные, собранные авторами этой статьи и доступные в их репозитории.
Все результаты работы можно воспроизвести, запустив скрипты из папки regressions
. Каждый скрипт соответствует одной из рассматриваемых в работе зависимых переменных. В репозитории приведён весь основной код, позволяющий получить промежуточные и финальные наборы данных, однако отсутствуют изначальные, необработанные данные, взятые из открытых источников. Эти данные можно получить при помощи ссылок из файла data_sources_and_description.xlsx
, который находится в папке data_description
.
Репозиторий имеет следующую структуру:
create_intermediate_data
- скрипты для созданияintermediate_data
create_plots
- скрипты для создания графиковdata_description
- описание данных и их источникиfinal_data
- финальные наборы данных для регрессийintermediate_data
- промежуточные наборы данных и пространственные матрицыplots
- графикиpredict_SCI
- ML модели, предсказывающие SCI при помощи взглядов и предпочтенийregressions
- скрипты для регрессионного анализаcreate_final_data.R
- скрипт для созданияfinal_data
Отметим, что в начале каждого скрипта указаны его Inputs и Outputs. В случае, когда в Inputs присутствует какой-либо файл из папок raw_data
и borrowed_raw_data
, скрипт не будет корректно работать, если не воспроизвести эти папки и их содержимое при помощи файла data_sources_and_description.xlsx
. Также мы готовы поделиться этими папками, если интересующиеся свяжутся с нами по электронной почте.
This repository reproduces the study "Social Connections and Views in Europe". If you happen to have any questions, please do not hesitate to contact the authors: Semen Zhizherin ([email protected]), Danila Kochnev ([email protected]).
Our research draws heavily on the paper by Bailey et al. (2020) The Determinants of Social Connectedness in Europe. We use the data collected by the authors of this article and available in their repository.
All results of the study can be reproduced by running scripts from the regressions
folder. Each script corresponds to one of the dependent variables considered in the work. The repository contains all the main code that allows you to get intermediate and final data sets, but there is no initial, raw data taken from open sources. This data can be obtained using links from the file data_sources_and_description.xlsx
, which is located in the folder data_description
.
The repository has the following structure:
create_intermediate_data
- scripts that createintermediate_data
create_plots
- scripts that create plotsdata_description
- data description and sourcesfinal_data
- final regression datasetsintermediate_data
- intermediate datasets and spatial matricesplots
- plotspredict_SCI
- ML models that predict SCI using views and preferencesregressions
- scripts for regression analysiscreate_final_data.R
- script that createsfinal_data
Note that at the beginning of each script its Inputs and Outputs are indicated. In the case when any file from the raw_data
and borrowed_raw_data
folders is present in Inputs, the script will not work correctly if you do not reproduce these folders and their contents using the data_sources_and_description.xlsx
file. Also we are ready to share these folders if those interested will contact us via email.