Возможности интеграции Google Trends и официальной статистики при оценке социальной комфортности и прогнозировании финансового положения населения
https://doi.org/10.26794/2587-5671-2021-25-5-215-234
Аннотация
Целью исследования является развитие теории статистического наблюдения в части научно-методологических подходов к обработке больших данных и определение возможностей интеграции информационных ресурсов различного типа в отношении измерения сложных латентных категорий (на примере социальной комфортности), применение данного опыта на практике посредством использования в прогнозировании индикаторов финансового состояния. Авторами построена модель социальной комфортности, в которой выбор весов для ее компонентов осуществляется на основе метода модифицированной главной компоненты. Оценка произведена с использованием данных Google Trends и официальной статистики. Методы анализа данных Google Trends базируются на разработке комплексного подхода к семантическому поиску информации о компонентах социальной комфортности, снижающего долю авторского субъективизма; методологии первичной обработки с учетом принципов сопоставимости, однородности, согласуемости, релевантности, описание функций и моделей, необходимых для отбора и корректировки поисковых запросов. Предложенный алгоритм работы с большими данными позволил определить компоненты социальной комфортности («Образование и обучение», «Безопасность», «Отдых и свободное время»), по которым необходимо произвести непосредственное встраивание больших данных в систему первичного статистического учета с дальнейшей обработкой данных и получением композитных показателей. Сделан вывод, что по компоненте «Финансовое положение» найдена устойчивая значимая корреляция, что позволяет использовать ее для дальнейших расчетов и экстраполяции показателей финансового состояния. Научная новизна состоит в разработке принципов и направлений интеграции двух альтернативных источников данных в оценке сложных латентных категорий. Полученные выводы и результаты интегральной оценки социальной комфортности могут быть использованы органами государственной статистики по формированию нового вида непрерывного статистического наблюдения на основе использования больших данных, а также исполнительной власти на федеральном, региональном и муниципальном уровнях в части определения приоритетов разрабатываемой социально-экономической политики.
Ключевые слова
JEL: I10, I12, C53, C55
Об авторах
М. В. ШаклеинаРоссия
Марина Владиславовна Шаклеина — кандидат экономических наук, доцент
Москва
М. И. Волкова
Россия
Мария Игоревна Волкова — кандидат экономических наук, лаборатория «Моделирование социально-экономических систем»
Москва
К. И. Шаклеин
Россия
Константин Игоревич Шаклеин — кандидат экономических наук, главный специалист Департамента экономики
Москва
С. Р. Якиро
Россия
Станислав Ростилавович Якиро — главный специалист Дирекции по рискам и анализу экономической эффективности
Москва
Список литературы
1. Liu J., Li J., Li W., Wu J. Rethinking big data: A review on the data quality and usage issues. ISPRS Journal of Photogrammetry and Remote Sensing. 2016;115:134–142. DOI: 10.1016/j.isprsjprs.2015.11.006
2. Algan Y., Beasley E., Guyot F., Higa K., Murtin F., Senik C. Big data measures of well-being: Evidence from a Google well-being index in the United States. OECD Statistics Working Papers. 2016;(03). URL: https://www.oecd-ilibrary.org/docserver/5jlz9hpg0rd1-en.pdf?expires=1629818036&id=id&accname=guest&checksum=7ED 855395D 5B 778D 71E 405ED 1925ECE 3
3. Фантаццини Д., Шаклеина М.В., Юрас Н.А. Big Data в определении социального самочувствия населения России. Прикладная эконометрика. 2018;50:43–66.
4. Carlquist E., Nafstad H.E., Blakar R.M., Ulleberg P., Delle Fave A., Phelps J.M. Well-being vocabulary in media language: An analysis of changing word usage in Norwegian newspapers. The Journal of Positive Psychology. 2017;12(2):99–109. DOI: 10.1080/17439760.2016.1163411
5. Curini L., Iacus S., Canova L. Measuring idiosyncratic happiness through the analysis of Twitter: An application to the Italian case. Social Indicators Research. 2015;121(2):525–542. DOI: 10.1007/s11205–014–0646–2
6. Prata D.N., Soares K.P., Silva M.A., Trevisan D.Q., Letouze P. Social data analysis of Brazilian’s mood from Twitter. International Journal of Social Science and Humanity. 2016;6(3):179–183. DOI: 10.7763/IJSSH.2016.V6.640
7. Nguyen Q.C., Kath S., Meng H.-W., Li D., Smith K.R., VanDerslice J.A., Wen M., Li F. Leveraging geotagged Twitter data to examine neighborhood happiness, diet, and physical activity. Applied Geography. 2016;73(8):77–88. DOI: 10.1016/j.apgeog.2016.06.003
8. Yang C., Srinivasan P. Life satisfaction and the pursuit of happiness on Twitter. PLoS ONE. 2016;11(3): e0150881. DOI: 10.1371/journal.pone.0150881
9. Wang W., Hernancez I., Newman D.A., He J., Bian J. Twitter analysis: Studying US weekly trends in work stress and emotion. Applied Psychology. 2016;65(2):355–378. DOI: 10.1111/apps.12065
10. Liu P., Tov W., Kosinski M., Stillwell D.J., Qui L. Do Facebook status updates reflect subjective well-being? Cyberpsychology, Behavior, and Social Networking. 2015;18(7):373–379. DOI: 10.1089/cyber.2015.0022
11. LiKamWa R., Liu Y., Lane N. D., Zhong L. MoodScope: Building a mood sensor from smartphone usage patterns. In: Proc. 11th Annu. int. conf. on mobile systems, applications, and services (MobiSys). (Taipei, June 25–28). New York: ACM; 2013:389–402. DOI: 10.1145/2462456.2464449
12. Schwartz H.A., Sap M., Kern M. L., Eichstaedt J. C., Kapelner A., Agrawal M., Ungar L. H. et al. Predicting individual well-being through the language of social media. In: Proc. Pacifc symp. on biocomputing (PSB). (Big Island of Hawaii, Jan. 4–8, 2016). Singapore: World Scientifc Publishing Co.; 2016:516–527.
13. Da Z., Engelberg J., Gao P. The sum of all FEARS investor sentiment and asset prices. The Review of Financial Studies. 2015;28(1):1–32. DOI: 10.1093/rfs/hhu072
14. Singer E. The use of incentives to reduce nonresponse in household surveys. The University of Michigan. Survey Methodology Program. 2002;(051). URL: https://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.611.1597&rep=rep1&type=pdf
15. Ginsberg J., Mohebbi M.H., Patel R.S., Brammer L., Smolinski M.S., Brilliant L. Detecting influenza epidemics using search engine query data. Nature. 2009;457(7232):1012–1014. DOI: 10.1038/nature07634
16. Упадхьяя Ш. Большие данные и официальная статистика. Вопросы статистики. 2019;26(12):5–14. DOI: 10.34023/2313–6383–2019–26–12–5–14
17. Оксенойт Г.К. Цифровая повестка, большие данные и официальная статистика. Вопросы статистики. 2018;25(1):3–16.
18. Плеханов Д.А. Большие данные и официальная статистика: обзор международной практики внедрения новых источников данных. Вопросы статистики. 2017;(12):49–60.
19. Шаклеина М.В., Волкова М.И., Шаклеин К.И., Якиро С.Р. Теоретические и методологические проблемы измерения социальной комфортности: результаты эмпирического анализа на российских данных. Экономические и социальные перемены: факты, тенденции, прогноз. 2020;13(5):135–152. DOI: 10.15838/esc.2020.5.71.8
20. Петрова Д.А. Прогнозирование инфляции на основе интернет-запросов. Экономическое развитие Рос сии. 2019;26(11):55–62.
21. Guzmán G. Internet search behavior as an economic forecasting tool: The case of inflation expectations. Journal of Economic and Social Measurement. 2011;36(3):119–167. DOI: 10.3233/JEM-2011–0342
22. Afkhami M., Cormack L., Ghoddusi H. Google search keywords that best predict energy price volatility. Energy Economics. 2017;67:17–27. DOI: 10.1016/j.eneco.2017.07.014
23. Tetlock P. C. Giving content to investor sentiment: The role of media in the stock market. The Journal of Finance. 2007;62(3):1139–1168. DOI: 10.1111/j.1540–6261.2007.01232.x
24. Brochado A. Google search-based sentiment indexes. IIMB Management Review. 2020;32(3):325–335. DOI: 10.1016/j.iimb.2019.10.015
25. Dunphy D. C., Bullard C. G., Crossing E. E.M. Validation of the general inquirer Harvard IV dictionary. Cambridge, MA: Harvard University Library; 1974. 158 p.
26. Kelly E.F., Stone P.J. Computer recognition of English word senses. Amsterdam: North-Holland; 1975. 269 p.
27. Zuell C., Weber R.P., Mohler P.P. Computer-aided text classifcation for the social sciences: The General Inquirer III. Mannheim: ZUMA, Center for Surveys, Research and Methodology; 1989.
28. Scott S.L., Varian H.R. Bayesian variable selection for nowcasting economic time series. NBER Working Paper. 2013;(19567). URL: https://www.nber.org/system/fles/working_papers/w19567/w19567.pdf
29. Kapounek S., Deltuvaitė V., Koráb P. Determinants of foreign currency savings: Evidence from Google search data. Procedia — Social and Behavioral Sciences. 2016;220:166–176. DOI: 10.1016/j.sbspro.2016.05.481
30. Bokelmann B., Lessmann S. Spurious patterns in Google Trends data — An analysis of the effects on tourism demand forecasting in Germany. Tourism Management. 2019;75:1–12. DOI: 10.1016/j.tourman.2019.04.015
31. Google Trends help — how Trends data is adjusted. Google 2018. URL: https://support.google.com/trends/answer/4365533?hl=en&ref_topic=6248052 (accessed on 23.04.2018).
32. Cleveland R.B., Cleveland W.S., McRae J.E., Terpenning I. STL: A seasonal-trend decomposition procedure based on loess. Journal of Offcial Statistics. 1990;6(1):3–73. URL: https://www.wessa.net/download/stl.pdf
33. Петрова Д.А., Трунин П.В. Выявление настроений экономических агентов на основе поисковых запросов. Прикладная эконометрика. 2020;(3):71–87. DOI: 10.22394/1993–7601–2020–59–71–87
34. Parker J., Cuthbertson C., Loveridge S., Skidmore M., Dyar W. Forecasting state-level premature deaths from alcohol, drugs, and suicides using Google Trends data. Journal of Affective Disorders. 2017;213:9–15. DOI: 10.1016/j.jad.2016.10.038
35. Айвазян С.А. Анализ качества и образа жизни населения. М.: Наука; 2012. 432 с.
36. Миндели Л.Э., Пашинцева Н.И. Российская система образования и ее отражение в статистике. Вопросы статистики. 2016;(11):67–84.
37. Chan K.L. Intelligence Capital Index. 2017. URL: http://www.kailchan.ca/wp-content/uploads/2017/04/KC_Intelligence-Capital-Index-full-results-and-methodology_Apr-2017_v2.pdf
38. Сатаров Г.А., Благовещенский Ю.Н. Статистическое сравнение России и других стран. Комитет гражданских инициатив. Фонд ИНДЕМ. URL: https://komitetgi.ru/upload/iblock/3cf/3cfcb375eced922f253c446a4b37645b.pdf
39. Иншаков С.М. Теоретические основы исследования и анализа латентной преступности. М.: ЮНИТИДАНА; 2011. 839 c.
Рецензия
Для цитирования:
Шаклеина М.В., Волкова М.И., Шаклеин К.И., Якиро С.Р. Возможности интеграции Google Trends и официальной статистики при оценке социальной комфортности и прогнозировании финансового положения населения. Финансы: теория и практика/Finance: Theory and Practice. 2021;25(5):215-234. https://doi.org/10.26794/2587-5671-2021-25-5-215-234
For citation:
Shakleinaa M.V., Volkova M.I., Shaklein K.I., Yakiro S.R. Prospects for the Integration of Google Trends Data and Official statistics to Assess social Comfort and Predict the Financial situation of the Population. Finance: Theory and Practice. 2021;25(5):215-234. https://doi.org/10.26794/2587-5671-2021-25-5-215-234