Выявление факторов воздействия на сектор связи и телекоммуникаций с применением ансамблевых методов машинного обучения
Актуальность. Сектор связи и телекоммуникаций играет одну из ключевых ролей в развитии экономики. В связи с этим особенно важным становится определение факторов, оказывающих на него воздействие. При исследовании российского рынка является существенным учет неоднородности развития регионов. Целью исследования выступает моделирование деятельности сектора телекоммуникаций и связи и выявление факторов, которые оказывают воздействие на него, с учетом региональной специфики. Методы. Эмпирическую базу данного исследования составили данные официальной статистической отчетности по 85 субъектам Российской Федерации поквартально за 2017–2023 гг. В качестве результирующей переменной взяты доходы от услуг связи, независимых переменных – объем информации, переданной от/к абонентам при доступе в интернет; индексы тарифов на услуги связи для юридических лиц; среднесписочная численность работников в сфере телекоммуникаций; базовый индекс потребительских цен на товары и услуги; среднемесячная заработная плата работников в экономике; почтовые переводы. С использованием языка программирования Python построены модели линейной регрессии, Ridge, Bagging, RandomForestRegressor, GradientBoostingRegressor и XGBRegressor. Для интерпретации результатов ансамблевых методов использован метод SHAP. Результаты. Анализ подтверждает неравномерное развитие сектора связи и телекоммуникаций в рамках субъектов страны. Среди построенных моделей наилучший результат достигнут с применением GradientBoostingRegressor, а анализ SHAP-значений выявил влияние на доходы от услуг связи различных факторов, таких как повышение среднемесячной зарплаты, увеличение объема информации (трафика), индексы тарифов услуг связи для юридических лиц, а также негативное влияние на них базового индекса потребительских цен и незначительное – почтовых переводов. Выводы. Выявление факторов, оказывающих воздействие на сектор связи и телекоммуникаций в условиях российской экономики, является важным и имеет как теоретическую, так и практическую значимость. Так, полученные результаты могут быть использованы для различных целей: стратегического планирования, оптимизации инвестиций, государственного регулирования, маркетинга и продаж, прогнозирования и планирования. Направления дальнейших исследований. Несмотря на то, что качество модели с учетом количества рассмотренных наблюдений представляется вполне высоким, в полученных моделях можно видеть некоторое переобучение, для устранения которого с целью проведения дальнейших исследований целесообразно при генерировании выборки добавлять значения наблюдений за новые периоды. Кроме того, целесообразным представляется генерировать нейронные сети для получения еще более точных оценок влияния различных факторов на сектор связи и телекоммуникаций, а также для получения более точных прогнозных оценок.