У данiй роботi розглянуто проблему кластеризацiї на графах на основi власних значень стохастичної матрицi графа. Доведено, що власнi значення стохастичної матрицi для великих графiв $(N > 100)$ подiляються на три групи, одна iз яких є визначальною для числа кластерiв у графi. Використовуючи теорiю випадкових матриць, вдалося показати, що асимптотичний розподiл пiдгрупи дiйсних частин власних значень стохастичної матрицi графу описується напiвколовим розподiлом Вiгнера, причому параметр даного розподiлу є $O (\frac{1}{\sqrt{N}})$.Використання стохастичних матриць дало змогу точно локалiзувати власнi значення, що вiдповiдають за кiлькiсть кластерiв, чого не вдавалося зробити для матриць сумiжностi. Основнi припущення моделi пов’язанi з властивостями дискретних ланцюгiв Маркова, що дозволяє розширити область застосування отриманих результатiв на бiльш ширший клас об’єктiв. Теоретичнi результати перевiренi на кластеризацiї часових рядiв, що описують вартостi $N = 470$ акцiй S&P500 в перiод 2013 –2018 рр. Результати кластеризацiї даних часових рядiв показали наявнiсть 5 чiтко виражених груп, якi узгоджується із використаними даними.
[1] Bagherikaram G., Motahari A., Khandani A. The Secrecy Capacity Region of the Gaussian MIMO Broadcast Channel. Information Theory 2013, 59, 2673-2682. doi:10.1109/TIT.2012.2236972.
[2] Bai Z., Fang Z., Liang Y. Spectral Theory of Large Dimensional Random Matrices and Its Applications to Wireless Communications and Finance Statistics : Random Matrix Theory and Its Applications, World Scientific Publishing Company, 2014.
[3] Bender E.A., Williamson S.G. Lists, Decisions and Graphs - With an Introduction to Probability. University of California at San Diego, San Diego, 2010.
[4] Biely С., Thurner S. Random matrix ensembles of time-lagged correlation matrices: Derivation of eigenvalue spectra and analysis of financial time-series. Quantitative Finance 2008. 8, 705-722. doi:10.1080/14697680701691477.
[5] Bolch G., Greiner S., Meer H., Trivedi K. Queueing Networks and Markov Chains. John Wiley, 2nd edition 2006, 40 (5), 567-568. doi:10.1080/07408170701623187.
[6] Crisan D., Del Moral P., Lyons T. Discrete filtering using branching and interacting particle systems. Markov Processes and Related Fields 1999, 5 (4), 293-318.
[7] Dongen S. Graph Clustering by Flow Simulation. PhD thesis, University of Utrecht, 2000.
[8] Girvan M., Newman M. Community structure in social and biological networks. Proc. Natl Acad. Sci. USA 2002, 99 (12), 7821-7826. doi:10.1073/pnas.122653799
[9] Qiu R., Antonik P. Smart Grid using Big Data Analytics. A Random Matrix Theory Approach. Wiley Online Library, 2017.
[10] Knignitska T.V. Estimate of time series similarity based on models. Problems of Control and Informatics 2019, 51 (4), 94-104.
[11] Marchenko V.A., Pastur L.A. Distribution of eigenvalues for some sets of random matrices. Mat. Sb. N.S. 1967, 72 (114) (4), 507--536.
- ACS Style
- Малик , І.В.; Кнігніцька , Т.В.; Горбатенко, М.Ю. Кластеризацiя: марковський алгоритм. Буковинський математичний журнал. 2019, 7 https://doi.org/https://doi.org/10.31861/bmj2019.02.059
- AMA Style
- Малик ІВ, Кнігніцька ТВ, Горбатенко МЮ. Кластеризацiя: марковський алгоритм. Буковинський математичний журнал. 2019; 7(2). https://doi.org/https://doi.org/10.31861/bmj2019.02.059
- Chicago/Turabian Style
- Ігор Володимирович Малик , Тетяна Василівна Кнігніцька , Микола Юрійович Горбатенко. 2019. "Кластеризацiя: марковський алгоритм". Буковинський математичний журнал. 7 вип. 2. https://doi.org/https://doi.org/10.31861/bmj2019.02.059