Сложность (теория информации)
Информационно-флуктуационная сложность — теоретико-информационная величина, определяемая как флуктуация информации по отношению к информационной энтропии. Она выводится из флуктуаций преобладания порядка и хаоса в динамической системе и используется в различных областях знания для измерения сложности. Теория была представлена в работе Бейтса и Шепарда в 1993 году[1].
Определение
Информационно-флуктуационная сложность дискретной динамической системы является функцией распределения вероятностей состояний этой системы, подвергающейся случайным вводам данных. Цель управления системой с помощью богатого информационного источника, такого как генератор случайных чисел или сигнал белого шума, состоит в том, чтобы исследовать внутреннюю динамику системы почти так же, как при обработке сигналов используется импульс, богатый частотами.
Если система имеет возможных состояний и вероятности состояний известны, то её информационная энтропия равна
где — это собственная информация о состоянии .
Информационно-флуктуационная сложность системы определяется как стандартное отклонение или флуктуация от её среднего значения :
или
Флуктуация информации о состоянии равна нулю в максимально неупорядоченной системе со всеми ; система просто имитирует случайные вводы данных. также равна нулю, когда система идеально упорядочена и имеет только одно фиксированное состояние , независимо от вводов. не равна нулю между этими двумя крайностями, когда возможны как состояния с высокой вероятностью, так и состояния с низкой вероятностью, заполняющие пространство состояний.
Флуктуации информации обеспечивают память и вычисления
По мере развития сложной динамической системы во времени она переходит из одного состояния в другое. То, как происходят эти переходы, зависит от внешних раздражителей нерегулярным образом. В одних случаях система может быть более чувствительной к внешним раздражителям (нестабильной), а в других менее чувствительной (стабильной). Если конкретное состояние имеет несколько возможных следующих состояний, внешняя информация определяет, какое из них будет следующим, и система получает эту информацию, следуя определённой траектории в пространстве состояний. Но если несколько разных состояний ведут к одному и тому же следующему состоянию, то при входе в него система теряет информацию о том, какое состояние ему предшествовало. Таким образом, по мере своего развития во времени сложная система демонстрирует чередующиеся прирост и потерю информации. Чередования или флуктуации информации равносильны запоминанию и забыванию — временному хранению информации или памяти — это существенная особенность нетривиальных вычислений.
Получение или потеря информации, сопутствующие переходам между состояниями, могут быть связаны с собственной информацией о состоянии. Чистый информационный прирост при переходе из состояния в состояние — это информация, полученная при выходе из состояния , за вычетом потери информации при входе в состояние :
Здесь — прямая условная вероятность того, что если текущим состоянием является , то следующим состоянием будет и — обратная условная вероятность того, что если текущим состоянием является , то предыдущим состоянием было . Условные вероятности связаны с вероятностью перехода , вероятностью того, что произойдёт переход из состояния в состояние , посредством :
Устраненив условные вероятности, получим:
Поэтому чистая информация, полученная системой в результате перехода, зависит только от увеличения информации о состоянии от начального до конечного состояния. Можно показать, что это верно даже для нескольких последовательных переходов[1].
Формула напоминает связь между силой и потенциальной энергией. подобна потенциальной энергии , а — силе в формуле . Внешняя информация «толкает» систему «вверх», в состояние с более высоким информационным потенциалом для сохранения памяти, подобно тому, как толкание тела с некоторой массой в гору, в состояние с более высоким гравитационным потенциалом, приводит к накоплению энергии. Количество накопленной энергии зависит только от конечной высоты, а не от пути в гору. Аналогично, объём хранящейся информации не зависит от пути перехода между двумя состояниями. Как только система достигает редкого состояния с высоким информационным потенциалом, она может «упасть» до обычного состояния, потеряв хранившуюся ранее информацию.
Может быть полезным вычислять стандартное отклонение от его среднего значения (которое равно нулю), а именно флуктуацию чистого информационного прироста [1], однако учитывает многопереходные циклы памяти в пространстве состояний и поэтому должно быть более точным индикатором вычислительной мощности системы. Более того, вычислить легче, поскольку переходов может быть намного больше, чем состояний.
Хаос и порядок
Динамическая система, чувствительная к внешней информации (нестабильная), демонстрирует хаотичное поведение, тогда как система, нечувствительная к внешней информации (стабильная), демонстрирует упорядоченное поведение. Под воздействием богатого источника информации сложная система демонстрирует оба варианта поведения, колеблясь между ними в динамическом балансе. Степень флуктуации количественно измеряется с помощью ; она фиксирует чередование преобладания хаоса и порядка в сложной системе по мере её развития во времени.
Пример: вариант элементарного клеточного автомата по правилу 110
Доказано, что вариант элементарного клеточного автомата по правилу 110 способен к универсальным вычислениям. Доказательство основано на существовании и взаимодействии связанных и самосохраняющихся клеточных конфигураций, известных как «планеры» или «космические корабли», явлении эмергентности, которые подразумевают способность групп клеток автомата запоминать, что планер проходит через них. Поэтому следует ожидать, что в пространстве состояний будут возникать петли памяти, в результате чередования получения и потери информации, нестабильности и стабильности, хаоса и порядка.
Рассмотрим группу из трёх смежных ячеек клеточного автомата, которые подчиняются правилу 110: конец-центр-конец. Следующее состояние центральной ячейки зависит от её текущего состояния и конечных ячеек, как указано в правиле:
3-ячеечная группа | 1-1-1 | 1-1-0 | 1-0-1 | 1-0-0 | 0-1-1 | 0-1-0 | 0-0-1 | 0-0-0 |
---|---|---|---|---|---|---|---|---|
следующая ячейка центра | 0 | 1 | 1 | 0 | 1 | 1 | 1 | 0 |
Чтобы рассчитать информационно-флуктуационную сложность этой системы, нужно прикрепить ячейку-драйвер к каждому концу группы из 3 ячеек, чтобы обеспечить случайный внешний стимул, например, драйвер→конец-центр-конец←драйвер, с тем, чтобы правило могло применяться к двум конечным ячейкам. Затем нужно определить, каково следующее состояние для каждого возможного текущего состояния и для каждой возможной комбинации содержимого ячейки-драйвера, чтобы вычислить прямые условные вероятности.
Диаграмма состояний этой системы изображена ниже. В ней кружки представляют состояния, а стрелки — переходы между состояниями. Восемь состояний этой системы, от 1-1-1 до 0-0-0 пронумерованы десятичными эквивалентами 3-битного содержимого группы из 3 ячеек: от 7 до 0. Возле стрелок переходов показаны значения прямых условных вероятностей. На схеме видна изменчивость в расхождении и схождении стрелок, что соответствует изменчивости в хаосе и порядке, чувствительности и нечувствительности, приобретении и потере внешней информации от ячеек-драйверов.

Прямые условные вероятности определяются пропорцией возможного содержимого ячейки-драйвера, что управляет конкретным переходом. Например, для четырёх возможных комбинаций содержимого двух ячеек-драйверов состояние 7 приводит к состояниям 5, 4, 1 и 0, поэтому , , и составляют 1/4 или 25 %. Аналогично, состояние 0 приводит к состояниям 0, 1, 0 и 1, поэтому и соответствуют 1/2 или 50 %. И так далее.
Вероятности состояния связаны формулой
- и
Эти линейные алгебраические уравнения могут быть решены вручную или с помощью компьютерной программы для вероятностей состояний, со следующими результатами:
p0 | p1 | p2 | p3 | p4 | p5 | p6 | p7 |
2/17 | 2/17 | 1/34 | 5/34 | 2/17 | 2/17 | 2/17 | 4/17 |
Информационная энтропия и сложность могут быть рассчитаны из вероятностей состояния:
- бита,
- бита.
Следует отметить, что максимально возможная энтропия для восьми состояний равна бита, что соответствует случаю, когда все восемь состояний одинаково вероятны, с вероятностями 1/8 (хаотичность). Следовательно, правило 110 имеет относительно высокую энтропию или использование состояния в 2,86 бит. Однако, это не исключает существенную флуктуацию информации о состоянии по отношению к энтропии и, следовательно, высокую величину сложности. Тогда как максимальная энтропия исключила бы сложность.
Для получения вероятностей состояния в случае, когда аналитический метод, описанный выше, неосуществим, может быть использован альтернативный метод. Он состоит в том, чтобы управлять системой через её входы (ячейки-драйверы) с помощью случайного источника в течение многих поколений и наблюдать за вероятностями состояния эмпирически. Когда это сделано с помощью компьютерного моделирования для 10 миллионов поколений, результаты выглядят следующим образом:[2]
количество ячеек | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 |
---|---|---|---|---|---|---|---|---|---|---|---|
(бит) | 2.86 | 3.81 | 4.73 | 5.66 | 6.56 | 7.47 | 8.34 | 9.25 | 10.09 | 10.97 | 11.78 |
(бит) | 0.56 | 0.65 | 0.72 | 0.73 | 0.79 | 0.81 | 0.89 | 0.90 | 1.00 | 1.01 | 1.15 |
0.20 | 0.17 | 0.15 | 0.13 | 0.12 | 0.11 | 0.11 | 0.10 | 0.10 | 0.09 | 0.10 |
Поскольку оба параметра, и , возрастают с увеличением размера системы, для лучшего сравнения систем разных размеров предложено безразмерное соотношение , относительная Информационно-флуктуационная сложность. Заметим, что эмпирические и аналитические результаты согласуются для 3-клеточного автомата.
В работе Бейтса и Шепарда[1] вычисляется для всех правил элементарных клеточных автоматов, и было замечено, что те из них, которые демонстрируют медленно движущиеся «планеры» и, возможно, стационарные объекты, например, правило 110, тесно связаны с большими значениями . Поэтому можно использовать в качестве фильтра при выборе правил, способных к универсальному вычислению, что утомительно доказывать.
Применения
Хотя вывод формулы информационно-флуктуационной сложности основан на флуктуациях информации в динамической системе, сама формула зависит только от вероятностей состояний и поэтому может быть также применена для любого распределения вероятностей, включая те, которые получены из статических изображений или текста.
На протяжении многих лет на оригинальную статью[1] ссылались исследователи из множества различных областей: теория сложности[3], наука о сложных системах[4], хаотическая динамика[5], инженерия окружающей среды[6], экологическая сложность[7], экологический анализ временных рядов[8], устойчивость экосистем[9], загрязнение воздуха[10] и воды[11], гидрологический вейвлет анализ[12], моделирование потоков воды в почве[13], влажность почвы[14], сток в водосборах[15], глубина подземных вод[16], управление воздушным движением[17], рисунок потоков[18], топология[19], рыночное прогнозирование цен на металлы[20] и электричество[21], информатика здоровья[22], человеческое познание[23], кинематика походки человека[24], неврология[25], анализ ЭЭГ[26], анализ речи[27], образование[28], инвестирование[29], эстетика[30].
Ссылки
- John E. Bates, Harvey K. Shepard. Measuring complexity using information fluctuation (англ.) // Physics Letters A. — 1993-01-18. — Vol. 172, iss. 6. — P. 416–425. — ISSN 0375-9601. — doi:10.1016/0375-9601(93)90232-O.
- Bates, John E. Measuring complexity using information fluctuation: a tutorial . Research Gate (30 марта 2020).
- Harald Atmanspacher. Cartesian cut, Heisenberg cut, and the concept of complexity // World Futures. — 1997-09-01. — Т. 49, вып. 3—4. — С. 333–355. — ISSN 0260-4027. — doi:10.1080/02604027.1997.9972639.
- Cosma Rohilla Shalizi. Methods and Techniques of Complex Systems Science: An Overview (англ.) // Complex Systems Science in Biomedicine / Thomas S. Deisboeck, J. Yasha Kresh. — Boston, MA: Springer US, 2006. — P. 33–114. — ISBN 978-0-387-33532-2. — doi:10.1007/978-0-387-33532-2_2.
- Renate Wackerbauer. Noise-induced stabilization of the Lorenz system // Physical Review E. — 1995-11-01. — Т. 52, вып. 5. — С. 4745–4749. — doi:10.1103/PhysRevE.52.4745.
- Singh, Vijay P. Entropy Theory and its Application in Environmental and Water Engineering : [англ.]. — John Wiley & Sons, 2013-01-10. — ISBN 978-1-118-42860-3.
- Parrott, Lael (2010-11-01). “Measuring ecological complexity”. Ecological Indicators [англ.]. 10 (6): 1069—1076. DOI:10.1016/j.ecolind.2010.03.014. ISSN 1470-160X.
- Holger Lange. Time-series Analysis in Ecology (англ.) // eLS. — American Cancer Society, 2006. — ISBN 978-0-470-01590-2. — doi:10.1038/npg.els.0003276.
- Wang, Chaojun; Zhao, Hongrui (2019-04-18). “Analysis of remote sensing time-series data to foster ecosystem sustainability: use of temporal information entropy”. International Journal of Remote Sensing. 40 (8): 2880—2894. DOI:10.1080/01431161.2018.1533661. ISSN 0143-1161.
- Klemm, Otto; Lange, Holger (1999-12-01). “Trends of air pollution in the Fichtelgebirge Mountains, Bavaria”. Environmental Science and Pollution Research [англ.]. 6 (4): 193—199. DOI:10.1007/BF02987325. ISSN 1614-7499.
- Wang, Kang; Lin, Zhongbing (2018). “Characterization of the nonpoint source pollution into river at different spatial scales”. Water and Environment Journal [англ.]. 32 (3): 453—465. DOI:10.1111/wej.12345. ISSN 1747-6593.
- Labat, David (2005-11-25). “Recent advances in wavelet analyses: Part 1. A review of concepts”. Journal of Hydrology [англ.]. 314 (1): 275—288. DOI:10.1016/j.jhydrol.2005.04.003. ISSN 0022-1694.
- Pachepsky, Yakov; Guber, Andrey; Jacques, Diederik; Simunek, Jiri; Van Genuchten, Marthinus Th.; Nicholson, Thomas; Cady, Ralph (2006-10-01). “Information content and complexity of simulated soil water fluxes”. Geoderma. Fractal Geometry Applied to Soil and Related Hierarchical Systems - Fractals, Complexity and Heterogeneity [англ.]. 134 (3): 253—266. DOI:10.1016/j.geoderma.2006.03.003. ISSN 0016-7061.
- Kumar, Sujay V.; Dirmeyer, Paul A.; Peters-Lidard, Christa D.; Bindlish, Rajat; Bolten, John (2018-01-01). “Information theoretic evaluation of satellite soil moisture retrievals”. Remote Sensing of Environment [англ.]. 204: 392—400. DOI:10.1016/j.rse.2017.10.016. HDL:2060/20180003069. ISSN 0034-4257.
- Hauhs, Michael; Lange, Holger (2008). “Classification of Runoff in Headwater Catchments: A Physical Problem?”. Geography Compass [англ.]. 2 (1): 235—254. DOI:10.1111/j.1749-8198.2007.00075.x. ISSN 1749-8198.
- Liu, Meng; Liu, Dong; Liu, Le (2013-09-01). “Complexity research of regional groundwater depth series based on multiscale entropy: a case study of Jiangsanjiang Branch Bureau in China”. Environmental Earth Sciences [англ.]. 70 (1): 353—361. DOI:10.1007/s12665-012-2132-y. ISSN 1866-6299.
- Xing, Jing; Manning, Carol A. (April 2005). “Complexity and Automation Displays of Air Traffic Control: Literature Review and Analysis” [англ.].
- Wang, Kang; Li, Li (November 2008). “Characterizing Heterogeneous Flow Patterns Using Information Measurements”. 2008 First International Conference on Intelligent Networks and Intelligent Systems: 654—657. DOI:10.1109/ICINIS.2008.110.
- Javaheri Javid, Mohammad Ali; Alghamdi, Wajdi; Zimmer, Robert & al-Rifaie, Mohammad Majid (2016), Bi, Yaxin; Kapoor, Supriya & Bhatia, Rahul, eds., A Comparative Analysis of Detecting Symmetries in Toroidal Topology, Studies in Computational Intelligence, Springer International Publishing, с. 323–344, ISBN 978-3-319-33386-1, doi:10.1007/978-3-319-33386-1_16, <https://doi.org/10.1007/978-3-319-33386-1_16>. Проверено 7 апреля 2020.
- He, Kaijian; Lu, Xingjing; Zou, Yingchao; Keung Lai, Kin (2015-09-01). “Forecasting metal prices with a curvelet based multiscale methodology”. Resources Policy [англ.]. 45: 144—150. DOI:10.1016/j.resourpol.2015.03.011. ISSN 0301-4207.
- He, Kaijian; Xu, Yang; Zou, Yingchao; Tang, Ling (2015-05-01). “Electricity price forecasts using a Curvelet denoising based approach”. Physica A: Statistical Mechanics and its Applications [англ.]. 425: 1—9. DOI:10.1016/j.physa.2015.01.012. ISSN 0378-4371.
- Mosabber Uddin Ahmed. Complexity Analysis in Health Informatics (англ.) // Signal Processing Techniques for Computational Health Informatics / Md Atiqur Rahman Ahad, Mosabber Uddin Ahmed. — Cham: Springer International Publishing, 2021. — P. 103–121. — ISBN 978-3-030-54932-9. — doi:10.1007/978-3-030-54932-9_4.
- Shi Xiujian; Sun Zhiqiang; Li Long; Xie Hongwei. “Human Cognitive Complexity Analysis in Transportation Systems”. Logistics. Proceedings: 4361—4368. DOI:10.1061/40996(330)637.
- Zhang, Shutao; Qian, Jinwu; Shen, Linyong; Wu, Xi; Hu, Xiaowu (October 2015). “Gait complexity and frequency content analyses of patients with Parkinson's disease”. 2015 International Symposium on Bioelectronics and Bioinformatics (ISBB): 87—90. DOI:10.1109/ISBB.2015.7344930.
- Wang, Jisung; Noh, Gyu-Jeong; Choi, Byung-Moon; Ku, Seung-Woo; Joo, Pangyu; Jung, Woo-Sung; Kim, Seunghwan; Lee, Heonsoo (2017-07-13). “Suppressed neural complexity during ketamine- and propofol-induced unconsciousness”. Neuroscience Letters [англ.]. 653: 320—325. DOI:10.1016/j.neulet.2017.05.045. ISSN 0304-3940.
- Michał Bola, Paweł Orłowski, Martyna Płomecka, Artur Marchewka. EEG signal diversity during propofol sedation: an increase in sedated but responsive, a decrease in sedated and unresponsive subjects (англ.) // bioRxiv. — 2019-01-30. — P. 444281. — doi:10.1101/444281.
- Fan Yingle; Wu Chuanyan; Li Yi; Pang Quan (2006-12-15). “Study on the Application of Fluctuation Complexity Measurement in Speech Endpoint Detection”. Aerospace Medicine and Medical Engineering. 19 (6). ISSN 1002-0837.
- Dilger, Alexander (2012-01-01). “Endogenous complexity, specialisation and general education”. On the Horizon. 20 (1): 49—53. DOI:10.1108/10748121211202062. ISSN 1074-8121.
- Ivanyuk, Vera Alekseevna Динамическая модель управления стратегическим инвестиционным портфелем . elibrary.ru (2015).
- Javid, Mohammad Ali Javaheri; Blackwell, Tim; Zimmer, Robert; al-Rifaie, Mohammad Majid (2016). Johnson, Colin; Ciesielski, Vic; Correia, João; Machado, Penousal, eds. “Correlation Between Human Aesthetic Judgement and Spatial Complexity Measure”. Evolutionary and Biologically Inspired Music, Sound, Art and Design. Lecture Notes in Computer Science [англ.]. Cham: Springer International Publishing: 79—91. DOI:10.1007/978-3-319-31008-4_6. ISBN 978-3-319-31008-4.