Номер 12(69) декабрь 2015 года | |
Эдуард Бормашенко |
Лишь только записав результаты…
בס''ד Я расскажу об удивительном научном наблюдении, настолько странном, противоречащем интуиции и здравому смыслу, что хочется объявить его в лучшем случае курьезом, а в худшем, досужим вымыслом околонаучных ротозеев, любящих порассуждать о неопознанных летающих половниках и целительных свойствах живой воды, заряженной Аланом Чумаком. А между тем, это наблюдение приводит к очень глубоким и далеко идущим результатам, как научным, так и гносеологическим. Речь пойдет о Законе Бенфорда. История эта давняя. Саймон Ньюком, работая с таблицами логарифмов (нынешнее студенты, слава Б-гу, незнакомы с этим литературным памятником; его похоронил карманный калькулятор), заметил в 1881 году, что страницы таблиц, содержащие логарифмы чисел, начинающихся с единицы, куда более засалены и истрепаны, нежели иные страницы таблиц. И далее по нисходящей. А страницы, на которых разместились логарифмы, стартующие с «девятки» и вообще чистеньки, как новенькие. Другой прошел бы мимо этого странного наблюдения, не задержав дыхания; другой, но не Саймон Ньюком. Саймон Ньюком, был личностью, более чем замечательной. Автодидакт, он оставил заметный след в астрономии, экономике, статистике, измерил скорость света с непостижимой для его времени точностью, писал фантастические романы. И мимо своего странного закона истрепанности таблиц логарифмов Саймон Ньюком без внимания не прошел. Тысячу раз прав Александр Воронель, когда говорит, что ремесло ученого требует наблюдательности и изобретательности. Так вот, я полагаю, что наблюдательность даже и важнее. Ньюком формулирует следующее утверждение: в списке случайных статистических данных, вероятность того, что первой цифрой окажется единица составляет приблизительно 30 %, а не ожидаемые 11 % (ноль не в счет, без нуля цифр в десятичной системе – девять, так что, если вероятности попадания цифр на первую позицию равны – то они составляют примерно 11%) [1]. От этого заявления на версту тянет безумием. Ну, чем
единица лучше двойки или семерки? А ничем. Посему следует ожидать равной
вероятности появления цифр десятичной системы на первой позиции. Как и многие другие хорошие вещи, наблюдение Ньюкома было забыто на полста лет, и переоткрыто в 1938 г. американским физиком и статистиком Фрэнком Бенфордом, исследовавшим со старомодной научной скрупулезностью полоумный набор статистических данных, включавших высоты американских небоскребов, площади озер, физические константы и биржевые сводки. Бенфорд показал, что наблюдение Ньюкома выполняется с неожиданной точностью: единица упорно лезет на первое место, вытесняя другие цифры десятичной нотации[2]. С тех пор, этот закон именуется законом Бенфорда, что вообще говоря, несправедливо. В военные годы было не до Бенфорда, потом все гонялись за бомбами и спутниками, но вот совсем уж недавно, интерес к закону Бенфорда, неожиданно возродился. А дело было так: один дошлый аудитор проверял бесконечные налоговые отчеты громадной американской компании, и учуял в них нюхом бухгалтерской ищейки неладное, фальсификации. Аудитор славно учился в Университете, и, зная о существовании закона Бенфорда, проверил представленные ему таблицы данных, и установил, что первые цифры в колонках распределены равномерно. С этого момента аудитор не сомневался – отчет фальсифицирован. Жулики, по невежеству своему, разумно предположили, что распределение первых цифр должно быть равномерным. Скандал был большой. Фирма требовала привлечь аудитора к
ответственности, ведь закон Бенфорда – эмпирическое наблюдение, не более того,
никем не обоснованное и недоказанное. Аудиторская фирма резонно отвечала,
фальсификации никак не связаны со справедливостью закона Бенфорда, он лишь
помог их выявить. С тех пор закон Бенфорда был успешно применен для выявления подделок на выборах в Иране, в отчетах Греции Евросоюзу, изрядно усложнив жизнь жуликам и прохиндеям. А, между тем, строго математически закон Бенфорда остается недоказанным, хотя многие большие математики серьезно брались за дело[3]. Экспериментаторы тоже засучили рукава и обнаружили, что закон Бенфорда выполняется в статистических данных о популяционной динамике народонаселения, данных о закупках через eBay, мощности пульсаров, генетической информации [4-10]. Мы с супругой недавно не поленились показать, что закон
работает в инфракрасных спектрах полимеров [11]. Заметим, что, разумеется, закон
Бенфорда работает не всегда. В телефонном справочнике вы его не обнаружите. Как же обосновать это странное наблюдение? Где его корни? Разные гипотезы выдвигались математиками и физиками. Но вот недавно мой коллега профессор Геннадий Вайман показал прелюбопытную вещь – закон Бенфорда отражает свойства десятичной позиционной системы счисления (в позиционной системе значение цифры напрямую зависит от ее положения в числе)[12]. Я не буду забивать мозги читателей тонкостями и деталями доказательства. Для меня важнее философский урок, следующий из работы Ваймана. Допустим, я записываю на листик текущие биржевые сводки.
Предположим, эти данные совершенно хаотичны, неупорядочены. Но записывая их, я,
не задумываясь, прибегаю к заученной с детства десятичной системе счисления. И
записанные мною данные, уже не вполне хаотичны. В них будет выполняться закон
Бенфорда, навязанный позиционной системой; единица с вероятностью в 30 % , расталкивая
остальные цифры, полезет на первое место. Из хаоса данных рождается порядок.
Упорядочение возникает от самого факта применения позиционной нотации.
Записанные в ней биржевые котировки уже не вполне хаотичны, в записи наличествует
порядок, продиктованный системой счисления (она может быть и не десятичной). Квантовая механика уже приучила нас к тому, что сам факт измерения меняет поведение физической системы. Закон Бенфорда учит, вдобавок, вот чему: лишь только записав результаты измерений в позиционной системе исчисления, мы уже их упорядочиваем. Перед нами не курьез, а небанальное наблюдение, осмысление которого ведет довольно далеко. Напрашивается вопрос: а почему из всех систем исчисления выжили только позиционные, вроде бы, изобретенные вавилонянами; ведь были в истории и иные системы – непозиционные, например, хорошо нам известная – римская? Быть может, потому что позиционные системы обеспечивают минимальное усилие необходимое для осмысления численных данных, они, попросту, наиболее удобны. Но это, разумеется, – чистая спекуляция. Источники [1] S. Newcomb, Note on the frequency of use of
different digits in natural numbers, Am. J. Math. 4 (1881) 39-40. [2] F. Benford,
The law of anomalous numbers, Proc. Am. Phil. Soc. 78 (1938) 551-572.
[3]
A. Berger,
T.P. Hill, Benford’s law strikes back: no simple explanation in sight for
mathematical gem, The Math. Intelligencer 33 (2011) 85-91.
[4]
J-C. Pain,
Benford’s law and complex atomic spectra, Phys. Rev. E 77 (2008) 012102.
[5]
T.A. Mir,
The law of the leading digits and the world religions, Physica A 391 (2012) 792-798.
[6]
M. Sambridge,
Benford’s law in the natural sciences, Geo. Phys.
Res. Lett. A 37 (2010) L22301. [7] J.L. Friar, T. Goldman, J. Pérez-Mercader, Genome sizes and the Benford distribution,
Plosone 7 (2012) e36624. [8] J.L. Hernandez Caceres, First digit distribution
in some biological data sets. Possible explanations for departures from
Benford’s Law, El. J. Biomed. 1(2008) 27–35. [9] L. Shao, B.Q. Ma, Empirical mantissa distributions
of pulsars, Astrop. Phys. 33 (2010) 255–262. [10] D. E. Giles, Benford's law and naturally occurring
prices in certain ebaY auctions, Applied Economics Lett. 14 (2007) 157-161. [11] Ed. Bormashenko, Ye. Bormashenko, et al.,
Benford's Law, its applicability and breakdown in the IR spectra of polymers,
Physica A, 444 (2016) 524-529. [12] G. Whyman, E. Shulzinger, E. Bormashenko, Intuitive considerations clarifying the origin and applicability of the Benford law, 2015, ArXiv: 1510.07220. |
|
|||
|