Feo.education

Закон Бенфорда

Сегодня суббота! Значит опять поболтаем про цифры.

Начнем с вопроса❓
Представьте, что у вас есть куча данных по финансовой отчетности крупной компании.
Цифр в ней — тьма тьмущая.

Если мы соберем все-все цифры в одном месте и посчитаем долю цифр, начинающихся на 1, то какая будет доля таких цифр?
1/9, т.е. 11%?

Что вам подсказывает ваш аналитический мозг или интуиция?



А если я вам скажу, что доля цифр, начинающихся на 1 будет примерно 30%?

Но почему? 🤯

А доля цифр, начинающаяся на 2 будет примерно 17,6%. И далее по ниспадающей. Доля цифр, начинающихся на 9 будет всего 4,6%.

Это называется законом Бенфорда.
Впервые проявление этого закона заметил американский астроном Саймон Ньюком в 1881 году. Он обнаружил, что книги, содержащие логарифмические таблицы, истрёпаны там, где содержатся логарифмы чисел, начинающихся с 1. И целы для чисел, начинающихся на 9.

Это явление было повторно обнаружено физиком Фрэнком Бенфордом в 1938 году. Бенфорд проанализировал около 20 таблиц, среди которых были данные о площади бассейна 335 рек, удельной теплоёмкости и молекулярном весе тысяч химических соединений и, в том числе, номера домов первых 342 лиц, указанных в справочнике.

Анализ чисел показал, что единица является первой значащей цифрой с вероятностью не 1/9, как следовало ожидать, а около 1/3.
Почему так?

В мире маленьких вещей всегда больше, чем больших: маленьких водоемов больше, чем больших, маленькие камни встречаются чаще, чем большие валуны, серьезные аварии случаются реже, чем незначительные. Богатых людей мало, а бедных много.

А если данные и явления имеют другой характер распределения или искусственно ограничены, то закон не работает.

Например: рост человека, школьные оценки, координаты мест в определенном городе, коэффициент интеллекта — тут не будет такой закономерности.
И как применять все это в жизни?

Закону Бенфорда подчинаются распределение голосов на выборах, поскольку данные о них также определяются большим массивом бюллетеней. На эту тему есть куча аналитических статей про честные и нечестные выборы. Можете погуглить.
Этому закону подчиняются и цифры в налоговых декларациях, соответственно несовпадение с законом первой цифры указывает на подтасовку данных. Если вы решите заниматься махинациями, то нагородите огород в отчетности. И распределение ваших чисел не будет соответствовать закону Бенфорда.

Это конечно не означает, что в вас сразу надо кидать камни, само по себе отклонение от Закона Бенфорда не является неоспоримым доказательством мошенничества. Однако, это означает, что вас надо прям проверить-проверить. Очень пристально. И не один раз.

Больше полезной информации в моем telegram-канале Feo.education
Крутые факты о цифрах