Как посчитать наиболее часто встречающееся значение в excel
Перейти к содержимому

Как посчитать наиболее часто встречающееся значение в excel

  • автор:

Функция МОДА

Предположим, что вы хотите узнать наиболее распространенное количество видов птиц, замеченных в выборке птиц, подсчитываемых на критических водно-болотных угодьях в течение 30-летнего периода времени, или вы хотите узнать наиболее часто встречающееся количество телефонных звонков в телефонный центр поддержки в часы вне пиковой нагрузки. Чтобы вычислить режим группы чисел, используйте функцию MODE.

ФУНКЦИЯ MODE возвращает наиболее часто встречающееся или повторяющееся значение в массиве или диапазоне данных.

Важно: Эта функция была заменена одной или несколькими новыми функциями, которые обеспечивают более высокую точность и имеют имена, лучше отражающие их назначение. Хотя эта функция все еще используется для обеспечения обратной совместимости, она может стать недоступной в последующих версиях Excel, поэтому мы рекомендуем использовать новые функции.

Дополнительные сведения о новых функциях см. в разделах Функция МОДА.НСК и Функция МОДА.ОДН.

Синтаксис

Аргументы функции МОДА описаны ниже.

  • Число1 Обязательный. Первый числовой аргумент, для которого требуется вычислить моду.
  • Число2. Необязательный. От 1 до 255 числовых аргументов, для которых вычисляется мода. Вместо аргументов, разделенных точкой с запятой, можно воспользоваться массивом или ссылкой на массив.

Замечания

  • Аргументы могут быть либо числами, либо содержащими числа именами, массивами или ссылками.
  • Если аргумент, который является массивом или ссылкой, содержит текст, логические значения или пустые ячейки, эти значения игнорируются; ячейки, содержащие нулевые значения, учитываются.
  • Аргументы, которые являются значениями ошибки или текстами, не преобразуемыми в числа, приводят к возникновению ошибок.
  • Если множество данных не содержит одинаковых данных, функция МОДА возвращает значение ошибки #Н/Д.

Функция МОДА измеряет центральную тенденцию, которая является центром множества чисел в статистическом распределении. Существует три наиболее распространенных способа определения центральной тенденции:

  • Среднее значение — это среднее арифметическое, которое вычисляется путем сложения набора чисел с последующим делением полученной суммы на их количество. Например, средним значением для чисел 2, 3, 3, 5, 7 и 10 будет 5, которое является результатом деления их суммы, равной 30, на их количество, равное 6.
  • Медиана — это число, которое является серединой множества чисел, то есть половина чисел имеют значения большие, чем медиана, а половина чисел имеют значения меньшие, чем медиана. Например, медианой для чисел 2, 3, 3, 5, 7 и 10 будет 4.
  • Мода — это число, наиболее часто встречающееся в данном наборе чисел. Например, модой для чисел 2, 3, 3, 5, 7 и 10 будет 3.

При симметричном распределении множества чисел все три значения центральной тенденции будут совпадать. При смещенном распределении множества чисел значения могут быть разными.

Пример

Скопируйте образец данных из следующей таблицы и вставьте их в ячейку A1 нового листа Excel. Чтобы отобразить результаты формул, выделите их и нажмите клавишу F2, а затем — клавишу Enter. При необходимости измените ширину столбцов, чтобы видеть все данные.

Как определить 10 самых часто встречающихся чисел в Excel?

Есть таблица Excel с колонкой на несколько тысяч ячеек. 1 ячейка в этом столбце = 1 числу. Как вычислить ТОП-10 самых часто встречающихся чисел и отобразить их?

P.s. работа идет в Office 365 для MacOS.

  • Вопрос задан более трёх лет назад
  • 431 просмотр

Комментировать
Решения вопроса 0
Ответы на вопрос 2

DS28

Аналитик (недоматематик, недопрограммист)

Если не писать код на VB, то алгоритм такой:
скопировать, удалить дубликаты, применить функцию счётесли, отсортировать.

Ответ написан более трёх лет назад
Нравится 3 7 комментариев
Username0 @Username0 Автор вопроса

если удалить дубликаты, то там останется каждого числа по 1 шт. А мне требуется узнать какие числа повторяются большее число раз.

Тогда так:
скопировать, применить функцию счётесли, отсортировать, скопировать по значению, удалить дубликаты.

Username0, счётесли надо применять так, что бы как ключ (искомое число) брался столбец БЕЗ дубликатов, а вот сам поиск вёлся в столбце с дубликатами

DS28

Username0, вы пропустили шаг «скопировать». Когда вы удаляете дубликаты у вас остаётся второй столбец, где дубликаты не удалены.

Когда вы удаляете дубликаты вы формируете список всех возможных чисел.
Когда применяете функцию счётесли — находите число повторений. (не просто счёт, а счётесли с определённым условием, которое вам предлагается написать самостоятельно после изучения этой функции)
Когда сортируете — получаете то, что хотели.

honor8

Если не писать код на VB, и числа не часто повторяются, то:

Условное форматирование -> Правила отбора первых и последних значений -> Первые 10 элементов. 

shushpanio @shushpanio

Дѣаволъ, условное форматирование не подойдет т.к. в данном случае форматирование выделит именно 10 самых больших чисел.

5caf418ae93f9427268616.jpeg

Топик стартеру нужен топ 10 часто встречающихся.

МОДА.ОДН (функция МОДА.ОДН)

Возвращает наиболее часто встречающееся или повторяющееся значение в массиве или интервале данных.

Синтаксис

Аргументы функции МОДА.ОДН описаны ниже.

  • Число1 Обязательный. Первый аргумент, для которого требуется вычислить моду.
  • Число2. Необязательный. Аргументы 2—254, для которых требуется вычислить моду. Вместо аргументов, разделенных точкой с запятой, можно использовать массив или ссылку на массив.

Замечания

  • Аргументы могут быть либо числами, либо содержащими числа именами, массивами или ссылками.
  • Если аргумент, который является массивом или ссылкой, содержит текст, логические значения или пустые ячейки, эти значения игнорируются; ячейки, содержащие нулевые значения, учитываются.
  • Аргументы, которые являются значениями ошибки или текстами, не преобразуемыми в числа, приводят к возникновению ошибок.
  • Если набор данных не содержит повторяющихся точек данных, функция МОДА.ОДН возвращает значение ошибки #Н/Д.

Примечание: Функция МОДА.ОДН измеряет центральную тенденцию, которая является центром группы чисел в статистическом распределении. Существует три наиболее распространенных способа определения центральной тенденции.

  • Среднее значение — это среднее арифметическое, которое вычисляется путем сложения набора чисел с последующим делением полученной суммы на их количество. Например, средним значением для чисел 2, 3, 3, 5, 7 и 10 будет 5, которое является результатом деления их суммы, равной 30, на их количество, равное 6.
  • Медиана — это число, которое является серединой множества чисел, то есть половина чисел имеют значения большие, чем медиана, а половина чисел имеют значения меньшие, чем медиана. Например, медианой для чисел 2, 3, 3, 5, 7 и 10 будет 4.
  • Мода — это число, наиболее часто встречающееся в данном наборе чисел. Например, модой для чисел 2, 3, 3, 5, 7 и 10 будет 3.

При симметричном распределении множества чисел все три значения центральной тенденции будут совпадать. При смещенном распределении множества чисел значения могут быть разными.

Пример

Скопируйте образец данных из следующей таблицы и вставьте их в ячейку A1 нового листа Excel. Чтобы отобразить результаты формул, выделите их и нажмите клавишу F2, а затем — клавишу Enter. При необходимости измените ширину столбцов, чтобы видеть все данные.

Поиск и подсчет самых частых значений

Необходимость поиска наибольших и наименьших значений в любом бизнесе очевидна: самые прибыльные товары или ценные клиенты, самые крупные поставки или партии и т.д. Но наравне с этим, иногда приходится искать в данных не топовые, а самые часто встречающиеся значения, что хоть и звучит похоже, но, по факту, совсем не то же самое. Применительно к магазину, например, это может быть поиск не самых прибыльных, а самых часто покупаемых товаров или самое часто встречающееся количество позиций в заказе, минут в разговоре и т.п. В такой ситуации задачу придется решать немного по-разному, в зависимости от того, с чем мы имеем дело — с числами или с текстом.

Поиск самых часто встречающихся чисел

Предположим, перед нами стоит задача проанализировать имеющиеся данные по продажам в магазине, с целью определить наиболее часто встречающееся количество купленных товаров. Для определения самого часто встречающегося числа в диапазоне можно использовать функцию МОДА (MODE) :
Выявление самых часто встречающихся чисел в диапазоне
Т.е., согласно нашей статистике, чаще всего покупатели приобретают 3 шт. товара. Если существует не одно, а сразу несколько значений, встречающихся одинаково максимальное количество раз (несколько мод), то для их выявления можно использовать функцию МОДА.НСК (MODE.MULT) . Ее нужно вводить как формулу массива, т.е. выделить сразу несколько пустых ячеек, чтобы хватило на все моды с запасом и ввести в строку формул =МОДА.НСК(B2:B16) и нажать сочетание клавиш Ctrl+Shift+Enter. На выходе мы получим список всех мод из наших данных: Выявление нескольких мод
Т.е., судя по нашим данным, часто берут не только по 3, но и по 16 шт. товаров. Обратите внимание, что в наших данных только две моды (3 и 16), поэтому остальные ячейки, выделенные «про запас», будут с ошибкой #Н/Д.

Частотный анализ по диапазонам функцией ЧАСТОТА

Частотный анализ функцией ЧАСТОТА

Если же нужно проанализировать не целые, а дробные числа, то правильнее будет оценивать не количество одинаковых значений, а попадание их в заданные диапазоны. Например, нам необходимо понять какой вес чаще всего бывает у покупаемых товаров, чтобы правильно выбрать для магазина тележки и упаковочные пакеты подходящего размера. Другими словами, нам нужно определить сколько чисел попадает в интервал 1..5 кг, сколько в интервал 5..10 кг и т.д. Для решения подобной задачи можно воспользоваться функцией ЧАСТОТА (FREQUENCY) . Для нее нужно заранее подготовить ячейки с интересующими нас интервалами (карманами) и затем выделить пустой диапазон ячеек (G2:G5) по размеру на одну ячейку больший, чем диапазон карманов (F2:F4) и ввести ее как формулу массива, нажав в конце сочетание Ctrl+Shift+Enter:

Частотный анализ сводной таблицей с группировкой

Альтернативный вариант решения задачи: создать сводную таблицу, где поместить вес покупок в область строк, а количество покупателей в область значений, а потом применить группировку — щелкнуть правой кнопкой мыши по значениям весов и выбрать команду Группировать (Group) . В появившемся окне можно задать пределы и шаг группировки: Частотный анализ группировкой сводной таблицы. и после нажатия на кнопку ОК получить таблицу с подсчетом количества попаданий покупателей в каждый диапазон группировки: Готовая группировка в сводной таблице
Минусы такого способа:

  • шаг группировки может быть только постоянным, в отличие от функции ЧАСТОТА, где карманы можно задать абсолютно любые
  • сводную таблицу нужно обновлять при изменении исходных данных (щелчком правой кнопки мыши — Обновить), а функция пересчитывается автоматически «на лету»

Поиск самого часто встречающегося текста

Если мы имеем дело не с числами, а с текстом, то подход к решению будет принципиально другой. Предположим, что у нас есть таблица из 100 строк с данными о проданных в магазине товарах, и нам нужно определить, какие товары покупались наиболее часто?

Самым простым и очевидным решением будет добавить рядом столбец с функцией СЧЁТЕСЛИ (COUNTIF) , чтобы подсчитать количество вхождений каждого товара в столбце А:

Подсчет количества текстовых значений в списке

Затем, само-собой, отсортировать получившийся столбец по убыванию и посмотреть на первые строчки.

Или же добавить к исходному списку столбец с единичками и построить по получившейся таблице сводную, подсчитав суммарное количество единичек для каждого товара:

Сводная таблица для подсчета количества вхождений каждого товара

Если исходных данных не очень много и принципиально не хочется пользоваться сводными таблицами, то можно использовать формулу массива:

Поиск самого частого значения формулой массива

Давайте разберем ее по кусочкам:

  • СЧЁТЕСЛИ(A2:A20;A2:A20) – формула массива, которая ищет по очереди количество вхождений каждого товара в диапазоне A2:A100 и выдаст на выходе массив с количеством повторений, т.е., фактически, заменяет собой дополнительный столбец
  • МАКС – находит в массиве вхождений самое большое число, т.е. товар, который покупали чаще всего
  • ПОИСКПОЗ – вычисляет порядковый номер строки в таблице, где МАКС нашла самое большое число
  • ИНДЕКС – выдает из таблицы содержимое ячейки с номером, который нашла ПОИСКПОЗ

Ссылки по теме

  • Подсчет количества уникальных значений в списке
  • Извлечение уникальных элементов из списка с повторами
  • Группировка в сводных таблицах

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *