Середнє проти медіани | Відмінності між методами, які використовуються у статистиці

Різниця між середньою та медіаною

Середнє та медіана - це два загальновживані терміни в математиці, середнє - це як середнє значення даного числа, і воно підсумовує числа та ділить їх із підрахунком чисел, що дає нам середнє значення, а медіана, з іншого боку, повертає середнє число з цілого набору даних, і якщо набір даних рівномірний, тоді медіана додає два середні числа і ділить його на 2, даючи нам медіану.

Вони є мірою центральної тенденції і часто використовуються для вимірювання великих наборів даних, де потрібно провести аналіз та інтерпретувати результати. Середнє, медіана та мода - це три міри середніх показників, які показують розподіл даних від середнього або середнього. Ці методи широко використовуються в статистиці, тоді як середнє значення даних є найбільш широко застосовуваним методом серед трьох.

Що це значить?

Середнє значення - це проста сума чисел спостережень у масиві, яка ділиться на кількість спостережень. Наприклад, якщо говорити про середній зріст або середній зріст групи, що складається з 5 осіб. Середній зріст обчислюється шляхом підсумовування зросту 5 людей, поділеного на кількість людей, тобто 5.

Формула

Середня формула = (Сума всіх спостережень / кількість спостережень)

Що таке медіана?

З іншого боку, медіана - це середнє число в наборі масиву даних, яке відокремлює вищий набір даних від нижчого. Для обчислення медіани даних спочатку дані слід упорядкувати за зростанням. Коли набір даних має потужність, потрібно взяти середнє значення середніх двох чисел у наборі даних. Однак ці два методи часто використовуються як взаємозамінні.

Формула

Формула медіани = (n + 1) / 2

коли n - непарне число

Медіана = [(n / 2) + {(n / 2) +1}] / 2

коли n - парне число

Середнє проти медіанної інфографіки

Давайте побачимо основні відмінності між середнім та середнім значенням.

Середні та середні ключові відмінності

  • Середнє значення просте у використанні та застосуванні, і воно може бути застосовано до будь-якого масиву даних, парного чи непарного. З іншого боку, медіана дещо складна у використанні, і перед обчисленням набір даних повинен бути упорядкований за зростанням або за спаданням.
  • Середнє значення зазвичай використовується для нормального розподілу, тоді як медіана використовується для набору даних з асиметричним розподілом.
  • Середнє значення є простим, але воно не є надійним, оскільки може містити відхилення в розподілах, а іноді не може дати користувачеві правильних результатів для інтерпретації. З іншого боку, медіанний метод є надійним і краще підходить для використання, оскільки застосовується для косих розподілів для виведення центральної тенденції встановленої дати і дасть користувачеві багато точних результатів у порівнянні із середнім
  • Існує лише одна формула середнього значення, яка є сумою всіх спостережень, поділеною на кількість спостережень. Тоді як медіана має дві формули, одну з непарних, де медіаною стають лише середні числа з набору даних. Але коли ми маємо парний набір даних, середину двох значень вибирають і ділять на 2, що надає нам медіану парного набору даних.

Середня та середня порівняльна таблиця

СереднійМедіана
Середнє значення обчислюється шляхом складання всіх значень у масиві даних, який потім ділиться на кількість спостереженьМедіана - це точне середнє значення набору даних. Це можна обчислити, упорядкувавши набір даних у порядку зростання, а потім знайшовши або вибравши середнє значення з набору даних
Він більш широко використовується в галузі завдяки легкому обчисленню середнього і дає нам швидкий номерВін не часто використовується в галузі, але є більш повним і точним, ніж середнє значення, яке є простою сумою чисел
Зазвичай він використовується для набору даних із перекосом, тобто для нормального розподілуОсобливо зручно описувати набір даних зі значним перекосом даних або коли дані мають довгий хвіст. Він широко використовується там, де контурні дані мають значну вагу в даних, що означає, що це не є хорошим методом розрахунку
Це не надійний інструмент для розрахунку для виведення центральної тенденціїЦе набагато надійніший інструмент, оскільки він визначає вагу даних, яка, як правило, є великою вагою на довших хвостах
Він дуже чутливий до викидівНа нього значно менше впливають викиди
Він простий у використанніВін має складний характер
Його неможливо розрахувати для категоріальних даних, оскільки значення не можуть бути підсумованіЙого неможливо ідентифікувати для категоризованих іменних даних, оскільки його не можна логічно впорядкувати.

Висновок

Окрім середнього та медіанного, існує ще один метод, який часто використовується для вимірювання центральної тенденції - це режим. Режим - це значення, яке найчастіше зустрічається у наборі даних, режим має перевагу перед середнім та середнім значенням, оскільки його можна знайти як для числового, так і для категоризованого набору даних.

Незважаючи на існування режиму та медіанної переваги кращих результатів та аналізу над середнім значенням, середнє значення все ще є найбільш підходящим мірилом центральної тенденції, особливо якщо набір даних є нормальним розподілом і дані, як правило, мають перекоси.

Як хороший аналітик, центральну тенденцію слід вимірювати за допомогою всіх трьох методів даних, а дисперсію в аналізі слід обмірковувати та ретельно аналізувати для отримання кращих та точніших результатів у наборі даних.