تنوع |محاسبه دامنه ، IQR ، واریانس ، انحراف استاندارد

ساخت وبلاگ

منتشر شده در 7 سپتامبر 2020 توسط Pritha Bhandari. اصلاح شده در 11 نوامبر 2022.

تغییرپذیری توصیف می کند که نقاط داده از هم جدا از یکدیگر و از مرکز توزیع قرار دارند. همراه با اقدامات گرایش مرکزی ، اقدامات تنوع به شما آمار توصیفی می دهد که داده های شما را خلاصه می کند.

تنوع همچنین به عنوان گسترش ، پراکندگی یا پراکندگی گفته می شود. بیشتر با موارد زیر اندازه گیری می شود:

  • دامنه: تفاوت بین بالاترین و کمترین مقادیر
  • دامنه بین Quartile: دامنه نیمه میانی توزیع
  • انحراف استاندارد: فاصله متوسط از میانگین
  • واریانس: میانگین مسافت مربع از میانگین

فهرست مطالب

  1. چرا تغییرپذیری اهمیت دارد؟
  2. دامنه
  3. دامنه بین قشر
  4. انحراف معیار
  5. واریانس
  6. بهترین اندازه گیری تنوع چیست؟
  7. سوالات متداول در مورد تنوع

چرا تغییرپذیری اهمیت دارد؟

در حالی که گرایش اصلی یا میانگین به شما می گوید که بیشتر نقاط شما در کجا قرار دارد ، تغییرپذیری خلاصه می کند که چقدر از هم فاصله دارند. این مهم است زیرا میزان تغییرپذیری تعیین می کند که چگونه می توانید نتایج را از نمونه به جمعیت خود تعمیم دهید.

تغییرپذیری کم ایده آل است زیرا به این معنی است که شما می توانید اطلاعات مربوط به جمعیت را بر اساس داده های نمونه بهتر پیش بینی کنید. تنوع بالا به این معنی است که مقادیر کمتر سازگار هستند ، بنابراین پیش بینی ها سخت تر است.

مجموعه داده ها می توانند همان تمایل اصلی را داشته باشند اما سطوح مختلف تنوع یا برعکس. اگر فقط تمایل اصلی یا تنوع را می دانید ، نمی توانید در مورد جنبه دیگر چیزی بگویید. هر دوی آنها با هم تصویر کاملی از داده های خود به شما می دهند.

A graph showing the distribution of 3 samples with the same average, but different variability.

دامنه

این محدوده گسترش داده های خود را از پایین ترین تا بالاترین مقدار در توزیع به شما می گوید. این ساده ترین اندازه گیری تغییرپذیری برای محاسبه است.

برای یافتن دامنه ، به سادگی کمترین مقدار را از بالاترین مقدار در مجموعه داده ها کم کنید.

The interquartile range on a normal distribution

درست مانند محدوده ، محدوده interquartile فقط از 2 مقدار در محاسبه خود استفاده می کند. اما IQR کمتر تحت تأثیر Outliers قرار می گیرد: 2 مقدار از نیمه میانی مجموعه داده ها ناشی می شود ، بنابراین بعید است که آنها نمرات شدید باشند.

ضریب هوشی یک اندازه گیری مداوم از تنوع برای توزیع و همچنین توزیع های عادی را ارائه می دهد.

خلاصه پنج شماره

هر توزیع را می توان با استفاده از خلاصه پنج شماره سازماندهی کرد:

  • کمترین مقدار
  • Q1: صدک 25
  • Q2: میانه
  • Q3: صدک 75
  • بالاترین مقدار (Q4)

این خلاصه های پنج شماره را می توان با استفاده از توطئه های جعبه و ویسکر به راحتی تجسم کرد.

A box and whisker plot visualizing the five-number summary of the data

انحراف معیار

انحراف استاندارد میانگین میزان تغییرپذیری در مجموعه داده شما است.

به طور متوسط به شما می گوید که هر نمره از میانگین تا چه حد نهفته است. هرچه انحراف استاندارد بزرگتر باشد ، مجموعه داده متغیر تر است.

شش مرحله برای یافتن انحراف استاندارد با دست وجود دارد:

  1. هر نمره را لیست کنید و میانگین آنها را پیدا کنید.
  2. میانگین را از هر نمره جدا کنید تا انحراف از میانگین دریافت کنید.
  3. مربع هر یک از این انحرافات.
  4. همه انحرافات مربع را اضافه کنید.
  5. جمع انحرافات مربع را با n - 1 (برای یک نمونه) یا N (برای یک جمعیت) تقسیم کنید.
  6. ریشه مربع شماره ای را که پیدا کردید پیدا کنید.

برای یافتن واریانس به صورت دستی ، تمام مراحل را برای انحراف استاندارد به جز مرحله نهایی انجام دهید.

فرمول واریانس برای جمعیت

فرمول واریانس برای نمونه ها

مغرضانه در مقابل برآوردهای بی طرفانه از واریانس

یک تخمین بی طرفانه در آمار یکی از مواردی است که به طور مداوم مقادیر بالا یا مقادیر کم به شما نمی دهد - هیچ تعصب سیستماتیک ندارد.

درست مانند انحراف استاندارد ، فرمول های مختلفی برای واریانس جمعیت و نمونه وجود دارد. اما در حالی که هیچ تخمین بی طرفانه ای برای انحراف استاندارد وجود ندارد ، یکی برای واریانس نمونه وجود دارد.

اگر فرمول واریانس نمونه از نمونه N استفاده کند ، واریانس نمونه نسبت به تعداد کمتر از حد انتظار می رود. کاهش نمونه N به N - 1 باعث می شود واریانس از نظر مصنوعی بزرگتر شود.

در این حالت ، تعصب نه تنها کاهش می یابد بلکه کاملاً برداشته می شود. فرمول واریانس نمونه تخمین های کاملاً بی طرفانه از واریانس را ارائه می دهد.

بنابراین چرا انحراف استاندارد نمونه نیز یک تخمین بی طرفانه نیست؟

این به این دلیل است که انحراف استاندارد از پیدا کردن ریشه مربع واریانس نمونه ناشی می شود. از آنجا که یک ریشه مربع یک عمل خطی نیست ، مانند افزودن یا تفریق ، بی طرفانه بودن فرمول واریانس نمونه بر روی فرمول انحراف استاندارد نمونه انجام نمی شود.

بهترین اندازه گیری تنوع چیست؟

بهترین اندازه گیری تنوع به سطح اندازه گیری و توزیع شما بستگی دارد.

سطح اندازه گیری

برای داده های اندازه گیری شده در سطح معمولی ، دامنه و دامنه بین قشر تنها اقدامات مناسب از تغییرپذیری هستند.

برای فاصله زمانی پیچیده تر و نسبت ، انحراف استاندارد و واریانس نیز کاربرد دارد.

توزیع

برای توزیع های عادی می توان از تمام اقدامات استفاده کرد. انحراف و واریانس استاندارد ترجیح داده می شود زیرا کل مجموعه داده های شما را در نظر می گیرد ، اما این همچنین بدان معنی است که آنها به راحتی تحت تأثیر Outliers قرار می گیرند.

برای توزیع یا مجموعه داده های skewed با Outliers ، محدوده interquartile بهترین اندازه گیری است. این حداقل تحت تأثیر مقادیر شدید است زیرا بر گسترش در وسط مجموعه داده ها تمرکز دارد.

سوالات متداول در مورد تنوع

تغییرپذیری به شما می گوید که نقاط از هم جدا از یکدیگر و از مرکز توزیع یا مجموعه داده فاصله دارند.

تنوع همچنین به عنوان گسترش ، پراکندگی یا پراکندگی گفته می شود.

تنوع بیشتر با آمار توصیفی زیر اندازه گیری می شود:

  • دامنه: تفاوت بین بالاترین و کمترین مقادیر
  • دامنه بین Quartile: دامنه نیمه میانی توزیع
  • انحراف استاندارد: فاصله متوسط از میانگین
  • واریانس: میانگین مسافت مربع از میانگین

در حالی که گرایش اصلی به شما می گوید که بیشتر نقاط داده شما در کجا قرار دارد ، تغییرپذیری خلاصه می کند که امتیازات شما از یکدیگر فاصله دارد.

مجموعه داده ها می توانند همان تمایل اصلی را داشته باشند اما سطوح مختلف تنوع یا برعکس. با هم ، آنها تصویری کامل از داده های شما به شما می دهند.

آمار توصیفی ویژگی های یک مجموعه داده را خلاصه می کند. آمار استنباطی به شما امکان می دهد یک فرضیه را آزمایش کنید یا ارزیابی کنید که آیا داده های شما برای جمعیت گسترده تر قابل تعمیم است یا خیر.

این مقاله Scribbr را ذکر کنید

اگر می خواهید این منبع را استناد کنید ، می توانید استناد را کپی و جایگذاری کنید یا بر روی دکمه "استناد به این مقاله Scribbr" کلیک کنید تا به طور خودکار استناد را به ژنراتور استناد رایگان ما اضافه کنید.

استراتژی برای تجارت گزینه های...
ما را در سایت استراتژی برای تجارت گزینه های دنبال می کنید

برچسب : نویسنده : فریبا کامران بازدید : 41 تاريخ : دوشنبه 22 خرداد 1402 ساعت: 18:00