وب لاگ امیرحسین اسعدی

آنچه یادگرفتم، خواندم و دیدم رو اینجا به اشتراک می‌گذارم
I share what I learned, read and saw

طبقه بندی موضوعی
آخرین نظرات
  • ۸ خرداد ۰۲، ۱۵:۲۲ - احمد صداقت زاده
    عالی

۱ مطلب در ارديبهشت ۱۴۰۱ ثبت شده است

تفاوت میان standard error و standard deviation و confidence interval

به روز شده در: ۱۷ اردیبهشت ۱۴۰۱

در علم آمار مفاهیمی داریم که ممکنه باهم اشتباه بگریمشون و به جای هم دیگه استفاده کنیم.

  • Standard Deviation
  • Standard Error
  • Confidence INterval

پیش نوشت: هرجا رابطه ریاضی در متن دیدین من اونها رو در قالب لتک نوشتم و مثلا میتونید اینجا پیست کنید و بهتر ببینید شون.

اول به standard deviation می‌پردازیم.

deviation  از deviate میاد که اینم اگه برگردیم عقب از de+way = away تشکیل شده. تو فارسی هم بهش انحراف میگن و standard رو هم معیار. و در کل شده انحراف معیار یا انحراف استاندارد. و وقتی ما یکسری مشاده از یک متغیر داشته باشیم میخوایم بدونیم این مشاهدات چقدر پایدارن، آیا هردفعه عوض میشن یا نه یک متر میتونه standard deviation یا به اختصار SD باشه. از این مفهموم برای توضیح داده‌هامون یا description بکار میره.

انحراف معیار جذر واریانس هست. و رابطش اینطوری حساب میشه.

S.D = \sqrt{\dfrac{(x_i-\bar x)^2}{n-1}}

مثلا اگه اومده باشم از توی باغ سه تا کرم پیدا کرده باشم و طولشون رو با خط کش اندازه بگیرم حاصل این ها شده ۳و۵و۷ سانتیمتر میانگین طول کرم‌ها ۵ سانتیمتر هست و انحراف معیار مثبت و منفی دو سانتیمتر هست. یا اگه طول کرم ها ۴و۵و۶ سانتیمتر می‌شد میانگین ۵ سانتیمتر و انحراف از معیار مثبت و منفی یک سانتیمتر می‌شد.

اما Standard Error  یا Standard Error of the Mean(SEM) چیه؟

به لحاظ مفهومی یعنی همون میانگین رو احتمالا با چه خطایی اندازه گیری کردیم؟ چقدر میانگینی که اندازه گیری کردیم از میانگین واقعی میتونه دور باشه؟ پراکندگی میانگین‌ها چقدر هست؟

توی زبان فارسی بهش خطای استاندارد یا خطای معیار هم میگن. گاهی میایم کل آزمایش و مشاهداتی که داشتیم رو مثلا ۲۰ بار دیگه تکرار می‌کنیم که مثلا اگه تو گزارش مون اوردیم میانگین فلان چیز بهمانه بگیم نگا حرف درسته، چون من کل آزمایشم رو ۲۰ بار دیگه هم تکرار کردیم و SD میانگین شده یک عدد کم. جالبه نه؟به عبارت دیگه این دفعه نمونه‌های من طول کرم‌ها نیستن بلکه میانگین‌هایی هست که حساب کردم.

حالا خوبیش این هست که لازم نیست شما آزمایش‌تون رو لزوما n بار دیگه تکرار کنید کافیه با رابطه‌های که موجود هست میزان Starndard Error یا SE رو گزارش بدین. از این مفهوم نه برای توضیح داده بلکه برای نتیجه گرفتن یا inference از داده‌ها استفاده می‌کنیم.

رابطش چیه؟

Standard Error = \dfrac{Standard Deviation}{\sqrt{n}}

سوال: حالا فایده‌ی خطای استاندارد چیه؟  چه زمانی از SD و چه زمانی از SE استفاده می‌کنیم؟

فرض کنیم توی سوال من اینه میخوام ببینم طول کرم‌هایی که تو باغ‌های هویج هستن با باغی که توش زالزالک کاشتیم تفاوت دارن یا نه؟ مثال دنیای واقعی ترش هم امید به زندگی در افرادی که ورزش می‌کنند و افرادی که ورزش نمی‌کنند.  حالا من میرم میانگین رو در دو گروه اندازه گیری میکنم. یکی میشه ۷۰ سال یکی میشه ۷۵ سال و در مثال کرم هم یکی میشه ۴ سانتیمتر و اون یکی میشه ۵ سانتیمتر.

حالا میخوام  بگم نگاه کنید این دو گروه با هم میانگین ها تفاوت دارن، کمی به این سوال فکر کنید و بعد ادامه مطلب رو بخونید. به نظر شما اینجا باید از SEM یا از SD استفاده کنم؟

بله احتمالا همون طور که حدس زدین برای اثبات حرفم اینجا بهتره از SEM استفاده کنم و بگم ببینم خطای استاندارم کم هست در نتیجه این دو گروه ورزشکار و غیر ورزشکار از هم واقعا تفاوت دارن ولی SEM طول کرم‌ها زیاد شده و در نتیجه طول کرم ربطی باغ هویج یا زالزالک نداره.

توجه داشته باشین همیشه طول SE از طول SD با یک ضریب رادیکال n کوچکتر هست. به عبارتی SD که تون رو حساب کردین تقسیم بر ردایکال اِن کنید میشه طول SE تون.

بازه اطمینان یا Confidence Interval

اگر بیایم و همون SE رو در ۱.۹۶ ضرب کنیم(همون تقریبا دو برابر کنیم) حالا ما به بازه اطمینان رسیدیم. بازه اطمینان به ما چی میگه؟ میگه اگر بیایم آزمایش مون رو بینهایت بار تکرار کنیم با احتمال ۹۵ درصد میانگین واقعی مون طوی بازه اطمینان میوفته.

اگر در یک آزمایش ببینیم بازه اطمینان دو حالت باهم تفاوت داره، میتونیم نتیجه بگیرم که این تفاوت به احتمال ۹۵ درصد معنی داره (یعنی p-value < 0.05) هست. و اگه بازه اطمینان دو حالت با هم اشتراک داشت یعنی p-valuse مون بیشتر از پنج صدم هست و این اختلاف دیده شده معنی دار نیست.

بیشتر بدانید:

قانون ۶سیگما چی میگه؟ میگه بیاد SD تو حساب کن طول error bar تو ۶برابر کن سه تا بیا بالا و سه تا هم پایین. حالا به احتمالا ۹۹ درصد تک تک نمونه‌های تو در این بازه میفتن.

take home message:

اگر مهم اینکه من چه نمونه‌هایی دیدم و چه نمون‌هایی خواهم دید از SD استفاده کنیم ولی اگه خواستیم بگیم میانگین دو چیز با هم متفاوتن بهتره از SE استفاده کنیم.

منبع(+)