آمار استنباطی - کاج نوین

آمار استنباطی

آمار استنباطی در حالی که آمار توصیفی ویژگی های یک مجموعه داده را خلاصه می کند، آمار استنباطی به شما کمک می کند تا به نتیجه گیری برسید و بر اساس داده های خود پیش بینی کنید.

هنگامی که داده ها را از یک نمونه جمع آوری می کنید، می توانید از آمار استنباطی برای درک جمعیت بزرگتری که نمونه از آن گرفته شده است استفاده کنید.

آمار استنباطی دو کاربرد عمده دارد:

تخمین زدن در مورد جمعیت (به عنوان مثال، میانگین نمره SAT همه دانش آموزان کلاس یازدهم در ایالات متحده).
آزمایش فرضیه ها برای نتیجه گیری در مورد جمعیت ها (به عنوان مثال، رابطه بین نمرات SAT و درآمد خانواده).

آمار استنباطی
آمار استنباطی – کاج نوین

آمار توصیفی در مقابل آمار استنباطی

آمار توصیفی به شما امکان می دهد یک مجموعه داده را توصیف کنید، در حالی که آمار استنباطی به شما امکان می دهد بر اساس یک مجموعه داده استنتاج کنید.

آمار توصیفی

با استفاده از آمار توصیفی، می توانید مشخصات داده های خود را گزارش دهید:

توزیع مربوط به فرکانس هر مقدار است.
گرایش مرکزی به میانگین مقادیر مربوط می شود.

تنوع به میزان پراکندگی مقادیر مربوط می شود.
در آمار توصیفی، هیچ عدم قطعیتی وجود ندارد – آمار دقیقاً داده هایی را که شما جمع آوری کرده اید توصیف می کند. اگر داده‌ها را از کل جمعیت جمع‌آوری کنید، می‌توانید مستقیماً این آمار توصیفی را با آمارهای سایر جمعیت‌ها مقایسه کنید.

مثال: آمار توصیفی
شما داده هایی را در مورد نمرات SAT همه دانش آموزان کلاس یازدهم در یک مدرسه به مدت سه سال جمع آوری می کنید.
می‌توانید از آمار توصیفی برای دریافت یک مرور سریع از نمرات مدرسه در آن سال‌ها استفاده کنید. سپس می توانید مستقیماً میانگین نمره SAT را با میانگین نمرات مدارس دیگر مقایسه کنید.

آمار استنباطی

بیشتر اوقات، شما فقط می‌توانید داده‌ها را از نمونه‌ها به‌دست آورید، زیرا جمع‌آوری داده‌ها از کل جمعیتی که به آن‌ها علاقه دارید بسیار دشوار یا گران است.

در حالی که آمار توصیفی فقط می تواند ویژگی های یک نمونه را خلاصه کند، آمار استنباطی از نمونه شما برای حدس های معقول در مورد جمعیت بزرگتر استفاده می کند.

با آمار استنباطی، استفاده از روش‌های نمونه‌گیری تصادفی و بی‌طرف مهم است. اگر نمونه شما نماینده جامعه شما نیست، نمی توانید استنباط آماری معتبری انجام دهید.

مثال: آمار استنباطی
شما به طور تصادفی یک نمونه از دانش آموزان کلاس یازدهم در ایالت خود را انتخاب می کنید و داده هایی را در مورد نمرات SAT و سایر ویژگی های آنها جمع آوری می کنید.
شما می توانید از آمار استنباطی برای تخمین زدن و آزمون فرضیه ها در مورد کل جمعیت کلاس یازدهم در ایالت بر اساس داده های نمونه خود استفاده کنید.

خطای نمونه گیری در آمار استنباطی

از آنجایی که اندازه یک نمونه همیشه کوچکتر از اندازه جامعه است، برخی از جامعه توسط داده های نمونه گرفته نمی شوند. این خطای نمونه‌گیری را ایجاد می‌کند، که تفاوت بین مقادیر واقعی جامعه (به نام پارامترها) و مقادیر نمونه اندازه‌گیری شده (به نام آمار) است.

هر زمان که از نمونه استفاده می کنید، خطای نمونه گیری رخ می دهد، حتی اگر نمونه شما تصادفی و بی طرفانه باشد. به همین دلیل همیشه در آمار استنباطی مقداری عدم قطعیت وجود دارد. اما استفاده از روش های نمونه گیری احتمالی این عدم قطعیت را کاهش می دهد.

آمار استنباطی - کاج نوین
آمار استنباطی – کاج نوین

برآورد پارامترهای جامعه از آمار نمونه

ویژگی های نمونه ها و جمعیت ها با اعدادی به نام آمار و پارامتر توصیف می شود:

آمار معیاری است که نمونه را توصیف می کند (به عنوان مثال، میانگین نمونه).
یک پارامتر معیاری است که کل جمعیت را توصیف می کند (به عنوان مثال، میانگین جمعیت).
خطای نمونه گیری تفاوت بین یک پارامتر و یک آمار مربوطه است. از آنجایی که در بیشتر موارد پارامتر جمعیت واقعی را نمی دانید، می توانید از آمار استنباطی برای تخمین این پارامترها به گونه ای استفاده کنید که خطای نمونه گیری را در نظر بگیرد.

دو نوع تخمین مهم وجود دارد که می توانید در مورد جمعیت انجام دهید: تخمین نقطه ای و تخمین فاصله ای.

تخمین نقطه ای یک تخمین مقدار واحد از یک پارامتر است. به عنوان مثال، میانگین نمونه، تخمین نقطه ای از میانگین جمعیت است.
تخمین بازه‌ای محدوده‌ای از مقادیر را به شما می‌دهد که انتظار می‌رود پارامتر در آن قرار داشته باشد. فاصله اطمینان رایج ترین نوع تخمین فاصله است.
هر دو نوع تخمین برای جمع آوری یک ایده واضح از جایی که یک پارامتر احتمالاً در آن قرار دارد، مهم هستند.

فاصله اطمینان – آمار استنباطی

یک بازه اطمینان از تغییرپذیری حول یک آمار برای بدست آوردن تخمین فاصله ای برای یک پارامتر استفاده می کند. فواصل اطمینان برای تخمین پارامترها مفید هستند زیرا خطای نمونه برداری را در نظر می گیرند.

در حالی که یک تخمین نقطه ای یک مقدار دقیق برای پارامتری که به آن علاقه دارید به شما می دهد، یک فاصله اطمینان عدم قطعیت تخمین نقطه را به شما می گوید. آنها بهتر است در ترکیب با یکدیگر استفاده شوند.

هر بازه اطمینان با سطح اطمینان همراه است. سطح اطمینان احتمال (بر حسب درصد) فاصله حاوی تخمین پارامتر را در صورت تکرار مجدد مطالعه به شما می گوید.

فاصله اطمینان 95٪ به این معنی است که اگر مطالعه خود را با یک نمونه جدید دقیقاً به همان روش 100 بار تکرار کنید، می توانید انتظار داشته باشید که تخمین شما در محدوده مقادیر مشخص شده 95 بار باشد.

اگرچه می توانید بگویید که برآورد شما در یک بازه زمانی مشخص خواهد بود، اما نمی توانید با اطمینان بگویید که پارامتر جمعیت واقعی خواهد بود. این به این دلیل است که شما نمی توانید مقدار واقعی پارامتر جمعیت را بدون جمع آوری داده ها از کل جمعیت بدانید.

با این حال، با نمونه گیری تصادفی و حجم نمونه مناسب، به طور منطقی می توانید انتظار داشته باشید که فاصله اطمینان شما در درصد معینی از زمان شامل پارامتر باشد.

آمار استنباطی - کاج نوین
آمار استنباطی – کاج نوین

مثال: برآورد نقطه ای و فاصله اطمینان

شما می خواهید بدانید که میانگین روزهای مرخصی با حقوق کارکنان یک شرکت بین المللی چقدر است. پس از جمع آوری پاسخ های نظرسنجی از یک نمونه تصادفی، شما یک تخمین نقطه و یک فاصله اطمینان را محاسبه می کنید.

برآورد امتیازی شما از میانگین جمعیت روزهای مرخصی با حقوق، میانگین نمونه 19 روز مرخصی با حقوق است. با نمونه گیری تصادفی، فاصله اطمینان 95% [16 22] به این معنی است که می توانید به طور منطقی مطمئن باشید که میانگین تعداد روزهای تعطیل بین 16 تا 22 است.

تست فرضیه – آمار استنباطی

آزمون فرضیه یک فرآیند رسمی تجزیه و تحلیل آماری با استفاده از آمار استنباطی است. هدف از آزمون فرضیه مقایسه جمعیت ها یا ارزیابی روابط بین متغیرها با استفاده از نمونه است.

فرضیه ها یا پیش بینی ها با استفاده از آزمون های آماری آزمایش می شوند. آزمون های آماری همچنین خطاهای نمونه گیری را تخمین می زنند تا بتوان استنباط معتبری داشت.

آزمون های آماری می توانند پارامتریک یا ناپارامتریک باشند. تست‌های پارامتریک از نظر آماری قدرتمندتر در نظر گرفته می‌شوند، زیرا در صورت وجود، احتمال بیشتری وجود دارد که اثری را تشخیص دهند.

آزمون های پارامتریک مفروضاتی را ایجاد می کنند که شامل موارد زیر است:

جامعه ای که نمونه از آن به دست آمده است از توزیع نرمال نمرات پیروی می کند
حجم نمونه به اندازه کافی بزرگ است که جامعه را نشان دهد
واریانس ها، معیاری از گسترش، هر گروهی که مقایسه می شود مشابه است

هنگامی که داده های شما هر یک از این مفروضات را نقض می کند، آزمون های ناپارامتریک مناسب تر هستند. آزمون‌های ناپارامتریک «آزمون‌های بدون توزیع» نامیده می‌شوند زیرا چیزی در مورد توزیع داده‌های جمعیت فرض نمی‌کنند.

آزمون های آماری به سه شکل ارائه می شوند: آزمون های مقایسه، همبستگی یا رگرسیون.

تست های مقایسه ای – آمار استنباطی

آزمون‌های مقایسه‌ای ارزیابی می‌کنند که آیا تفاوت‌هایی در میانگین، میانه یا رتبه‌بندی نمرات دو یا چند گروه وجود دارد یا خیر.

برای تصمیم گیری در مورد اینکه کدام آزمون با هدف شما مطابقت دارد، در نظر بگیرید که آیا داده های شما شرایط لازم برای آزمون های پارامتریک، تعداد نمونه ها و سطوح اندازه گیری متغیرهای شما را دارد یا خیر.

آزمون های همبستگی – آمار استنباطی

آزمون های همبستگی میزان ارتباط دو متغیر را تعیین می کنند. اگرچه r پیرسون قوی‌ترین آزمون آماری است، اما r Spearman برای متغیرهای بازه و نسبت زمانی مناسب است که داده‌ها از توزیع نرمال پیروی نمی‌کنند.

تست های رگرسیون

آزمون‌های رگرسیون نشان می‌دهند که آیا تغییرات در متغیرهای پیش‌بینی‌کننده باعث تغییر در متغیر نتیجه می‌شود یا خیر. شما می توانید بر اساس تعداد و انواع متغیرهایی که به عنوان پیش بینی کننده و پیامد دارید، تصمیم بگیرید که از کدام آزمون رگرسیون استفاده کنید.

اکثر آزمون‌های رگرسیون که معمولاً مورد استفاده قرار می‌گیرند پارامتریک هستند. اگر داده های شما به طور معمول توزیع نشده است، می توانید تبدیل داده ها را انجام دهید.

این مقاله را مطالعه کنید  10 مهارت اساسی تفکر انتقادی

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.

17 − 8 =

شروع گفتگو
نیاز به کمک دارید؟
سلام
چطور می تونم کمکتون کنم؟