تجزیه و تحلیل آماری - کالج نوین

تجزیه و تحلیل آماری

تجزیه و تحلیل آماری به معنای بررسی روندها، الگوها و روابط با استفاده از داده های کمی است. این یک ابزار تحقیقاتی مهم است که توسط دانشمندان، دولت ها، مشاغل و سایر سازمان ها استفاده می شود. برای نتیجه گیری معتبر، تجزیه و تحلیل آماری نیاز به برنامه ریزی دقیق از همان آغاز فرآیند تحقیق دارد.

تجزیه و تحلیل آماری شما باید فرضیه های خود را مشخص کنید و در مورد طرح تحقیق، حجم نمونه و روش نمونه گیری تصمیم گیری کنید. پس از جمع آوری داده ها از نمونه خود، می توانید داده ها را با استفاده از آمار توصیفی سازماندهی و خلاصه کنید.

سپس، می‌توانید از آمار استنباطی برای آزمایش رسمی فرضیه‌ها و تخمین‌هایی درباره جمعیت استفاده کنید. در نهایت، می توانید یافته های خود را تفسیر و تعمیم دهید.

تجزیه و تحلیل آماری این انجام مقاله مقدمه ای کاربردی برای تحلیل های آماری برای دانشجویان و محققین است. ما با استفاده از دو مثال تحقیقاتی شما را از طریق مراحل راهنمایی می کنیم.

این مقاله را مطالعه کنید  تفکر انتقادی

اولی یک رابطه علت و معلولی بالقوه را بررسی می کند، در حالی که دومی یک همبستگی بالقوه بین متغیرها را بررسی می کند.

مثال: سوال علّی تحقیق
آیا مدیتیشن می تواند عملکرد امتحان را در نوجوانان بهبود بخشد؟

مثال: سوال تحقیق همبستگی
آیا بین درآمد والدین و معدل دانشگاهی (GPA) رابطه ای وجود دارد؟

تجزیه و تحلیل آماری
تجزیه و تحلیل آماری – کالج نوین

مرحله 1: فرضیه های خود را بنویسید و طرح تحقیق خود را برنامه ریزی کنید

تجزیه و تحلیل آماری برای جمع آوری داده های معتبر برای تجزیه و تحلیل آماری، ابتدا باید فرضیه های خود را مشخص کنید و طرح تحقیق خود را برنامه ریزی کنید.

نوشتن فرضیه های آماری

تجزیه و تحلیل آماری هدف پژوهش اغلب بررسی رابطه بین متغیرها در یک جامعه است. شما با یک پیش بینی شروع می کنید و از تجزیه و تحلیل آماری برای آزمایش آن پیش بینی استفاده می کنید.

فرضیه آماری روشی رسمی برای نوشتن پیش‌بینی در مورد یک جمعیت است. هر پیش‌بینی تحقیق به فرضیه‌های صفر و جایگزین تبدیل می‌شود که می‌توانند با استفاده از داده‌های نمونه آزمایش شوند.

تجزیه و تحلیل آماری در حالی که فرضیه صفر همیشه هیچ تاثیری یا عدم رابطه بین متغیرها را پیش‌بینی می‌کند، فرضیه جایگزین پیش‌بینی تحقیق شما از یک اثر یا رابطه را بیان می‌کند.

مثال: فرضیه های آماری برای آزمایش یک اثر
فرضیه صفر: یک تمرین مدیتیشن 5 دقیقه ای هیچ تاثیری بر نمرات آزمون ریاضی در نوجوانان نخواهد داشت.
فرضیه جایگزین: یک تمرین مراقبه 5 دقیقه ای نمرات آزمون ریاضی را در نوجوانان بهبود می بخشد.

مثال: فرضیه های آماری برای آزمون همبستگی
فرضیه صفر: درآمد والدین و معدل در دانشجویان ارتباطی با یکدیگر ندارند.
فرضیه جایگزین: درآمد والدین و معدل در دانشجویان همبستگی مثبت دارند.

تجزیه و تحلیل آماری - کالج نوین
تجزیه و تحلیل آماری – کالج نوین

طرح تحقیق خود را برنامه ریزی کنید

تجزیه و تحلیل آماری طرح تحقیق استراتژی کلی شما برای جمع آوری و تجزیه و تحلیل داده ها است. این آزمون های آماری را تعیین می کند که می توانید بعداً برای آزمایش فرضیه خود از آنها استفاده کنید.

ابتدا تصمیم بگیرید که آیا تحقیق شما از طرح توصیفی، همبستگی یا آزمایشی استفاده خواهد کرد. آزمایش‌ها مستقیماً بر متغیرها تأثیر می‌گذارند، در حالی که مطالعات توصیفی و همبستگی فقط متغیرها را اندازه‌گیری می‌کنند.

در یک طرح آزمایشی، می‌توانید با استفاده از آزمون‌های آماری مقایسه یا رگرسیون، یک رابطه علت و معلولی (به عنوان مثال، تأثیر مراقبه بر نمرات آزمون) را ارزیابی کنید.
در یک طرح همبستگی، می توانید روابط بین متغیرها (به عنوان مثال، درآمد والدین و معدل) را بدون هیچ گونه فرض علیت با استفاده از ضرایب همبستگی و آزمون های معناداری بررسی کنید.
در یک طرح توصیفی، می‌توانید ویژگی‌های یک جمعیت یا پدیده را با استفاده از آزمون‌های آماری برای استنتاج از داده‌های نمونه مطالعه کنید (به عنوان مثال، شیوع اضطراب در دانشجویان ایالات متحده).
طرح تحقیق شما همچنین به این موضوع مربوط می شود که آیا شرکت کنندگان را در سطح گروهی یا فردی یا هر دو مقایسه خواهید کرد.

تجزیه و تحلیل آماری در طراحی بین آزمودنی‌ها، نتایج در سطح گروه شرکت‌کنندگانی را که در معرض درمان‌های مختلف قرار گرفته‌اند (مثلاً کسانی که تمرین مدیتیشن انجام داده‌اند در مقابل کسانی که انجام نداده‌اند) مقایسه می‌کنید.

در یک طرح درون آزمودنی، اقدامات مکرر شرکت‌کنندگانی را که در تمام درمان‌های یک مطالعه شرکت کرده‌اند (به عنوان مثال، نمرات قبل و بعد از انجام تمرین مدیتیشن) مقایسه می‌کنید.

تجزیه و تحلیل آماری - کالج نوین
تجزیه و تحلیل آماری – کالج نوین

اندازه گیری متغیرها

تجزیه و تحلیل آماری هنگام برنامه ریزی یک طرح تحقیق، باید متغیرهای خود را عملیاتی کنید و دقیقاً تصمیم بگیرید که چگونه آنها را اندازه گیری کنید.

برای تجزیه و تحلیل آماری، مهم است که سطح اندازه گیری متغیرهای خود را در نظر بگیرید، که به شما می گوید چه نوع داده هایی دارند:

داده های طبقه بندی نشان دهنده گروه بندی است. اینها ممکن است اسمی (مثلاً جنسیت) یا ترتیبی (مثلاً سطح توانایی زبان) باشند.
داده های کمی نشان دهنده مقادیر هستند. اینها ممکن است در مقیاس فاصله ای (مثلاً نمره آزمون) یا مقیاس نسبت (مثلاً سن) باشند.
بسیاری از متغیرها را می توان در سطوح مختلف دقت اندازه گیری کرد. به عنوان مثال، داده های سنی می تواند کمی (8 ساله) یا طبقه ای (جوان) باشد. اگر متغیری به صورت عددی کدگذاری شود (مثلاً سطح توافق از 1 تا 5)، به طور خودکار به این معنی نیست که به جای طبقه‌بندی، کمی است.

شناسایی سطح اندازه گیری برای انتخاب آمار و آزمون های فرضیه مناسب مهم است. به عنوان مثال، شما می توانید میانگین امتیاز را با داده های کمی محاسبه کنید، اما نه با داده های طبقه بندی.

تجزیه و تحلیل آماری در یک مطالعه تحقیقاتی، همراه با اندازه گیری متغیرهای مورد علاقه خود، اغلب داده هایی را در مورد ویژگی های شرکت کننده مرتبط جمع آوری می کنید.

یک روش نمونه گیری مناسب ایجاد کنید

بر اساس منابع موجود برای تحقیق خود، در مورد نحوه جذب شرکت کنندگان تصمیم بگیرید.

آیا منابعی برای تبلیغ گسترده مطالعه خود، از جمله خارج از محیط دانشگاه خود خواهید داشت؟

آیا ابزاری برای استخدام یک نمونه متنوع خواهید داشت که نشان دهنده یک جمعیت گسترده باشد؟
آیا زمانی برای تماس و پیگیری با اعضای گروه های غیرقابل دسترسی دارید؟

حجم نمونه کافی را محاسبه کنید

قبل از استخدام شرکت کنندگان، با بررسی سایر مطالعات در زمینه خود یا با استفاده از آمار، در مورد حجم نمونه خود تصمیم بگیرید. نمونه‌ای که خیلی کوچک است ممکن است نمایانگر نمونه نباشد، در حالی که نمونه‌ای که خیلی بزرگ است گران‌تر از آنچه لازم است خواهد بود.

تعداد زیادی ماشین حساب اندازه نمونه آنلاین وجود دارد. بسته به اینکه آیا شما زیر گروه دارید یا اینکه مطالعه شما چقدر باید دقیق باشد (مثلاً در تحقیقات بالینی) از فرمول های مختلفی استفاده می شود. به عنوان یک قاعده کلی، حداقل 30 واحد یا بیشتر در هر زیرگروه ضروری است.

برای استفاده از این ماشین حساب ها، باید این مولفه های کلیدی را بدانید و وارد کنید:

سطح اهمیت (آلفا): خطر رد یک فرضیه صفر واقعی که مایل به پذیرش آن هستید، معمولاً 5٪ تعیین می شود.

قدرت آماری: احتمال اینکه مطالعه شما اثری با اندازه معین را تشخیص دهد، در صورتی که وجود داشته باشد، معمولاً 80٪ یا بیشتر.
اندازه اثر مورد انتظار: یک نشانه استاندارد از اینکه نتیجه مورد انتظار مطالعه شما چقدر بزرگ خواهد بود، معمولا بر اساس سایر مطالعات مشابه.
انحراف استاندارد جمعیت: برآورد پارامتر جمعیت بر اساس مطالعه قبلی یا مطالعه آزمایشی خودتان.

مرحله 3: داده های خود را با آمار توصیفی خلاصه کنید

هنگامی که تمام داده های خود را جمع آوری کردید، می توانید آنها را بررسی کرده و آمار توصیفی را محاسبه کنید که آنها را خلاصه می کند.

داده های خود را بررسی کنید
روش های مختلفی برای بررسی داده های شما وجود دارد، از جمله موارد زیر:

سازماندهی داده ها از هر متغیر در جداول توزیع فرکانس.
نمایش داده ها از یک متغیر کلیدی در نمودار میله ای برای مشاهده توزیع پاسخ ها.

تجسم رابطه بین دو متغیر با استفاده از نمودار پراکندگی.
با تجسم داده‌های خود در جداول و نمودارها، می‌توانید ارزیابی کنید که آیا داده‌های شما از توزیع اریب یا نرمال پیروی می‌کنند و آیا داده‌های پرت یا گمشده وجود دارد یا خیر.

توزیع نرمال به این معنی است که داده‌های شما به طور متقارن در اطراف مرکزی توزیع می‌شوند که بیشتر مقادیر در آن قرار دارند و مقادیر در انتهای انتهایی آن کاهش می‌یابد.

در مقابل، توزیع اریب نامتقارن است و مقادیر بیشتری در یک طرف نسبت به طرف دیگر دارد. شکل توزیع مهم است که به خاطر داشته باشید زیرا فقط برخی از آمار توصیفی باید با توزیع های اریب استفاده شوند.

نقاط دورافتاده شدید نیز می توانند آمار گمراه کننده ای تولید کنند، بنابراین ممکن است به یک رویکرد سیستماتیک برای مقابله با این مقادیر نیاز داشته باشید.

معیارهای گرایش مرکزی را محاسبه کنید

معیارهای گرایش مرکزی توصیف می کنند که بیشتر مقادیر در یک مجموعه داده کجا قرار دارند. سه معیار اصلی گرایش مرکزی اغلب گزارش می شود:

حالت: محبوب ترین پاسخ یا مقدار در مجموعه داده ها.
میانه: مقدار دقیقاً در وسط مجموعه داده در هنگام سفارش از کم به زیاد.
میانگین: مجموع همه مقادیر تقسیم بر تعداد مقادیر.

با این حال، بسته به شکل توزیع و سطح اندازه گیری، تنها یک یا دو مورد از این اقدامات ممکن است مناسب باشد. به عنوان مثال، بسیاری از ویژگی های جمعیت شناختی را فقط می توان با استفاده از حالت یا نسبت ها توصیف کرد، در حالی که متغیری مانند زمان واکنش ممکن است اصلاً حالت نداشته باشد.

اندازه گیری تغییرپذیری را محاسبه کنید

اندازه گیری تغییرپذیری به شما می گوید که مقادیر در یک مجموعه داده چقدر پراکنده هستند. چهار معیار اصلی تغییرپذیری اغلب گزارش شده است:

محدوده: بالاترین مقدار منهای کمترین مقدار مجموعه داده.
محدوده بین چارکی: محدوده نیمه میانی مجموعه داده.

انحراف استاندارد: فاصله متوسط ​​بین هر مقدار در مجموعه داده شما و میانگین.
واریانس: مربع انحراف معیار.

یک بار دیگر، شکل توزیع و سطح اندازه‌گیری باید راهنمای انتخاب آمار تنوع شما باشد. محدوده بین چارکی بهترین معیار برای توزیع های اریب است، در حالی که انحراف استاندارد و واریانس بهترین اطلاعات را برای توزیع های نرمال ارائه می دهد.

مرحله 4: فرضیه ها را آزمایش کنید یا با آمار استنباطی تخمین بزنید

عددی که یک نمونه را توصیف می کند، آمار و عددی که یک جامعه را توصیف می کند، پارامتر نامیده می شود. با استفاده از آمار استنباطی می توانید بر اساس آمار نمونه در مورد پارامترهای جمعیت نتیجه گیری کنید.

محققان اغلب از دو روش اصلی (به طور همزمان) برای استنتاج در آمار استفاده می کنند.

برآورد: محاسبه پارامترهای جمعیت بر اساس آمار نمونه.
آزمون فرضیه: فرآیندی رسمی برای آزمایش پیش‌بینی‌های پژوهشی در مورد جمعیت با استفاده از نمونه.
برآورد کردن
شما می توانید دو نوع تخمین از پارامترهای جمعیت را از آمار نمونه انجام دهید:

تخمین نقطه ای: مقداری که بهترین حدس شما را از پارامتر دقیق نشان می دهد.
تخمین بازه ای: محدوده ای از مقادیر که بهترین حدس شما را از کجای پارامتر نشان می دهد.

اگر هدف شما استنباط و گزارش ویژگی های جمعیت از داده های نمونه است، بهتر است از هر دو تخمین نقطه ای و فاصله ای در مقاله خود استفاده کنید.

هنگامی که نمونه ای نماینده دارید، می توانید یک آمار نمونه را تخمین نقطه ای برای پارامتر جمعیت در نظر بگیرید (به عنوان مثال، در یک نظرسنجی گسترده عمومی، نسبت نمونه ای که از دولت فعلی حمایت می کند به عنوان نسبت جمعیت حامیان دولت در نظر گرفته می شود).

همیشه در تخمین خطا وجود دارد، بنابراین باید یک فاصله اطمینان را نیز به عنوان تخمین فاصله ارائه کنید تا تغییرپذیری حول یک تخمین نقطه را نشان دهید.

یک فاصله اطمینان از خطای استاندارد و امتیاز z از توزیع نرمال استاندارد استفاده می کند تا جایی که معمولاً انتظار دارید پارامتر جمعیت را در بیشتر مواقع پیدا کنید.

تست فرضیه

تجزیه و تحلیل آماری با استفاده از داده های یک نمونه، می توانید فرضیه هایی را در مورد روابط بین متغیرها در جامعه آزمایش کنید. آزمون فرضیه با این فرض شروع می شود که فرضیه صفر در جامعه صادق است و شما از آزمون های آماری برای ارزیابی اینکه آیا فرضیه صفر قابل رد است یا خیر، استفاده می کنید.

آزمون‌های آماری تعیین می‌کنند که اگر فرضیه صفر درست باشد، داده‌های نمونه شما در توزیع مورد انتظار داده‌های نمونه کجا قرار می‌گیرند. این تست ها دو خروجی اصلی را ارائه می دهند:

یک آمار آزمون به شما می گوید که چقدر داده های شما با فرضیه صفر آزمون تفاوت دارد.
اگر فرضیه صفر واقعاً در جامعه صادق باشد، یک مقدار p احتمال به دست آوردن نتایج را به شما می گوید.
آزمون های آماری در سه نوع اصلی ارائه می شوند:

آزمون‌های مقایسه تفاوت‌های گروهی را در نتایج ارزیابی می‌کنند.
آزمون رگرسیون روابط علت و معلولی بین متغیرها را ارزیابی می کند.

تجزیه و تحلیل آماری آزمون های همبستگی روابط بین متغیرها را بدون فرض علیت ارزیابی می کنند.
انتخاب آزمون آماری شما به سؤالات تحقیق، طرح تحقیق، روش نمونه گیری و ویژگی های داده بستگی دارد.

تست های پارامتریک

در تجزیه و تحلیل آماری آزمون‌های پارامتریک استنباط‌های قدرتمندی در مورد جامعه براساس داده‌های نمونه ایجاد می‌کنند. اما برای استفاده از آنها باید برخی از مفروضات را رعایت کرد و فقط می توان از برخی از انواع متغیرها استفاده کرد.

اگر داده‌های شما این مفروضات را نقض می‌کنند، می‌توانید تبدیل داده‌های مناسب را انجام دهید یا به جای آن از آزمون‌های ناپارامتریک جایگزین استفاده کنید.

رگرسیون میزانی را که تغییرات در یک متغیر پیش بینی منجر به تغییر در متغیر(های) نتیجه می شود، مدل می کند.

یک رگرسیون خطی ساده شامل یک متغیر پیش‌بینی‌کننده و یک متغیر نتیجه است.
یک رگرسیون خطی چندگانه شامل دو یا چند متغیر پیش‌بینی‌کننده و یک متغیر نتیجه است.

آزمون های مقایسه معمولاً میانگین گروه ها را با هم مقایسه می کنند. اینها ممکن است میانگین گروه‌های مختلف در یک نمونه (به عنوان مثال، گروه درمان و کنترل)، میانگین یک گروه نمونه در زمان‌های مختلف (مثلاً نمرات پیش‌آزمون و پس‌آزمون)، یا میانگین نمونه و میانگین جامعه باشد.

آزمون t دقیقاً برای 1 یا 2 گروه است که نمونه کوچک است (30 یا کمتر).
یک تست z دقیقاً برای 1 یا 2 گروه است که نمونه بزرگ است.
ANOVA برای 3 گروه یا بیشتر است.
آزمون‌های z و t بر اساس تعداد و نوع نمونه‌ها و فرضیه‌ها دارای زیرگروه‌هایی هستند:

اگر فقط یک نمونه دارید که می خواهید آن را با میانگین جامعه مقایسه کنید، از آزمون تک نمونه ای استفاده کنید.
اگر اندازه‌گیری‌های زوجی (طراحی درون آزمودنی‌ها) دارید، از آزمون نمونه‌های وابسته (جفتی) استفاده کنید.
اگر اندازه گیری های کاملا مجزا از دو گروه بی همتا (طراحی بین آزمودنی ها) دارید، از آزمون نمونه های مستقل استفاده کنید.

تجزیه و تحلیل آماری اگر انتظار دارید بین گروه ها در جهت خاصی تفاوت وجود داشته باشد، از آزمون یک دم استفاده کنید.
اگر هیچ انتظاری برای جهت تفاوت بین گروه ها ندارید، از آزمون دو طرفه استفاده کنید.
تنها آزمون همبستگی پارامتریک، r پیرسون است. ضریب همبستگی (r) قدرت رابطه خطی بین دو متغیر کمی را به شما می گوید.

تجزیه و تحلیل آماری با این حال، برای آزمایش اینکه آیا همبستگی در نمونه به اندازه کافی قوی است که در جامعه مهم باشد، باید یک آزمون معناداری ضریب همبستگی، معمولاً آزمون t، برای به دست آوردن مقدار p انجام دهید. این آزمون از حجم نمونه شما برای محاسبه میزان تفاوت ضریب همبستگی با صفر در جامعه استفاده می کند.

مرحله 5: نتایج خود را تفسیر کنید

 در تجزیه و تحلیل آماری مرحله نهایی تجزیه و تحلیل آماری، تفسیر نتایج شما است.

اهمیت آماری
در آزمون فرضیه ها، اهمیت آماری معیار اصلی برای نتیجه گیری است. شما مقدار p خود را با سطح معنی داری مجموعه ای (معمولاً 0.05) مقایسه می کنید تا تصمیم بگیرید که آیا نتایج شما از نظر آماری معنی دار هستند یا غیر معنی دار.

نتایج از لحاظ آماری معنی دار بعید به نظر می رسد که صرفاً به دلیل شانس به دست آمده باشند. اگر فرضیه صفر در جامعه صادق باشد، احتمال وقوع چنین نتیجه ای بسیار کم است.

اشتباهات تصمیم گیری

تجزیه و تحلیل آماری در تجزیه و تحلیل آماری خطاهای نوع اول و دوم اشتباهاتی هستند که در نتیجه گیری تحقیق انجام می شوند. خطای نوع یک به معنای رد فرضیه صفر زمانی است که واقعاً درست است، در حالی که خطای نوع II به معنای عدم موفقیت در رد فرضیه صفر در صورت نادرست است.

تجزیه و تحلیل آماری شما می توانید با انتخاب یک سطح اهمیت بهینه و اطمینان از قدرت بالا، خطر این خطاها را به حداقل برسانید. با این حال، یک معاوضه بین این دو خطا وجود دارد، بنابراین یک تعادل خوب ضروری است.

آمار متداول در مقابل بیزی

تجزیه و تحلیل آماری در تجزیه و تحلیل آماری به طور سنتی، آمارهای مکرر بر آزمون اهمیت فرضیه صفر تأکید می‌کنند و همیشه با فرض یک فرضیه صفر واقعی شروع می‌شوند.

با این حال، آمار بیزی به عنوان یک رویکرد جایگزین در چند دهه اخیر محبوبیت یافته است. در این رویکرد، شما از تحقیقات قبلی برای به روز رسانی مداوم فرضیه های خود بر اساس انتظارات و مشاهدات خود استفاده می کنید.

عامل بیز قدرت نسبی شواهد را برای فرضیه صفر در مقابل فرضیه جایگزین مقایسه می کند تا اینکه در مورد رد فرضیه صفر نتیجه گیری کند یا خیر.

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.

20 − دوازده =

شروع گفتگو
نیاز به کمک دارید؟
سلام
چطور می تونم کمکتون کنم؟