آخرین ارسال ها |
نوار پیام ها |
مدیریت پیام ها |
نمایش موضوع به شکل عادی | |||
اطلاعات نویسنده |
آموزش نرم افزار SPSS
پنجشنبه ۲۱ خرداد ۱۳۹۴ ۰۴:۱۳ قبل از ظهر
[#13]
|
||
مدیر انجمن
شماره عضویت :
44
حالت :
ارسال ها :
2792
جنسیت :
تعداد بازدیدکنندگان :
773
دعوت شدگان :
12
اعتبار کاربر :
21876
پسند ها :
2658
تشکر شده : 3464
وبسایت من :
وبسایت من
|
رگرسیونمقدمهیکی از اهداف اکثر بررسیهای آماری، یافتن رابطههایی است که به کمک آن بتوان اثر تغییر یک یا چند متغیر را برروی متغیرهای دیگر پیشبینی کرد. مانند: 1- پیش بینی امکان فروش یک فرآوردهی جدید برحسب قیمت آن.2- پیشبینی درصد مردمی که دارای شرایط رای دادن هستند نسبت به عوامل اجتماعی- سیاسی مانند ساختار سنی، سطح سواد و میانگین درآمد. 3- پیش بینی هزینهی مهمانی یک خانواده برحسب تعداد میهمانها و... رویهم رفته هدف از نگارش این فصل، ارایهی روش استخراج رابطههای موجود بین متغیرها است که با استفاده از انبوه دادههای گردآوری شده صورت میگیرد. این روش، رگرسیون نام دارد.لازم به توضیح است که معنی واژهی رگرسیون «برگشت» است که از نظر تاریخی نخستین بار فرانسیس گالتن این واژه را به کار برد. در واقع، وی با استفاده از آن، ارتباط بین میانگین طول قامت پدران و پسران را مورد مطالعه قرار داد. گالتن از روی مشاهدههای خود نتیجه گرفت که طول قامت پسران متعلق به والدین خیلی بلندقد (یا کوتاه)، روی هم رفته بلندتر (کوتاهتر) از طول قامت متوسط بوده است، ولی البته نه به بلندی (یا کوتاهی) قد والدینشان. وی این نتیجهگیری را در سال 1885 تحت عنوان برگشت قد ارثی به سوی حد متوسط منتشر کرد. تحلیل رگرسیونی روشی ساده برای بررسی و تعیین روابط میان متغیرهاست. به عبارت دیگر، تحلیل رگرسیونی یکی از ابزارهایی است که از ارتباط و همبستگی بین متغیرها استفاده میکند تا مقدار یک متغیر را از روی مقدار متغیرهای دیگر که با آن ارتباط دارند، پیشگویی کند. در واقع، میتوان دو نوع متغیر را شناسایی کرد که آنها را متغیر مستقل (متغیر کنترل شده) و متغیر وابسته (متغیر پاسخ) مینامند. منظور از متغیرهای مستقل آن دسته از متغیرهایی هستند که میتوانند مقدار معینی را اختیار کنند و به طور کلی این نوع متغیرها کنترل پذیر هستند. مانند قیمت یک فراوردهی جدید، شمار دعوت شدگان یک مهمانی و همانند آن، و یا مقداری که اختیار میکنند قابل مشاهده ولی کنترل پذیر هستند مانند: عوامل اجتماعی- سیاسی همچون ساختار سنی، سطح سواد، میانگین درآمد و نظایر آن. نتیجهی تغییرهایی که به شکل تعمدی یا غیر تعمدی برای متغیر مستقل به وجود میآید، به صورت یک اثر به متغیر دیگر منتقل میشود. این متغیر، متغیر وابسته (پاسخ) است، مانند: امکان فروش یک فراوردهی جدید، هزینهی مهمانی یک خانواده و درصد مردم واجد شرایط برای رای دادن. روشن است که اگر بتوانیم رابطهای ساده میان یک متغیر وابسته و یک یا چند متغیر مستقل بیابیم، خوشحال خواهیم شد ولی همیشه اینگونه نیست و ممکن است رابطهای پیچیده میان آنها برقرار باشد. البته شایان ذکر است که گاهی تحلیل رگرسیونی را اساسا برای بررسی ماهیت همبستگی (رابطهی) بین متغیرهای مستقل و متغیر پاسخ به کار میبرند. مثلاً در مطالعهی میزان درآمد افراد و میزان پسانداز آنها مایلیم بدانیم آیا با افزایش درآمد، پسانداز آنها افزایش مییابد یا خیر.رابطهی بین متغیرهارابطهی بین دو متغیر ممکن است به صورت رابطهی ریاضی یا رابطهای آماری باشد.ضریب تعیینمشاهده کردیم که SST ،انحراف مشاهدههای Yi را اندازهگیری میکند، وقتی که از متغیر مستقل X استفاده نمیکنیم.در واقعSST، میزان عدم اطمینان در پیشبینی Y است، وقتی X در نظر گرفته نمیشود. SSE نیز انحراف مشاهدههای Yi را اندازهگیری میکند، وقتی که یک مدل رگرسیونی از متغیر مستقل X استفاده میکند. از اینرو، یک معیار طبیعی و منطقی برای اندازهگیری میزان تاثیرX در کاهش میزان پراکندگی Y عبارت است از: که ضریب تعیین نامیده میشود.از آنجا که است، میتوان نتیجه گرفت که :
R2 در واقع، نسبت کاهش انحرافهای کل Y با استفاده از متغیرمستقل X است. بنابراین، هرچه R2 زیادتر باشد بدین معنی است که با استفاده از X انحرافهای Y بیشتر کاهش مییابد. نکته 1- اگر تمام مشاهدهها روی خط رگرسیون برازش شده قرار گیرند، آنگاه SSE=0 است و در نتیجه1=R2 میشود. شکل9-5 نشان دهندهی این وضعیت است.
شکل9-5
نکته 2- اگر SSE =SST باشد، آنگاه 0=b1 و است. در نتیجه0= R2 میشود و در واقع، هیچ ارتباط خطی بینX وY وجود ندارد. به عبارت دیگرمتغیر X هیچ کمکی به کاهش انحرافهای Yi نمیکند. این حالت در شکل 10-8 نشان داده شده است. نکته 3- البته در عمل0= R2 یا 1= R2 به ندرت اتفاق میافتد. ولی هرچه R2 به 1 نزدیک باشد، درجهی همبستگی خطی بین XوY بیشتر خواهد بود. درنتیجه R2 میزان همبستگی حول خط رگرسیونی را نشان میدهد و بنابراین نشان دهندهی میزان توجیه پراکندگی متغیر پاسخ به وسیلهی مدل خطی برازش داده شده است. هرچه مقدار R2 بیشتر باشد مدل خطی برازش داده شده مناسبتر است.
ویرایش ارسال توسط : programmer
در تاریخ : پنجشنبه ۲۱ خرداد ۱۳۹۴ ۰۸:۵۹ بعد از ظهر |
||
|