نوشته‌ها

آزمون فرض آماری در spss

آزمون فرض آماری در spss | تصویری و قدم به قدم

آزمون فرض آماری در spss

آزمون فرض آماری در spss، کاربران عزیز صنایع سافت با یکی دیگه از آموزش های نرم افزار spss در خدمت شما هستیم. این مقاله فقط مخصوص کسانیه که میخوان spss رو مختص بازارکار یاد بگیرند، پس اگه شما هم تو این دسته هستین این مقاله آموزشی رو از دست ندین. تا یادم نرفته بگم این آموزش ها همیشه واستون رایگان تولید میشه پس اگه دوستی دارین که این مقاله ها بدردش میخوره واسه اون هم به اشتراگ بگذارین :)

در این آموزش به آزمون فرض آماری در SPSS پرداخته ایم که شامل موارد زیر است :

  1. مقدمه
  2. فرض صفر و فرض مقابل
  3. سطح معنی داری و خطاهای آماری
  4. توزیع نمونه گیری آمارهآزمون فرض یک طرفه و دو طرفه
  5. مراحل کلی آزمون فرض آماری
  6. ماهیت P-Value
  7. آزمون آماری برای میانگین جامعه – آزمون t تک نمونه ای
  8. آزمون آماری برای نسبت جامعه – آزمون دو جمله ای
  9. آزمون اختلاف میانگین ها برای دو جامعه مستقل – آزمون t- دو نمونه مستقل

 

قبل از اینکه این آموزش رو شروع کنید حتما توصیه میکنم آموزش های رایگان قبلی ما رو از دست ندید.

  1. آموزش spss به زبان ساده
  2. آمار توصیفی در spss
  3. آموزش گام به گام فارسی spss

 

آزمون فرض آماری

تحقیقات همواره با سوال و فرضیه شروع می شوند. بسیاری از تحقیقات از مرحله سوال گذشته و به مرحله فرضیه می رسند. فرضیه حدس زیرکانه درباره پارامتر جامعه است. به فنون آماری مناسب برای تحلیل صحت یا نادرستی فرضیه ها فنون «آزمون فرض آماری» (Hypothesis testing) گفته می شود که در این فصل آنها را بررسی می کنیم.

به طور کلی هدف «آزمون فرض آماری» تعیین این موضوع است که با توجه به اطلاعات بدست آمده از داده های نمونه حدسی که درباره خصوصیتی از جامعه می زنیم به طور قوی تایید می شود یا نه. این حدس بنا به تحقیق نوعا شامل ادعایی درباره مقدار یک پارامتر جامعه است. «در واقع هر حکمی درباره جامعه را یک فرض آماری می نامند که قابل قبول بودن آن باید برمبنای اطلاعات حاصل از نمونه گیری از جامعه بررسی شود.»

چون ادعا ممکن است صحیح یا غلط باشد بنابراین دو فرض مکمل در ذهن بوجود می آید:

  1. ادعا صحیح است(فرض H0)
  2. ادعا غلط است (فرض H1)

با به کاربردن اطلاعاتی که از مشاهدات نمونه بدست می آید تصمیم گیرنده باید یکی از دو تصمیم یا استنباط را انتخاب کند:

  1. فرض H1 را رد کند و نتیجه بگیرد که H0 بوسیله داده ها تایید می شود.
  2. فرض H1 را رد نکند و نتیجه بگیرد که داده ها H0 را تایید نمی کند.

فرآِیند انتخاب یکی از دو تصمیم فوق را «آزمون فرض آماری» می نامند.

قبول یا رد یک فرضیه آماری با اثبات و یا رد یک گزاره ریاضی متفاوت است.در ریاضی گزاره ای را اثبات و یا نفی می کنند و در هر حالت نتیجه اش که بدست می آید بدون هیچ شکی برقرار است ولی در مقابلنتیجه حاصل از «آزمون فرض آماری» به وسیله تحلیل داده های تجربی حتمی و قطعی نیست. شیوه مناسب برای آزمون فرض دارای مراحل منطقی است.

قبل از ذکر مراحل مورد نظر به بیان مفاهیم و اصطلاحات استفاده شده درآزمون پرداخته می شود. مهم ترین مرحله در «آزمون فرض آماری» تبدیل «فرضیه پژوهشی» و نقیض آن به «فرضیه های آماری» است. بنابراین مرحله فوق را با عنوان فرض صفر و فرض مقابل تشریح می کنیم.در این فصل به بیان برخی تعاریف در زمینه آمار استنباطی خواهیم پرداخت و سپس چهار آزمون آماری پرکاربرد در آمار کاربردی را معرفی خواهیم کرد.

 

فرض صفر و فرض مقابل

برای بحث درباره فرمول بندی مساله آزمون فرض آماری و حل آن به معرفی پاره ای از تعاریف و مفاهیم نیاز داریم.

مثال ۱:

نظریه ای پیشنهاد می کند که محصول یک واکنش شیمیایی معنی دارای توزیع نرمال (۱۶٫فرمول)  X~N  است.آزمایش گذشته نشان می دهد که اگر یک ماده معدنی به این محصول اضافه نشده باشد۱۰=µ و در غیر اینصورت۱۱=µ است. آزمایش ما عبارت است ازانتخاب نمونه تصادفی به حجم n .بر اساس این نمونه سعی خواهیم کرد تصمیم بگیریم کدام مورد درست است؟

پاسخ:

با توجه به فرضیه ای که در صورت مسئله بیان شده است دو فرض آماری زیر مطرح می شود:

میانگین جامعه برابر عدد ۱۰ است:۱۰=µ

میانگین جامعه برابر عدد۱۱است:۱۱=µ

در اینجا عدد نامعلوم برابر بودن ۱۱=µ است. از دو حکم فوق یکی را «فرض صفر»(Null Hypothesis) و دیگری را «فرض مقابل»(Alternative Hypothesis) می نامیم و آنهارا به ترتیب و به اختصاربا H0 و H1 نشان می دهیم برای اینکه معلوم شود کدام فرض را باید فرض صفر نامید لازم است که تفاوت اساسی بین دو اصطلاح فوق به روشنی درک شود. قبل ازاینکه ادعا کنیم حکمی معتبر است باید شواهد کافی در تایید آن بدست آوریم.

در نتیجه شخص تحلیلگر باید حمل را غلط بداند مگر اینکه داده های بدست آمده خلاف آنرا تایید کنند. به عبارت دیگر باید «فرض صفر» را صحیح دانست و فقط وقتی آنرا رد کرد که داده ها بر خلاف آن حکم کنند. تشابه زیادی بین این امر و محاکمه در دادگاه وجود دارد که در آن هیات منصفه فرض «مجرم بودن» را اتخاذ می کنند مگر اینکه شواهد قانع کننده ای مجرم بودن منتهی را ثابت کنند و نه اینکه در اثبات بی گناهی او بکوشند.

با توجه به نکات فوق می توان نتیجه گرفت که هرگاه بخواهیم یک ادعا را از طریق تایید آن بوسیله اطلاعات حاصل از نمونه آزمون کنیم نفی آن ادعا را فرض صفر و خود آن رافرض مقابل می گیریم بنابراین فرض صفر و فرض مقابل در فرضیه فوق باید به این صورت باشد:

۱۰=µ:H0}

۱۱=µ:H1}

سطح معنی داری و خطاهای آماری

در ادامه آموزش آزمون فرض آماری در spss بعد از تعریف فرضیه های آماری قدم بعدی مشخص کردن درجه ای برای معنی دار بودن تفاوت ها (α) و حجمی برای نمونه مورد بررسی (n) است.روش این کار این است که فرض H0را به نفع فرض H1 رد می کنیم به شرط اینکه از یک آزمون آماری مقداری بدست آوریم که احتمال وقوع آن مقدار با توجه به H0 برابر با کمتر از یک احتمال بسیار کوچک باشد که با α نشان داده می شود.این احتمال وقوع کوچک را «سطح معنی داری» می گویند.

مقادیری که معمولا برای α استفاده می شود بیشتر از ۰٫۰۱ و۰٫۰۵ است. از آنجا که مقدار فرمول در تعیین اینکه H0 باید رد شود یا نه دخالت مستقیم دارد . الزام رعایت عینیت در تحقیق ایجاب می کند که α را پیش از شروع جمع آوری داده ها مشخص کنیم.

سطح معنی داری که محقق برای تعیین α در تحقیق انتخاب می کند براساس تخمین او از اهمیت و یا درجه قابلیت کاربرد یافته هایش مبتنی است. طبیعی است که اگر تحقیق مثلا درباره آثار درمانی عمل جراحی  روی مغز باشد محقق باید α را خیلی کمتر در نظر بگیرد زیرا خطرهای رد کردن نادرست فرضیه صفر بسیار زیاد است.

هنگام اتخاذ تصمیم درباره H0 ممکن است دو نوع خطا پیش آید:

  1. خطای نوع اول (Type I Error): رد کردن فرض H0 درحالی که درست است.
  2. خطای نوع دوم (Type I Error): رد کردن فرض H0 درحالی که غلط است.

احتمال وقوع خطای نوع اول با α بزرگتر شود احتمال اینکه H0 را به غلط رد کنیم یا به عبارت دیگر احتمال اینکه مرتکب خطای نوع اول شویم افزایش می یابد. خطای نوع دوم معمولا با β نشان داده می شود α و β هم برای نشان دادن نوع خطاها و هم ارتکاب آن خطاها به کار می روند. یعنی:

( رد کردن H0 وقتی H0 درست است)P=(خطای نوع اول)P=α

(رد کردن H0 وقتی H1 درست است)P=(خطای نوع اول)P=β

احتمال α به مقدار مشخص پارامتر در دامنه ای بستگی دارد که H0 آنرا در بر می گیرد و حال آنکه β به مقدار پارامتر در دامنه ای بستگی دارد که H1 آنرا در بر می گیرد. این خطاها و احتمال آنها در رابطه با H0 را می توان بصورت زیر خلاصه کرد:

واضح است که بین α و β رابطه معکوس وجود دارد. بالا رفتن α و مقدار β کاهش می یابد و برعکس. این رابطه در آمار به «بده _ بستان» بین α و β معروف است. آنچه مسلم است مجموع α و β الزاما عدد یک نیست.واضح است که در هر استنباط آماری احتمال وقوع یکی از این دو نوع خطا وجود دارد و لازم است که آزمون کننده به نوعی سازش که تعادل بین احتمال وقوع این دو نوع خطا را به حد مطلوب برساند دست یابد.

آزمونهای آماری مختلف احتمال تعادل های مختلفی را عرضه می کنند. در رسیدن به چنین تعادلی است که موضوع «توان آزمون» مطرح می شود. توان آزمون عبارت است از احتمال رد کردن H0 وقتی که H0 حقیقتا نادرست باشد. یعنی:

β – ۱ = (احتمال وقوع خطای نوع دوم) – ۱ = توان آزمون

آنچه موجب کاهش خطای نوع اول و دوم و همچنین توان آزمون می شود افزایش حجم نمونه است. منحنی های شکل ۱-۴ نشان می دهند که وقتی حجم نمونه (n) افزایش می یابد احتمال وقوع خطای نوع دوم (β) کاهش می یابد.

در این شکل افزایش توان آزمون دو طرفه میانگین وقتی که نمونه افزایش می یابد با یکدیگر مقایسه شده است. مشاهده می شود که وقتی حجم نمونه از ۴ به ۱۰٫۲۰٫۵۰و۱۰۰ افزایش می یابد چگونه توان آزمون زیادتر می شود.

توزیع نمونه گیری آماره

صحت یک فرضیه آماری فقط با استفاده از نمونه ای nتایی از جامعه آماری و توزیع نمونه گیری آماره مشخص میشود. در بحث «آزمون فرض» تایید یا رد «فرضیه صفر» به توزیع نمونه گیری آماره بستگی دارد. واضح است که توزیع آماره متاثر از توزیع جامعه و شرایط برآورد و همچنین حجم نمونه است. متغیرهای استاندارد مورد استفاده به کمک توزیع نمونه گیری تعریف می شوند. اصطلاح «آماره آزمون» یا پارامتر مورد آزمون تعریف می شود.

 

آزمون فرض یک طرفه و دو طرفه

براساس آنچه گفتیم نتیجه می گیریم که H0 را باید پذیرفت مگر آنکه دلیل محکمی بر رد آن وجود داشته باشد. این بدین معناست که فرض صفر همواره شامل سطح اطمینان ۱۰۰(α-۱) درصد است. بنابراین H1 در برگیرنده سطح معنی داری α است.

مفهوم کاربردی این جمله آن است که رد یا قبول H0 یا سطح اطمینان دلخواه صورت خواهد گرفت. پس همواره H1 به اندازه α در طرفین توزیع نمونه گیری تعریف خواهد شد. «یک طرفه» یا دو طرفه بودن آزمون فرض آماری به تعریف H0 و یا H1 بستگی دارد.

 

 

مراحل کلی آزمون فرض آماری

از جمع بندی میانی آزمون فرض می توان برای همه آزمون فرض های آماری مراحل چهارگانه زیر را تدوین کرد. از این مراحل در طی فصول بعدی کتاب جهت تفسیر خروجی ها استفاده خواهد شد:

 

۱- تعریف فرضیه های آماری H0 و H1  (فرض ها):

براساس قاعده ای که بیان شد چنانچه فرضیه پژوهشی یا هدف مرز مشخصی (-) داشته باشند H0 نشان دهنده ادعا خواهد بود در غیر این صورت نقیض آن در H0 قرار خواهد گرفت. آنچه مسلم است فرض H0 و H1 مکمل یکدیگرند. با این توصیف H0 گاهی بیان کننده ادعا و گاهی نقیض ادعا خواهد بود.

II– تعیین توزیع نمونه گیری آماره و نوع آماره آزمون (آماره آزمون):

توزیع نمونه گیری به شرایط تخمین پارامتر مورد ادعا بستگی دارد. بسته به اینکه فرضیه پژوهشی چه نوع پارامتری را بیان می کنند. توریع نمونه گیری آماره و آماره آزمون تغییر خواهد کرد.

III– تعیین سطح زیر منحنی  H0 و H1 و محاسبه مقدار بحرانی (مقدار بحرانی):

سطح زیر منحنی H0 و H1 به توزیع نمونه گیری و مقدار α بستگی دارد. یک طرفه یا دو طرفه بودن آزمون نیز بر سطح زیر منحنی فرضیه های آماری تاثیر مستقیم دارد. چنانچه گفته شد:   H0 در برگیرنده سطح اطمینان و H1 سطحی برابر α خواهد بود.

محاسبه مقدار استانداردی که تفکیک کننده H0 و H1 بصورت عددی باشد از دیگر موارد ضروری این مرحله است. مقدار استاندارد براساس نوع آزمون و مقدار α از جداول آماری موجود استخراج می شود. این مقدار با توجه به علامت آن «مقدار بحرانی» نامیده می شود. مقدار استاندارد وجدول آماری مورد نیاز برای استخراج آن براساس آماره آزمون تعیین می شود. برای مثال اگر آماره آزمون از نوع Z باشد مقدار بحرانی براساس جدول استاندارد Z تعیین می شود و اگر از نوع F باشد براساس جدول F تعریف می شود.

IV . تصمیم گیری:

در این مرحله مقدار آماره آزمون محاسبه شده در مرحله دوم یا مقدار بحرانی مرحله سوم مقایسه می شود. چنانچه آماره آزمون در ناحیه پذیرش H0 قرار گیرد. گفته می شود که رد سطح اطمینان مورد نظر دلیل کافی برای پذیرش H0 وجود دارد. در غیر اینصورت فرض H0 رد شده و H1 آیا در سطح خطای α درصد پذیرفته می شود.

پس از تایید یا رد H0 تحلیلگر باید بطور مشخص بیان کند که آیا فرضیه پژوهشی پذیرفته یا رد شده است. بدیهی است محقق هیچگاه ادعای اثبات یا عدم اثبات فرضیه پژوهشی یا فرضیه های آماری را ندارند بلکه در تحلیل خود به لحاظ استقرار احتیاط را رعایت کند.

ماهیت P-Value

P-Value  یک آزمون آماری مقدار احتمالی است که میزان سازگاری داده های نمونه را با نتیجه H0 اندازه می گیرد. این مقدار خلاصه ای فشرده از یافته های نمونه ای را در یک آزمون آماری معرفی می کند و غالبا در گزارشهای منتشر شده نتایج آزمون آماری و در خروجی برنامه ها کامپیوتری مورد استفاده واقع می شود.

برای یک آزمون یک طرفه مربوط به میانگین جامعه P-Value برحسب آماره آزمون استاندارد شده *Ζ بصورت زیر تعریف می شود:

P-Value یک آزمون آماری یک طرفه برای µ عبارت است از احتمال آنکه اگر µ۰ = µ آماره آزمون استاندارد شده *Z در جهت ناحیه رد می تواند کمتر از مقداری باشد که واقعا مشاهده شده است.

 

آزمون P-Value

در ادامه یادگیری آزمون فرض آماری در spss همانطورکه قبلا گفتیم P-Value یک آزمون برای µ میزان سازگاری بین بر آمد نمونه ای و مقدار µ۰ را که در H0 مسلم فرض شده است اندازه می گیرد. یک P-Value بزرگ نشان می دهد که µ۰ موجه است و بنابراین باید H0 نتیجه گرفته شود.

در واقع برحسب اینکه P-Value بزرگتر یا کوچکتر از α (ناحیه بحرانی) باشد که از آزمون مبتنی بر P-Value بدست می آید از نظر ریاضی هم ارز یا نتیجه ای است که از قاعده تصمیم متناظر مبتنی بر آماره آزمون استاندارد شده حاصل می شود. قاعده تصمیم مبتنی بر P-Value بصورت زیر است:

اگر P-Value ≥ α  باشد گزینه H0 را نتیجه بگیرید.

اگر P-Value ≤α باشد گزینه H1 را نتیجه بگیرید.

با استفاده از یک P-Value یک طرفه یا دو طرفه هر کدام که مقتضی باشد این قاعده تصمیم خواه آزمون یک طرفه یا دو طرفه باشد صادق است.

 

۴-۸ آزمون آماری برای میانگین جامعه – آزمون t تک نمونه ای

وقتی می خواهیم برای میانگین جامعه (µ) آزمونی انجام دهیم. در واقع علاقه مندیم آزمون کنیم که آیا میانگین جامعه برابر عدد مشخصی هست یا خیر؟ در این حالت فرض های آماری عبارتند از:

µ=µ۰ : H0
H1 : µ≠µ۰

 

از آنجایی که در عمل همواره واریانس جامعه نامعلوم است آزمون مناسب آزمون t تک نمونه ای می باشد.

مثال ۱) داده های زیر نمره های ۲۰ دانش آموز در درس آمار است:

۱۷٫۵٫ ۱۴٫ ۱۳٫۵٫ ۱۶ .۱۴٫۵٫ ۲۰ . ۱۳ . ۱۲٫ ۱۶٫۵٫ ۱۹٫ ۱۶٫ ۱۰٫۵ . ۱۷٫ ۱۲٫ ۱۳٫ ۱۴٫۵٫ ۱۷٫ ۱۱٫ ۱۹٫۸٫ ۱۲٫۵

آیا میتوان گفت میانگین نمره های دانش آموزان این کلاس برابر ۱۵ است؟

در واقع می خواهیم آزمون فرض زیر را انجام دهیم:

µ=۱۵ : H0
H1 : µ≠۱۵

 

برای انجام ای آزمون مسیر Analyze>Compare Means>One-Sample T Test را طی کنید تا کادر مکالمه ای One-SampleT Test باز شود. در این کادر متغیر “نمره” را در جعبه Test Variable و درجعبه Test Values عدد ۱۵ را تایپ کنید.

 

آزمون فرض آماری در spss

 

 

سپس گزینه OK را بزنید تا خروجی آزمون را ببینید.

 

 

 

معرفی جداول: جدول اول (One-Sample Statistics) حجم نمونه شاخص های آماری میانگین . انحراف معیار و خطای معیار میانگین را نشان می دهد. جدول دوم (One-Sample Test) نتایج آزمون t تک نمونه ای را نشان می دهد. مقدار آماره t محاسبه شده برابر با ۰/۰۷۹ – شده است که می دانیم آماره مربوط به آن به صورت زیر است و دارا توزیع t یا n-1 درجه آزادی (df) است.

 

 

عبارت sig که مخفف significant levele و  به معنی “سطح معنی داری” است نشان دهنده P مقدار آزمون است که در این آزمون برابر ۰/۹۴ شده است. همچنین مقدار Mean Difference نشان دهنده  Χ-µ۰ است که در اینجا برابر است با ۰/۰۵-=۱۴/۹۵-۱۵

در قسمت بعد ۹۵%Confidence Interval فاصله اطمینان ۹۵ % را برای پارامتر Χ-µ۰ نشان می دهد که در این مثال برابر (-۱/۳۷ _۱/۲۷) است حال اگر بخواهیم فاصله اطمینان برای فرمول بدست آوریم باید نا معادله فرمول را برای مجهول Χ-µ بین دو عدد ۱٫۳۷-  و  ۱٫۲۷ حل کنیم لذا فاصله اطمینان برای فرمول برابر است با( ۱۳/۶۸ _۱۶/۳۲).

 

۳-    روش فاصله اطمینان: در اینجا فرضیه ۰=۱۵-µ :H0 که معادل است با ۱۵=µ :H0 را بررسی می کنیم. بنابراین برای آزمون فرضیه فوق به روش فاصله اطمینان کافیست که چک کنیم آیا فاصله اطمینان۱۵-µ عدد صفر را شامل می شود؟ در صورتی که فاصله اطمینان شامل عدد صفر باشد تصمیم به عدم رد فرض H0 خواهیم گرفت و با توجه به فاصله اطمینان ۹۵ % در این مثال در سطح معنی داری۰/۰۵ فرض H0 یعنی فرض برابری را رد نمی کنیم.

مثال ۲) در مثال ۱ فرضیه ۱۲=فرمول : H0 را آزمون کنید.

در این حالت همه مراحل بیان شده در مثال قبل را انجام خواهیم داد با این تفاوت که عدد ۱۲ را در جعبه Test Values تایپ می کنیم و خروجی زیر را خواهیم دید

 

از سه روش میتوان نشان داد که فرضیه ۱۲= فرمول :H0 در سطح معنی داری۰/۰۵ رد می شود(؟).

 

توجه:

  1. از آنجایی که در عمل هیچگاه واریانس جامعه معلوم نیست در SPSS نیز آزمون از طریق آماره Z تعبیه نشده است.
  2. در این آزمون فرض بر این است داده ها از جامعه ای با توزیع نرمال هستند.
  3. در SPSS گزینه انجام آزمون های یک طرفه تعبیه نشده است. اما در آزمون هایی که آماره آنها از توزیع t که توزیعی متقارن است پیروی می کند. P- مقدار آزمون یک طرفه نصف P- مقدار آزمون دو طرفه است (؟). لذا در این آزمون نیز می توان آزمون های یک طرفه را انجام داد.

 

آزمون آماری برای نسبت جامعه – آزمون دو جمله ای

مثال ۳) فرض کنید سکه ای را ۳۰ مرتبه پرتاب کرده اید و نتایج به صورت زیر بدست آمده است(۱-شیر.۰-خط)

۰٫۰٫۰٫۰٫۰٫۰٫۰٫۰٫۰٫۰٫۰٫۰٫۰٫۰٫۰٫۰٫۰٫۰٫۱٫۱٫۱٫۱٫۱٫۱٫۱٫۱٫۱٫۱٫۱٫۱

می خواهیم آزمون کنیم که آیا سکه سالم است یا خیر؟ می خواهیم فرض های زیر را آزمون کنیم:

H0 = p = 0.5

H1 = p ≠ ۰٫۵

برای آزمون این فرض از آزمون دو جمله ای استفاده می کنیم.

برای انجام این کار داده های بالا را به عنوان متغیر Toss وارد کرده و مسیرAnalyze>Nonparametric Tests>Legacy Diolog>Binomial را طی کنید تا کادر مکالمه ای Binomial Test باز شود.

آزمون فرض آماری در spss

 

 

متغیر Toss را به قسمت Test Variable List وارد کرده و مقدار Test Proportion را ۰٫۵ وارد کنید و در قسمت Define Dichotomy گزینه Get from data را انتخاب کنید و سپس دکمه OK را کلیک کنید تا خروجی زیر ظاهر شود:

 

 

 

معرفی جداول: در ستون اول دو گروه جامعه را نشان می دهد و در ستون دوم آنها را معرفی می کند. توجه داشته باشید که در SPSS هر گروهی که کدش اول وارد شود را به نام گروه اول (اصلی) می شناسد و نسبت P  برای این گروه تعریف می شود.

برای مثال اگر اولین عدد در وارد کردن داده های مربوط به متغیر Toss را “۱” وارد کنیم عدد “۱” را به عنوان کد گروه اول می شناسد و نسبت P را برای این گروه (شیر بودن) و نسبت ۱-P را برای گروه دیگر (خط بودن) در نظر می گیرد.

در ستون سوم N تعداد افراد مشاهده شده در هر گروه را نشان می دهد و در ستون بعد نسبت مشاهده شده هر گروه را نشان می دهد. در ستون پنجم Test Prop. عدد مورد آزمون در فرض صفر را نشان می دهد که در اینجا۰٫۰۵ است. در ستون آخر (P ,Exact Sig.(2-tailed-مقدار دقیق را در حالت دو طرفه نشان می دهد.

تفسیر: با توجه به اینکهP-مقدار دقیق دو طرفه بیشتر از ۰٫۰۵ است فرض صفر سالم بودن سکه را رد نمی کنیم.

 

در یک نمونه ی تصادفی ۱۰۰۰۰ نفری از جامعه ی بزرگ تعداد ۱۰۰ مورد از یک بیماری خاص مشاهده شده در سطح اطمینان ۹۵ درصد آزمون کنید که:

الف) آیا نسبت مبتلایان به بیماری خاص در جامعه از ۰٫۰۲ کم تر است؟

ب) آیا می توان گفت نسبت مبتلایان به بیماری خاص در جامعه برابر ۰٫۰۲ است یا خیر؟

– این داده ها را با استفاده از دستور weighte cases وارد کنید.

الف)تمام مراحل مربوط به مثال ۱ را در اینجا انجام می دهیم با این تفاوت که در قسمت Test Proportion از کادر مکالمه ایBinomial Test عدد ۰٫۰۲ را جایگزین عدد ۰٫۵ می کنیم و سپس دکمه OK را میزنیم و خروجی را به صورت زیر خواهیم داشت.

 

 

توجه داشته باشید که اگر مقدار Test Proportion از ۰٫۵ کمتر باشد آزمون به صورت یک طرفه انجام می شود و فرض H0 به صورت P < 0.02 خواهد بود لذا با توجه به اینکه –P مقدار از ۰٫۰۵ کمتر است فرض صفر را رد نمی کنیم.

ب) به علت وجود تقارن توزیع نرمال و این که در این حالت SPSS آزمون دو طرفه را انجام نمی دهد. برای انجام آزمون دو طرفه P-مقدار آزمون یک طرفه را دو برابر می کنیم در این حالت باز هم میبینیم کهP-مقدار از ۰٫۰۵ کمتر است بنابراین فرض صفر را رد نمی کنیم.

 

توجه:

آزمونهایی که در بالا انجام شده از طریق توزیع نرمال استاندارد است. اما می دانیم که صورت مساله برای یک توزیع گسسته (دو جمله ای) مطرح شده بود. لذا نتایج آزمونهای فوق همواره بصورت مجانبی (تقریبی) بوده و برای نمونه ای بزرگ صحیح است.

اگر بخواهیم آزمون را در نمونه ای کوچک انجام دهیم بهتر است از روشهای شبیه سازی مونت کارلو استفاده کنیم برای این کار می توانیم از گزینه Exact در کادر مکالمه ای Binomial Test استفاده کنیم و گزینه Monte Carlo را تیک زده و سپس دکمه های   Continue و Ok را بزنیم.

 

آزمون اختلاف میانگین ها برای دو جامعه مستقل – آزمون t- دو نمونه مستقل

این آزمون زمانی به کار می رود که بخواهیم میانگین یک متغیر کمی را در بین دو گروه مستقل باهم مقایسه کنیم. برای مثال مقایسه فشارخون دو گروه افراد بعد از استفاده از داروهای A و B .

در آزمون t-دو نمونه مستقل فرضیات زیر را مورد بررسی قرار می دهیم:

۰=H0 : µ۲- µ۱

۰≠H1 : µ۲- µ۱

برای استفاده صحیح از این آزمون نیاز به اطلاع در مورد برابری و یا نابرابری واریانس های دو گروه خواهیم داشت. لذا ابتدا بایستی با استفاده از آزمون  Levene برابری واریانس های دو گروه را مورد بررسی قرار داد.دو حالت می تواند پیش آید که هر دو حالت در SPSS به طور همزمان اجرا می شود.

 

  1. برابری واریانس ها: چنانچهP-مقدار حاصل از آزمون  Levene بیشتر از α باشد می توان نتیجه گرفت که واریانس های دو گروه باهم برابر است. در این حالت برای بررسی معنی داری اختلاف بین میانگین های دو گروه  از آزمون “t- دو نمونه مستقل در حالت برابری واریانس ها” استفاده می کنیم.
  2. نابرابری واریانس ها: چنانچهP-مقدار حاصل از آزمون Levene کمتر مساوی α باشد می توان نتیجه گرفت که واریانس های دو گروه باهم برابر نیستند. در این حالت برای بررسی معنی داری اختلاف بین میانگین های دو گروه  از آزمون “t- دو نمونه مستقل در حالت نابرابری واریانس ها” استفاده می کنیم.

 

مثال ۵) ده دانش آموز پسر و ده دانش آموز دختر به دلخواه انتخاب شده اند و وزن آنها اندازه گیری شده است. داده ها بصورت زیرند:

دختر
۵۵ ۶۳ ۶۰ ۴۵ ۵۷ ۴۵ ۶۰ ۶۵ ۴۸ ۵۴

پسر
۷۵ ۹۰ ۸۵ ۷۰ ۶۸ ۷۲ ۷۴ ۸۰ ۶۸ ۷۵

مایلیم بدانیم آیا وزن دانش آموزان دختر و پسر از لحاظ آماری باهم برابر است؟

ابتدا داده ها را به صورت زیر در SPSS وارد کنید.مردان با کد ۱ و زنان با کد ۲ مشخص شده اند.

 

آزمون فرض آماری در spss

 

 

برای انجام این آزمون مسیر Analyze>Compare Means>Independent-Samples T Test را طی کنید. تا کادر مکالمه ای  Independent-Samples T Test باز شود. در این کادر متغیر “Weight” را در جعبه Test Variable(s) و متغیر “Sex” را در جعبه Grouping Variable وارد کنید. روی دکمه Define Groups کلیک کنید و سپس Ok را کلیک کنید تا خروجی به صورت زیر ظاهر شود:

 

شکل

 

 

 

معرفی جدول: این جدول شامل ۳ قسمت است:

  1. Group Statistics : شامل تعداد نمونه و شاخص های آماری به تفکیک هر یک از گروه هاست.
  2. Levene’s Test : شامل آزمون Levene برای آزمون برابری واریانس ها(آماره F وP-مقدار)
  3. t-test for Equality of Means : نتایج آزمون t-دو نمونه ای مستقل است که ستون های آن به ترتیب از چپ به راست عبارتند از:مقدار آماره t.
    درجه آزادی P-مقدار آزمون دوطرفه sig(two-) (tailed). اختلاف میانگین ها .(Difference Mean) خطای استاندارد اختلاف میانگین ها  (Std. Error Difference )و فاصله اطمینان ۹۵ % برای  (۹۵% Confidence Interval of the Difference). همه این نتایج برای دو حالت بیان شده اند. مقادیر خط اول برای حالت برابری واریانس ها و مقادیر خط دوم برای حالت نابرابری واریانس ها هستند.

تفسیر:P- مقدار آزمون Levene نشان می دهد که بین واریانس وزن دانش آموزان پسر و دختر اختلاف معنی داری وجود ندارد لذا باید نتایج ازمون t را از خط دوم قسمت مربوطه گزارش کرد در اینجا نیز می توانیم از سه روش ناحیه رد. P-مقدار. فاصله اطمینان آزمون فرض را انجام دهیم.

 

  1. روش p- مقدار: در این مثال P-مقدار ۰٫۰۰۰ گزارش شده است و لذا کمتر از ۰٫۰۵ است بنابراین در سطح معنی داری ۰٫۰۵ فرض H0 یعنی فرض برابری را قبول نمی کنیم و معنی داری اختلاف را می پذیریم.
  2. روش فاصله اطمینان: در اینجا فرضیه  ۰ = H0 : µ۱-µ۲ بررسی می کنیم بنابراین برای آزمون فرضیه فوق به روش فاصله اطمینان کافیست که چک کنیم آیا فاصله اطمینان عدد صفر را شامل می شود؟ با توجه به فاصله اطمینان ۹۵ % در این مثال در سطح معنی داری ۰٫۰۵ فرض H0 یعنی فرض برابری را قبول نمی کنیم و معنی داری اختلاف را می پذیریم.

 

 

امیدواریم از این مطلب که درباره آزمون فرض آماری در spss در سایت صنایع سافت بود، لذت برده باشید.نظرات خودتون رو واسه ما کامنت بزارین تا ما بتونیم هر چه بیشتر از اونها واسه بهتر شدنه تیممون استفاده کنیم.

 

حتما شما هم علاقه مندید مانند دیگر مهندسان صنایع از مقاله های جدید ما باخبر بشین، خب کافیه که فقط ایمیلتونو داخل فرم زیر وارد کنید. به همین راحتی :)

 

دانشجوی کارشناسی رشته مهندسی صنایع، فعال در حوزه دیجیتال مارکتینگ و علاقه مند به استارت اپ ها و دوست دارم که هر روز آموزش های بیشتری برای مهندسان صنایع تولید کنم

احمد جعفری

اگر این مقاله برای شما مفید بود برای دوستان خود هم به اشتراک بگذارید تا بقیه هم از این مطلب استفاده لازم را ببرند.

 

 

آموزش گام به گام اس پی اس اس

آموزش گام به گام اس پی اس اس به زبان فارسی

آموزش گام به گام اس پی اس اس

در این مقاله آموزشی به ادامه آموزش نرم افزار Spss در پی آموزش های قبلی این نرم افزار میپردازیم. همچنین اگر با این نرم افزار آشنایی ندارید میتوانید قبل از خواندن این مقاله به دو مقاله قبلی بروید و آنها را مطالعه کنید.

  1. آموزش Spss به زبان ساده
  2. آمار توصیفی در Spss

 

دستورهایی برای دستکاری داده ها در SPSS

در این آموزش به بررسی برخی دستورات در spss  خواهیم پرداخت که برای کار با داده ها و آماده کردن آنها برای تحلیل های بعدی بسیار مهم است. به اعتقاد برخی نویسندگان در حین کار با اس پی اس اس استفاده از این دستورها بسیار کمک کننده است و بدون وجود این دستورها این نرم افزار قابل استفاده نیست.

 

 دستور select cases

همانطور که از نام این دستور پیداست توسط آن می توان موردهایی (افرادی) خاص را انتخاب کرد. برای مثال فرض کنید می خواهیم تحلیل مورد نظر را بر روی افرادی از نمونه که دارای ویژگی خاص (برای مثال سیگاری بودن) هستند اجرا کنیم. توسط این دستور به اس پی اس اس می گوییم که تحلیل را فقط بر روی افراد سیگاری انجام بده.

 

برای بررسی این دستور ابتدا فایل داده “”adl.sav را از فایل های نمونه SPSS  باز کنید. می خواهیم رابطه بین فشار خون (hypertns) و ابتلا به بیماری دیابت (diabetic) را فقط در گروه مورد (Treatment) داده ها بررسی کنیم . توجه کنید که گروه مورد در متغییر   group با کد ۱ مشخص شده است.

می دانیم که برای بررسی این رابطه باید از دستور Crosstabs استفاده کرد اما چون می خواهیم رابطه را فقط در گروه مورد انجام دهیم ابتدا باید دستور select cases را اجرا کنیم. برای اجرای این دستور مسیر Data>Select Cases را انتخاب کنید ویا در نوار ابزار روی دکمه عکس کلیک کنید تا کادر مکالمه مربوطه باز شود. در این کادر گزینه دوم (If condition is satisfied) را انتخاب کنید و دکمه If  را کلیک کنید و متغییر group را وارد کادر سمت راست انداخته و عبارت “۱=” را تایپ کنید و گزینه continue و سپس Ok را بزنید. در این حالت در فایل داده ها فقط افراد مورد انتخاب شده اند و افراد کنترل برای آنالیزها فیلترشده اند.

 

آموزش گام به گام اس پی اس اس

 

 

حال با اجرای دستور  Crosstabs رابطه بین فشار خون و دیابت را بررسی می کنیم. خروجی نرم افزار به صورت زیر است:

 

 

 

همانطور که مشاهده می کنید این همان خروجی دستور Crosstabs با این تفاوت که رابطه بین دو متغییر فشار خون و دیابت فقط در افراد “مورد” بررسی شده است.

توجه: در پنجره select cases:if که نحوه انتخاب  Caseها را تعیین می کنیم گزینه های زیاد دیگری نیز برای انتخاب وجود دارد. برای مثال  می توان با استفاده از صفحه کلید این کادر تعیین کنیم که برای مثال “افراد با سن کمتر یا مساوی ۷۳سال” انتخاب شوند.برای این کار باید در کادر تایپ شود : age<=30 . یا می توان از دستورهای منطقی & =(and) و| (or) استفاده کرد.

دستور split file

همانطور که از نام این دستور پیداست فایل داده هارا می شکند.به عبارتی با در نظر گرفتن یک متغیر کیفی مثل جنسیت یا مقطع تحصیلی فایل داده ها تفکیک شده و تمام آنالیزها و خروجی ها به تفکیک طبقات این متغیر کیفی ارائه خواهد شد.

برای بررسی این دستور ابتدا فایل داده۸ “adl.sav” را از فایل های نمونه SPSS باز کنید . می خواهیم رابطه بین فشارخونی بودن (hypertns) و ابتلا به بیماری دیابت (diabetic) را به تفکیک هریک از گروه های تیماری (group) بررسی کنیم.

می دانیم که برای بررسی این رابطه باید از دستور Crosstabs استفاده کرد اما چون می خواهیم رابطه را به تفکیک یک متغیر سوم بررسی کنیم ابتدا باید دستور Split file را اجرا کنیم. برای اجرای این دستور مسیر Data>Split file  را انتخاب کنید و یا در نوار ابزار روی دکمه عکس کلیک کنید تا کادر مکالمه مورد نظر باز شود . در این کادر گزینه دوم (Compared groups) را انتخاب کنید و متغیر group را وارد کادر  Groups Based On  کنید و گزینه ok را بزنید.

 

آموزش گام به گام اس پی اس اس

 

 

 

در این حالت داده ها تفکیک شده اند و حالا می توانید آنالیز مورد نظر را انجام دهید.بعد از اجرای دستور Crosstabs خروجی را به صورت زیر خواهید دید. همانطور کهد مشاهده می کنید این همان خروجی دستور Crosstabs است با این تفاوت که رابطه بین دو متغیر فشارخون و دیابت به تفکیک یک متغیر سوم بررسی شده است.

 

 

  1. این دستور به خصوص زمانی کاربرد دارد که بخواهیم اثر مخدوشگری یا اثرات متقابل را بررسی کنیم.
  2. بعد از اجرای دستور Split file فایل اس پی اس اس همواره به صورت تفکیک شده است و مادامی که فایل داده ها به این صورت است، در قسمت نوار وضعیت SPSS عبارت Split file on نوشته شده است. در صورتی که میخواهید از این حالت خارج شوید دوباره مسیر بالا را طی کنید و در کادر مکالمه ای مذکور گزینه “Analysis all cases” را انتخاب کنید و ok را کلیک کنید. در این حالت فایل از حالت تفکیکی در آمده و می توانید تمام داده ها را تحلیل کنید.
  3. در صورتی که گزینه “Organize output by groups” را انتخاب کنید خروجی فایل ها را به صورت تفکیکی ارائه می دهد اما ن کنار هم.
  4. این دستور ابتدا فایل داده ها را براساس متغیر تفکیکی مرتب می کند و سپس فایل داده ها را تفکیک می کند و از آنجایی که عموما فایل داده ها مرتب نیست همواره گزینه “Sort the file…” را انتخاب کنید.

 

دستور Weight Cases

زمانی که داده ها از نوع فراوانی باشند برای تعریف داده ها می توان از این دستور استفاده کرد دستور را با یک مثال توضیح میدهیم.

مثال: در یک مطالعه ژنتیکی مربوط به ساختار کروموزوم ها ۲۸ نفر برحسب نوع انحرافی که ساختار کروموزوم آنها از وضع طبیعی دارد و برحسب اینکه والدینشان حامل این انحراف هستند یا نه رده بندی شده اند و در نتیجه داده های زیر بدست آمده است:

 

 

 

 

می خواهیم آزمون کنیم که “نوع انحراف از وضع طبیعی” مستقل از “حامل بودن والدین” است یا خیر.

برای انجام این آزمون قاعدتا باید ابتدا داده ها را در SPSS وارد کرد!! که البته در این قسمت تنها بر نحوه ورود داده ها بحث خواهیم کرد و نه برنحوه انجام آزمون آماری آن. برای این کار دو راه وجود دارد. راه اول این که داده ها را به طور خام وارد اس پی اس اس کنیم یعنی دو متغیر برای “نوع انحراف از وضع طبیعی” و “حامل بودن والدین” تعریف کنیم آنها را کد بندی کرده و به صورت زیر وارد کنیم :

 

 

حال اگر فراوانی داده ها در هریک از خانه های جدول زیاد باشد و بخواهیم از روش اول استفاده کنیم ورود داده ها وقت زیادی خواهد گرفت. راه دوم این است که طبقات داده ها را به نرم افزار معرفی برای آنها فراوانی تعریف کنیم و به فراوانی ها وزن دهیم.

به عبارتی در این مثال که ۴طبقه (به صورت ترکیبی) داریم کافیست ۴ طبقه را به عنوان ۴ مشاهده تعریف کنیم و برای آنها فراوانی تعریف کنیم به عبارتی داده ها را به صورت زیر تعریف کنیم . توجه کنید یک متغیر Frequency برای تعریف فراوانی ها به دو متغیر قبلی اضافه شده است.

 

 

بعد از این کار مسیر Data > Weight Cases را طی کنید یا از نوار ابزار بر دکمه  کلیک کنید و در کادر مکالمه مورد نظر متغیرFrequency را به عنوان متغیر وزنی تعریف کنید و گزینه ok را بزنید با این کار نرم افزار دیگر می داند که افراد با انحراف نوع ۱ که فقط یکی از والدینشان هم به این عارضه دچارند تعدادشان ۴نفر است!!

 

آموزش گام به گام اس پی اس اس

 

 

حالا می توانید دستور Crosstabs را اجرا کنید و خروجی به صورت زیر خواهد شد:

 

 

 

 

  1. مادامی که دستور Weight cases اجرا شده است داده ها به صورت وزنی هستند لذا برای خارج شدن از این حالت مسیر Data > Weight Cases را طی کنید و گزینه “Do not weight cases” را انتخاب کنید.
  2. وقتی داده ها وزن دارند در نوار وضعیت SPSS عبارت Weight on نوشته شده است.
  3. این دستور به خصوص زمانی کاربرد دارد که با داده هایی که سرو کار دارید که خام نیستند و تعداد آنها نیز زیاد است.

دستور Compute

 

بسیاری اوقات پیش می آید که محقق می خواهد عبارتی را به طور سطری و برای هریک از موردها (افراد) محاسبه کند برای مثال فرض کنید قد و وزن نمونه را داریم و می خواهیم برای هر فرد به طور جداگانه BMI یعنی قد و وزن را محاسبه کنیم. به عنوان مثالی دیگر فرض کنید در یک تست سنجش افسردگی که شامل ۱۵سوال ۵ گزینه ای (۱تا۵) است می خواهیم امتیاز افسردگی هر شخص را به طور جداگانه محاسبه کنیم ذر تمام این موارد دستور Compute می تواند به ما در محاسبه عبارت مورد نظر کمک کند.

برای بررسی این دستور ابتدا فایل داده “dietstudy” را از فایل های نمونه SPSS باز کنید.

میخواهیم میانگین وزن افراد در ۵ نوبت پیگیری (wgt0 تا wgt4)را محاسبه کنیم و در متغیری به نام mwgt  در همین فایل داده ها محاسبه کنیم برای اجرای این دستور مسیر Transform >Compute variable را انتخاب کنید تا در کادر مکالمه Compute variable باز شود در کادر سمت چپ (Target variable) عبارت mwgt را تایپ کنید و در کادر سمت راست (Numeric expression) عبارت  ۵/ (wgt0+wgt1+wgt2+wgt3+wgt4)  را تایپ کنید برای این قسمت می توانید از صفحه کلید پایین یا گروه توابع (Function group) سمت راست هم استفاده کنید.

 

 

 

پس از اینکار کلید ok را کلیک کنید و به پنجره داده ها برگردید.خواهید دید که متغیری تحت عنوان mwgt به متغیرهای قبلی اضافه شده است که در واقع میانگین وزن هر فرد در ۵ دوره پیگیری است.

  1. در کادر مکالمه Compute variable با استفاده از تابع های موجود در قسمت Function group بسیاری از محاسبات آماری و ریاضی را می توان برای هر فرد به طور جداگانه انجام داد.
  2. این دستور به خصوص برای محققین رشته های پرستاری روانشناسی و علوم اجتماعی زمانی که با پرسشنامه سرو کار دارند کاربرد فراوانی دارد.
  3. فرض کنید بخواهیم برای گروهی از افراد نمونه یک فرمول و برای گروهی دیگر فرمولی دیگر را محاسبه کنیم در این حالت در کادر مکالمه Compute variable می توان از دستور if استفاده کرد.

 

دستور Count Values

 

یک تست سنجش افسردگی را در نظر بگیرید ممکن است محقق بخواهد بداند هر فرد در پاسخگویی چندبار گزینه ۳ را انتخاب کرده است برای پاسخ به این سوال باید از دستور Count values استفاده کرد

برای بررسی این دستور ابتدا فایل داده “tv-survey.sav” را از فایل های نمونه SPSS باز کنید.این فایل مربوط به یک نظر سنجی در مورد برنامه های تلوزیونی میباشد که شامل ۷ سوال بلی و خیر است. می خواهیم می خواهیم بدانیم هرفرد به طور کلی چند مرتبه به این سوالات جواب بلی (کد۱) را داده است وجواب را در متغیری تحت عنوان ny  ذخیره کنیم

برای اجرای این دستور مسیر Transform>Count values را انتخاب کنید تا در کادر مکالمه count occurrence of values within cases باز شود در کادرسمت چپ(target variable) عبارت ny را تایپ کنید و در کادر variable همه متغیرهای سمت چپ (متغیرهایی که میخواهیم در آنها عدد ۱ خوانده شود) را وارد کنید.

در این پنجره کلید Define values را کلیک کنید تا پنجره Count values within cases: values to count باز شود. در این پنجره انچه را که می خواهید شمارش شود را اضافه کنید در این مثال میخواهیم عدد ۱ شمارش شود.

آموزش گام به گام اس پی اس اس

 

 

لذا عدد ۱ را در قسمت values تایپ کرده و عبارت Add را کلیک می کنیم سپس دکمه Continue و ok را کلیک  می کنیم. حال به پنجره داده ها برگردید خواهید دید که متغیری تحت عنوان ny به متغیرهای قبلی اضافه شده است که در واقع تعداد پاسخ های بله هر فرد است.

 

 

 

  1. در کادر مکالمه ای Count values within cases: values to count می توان نحوه شمارش را به صورت دیگری (غیر از مثال بالا) نیز تعریف کرد.همچنین می توان در این پنجره بیش از یک شرط شمارش تعریف کرد.
  2. هرگاه بخواهیم این شمارش را برای گروهی ازافراد نمونه با گروه دیگر از افراد نمونه متفاوت باشد باید از دستورif در کادر مکالمهCount occurrence of values within cases استفاده کرد.

دستور Recode

در این قسمت به بررسی دو کاربرد دستور Recode می پردازیم.

جدول فراوانی برای صفات کمی پیوسته (دستور Recode)

یک روش تعیین طبقات در فصل دوم ارائه شد.فرض کنید حدود طبقات را با این روش تعیین کردیم در این بخش میخواهیم این حدود طبقات را به نرم افزار معرفی کنیم تا داده ها را دسته بندی کند و به وسیله آن جدول فراوانی داده ها را رسم کنیم.

مثال) داده های مثال (تمرکز وزن در ۴۰ شهر بزرگ) را در SPSS وارد کنید و نام متغیر را O.C بگذارید. برای دسته بندی داده ها با استفاده از اس پی اس اس در گام اول حدود طبقات را به آن تعریف می کنیم و متغیر دسته بندی شده را به عنوان متغیری جدید در صفحه داده ها ایجاد می کنیم  حدود طبقاتی که باید تعریف شوند به این صورت است.

توجه داشته باشید عدد ۴/۴ که یکی از کران هاست (کران بالای طبقه دوم و کران پایین طبقه سوم ) در داده ها نیز وجود دارد و از آنجایی که میخواهیم ۴/۴در طبقه سوم باشد در طبقه دوم و سوم بجای عدد ۴/۴ در کرانه ها عدد ۴٫۳۵ را در نظر گرفته ایم و اگر اعداد ۲٫۷، ۱٫۶، ۷٫۸ یا ۹٫۵ نیز در داده ها بودند همین کار را انجام می دادیم.

 

 

 

برای دسته بندی داده ها مسیر Transform>Recode into different variables را انتخاب کنید تا در کادر مکالمه Recode into different variables باز شود. در این کادر متغیر”مقدار تمرکز وزن (O.C)” را انتخاب و وارد پنجره سمت راست (Numeric Variable->Output variable) می کنیم.

در قسمت سمت راست این کادر(Output Variable) و در قسمت  Name نام متغیر جدید یعنی r_O.C راتایپ می کنیم و سپس دکمه Old and New values  را کلیک می کنیم

تا کادر Old and New values  Recode into different variables: باز شود در این کادر و در قسمت Old values گزینه Range را انتخاب کنید و اعداد ۱ و ۲٫۷ (حد بالا و پایین طبقه اول) را در این جعبه تایپ کنید در قسمت New values عدد ۱ را تایپ می کنیم و دکمه Add را می زنیم.

 

به همین ترتیب سایر طبقات را به نرم افزار معرفی می کنیم.

 

آموزش گام به گام اس پی اس اس

 

 

پس از اینکه معرفی طبقات به نرم افزار به اتمام رسید دکمه های  Change. Continue و ok  را به ترتیب کلیک می کنیم. حال به پنجره داده ها برگردید خواهید دید که متغیری تحت عنوان r_O.C به متغیرهای قبلی اضافه شده است که در واقع همان O.C است اما با کد بندی جدید.

گام دوم این است که به هر یک از طبقات متغیر جدید valueای در خور مانند شکل زیر در نظر بگیریم  (در پنجره variable view) .

 

 

 

حال با استفاده از دستور Frequency برای متغیر r_O.C جدول فراوانی رسم کنیم.

 

معکوس کردن امتیازات(دستور Recode)

همانطور که از نام این دستور پیداست توسط آن میتوان داده ها را دوباره کد بندی کرد. برای مثال فرض کنید در پرسشنامه ای ۲۰ سوالی ۱۸سوال با نمره گذاری ۱تا ۵ (مستقیم) معنی می دهد اما در ۲ سوال جهت نمره گذاری ۵ تا ۱ (معکوس)است. در این حالت بهتر است همه داده ها وارد شوند اما جهت نمره گذاری آن دو سوال را با استفاده از دستور  Recode برعکس کرد.

برای بررسی این دستور ابتدا فایل داده “satisfy.sav” را از فایل های نمونه SPSS باز کنید می خواهیم کد بندی متغیر price را معکوس کرده و آن رت در متغیری جدید به نام r_price ذخیره کنیم برای این کار مسیر Transform>Recode into different variables را انتخاب کنید تا در کادر مکالمه Recode into different variables باز شود. در این کادر متغیر Price را انتخاب و وارد پنجره سمت راست می کنیم.

در قسمت سمت راست این کادر (Output Variable) و در قسمت Name نام متغیر جدید یعنی r_price را تایپ می کنیم و سپس دکمه Old and New values را کلیک می کنیم تا کادر Old and New values Recode into different variables: باز شود در این کادر در قسمت Old values عدد ۱ را در قسمت New values عدد ۵ را تایپ می کنیم و همین کار را برای کدهای ۴,۳,۲و۵ انجام می دهیم و آنها تبدیل به کدهای به ترتیب ۲٫۳٫۴و۱ می کنیم.

سپس دکمه های Continue.change و ok را به ترتیب کلیک می کنیم حال به پنجره داده ها برگردید. خواهید دید که متغیری تحت عنوان r_price به متغیرهای قبلی اضافه شده است که در واقع همان متغیر price است اما با کدبندی معکوس.

 

 

 

 

آموزش گام به گام اس پی اس اس

 

 

  1. کاربرد دیگر دستور Recode را بیشتر در فصل دوم در قسمت دسته بندی داده های کمی بحث کرده ایم.
  2. هرگاه بخواهیم دوباره کدبندی را برای گروهی از افراد نمونه با گروه دیگر از افراد نمونه متفاوت باشد در کادر مکالمه Recode into different variables باید از دستور if استفاده کرد.
  3. در منوی  Transform دو نوع دستور Recode تعبیه شده است. یک نوع را در بالا بررسی کردیم حالت دیگر Recode into same . . . است که درآن متغیر جدیدی ایجاد نمی شود و اعداد دوباره کد بندی شده در همان متغیر اول ذخیره می شوند. لذا این امر باعث از بین رفتن اطلاعات اصلی می شود و استفاده از دستور Recode بدین گونه توصیه نمی شود.

 

 

امیدواریم از این مطلب در سایت صنایع سافت لذت برده باشید.نظرات خودتون رو واسه ما کامنت بزارین تا ما بتونیم هر چه بیشتر از اونها واسه بهتر شدنه تیممون استفاده کنیم.

 

حتما شما هم دوست دارید مانند دیگر مهندسان صنایع از مقاله های جدید ما باخبر بشین، خب کافیه که فقط ایمیلتونو داخل فرم زیر وارد کنید. به همین راحتی :)

 

دانشجوی کارشناسی رشته مهندسی صنایع، فعال در حوزه دیجیتال مارکتینگ و علاقه مند به استارت اپ ها و دوست دارم که هر روز آموزش های بیشتری برای مهندسان صنایع تولید کنم

احمد جعفری

اگر این مقاله برای شما مفید بود برای دوستان خود هم به اشتراک بگذارید تا بقیه هم از این مطلب استفاده لازم را ببرند.

آموزش spss به زبان ساده

آموزش Spss به زبان ساده و آسان | گام به گام و تصویری

سلام دوستان عزیز با یکی دیگه از سری مقاله های آموزشی در سایت صنایع سافت که در زمینه آموزش نرم افزارهای مهندسی صنایع کار میکنیم در خدمتتون هستیم.در این مقاله قصد داریم که آموزشی به زبان ساده در خصوص آشنایی با محیط نرم افزار آماری Spss آماده کنیم.

همانطور که میدانید در اکثر تحقیقات با حجم زیاد از داده ها مواجه هستیم که اجرای عملیات بر روی داده ها حجم وسیعی از محسبات را نیز خواهد داشت لذا استفاده از یک نرم افزار مناسب آماری ضروری می نماید.

در حال حاضر نرم افزار های بسیاری باکارایی و قدرت متفاوت موجود میباشد که ما قصد داریم در این مقاله به آموزش spss به زبان ساده و آسان به نحوی که برای شما کاربران عزیز براحتی قابل فهم باشد بپردازیم.

لازم به ذکر است که این سری آموزش ها که در صنایع سافت منتشر میشود، صرفا مکمل آموزش های غیررایگان است لذا برای یادگیری آموزش کامل این نرم افزار روی آموزش نرم افزار Spss کلیک کنید.

آموزش spss به زبان ساده

 

علت استقبال اکثر محققان از نرم افزار Spss استفاده راحت،ارائه خروجی ها با محیط گرافیکی بسیار عالی و انجام اکثر روشهای آماری بدون نیاز به برنامه نویسی و نیز دارا بودن محیط برنامه نویسی  SYNTAX SPSS EDITOR برای کاربران حرفه ای میباشد.

در این مقاله آموزشی فرض بر این است که خواننده محترم آشنایی کافی با سیستم عامل ویندوز دارد.

 

اجرای برنامه Spss

برای اجرای نرم افزار Spss از روش های زیر میتوان استفاده نمود.

  1. Start \ All Programs \ Spss for windows \ Spss 13 for windows
  2. اجرای مستقیم Spss با دابل کلیک بر روی فتیل Spsswin که در موشه محتوی فایل های SPSS در مسیر نصب قرار دارد
  3. اجرای نرم افزار با استفاده از آیکون های میانبر
    الف) پوشه ای که SPSS در آنجا نصب شده است را پیدا کنید
    ب) فایل Spsswin را پیدا کرده و ار آن یک میانبر بر روی Desktop ایجاد کنید
    ج) با دابل کلیک بر روی ایکون مربوط Spss شوید
  4. اجرای Spss با استفاده از دستور Run کافی است مسیر Spsswin را در مقابل دستور Run وارد نمایید بطور مثال : Run: D: SPSS\Spsswin

 

دسترسی به پنجره ویرایشگر ها

پس از اجرای Spss پنجره ای مانند شکل پایین باز میشود و از شما میپرسد ایل به انجام چه کلری هستید ؟؟ پس انتخاب گزینه Type in date و کلیک Ok پنجره ای بنام Untitled Spss Editor باز میشود که شمال دو پنجره مختلف به نام های ذیل است :

  1. Data View
  2. Variable View

 

 

 

 

 

مقاله ای که حتما بدردتان میخورد : آموزش گام به گام اس پی اس اس به زبان فارسی

وارد کردن مشخصات متغیرها در پنجره Variable View

 

برای حرکت بین سلول های جدول میتوان از کلیدهای جهت نما استفاده نمایید

  1. نام متغیر را درستون Name وارد میکنیم
  2. نوع متغیر را درستون Type وارد میکنیم با کلیک بر روی مربع سه نقطه که در قسمت راست عبارت Numeric قرار دارد پنجره ای مانند شکل پایین باز میشود که میتوانیم نوع متغیر را مشخص نماییم

 

انواع متغیر ها شامل سه رقمی، نمایی، تاریخی، باعلامت دلار، باعلامت دلخواه و یا رشته ای میباشد.

 

۳) پهنای متغیر را میتوان با تغییر عدد داهل ستون Width تعیین کرد

۴)تعدا ارقام اعشار را میتوانید با تغییر عدد  داخل ستون decimals تعیین کنید.

۵) جهت انتساب یک برچسب به یک متغیر د رستون رود نظر بریای متغیر را تعریف نمایید.(طول برچسب حداکثر ۲۵۵ کارکتر میباشد)

۶)در مورد متغیر های گروه بندی مانند جنسیت بهتر است گروه های مختلف را با مقادیر و برچسب هایی مشخص نمایید. مثلا مرد را برابر مقدار عددی ۱ و زن را برابر ۲ قرار دهید. برا یاین منظور برروی مربع سه نقطه دار موجو در سمت راست ستون Values کلیک کرده تا پنجره ای مانند شکل پایین باز شود کدهای مورد نظر را در مقابل عبارت Values و برچسب مورد نظر را در مقابل Value Lable وارد نموده روی دکمه Add کلیک کرده و پس از وارد نمودن سایر برچسب ها و مقادیر بر روی دکمه Ok کلیک مینماییم.

 

 

۷) برای تعریف مقادیر گمشده باید دکمه سه نقطه دار موجود در سممت راست ستون Missing را کلیک کنیم تا پنجره ای مانند شکل پایین باز شود. در اینجا لازم است توضیحاتی در مورد داده های گمشده داده شود:

۱) گمشده سیستمی (system missing ) : اگر کاربر داده ای را در خانه ای وارد نکند SPSS یک مقدار گمشده سیستمی در آن وارد خواهد کرد که با یک نقطه نشان داده میشود.

۲) گمشده کاربری  (User missing) : گاهی کاربر میخواهد بنا به دلایلی برخی از داده هایی که وارد شده اند را به عنوان داده گمشده لحاظ نمایند.مثلا فردی در پاسخ به سوالات یک پرسشنامه از بیان سن خودداری میکند و محقق میخواهد برای این چنین وضعیتی عدد ۱۰۰- را بجای سن وارد نماید و برای زمانی که سن خوانا نمیباشد عدد ۱۰۱- را وارد نمایدتوجه داشته باشیم که در SPSS تمام مقادیر گمشده از محاسبات کنار گذاشته میشوند.

 

حال برای تعریف داده گمشده کاربری به صورت زیر عمل کنیم:
در پنجره Missing Values گزینه Discrete missing values را فعال کرده و مقادیر گمشده کاربری را در آن پنجره وارد می نماییم(حداکثر سه مقدار ) ویا میتوانیم یکدامنه از مقادیر گمشده به اضافه یکمقدار خارجاز دامنه را به عنوان مقادیر گمشده وارد نمایید .

آموزش spss به زبان ساده

 

 

۸) پهنای ستون را میتوان با تغییر عدد ستون Columns تغییر داد

۹) داده ها را میتوان به کمکستون Align در داخل هر سلول تراز کرد

۱۰) مقیاس اندازه گیری را میتوان با استفاده از ستون Measure تعیین کرد.مقیاس اندازه گیری برای متغیرهای نسبتی و فاصلهای گزینه scale، برای متغیرهای ترتیبی گزینه Ordinal وبرای متغیرهای اسمی مقیاس Norminal می باشد. ضمنا انتخاب مقیاس در محاسبات SPSS تاثیری ندارد و تنها در چند نمودار تغییراتی را ایجاد مینماید. در ادامه آموزش Spss به بررسی وارد کردن داده ها در Spss خواهیم پرداخت.

 

وارد کردن داده ها

پس از انکه مشخصات متغیرها را وارد کردیم ( ۱۰ مرحله فوق ) نوبت به وارد کردن داده ها Spss میشود برای اینکار در Data Editor دکمه Data View در پائین صفحه را فشار داده داده های هر متغیر را در ستون مربوط به آن متغیر وارد میکنیم

.

آموزش spss به زبان ساده

 

ذخیره و بازکردن فایلهای Spss

برای ذخیره فایل های Spss دستور File /Save as را اجرا کنیم تا پنجره ای به شکل پایین باز شود سپس مسیر ذخیره سازی، نام فایل و نیز نوع فایل را مشخص می نمایید.

آموزش spss به زبان ساده

 

نکته: درصورتی که بخواهید فایلی را با فرمت اکسل ذخیره کنید باید در قسمت Save as type گزینه  (Excel (*.xls را انتخاب نمایید در صورتی که نمیخواهید اسم متغیر ها در ثفحه گسترده اکسل نوشته شود گزینه Write variable names to spreadsheet را غیر فعال نمایید. مانند شکل پایین
درضمن توجه داشته باشید داده های گمشده که در SPSS با نقطه(.) نشان داده میشوند در اکسل بصورت (#NULL!) نمایش داده میشوند.

 

آموزش spss به زبان ساده

 

 

برای باز کردن فایل ها در SPSS از دستور File\ Open\ Data استفاده میشود که باید در آن پنجره مسیر، نام و نوع فایل را مشخص نمایید.

 

نکته :درصورتی که بخواهید فایلی را ازنوع اکسل باز کنید باید از ابتدا نوع فایل را (Excel(.xls انتخاب نمایید سپس مسیر و نام فایل مورد نظر را انتخاب کرده و دکمه Open را کلیک نمایید تا پنجره ای مانند شکل پایین باز شوددر این پنجره در صورتی که اسامی متغیر ها را در ابتدای فایل اکسل ننوشته اید غیرفعال سازید.
در این پنجره همچنین میتوانید یک صفحه کاری از اکسل و نیز یک محدوده از یک صفحه کار را انتخاب نمایید تا توسط Spss باز شود.

 

مثال : داده های مربوط به سه شاخص درصد اشتغال تخت متوسط روز بستری، نسبت پذیرش تخت بیمارستان های امام رضا(ع)، قائم شهید هاشمی نژاد و امید مربوط به سال ۱۳۸۳ در زیر آمده است با توجه به مطالبی که تا کنون عنوان شد این داده هارا در Spss وارد نمایید. ودر فایلیبه نام Hospital با فرمتهای    (spss (*.sav و  (Excel (*.xls ذخیره نمایید.

 

 

به شکل های زیر توجه کنید.

آموزش spss به زبان ساده

 

توجه نمایید که شکل ۱ چارده مربوط به مخصات متغیر ها و شکل ۱ پونزه مربوط به وارد کردن داده ها می باشد.داده ها را به همان صورتی که در بالا آمده است وارد نمایید.
توجه نمایید که در بالا نوع متغیر نام رشته ای انتخاب شده است که میتوانستیم بجای اینکار متغیر را از نوع عددی انتخاب نموده و در قسمت Values به اسم هر بیمارستان یک کد بدهید مثلا مقدار عددی ۱ را بجای بیمارستان امام رضا و مقدار ۲ را بجای بیمارستان قائم و…که در مقاله های بعدی از این روش استفاده شده است. که یقینا وارد کردن داده ها در این روش ساده تر و زمان کمتری میگیرد زیرا بجای تایپ عبارت بیمارستان امام رضا کافی است عدد ۱ تایپ شود.
منتها هدف از روشی که در این مثال عنوان شده است تفهیم کاربرد Width میباشد.

در ادامه کار فایل Hospital را با فرمت اکسل توسط Spss باز نمایید و مطالبی را که بیان شد. را اجرا نمایید.در ادامه بحث می خواهیم نحوه بدست آوردن شاخص های مرکزی و پراکندگی و نیز نمودارهای آماری را توسط Spss بیاموزیم.

 

 

امیدواریم از این مطلب در سایت صنایع سافت لذت برده باشید.نظرات خودتون رو واسه ما کامنت بزارین تا ما بتونیم هر چه بیشتر از اونها واسه بهتر شدنه تیممون استفاده کنیم.

 

حتما شما هم دوست دارید مانند دیگر مهندسان صنایع از مقاله های جدید ما باخبر بشین، خب کافیه که فقط ایمیلتونو داخل فرم زیر وارد کنید. به همین راحتی :)

 

دانشجوی کارشناسی رشته مهندسی صنایع، فعال در حوزه دیجیتال مارکتینگ و علاقه مند به استارت اپ ها و دوست دارم که هر روز آموزش های بیشتری برای مهندسان صنایع تولید کنم

احمد جعفری

اگر این مقاله برای شما مفید بود برای دوستان خود هم به اشتراک بگذارید تا بقیه هم از این مطلب استفاده لازم را ببرند.