کلمه همبستگی در زندگی روزمره برای نشان دادن نوعی ارتباط استفاده می شود. ممکن است بگوییم که ما بین روزهای مه آلود و حملات خس خس دیده شده ، متوجه همبستگی شده ایم. با این حال ، از نظر آماری ما از همبستگی استفاده می کنیم تا ارتباط بین دو متغیر کمی را نشان دهیم. ما همچنین فرض می کنیم که این ارتباط خطی است ، یک متغیر برای افزایش یا کاهش واحد در یک واحد افزایش یا کاهش می یابد. تکنیک دیگر که اغلب در این شرایط مورد استفاده قرار می گیرد ، رگرسیون است که شامل تخمین بهترین خط مستقیم برای خلاصه کردن انجمن است.
ضریب همبستگی
درجه ارتباط با ضریب همبستگی اندازه گیری می شود ، که توسط r مشخص شده است. گاهی اوقات پس از مبدأ آن ، ضریب همبستگی پیرسون نامیده می شود و اندازه گیری ارتباط خطی است. در صورت نیاز به یک خط خمیده برای بیان رابطه ، باید از اقدامات دیگر و پیچیده تر همبستگی استفاده شود.
ضریب همبستگی در مقیاس اندازه گیری می شود که از + 1 تا 0 ت ا-1 متغیر است. همبستگی کامل بین دو متغیر توسط + 1 ی ا-1 بیان شده است. هنگامی که یک متغیر افزایش می یابد با افزایش دیگری ، همبستگی مثبت است. وقتی یکی با افزایش دیگری کاهش یابد ، منفی است. عدم وجود همبستگی با 0. نشان داده شده است. شکل 11. 1 برخی از نمایش های گرافیکی از همبستگی را نشان می دهد.
نگاه به داده ها: نمودارهای پراکنده
هنگامی که یک بازپرس دو سری از مشاهدات را جمع آوری کرده است و آرزو می کند ببیند آیا رابطه ای بین آنها وجود دارد ، ابتدا باید یک نمودار پراکنده بسازد. مقیاس عمودی یک مجموعه از اندازه گیری ها و مقیاس افقی دیگری را نشان می دهد. اگر یک مجموعه از مشاهدات شامل نتایج تجربی باشد و دیگری از یک مقیاس زمانی یا طبقه بندی مشاهده شده به نوعی تشکیل شود ، معمول است که نتایج تجربی را در محور عمودی قرار دهید. اینها نشان دهنده آنچه "متغیر وابسته" نامیده می شود."متغیر مستقل" ، مانند زمان یا ارتفاع یا طبقه بندی مشاهده شده دیگر ، در امتداد محور افقی یا پایه اندازه گیری می شود.
کلمات "مستقل" و "وابسته" می توانند مبتدی را معما کنند زیرا بعضی اوقات مشخص نیست که به چه چیزی وابسته است. این سردرگمی یک پیروزی از عقل سلیم بر اصطلاحات گمراه کننده است ، زیرا اغلب هر متغیر به برخی متغیرهای سوم بستگی دارد ، که ممکن است ذکر شود یا ممکن است ذکر نشود. به عنوان مثال ، معقول است که به اوج کودکان وابسته به سن و نه مکالمه باشد ، اما همبستگی مثبت بین میانگین عملکرد تار و عملکرد نیکوتین مارک های خاص سیگار را در نظر بگیرید. در تار: هر دو به طور موازی با برخی از عوامل یا عوامل دیگر در ترکیب سیگار متفاوت هستند. به نظر نمی رسد که عملکرد آن به معنای دیگری "وابسته" باشد به این معنا که ، به طور متوسط ، قد کودک به سن او بستگی دارد. در چنین مواردی اغلب مهم نیست که مقیاس در کدام محور نمودار پراکندگی قرار داده شده است. با این حال ، اگر هدف این است که استنتاج در مورد یک متغیر از دیگری انجام شود ، مشاهداتی که از آن استنباط ها انجام می شود ، معمولاً در پایه قرار می گیرد. به عنوان نمونه دیگر ، یک نقشه مرگ و میر ماهانه ناشی از بیماری قلبی در برابر فروش ماهانه بستنی ، یک ارتباط منفی را نشان می دهد. با این حال ، به سختی احتمالاً خوردن بستنی از بیماری های قلبی محافظت می کند! به سادگی این است که میزان مرگ و میر ناشی از بیماری قلبی به طور معکوس - و مصرف بستنی به طور مثبت - به یک عامل سوم ، یعنی دمای محیطی مرتبط است.
محاسبه ضریب همبستگی
یک ثبت کننده کودکان فضای مرده آناتومیکی ریوی (در میلی لیتر) و قد (در سانتی متر) از 15 کودک را اندازه گیری کرده است. داده ها در جدول 11. 1 آورده شده است و نمودار پراکندگی نشان داده شده در شکل 11. 2 هر نقطه یک کودک را نشان می دهد ، و در نقطه ای مطابق با اندازه گیری ارتفاع (محور افقی) و فضای مرده (محور عمودی) قرار می گیرد. ثبت کننده اکنون این الگوی را بازرسی می کند تا ببیند آیا به نظر می رسد منطقه تحت پوشش مراکز نقاط بر روی یک خط مستقیم باشد یا اینکه آیا یک خط خمیده مورد نیاز است یا خیر. در این حالت ، متخصص اطفال تصمیم می گیرد که یک خط مستقیم می تواند روند کلی نقاط را به اندازه کافی توصیف کند. بنابراین مرحله بعدی وی محاسبه ضریب همبستگی خواهد بود.
هنگام ساختن نمودار پراکندگی (شکل 11. 2) برای نشان دادن ارتفاعات و فضاهای مرده آناتومیکی ریوی در 15 کودک ، متخصص اطفال شکل هایی را مانند ستون های (1) ، (2) و (3) جدول 11. 1 نشان می دهد. ترتیب دادن مشاهدات به ترتیب سریال متغیر مستقل مفید است که یکی از دو متغیر به وضوح به عنوان مستقل قابل شناسایی باشد. ارقام مربوطه برای متغیر وابسته می تواند در رابطه با سری فزاینده برای متغیر مستقل مورد بررسی قرار گیرد. به این ترتیب ما همان تصویر را می گیریم ، اما به شکل عددی ، همانطور که در نمودار پراکندگی ظاهر می شود.
شکل 11. 2 نمودار پراکندگی رابطه در 15 کودک بین ارتفاع و فضای مرده آناتومیکی ریوی.
محاسبه ضریب همبستگی به شرح زیر است ، با x نشان دهنده مقادیر متغیر مستقل (در این ارتفاع) و Y نشان دهنده مقادیر متغیر وابسته (در این مورد فضای مرده آناتومیکی) است. فرمولی که مورد استفاده قرار می گیرد عبارت است از: < Pan> هنگام ساخت نمودار پراکندگی (شکل 11. 2) برای نشان دادن ارتفاعات و فضاهای مرده آناتومیکی ریوی در 15 کودک ، متخصص اطفال شکل هایی را مانند ستون های (1) ، (2) و و شکل نشان می دهد.(3) جدول 11. 1. ترتیب دادن مشاهدات به ترتیب سریال متغیر مستقل مفید است که یکی از دو متغیر به وضوح به عنوان مستقل قابل شناسایی باشد. ارقام مربوطه برای متغیر وابسته می تواند در رابطه با سری فزاینده برای متغیر مستقل مورد بررسی قرار گیرد. به این ترتیب ما همان تصویر را می گیریم ، اما به شکل عددی ، همانطور که در نمودار پراکندگی ظاهر می شود.