วันจันทร์ที่ 22 กรกฎาคม พ.ศ. 2562

การวิเคราะห์การถดถอยพหุคูณ (Multiple Linear Regression)



           

                    การวิเคราะห์การถดถอยเป็นวิธีการทางสถิติที่ใช้ศึกษาความสัมพันธ์ระหว่างตัวแปรอิสระ (Independent Variable) กับตัวแปรตาม (Dependent Variable) จะเป็นการศึกษาความสัมพันธ์เชิงเส้นตรง (Linearity) ถ้าศึกษาความสัมพันธ์ระหว่างตัวแปรอิสระหนึ่งตัวกับตัวแปรตามหนึ่งตัว เรียกว่า การวิเคราะห์ถดถอยเชิงเส้นเชิงเดี่ยวหรือการวิเคราะห์ถดถอยเชิงเส้นอย่างง่าย (Simple Linear Regression Analysis) ถ้าตัวแปรอิสระมีมากกว่าหนึ่งตัวกับตัวแปรตามหนึ่งตัว เรียกว่า การวิเคราะห์การถดถอยเชิงเส้นพหุคูณ (Multiple Linear Regression)

                (1) วัตถุประสงค์ของการวิเคราะห์การถดถอย (ตัวอย่าง)
                1) เพื่อศึกษาความสัมพันธ์ระหว่างตัวแปรอิสระกับตัวแปรตาม เช่น ศึกษาความสัมพันธ์ของอายุกับระดับคลอเลสเตอรอล
                2) เพื่อศึกษาปัจจัย (ตัวแปรอิสระ) ที่ร่วมกันทำนายหรือพยากรณ์ตัวแปรตาม เช่น การศึกษาปัจจัยที่มีผลต่อระดับน้ำตาลในเลือดของผู้ป่วยเบาหวาน
                การวิเคราะห์การถดถอยเพื่อหาความสัมพันธ์หรือสร้างสมการทำนายหรือพยากรณ์ตัวแปรตาม (Y) หนึ่งตัว จากกลุ่มตัวแปรอิสระ (X) หลายตัวนั้น ตัวแปรอิสระที่นำมาวิเคราะห์จะต้องมีหลักฐานตามทฤษีหรือรายงานการวิจัยที่เกี่ยวข้องว่าเป็นตัวแปรต้นเหตุที่ส่งผลต่อตัวแปรตาม

                (2) ข้อตกลงเบื้องต้น (Assumption) ในการวิเคราะห์การถดถอย
                1) ตัวแปรอิสระ (X) และตัวแปรตาม (Y) ต้องเป็นตัวแปรเชิงปริมาณ (Quantitative Variable) หรือ ตัวแปรต่อเนื่อง (Continuous Variable) หรือมีระดับการวัดเป็น Interval หรือ Ratio Scale เช่น น้ำหนัก ส่วนสูง ระดับความดันโลหิต ระดับคลอเลสเตอรอล รายได้ อายุ คะแนน เป็นต้น ในกรณีที่ตัวแปรอิสระ (X) บางตัวมีระดับการวัดเป็น Nominal หรือ Ordinal Scale จะต้องแปลงข้อมูลให้เป็นตัวแปรหุ่น (Dummy Variable) คือ มีค่า 0 กับ 1 ก่อนจึงจะนำไปวิเคราะห์ และตัวแปรหุ่นไม่ควรจะมีหลายตัว เพราะจะทำให้เกิดความคลาดเคลื่อนมากขึ้น
                2) ตัวแปรอิสระแต่ละตัวมีความสัมพันธ์เชิงเส้นตรงกับตัวแปรตาม
                3) ตัวแปรอิสระไม่ควรมีความสัมพันธ์กันหรือเป็นอิสระต่อกัน (ค่าสหสัมพันธ์ไม่ควรเกิน 0.7) ในกรณีการวิเคราะห์ถดถอยแบบพหุคูณเพราะจะทำให้เกิด Multicollinearity คือ การที่ตัวแปรอิสระมีความสัมพันธ์กันมาก ซึ่งจะมีผลกระทบทำให้ค่าสัมประสิทธิ์การตัดสินใจ (R2) สูงเกินความเป็นจริง
                4) การแจกแจงของตัวแปรตามเป็นแบบโค้งปกติ (Normal Distribution) ที่ทุกค่าของ X
                5) ค่าของ Y มีความแปรปรวนเท่ากันทุกค่าของ X
                6) ความแปรปรวนของค่าความคลาดเคลื่อนจากการพยากรณ์ (Residual) ที่ทุกจุดบน
เส้นถดถอยมีค่าเท่ากัน

เครดิตภาพ: piratenproxy.nl 🙏

ไม่มีความคิดเห็น:

แสดงความคิดเห็น