การวิเคราะห์ความผันแปรร่วมระหว่างตัวแปรในการวิจัย
รศ.ดร.ศิริชัย
กาญจนวาสี
การวิเคราะห์เชิงปริมาณในงานวิจัยส่วนใหญ่เป็นการศึกษาความสัมพันธ์หรือความผันแปรร่วมกันระหว่างกลุ่มตัวแปร โดยนิยมให้ความสำคัญต่อการศึกษาความผันแปรของตัวแปรตาม (หนึ่งตัวหรือมากกว่า) อันเป็นผลเนื่องมาจากความผันแปรของตัวแปรอิสระอย่างน้อยหนึ่งตัว ถึงแม้ว่าการวิจัยบางลักษณะอาจจะไม่จำเป็นต้องจัดกลุ่มตัวแปรเป็นตัวแปรอิสระ/ตัวแปรตาม แต่ถ้าเป็นไปได้ ความพยายามของการจัดกลุ่มตัวแปรเป็นตัวแปรอิสระ/ตัวแปรตาม โดยอาศัยความรู้ แนวคิด ทฤษฎีที่เหมาะสมถือว่ามีความสำคัญต่อแนวทางของการวิจัยและการเลือกใช้สถิติวิเคราะห์ที่เหมาะสมเพื่อสนองตอบต่อเป้าหมายของการวิจัย
การแบ่งกลุ่มตัวแปรออกเป็นตัวแปรอิสระและตัวแปรตาม เป็นความเกี่ยวข้องที่แฝงความสัมพันธ์เชิงสาเหตุระหว่างตัวแปร (causal relationship) ซึ่งกลุ่มตัวแปรอิสระและตัวแปรตามทั้งหมดอาจเป็นตัวแปรที่สามารถสังเกตได้โดยตรง (Observable variables หรือ Manifest variables) อาจเป็นตัวแปรที่ไม่สามารถสังเกตได้โดยตรง (Unobservable variables) เนื่องจากเป็นสภาวะสันนิษฐานทางจิตวิทยา หรือเรียกว่าตัวแปรแฝง (Latent variables) ดังภาพที่1
ภาพที่ 1 ความสัมพันธ์เชิงสาเหตุระหว่างตัวแปร

กลุ่มเทคนิคทางสถิติที่ได้รับการพัฒนาขึ้นสำหรับใช้กับการวิจัยที่เกี่ยวข้องกับการวิเคราะห์ความผันแปรร่วมระหว่างตัวแปรที่สำคัญ ๆ มีดังสรุปในตารางที่ 1
ตารางที่ 1 ลักษณะความสัมพันธ์ระหว่างตัวแปรในการวิจัยและการวิเคราะห์ทางสถิติ
| ความสัมพันธ์ระหว่างตัวแปร | การวิเคราะห์ | ||
| POSSIBLE CAUSE (X1, X2, , X) |
POSSIBLE EFFECT (Y1, Y2, , Y) |
UNVARIATE | MULTIVARIATE |
| 1. INDEPENDENT VARIANLE 1 ตัว DICHOTOMOUS 1 ตัว POLYTOMOUS WITH COVARIATE >1 ตัว DICHO. OR POLY. WITH COVARIATE >1 ตัว CATEGORICAL |
DEPENDENT VARIANLE CONTINUOUS CONTINUOUS CONTINUOUS CONTINUOUS CONTINUOUS CONTINUOUS |
TEST ONE WAY ANOVA ONE WAY ANOVA FACTORIAL ANOVA FACTORIAL ANOVA LOGLINEAR |
HOTELLINGS T2 ONE WAY MANOVA ONE WAY MANOVA FACTORIAL MANOVA ONE WAY MANOVA GENERAL LOGLINEAR |
| 2. PREDICTOR VARIABLE 1 ตัว CATEG. or CONT. >1 ตัว CATEG. or CONT. >1 ตัว CATEG. or CONT. |
CRITERION/ OUTCOME V. CONTINUOUS CONTINUOUS DICHOTOMOUS POLYTOMOUS |
SIMPLE REG. MULTIPLE REG. LPM, PROBIT, LOGIT. TOBIT, ANALYSIS |
MULTIVAR. REG. MULTIVAR. REG. |
| 3. LATENT VARIABLE > 1 ตัว CONTINUOUS |
OBSERVED VARIABLE CONTINUOUS CATEGORICAL |
EXPLORATORY FA. CONFIRMATORY FA. FACTOR ANALYSIS MDS. IRT |
|
| 4. CAUSAL VARIABLE >1 ตัว CATEG. or CONT. POSSIBLE CAUSE (X1, X2, , X) |
EFFECT VARIABLE ALL CATEG. ALL CONT. MIXED:CATEG. &CONT. POSSIBLE EFFECT (Y1, Y2, , Y) |
UNVARIATE |
LPM, PROBIT LOGIT, LISCOMP PATH ANALYSIS STRUC. EQ. MODELLING LISREL, LISCOMP ? MULTIVARIATE |
| 5. DISCRIMINATING VAR. >1 ตัว CATEG. or CONT. |
GROUPING VARIABLE CATEGORICAL | DISCRIMINANT ANALYSIS |
|
| 6. DISCRIMINATING VAR. >1 ตัว CATEG. or CONT. |
CLASSIFICATION CATEGORICAL |
CLUSTER ANALYSIS |
|
เทคนิคทางสถิติที่อยู่บนพื้นฐานของการวิเคราะห์ความผันแปรร่วมกันระหว่างตัวแปร โดยอาศัยโมเดลทางคณิตศาสตร์เชิงเส้นตรง (linear mathmatical model) และที่ไม่ใช่เชิงเส้นตรงที่สำคัญมีดังนี้
การทำนาย (PREDICTION)
โมเดลที่ใช้กันแพร่หลายในการทำนายได้แก่ Regression model ซึ่งสามารถแบ่งประเภทใหญ่ ๆ ได้ 2 ประเภท ดังนี้
สมการทำนายอย่างง่ายเป็นการทำนายตัวแปรตามครั้งละ 2 ตัว จากตัวแปรอิสระ 1 ตัว สมมติว่า Y ป็นตัวแปรตาม ซึ่งมีความเกี่ยวข้องสัมพันธ์อย่างเป็นระบบกับตัวแปรอิสระ X จึงเขียนเป็นฟังก์ชั่นทางคณิตศาสตร์ไว้ดังนี้
Y = f(x)
โมเดล :
yi = a + bxi + ei
ในเมื่อ yi = ค่าสังเกตของตัวแปรตาม
xi = ค่าสังเกตของตัวแปรอิสระ
หรือตัวแปรทำนาย
a = ค่าคงที่ หรือ intercept
b = ค่าสังเกตของตัวแปรตาม
ei = ค่าความชัน (slope)
หรือค่าเฉลี่ยของการเปลี่ยนแปลงใน y เมื่อ x
เปลี่ยนแปลงไป 1 หน่วย (error)
การประมาณค่า :
การประมาณค่าพารามิเตอร์ a และ b นิยมใช้วิธี Ordinary
Least Squares Technique (OLS)
มีค่าน้อยที่สุด
ดังนั้น
หรือ 
สมการทำนาย :
/ ![]()
สมการทำนายเชิงพหุเป็นการทำนายตัวแปรตามครั้งละ 1 ตัว จากชุดของตัวแปรอิสระมากกว่า 1 ตัว ดังนี้
โมเดล : ![]()
ตัวอย่าง : การทำนายตัวแปรตาม (y) จากชุดของตัวแปรอิสระ (X1, X2, X3) สามารถเขียนเป็นสมการเชิงเส้นตรงได้ดังนี้

ข้อตกลงเบื้องต้น :
การประมาณค่า :
ใช้หลักการของ Ordinary Least Squares (OLS)
ในการประมาณค่าพารามิเตอร์ (a และ bi)
เพื่อให้
มีค่าน้อยที่สุด
โดยปกติ Regression analysis
จะมีความคงทนต่อการฝ่าฝืนข้อตกลงเบื้องต้น
ยกเว้นการฝ่าฝืนเกี่ยวกับความคลาดเคลื่อนในการวัด
(measurement errors)
และความคลาดเคลื่อนในการกำหนดรูปแบบของโมเดล
(specification errors)
ความคลาดเคลื่อนในการวัด : ถ้ามีความคลาดเคลื่อนในการวัดค่า X เกิดขึ้นอย่างสุ่ม (random measurement error) ค่าพารามิเตอร์ที่คำนวณได้จะมีค่าน้อยกว่าความเป็นจริงและลำเอียง
ถ้ามีความคลาดเคลื่อนในการวัดค่า y เกิดขึ้นอย่างสุ่ม การประมาณค่าพารามิเตอร์จะมีขนาดน้อยกว่าความเป็นจริงแต่ไม่ลำเอียง จะลำเอียงก็ต่อเมื่อความคลาดเคลื่อนในการวัดเกิดขึ้นอย่าง nonrandom หรือ systemic
ความคลาดเคลื่อนในการกำหนดโมเดล : เกิดขึ้นได้เนื่องจาก
การวิจัยโดยทั่วไปมักมีตัวแปรบางตัวมีลักษณะเป็นการจำแนกรายการ หรือตัวแปรเชิงคุณภาพ (Qualitative variable) เช่น เพศ อาชีพ เชื้อชาติ การนับถือศาสนา เป็นต้น ถ้ามีความจำเป็นต้องนำตัวแปรเหล่านี้มาใช้ในสมการทำนาย สามารถกระทำได้โดยจัดกระทำตัวแปรดังกล่าวให้เป็นตัวแปรจัดประเภท (catigorical variable) หรือ (dummy variable) ดังตัวอย่างต่อไปนี้
ตัวแปรอิสระเชิงคุณภาพ (qualitative independent variable)
ในกรณีที่ตัวแปรอิสระ (X) บางตัวเป็นตัวแปรจัดประเภท ตัวอย่างเช่น การทำนายผลสัมฤทธิ์ทางการเรียนคณิตศาสตร์ (y) จากตัวแปรอิสระ ความตั้งใจเรียน (X1) และ เพศ ของผู้เรียน (X2) ผู้วิจัยสามารถสร้างโมเดลการทำนายได้ดังนี้
โมเดล 1 Assumed ว่า Intercept ต่างกัน แต่ Slope เท่ากัน
โมเดล : yi = a + b1xi1 + b2xi2 + ei
เมื่อ
yi = คะแนนผลสัมฤทธิ์ทางการเรียนคณิตศาสตร์
xi1 = คะแนนความตั้งใจเรียน
xi2 = เพศของผู้เรียน เป็น Dummy variable โดยกำหนดให้เพศชาย = 1 และเพศหญิง = 0สมการทำนาย y สามารถแยกออกได้เป็น 2 สมการ ได้แก่ สมการทำนาย y สำหรับเพศชาย และสมการทำนาย y สำหรับเพศหญิง ดังนี้
สำหรับเพศชาย
และสำหรับเพศหญิง
โมเดล 2 Assumed ว่า Intercept และ Slope ต่างกัน
โมเดล : yi = a + b1xi1 + b2xi2 + b3(xi1+ xi2) + ei
ตัวแปร (xi1+ xi2) = xi1 สำหรับเพศชาย และเป็น 0 สำหรับเพศหญิง
สมการทำนาย y สามารถแยกออกได้เป็น 2 สมการสำหรับเพศชายและหญิง ดังน
สำหรับเพศชาย
และสำหรับเพศหญิง
ตัวแปรตามเชิงคุณภาพ (qualitative dependent variable)
การวิเคราะห์ถดถอยพหุเชิงเส้นตรงเป็นโมเดลการวิเคราะห์มาตรฐานที่ใช้กันอย่างแพร่หลายสำหรับการวิจัยทางสังคมศาสตร์ ถึงแม้ว่าข้อตกลงเบื้องต้นบางข้อยังเป็นที่สงสัยกันอยู่ โดยเฉพาะอย่างยิ่งเมื่อตัวแปรตามไม่เป็นตัวแปรต่อเนื่อง การนำโมเดลการวิเคราะห์ถดถอยพหุเชิงเส้นตรงมาใช้ถือว่าเป็นการไม่เหมาะสม
ในกรณีที่ตัวแปรตาม (y) เป็นตัวแปรจัดประเภทแบบ dichotomous หรือ binary data เช่น การทำนายการเข้าร่วมกิจกรรมพิเศษของนักเรียน ซึ่งตัวแปรตามสามารถกำหนดได้เป็นเพียงเข้าร่วม = 1 และไม่เข้าร่วม = 0 เป็นต้น ลักษณะการทำนายแบบนี้ สามารถใช้ Discriminant function เนื่องจากค่า y อยู่ระหว่าง 1 กับ 0 จึงนิยมเรียก โมเดลการทำนายเชิงเส้นตรงแบบนี้ว่า Linear Probability Model (LPM)
ถ้าหากใช้เทคนิค OLS Regression สำหรับประมาณค่าพารามิเตอร์ของ LPM (Y เป็น dichotomous variable) มีข้อจำกัดที่สำคัญ 2 ประการ คือ
- ถึงแม้ว่า E(e) = 0 ตามข้อตกลงเบื้องต้น แต่
ไม่คงที่ โดยผันแปรไปกันตัวแปร y หรือ x
- ค่า
ที่ทำนายได้อาจตกอยู่นอกช่วง 0-1 ซึ่งไม่สอดคล้องกับนิยามของความน่าจะเป็น
ทางแก้ไขสำหรับการวิเคราะห์ที่เหมาะสม คือ การเลือกใช้ฟังก์ชั่นที่เหมาะสมในรูปของ Non - linear Probability model ดังต่อไปนี้
- Probit Model และ Logit Model
- ทั้ง
สองโมเ
ดล
ช่วย
แก้
ไข
ปัญหา
ของ
การ
ใช้ OLS ใน
การ
ทำนาย y ที่
เป็น dichotomous variable โดย
การ
แปลง
ค่า
ของ
ความ
น่า
จะ
เป็น
เชิง
เส้น
ตรง
ตามโมเ
ดล
เดิม
ให้
เป็น
ค่า
ความ
น่า
จะ
เป็น
ที่
ไม่
ใช่
เชิง
เส้น
ตรง
ตามโมเ
ดล
ใหม่ เพื่อ
ให้
ค่า
ทำนาย
ซึ่ง
เป็น
ความ
น่า
จะ
เป็น
ให้
ตก
อยู่
ใน
ช่วง 0-1 เท่า
นั้น
- โมเ
ดล
ทั้ง
สอง
ฟังก์ชั่น
การ
แจก
แจง
เป็น
รูป
โค้ง
ความ
ถี่
สะ
สม
ที่
ใกล้
เคียง
กัน
มาก เพียง
แต่โมเ
ดล Logit มี
ความ
ชัน
น้อย
กว่า
โค้ง
การ
แจก
แจง
ปกติ
เล็ก
น้อย ซึ่ง
ใกล้
เคียง
กับ
การ
แจก
แจง
ที ( t - distribution)
- Probit Model : ใช้ Commulative Normal Probability Function
- โมเ
ดล :
- เมื่อ Zi เป็น
คะแนน
มาตร
ฐาน
- มี
ค่า
ระหว่าง
ถึง
ซึ่ง
สามารถ
แปลง
เป็น
ค่า
ความ
น่า
จะ
เป็น
ได้ โดย
การ
เปิด
ตา
ราง
พื้น
ที่
ใต้
โค้ง
การ
แจก
แจง
ปกติ
- จาก
ค่า Zi สามารถ
เชื่อม
โยง
ถึง
ตัวแปร
ตาม yi (1 = เข้า
ร่วม , 0 = ไม่
เข้า
ร่วม) ได้
โดย
การ
กำหนด
ค่า Threshold Zi* ซึ่ง
แสดง
ด้วย
สูตร
ดัง
นี้
ดังนั้นจากค่า a, และ b จึงเชื่อมโยงสู่การทำนาย Yi ได้
สมการทำนาย :
การประมาณค่า : ประมาณค่า a, bj โดยใช้หลักการ Maximum Likelihood
- Logit Model : ใช้ Commulative Logistic Probability Function
- Pi = (Zi) = (a + bxi)
- เมื่อ Pi เป็น Probability ของ
การ
เกิด
เหตุ
การณ์ เช่น การ
เข้า
ร่วม
กิจ
กรรม
พิเศษ เป็น
ต้น ส่วน f เป็น
ฟังก์ชั่น
โลหิตโลจิ
สติค
ซึ่ง
สามารถ
เขียน
เป็น
สมการ
ได้
ดัง
นี้
- โมเ
ดล :
- เมื่อ e = ค่า
คง
ที่
ซึ่ง
เป็น
ฐาน
ของ
ลอก
กา
ริ
ทึม
ธรรม
ชาติ มี
ค่า
ประมาณ 2.718
- สมการ
ทำนาย :
- การ
ประมาณ
ค่า : กระ
ทำ
ได้ 2 วิธี
- วิธี
ที่ 1 ใช้ OLS Technique
ทำการแปลงสมการทำนาย Pi ให้เป็นเส้นตรง

พิจารณาแต่ละ Xi
(หรือแบ่งช่วง Xi
สำหรับจัดเป็นกลุ่มย่อย ๆ) เพื่อคำนวณค่า
ของแต่ละ Xi
ทำการวิเคราะห์ OLS ตาม 1)
เพื่อประมาณค่า
และ ![]()
สร้างสมการทำนาย
และคำนวณค่า
ออกมาได้
วิธีที่ 2 ใช้ Maximum Likelihood Method
การประมาณค่าพารามิเตอร์ใช้หลักการเดียวกับ
Probit Regression โดยการแทนค่า Zi ด้วย Yi
กำหนดค่าประมาณของ
,
เพื่อประมาณค่า
จนถึงจุดที่ Likelihood function
มีค่าสูงสุด จึงรายงานค่า
และ ![]()
Tobit Model
ในกรณีที่ตัวแปรตาม (y)เป็น discrete number เช่น จำนวนบุตร จำนวนวันของการขาดเรียน เป็นต้น การทำนายตัวแปรตาม y ลักษณะดังกล่าว สามารถกระทำได้ 2 วิธี คือ การประยุกต์ใช้ OLS และใช้ Tobit Model ซึ่งวิธีหลังมีความเหมาะสมมากกว่า
วิธีที่ 1 ประยุกต์วิธี OLS
1) แบ่งกลุ่มตัวอย่างออกเป็น 2 กลุ่ม ได้แก่ Y = 0 และกลุ่ม Y> 0 จากนั้นจึงใช้เทคนิค OLS สร้างสมการทำนายสมการแรก โดยใช้กลุ่มตัวอย่างทั้งหมดเพื่อทำนาย Y ( y = 0 และ y > 0 ซึ่ง Recode ให้ y = 1)
สร้างสมการทำนายสมการที่สองเฉพาะกลุ่ม Y > 0 โดยจัดกลุ่ม Y = 1 ให้เป็น Y = 0 และ Y > 1 ให้เป็น Y = 1 และสร้างสมการทำนายต่าง ๆ ไปจนครบ
วิธีที่ 2 ใช้ Tobit Model
มีลักษณะคล้าย Probit Model โดยใช้หลักการของ Maximum Likelihood ในการประมาณค่าพารามิเตอร์
โมเดลทำนายตัวแปรตามที่เป็นบวก
: 
เมื่อ
เป็นส่วนเบี่ยงเบนมาตรฐานของ Likelihood function
ดังนั้นค่าที่คาดหมายของตัวแปรตามจึงเป็น

เมื่อ
= cummulative probability function
=
density function ของอัตราส่วนระหว่าง
และ ![]()
การวิเคราะห์โครงสร้างความสัมพันธ์ระหว่างตัวแปร
โมเดลที่ใช้กันแพร่หลายในการศึกษาโครงสร้างความสัมพันธ์ระหว่างตัวแปร ได้แก่ Factor Analytical model ซึ่งเป็นเทคนิคทางสถิติที่ใช้ในการลดปริมาณของข้อมูลทีสังเกตมาได้ให้น้อยลง โดยการศึกษาแบบแปนหรือการจับกลุ่มความสัมพันธ์ระหว่างตัวแปรที่สังเกตได้ เพื่อทราบถึงโครงสร้าง (structure) ของข้อมูลอันเป็นองค์ประกอบ (ภายใน) ร่วมกัน (common factor)
Exploratory Factor Model (EFM)
โมเดล : ตัวแปรอยู่ในรูปของคะแนนมาตรฐาน
![]()
ในเมื่อ Xik = คะแนนมาตรฐานของคนที่ เกี่ยวกับตัวแปร
F,S,E = คะแนนมาตรฐานของตัวประกอบร่วม ตัวประกอบเฉพาะ
และความคลาดเคลื่อน ตามลำดับ
a = น้ำหนักตัวประกอบ ( ) ซึ่งเป็นสัมประสิทธิ์การถดถอยของ
ตัวแปรที่สังเกตได้กับตัวประกอบร่วม
หรือ
(p x 1) (p x k) (k x 1) (p x 1)
ในเมื่อ X = เวคเตอร์ของตัวแปรที่สังเกตได้ p ตัวแปร
F = เวคเตอร์ของตัวประกอบร่วม k ตัวประกอบ
= เมตริกซ์ของน้ำหนักตัวประกอบ
U = เวคเตอร์ของค่าที่เหลือ (residual) ซึ่งประกอบด้วยผลรวมของ
ตัวประกอบเฉพาะและความคลาดเคลื่อนสุ่ม
ตัวอย่าง สมมติว่ามีตัวประกอบร่วมอยู่ 2 คุณลักษณะที่เป็นตัวแปรแฝงของตัวแปรที่สังเกตค่าได้ 6 ตัวแปร ดังภาพที่ 2
ภาพที่ 2 ตัวอย่าง โมเดล EFM
![]()
Common factors
| X1 | X2 | X3 | X4 | X5 | X6 | Mainifest variables |
![]()
ข้อตกลงเบื้องต้น
ตัวประกอบร่วมทุกตัวมีความสัมพันธ์กัน (oblique rotation) หรือตัวประกอบร่วมทุกตัวเป็นอิสระต่อกัน (orthogonal rotation)
2. ตัวแปรที่สังเกตค่าได้ทุกตัวได้รับอิทธิพลโดยตรงจากทุกตัวประกอบ
ตัวแปรที่สังเกตค่าได้ทุกตัวได้รับอิทธิพลจากตัวประกอบเฉพาะหรือความคลาดเคลื่อนเพียงตัวเดียว
ความคลาดเคลื่อนทุกตัวเป็นอิสระต่อกัน และเป็นอิสระจากตัวประกอบทุกตัว
ข้อจำกัด : ผลการวิเคราะห์อาจจะไม่ unique เนื่องจากอาจจะมีคำตอบหลายชุดที่เหมาะสมกับข้อมูล และไม่สามารถทดสอบความสอดคล้องระหว่างโมเดลกับข้อมูล
2.2 Confirmatory Factor Model (CGM)
ข้อจำกัดของ EFM ได้รับการแก้ไขโดยการพัฒนาโมเดลการวิเคราะห์ตัวประกอบเพื่อการตรวจสอบยืนยัน (CFM) (Joreskog, 1967, 1969) ใน CFM ผู้วิจัยสามารถยกเลิกข้อตกลงเบื้องต้นบางข้อของ EFM หรือเพิ่มข้อจำกัดบางประการที่สอดคล้องกับแนวคิด/ ทฤษฎีที่ต้องการทดสอบได้ เช่น ผู้วิจัยสามารถที่จะวางเงื่อนไขให้ตัวประกอบบางคู่มีความสัมพันธ์กัน เลือกตัวแปรที่สังเกตค่าได้บางตัวให้ได้รับอิทธิพลโดยตรงจากเพียงบางตัวประกอบ เลือกตัวแปรที่สังเกตได้เพียงบางตัวที่ได้รับอิทธิพลจากความคลาดเคลื่อน หรือกำหนดให้ความคลาดเคลื่อนของตัวแปรบางคู่ที่มีความสัมพันธ์กัน เป็นต้น
ตัวอย่าง สมมติว่ามีตัวประกอบอยุ่ 2 คุณลักษณะ ซึ่งต่างเป็นตัวแปรของตัวแปรทีสังเกตค่าได้ 3 ตัวแปร ดังภาพที่ 3
ภาพที่ 3 ตัวอย่างโมเดล CFM
| X1 | X2 | X3 | X4 | X5 | X6 |
![]()
ข้อดี : สามารถใช้การวิเคราะห์ทางสถิติทำการทดสอบว่าข้อมูลที่เก็บรวบรวมมาได้มีความสอดคล้องกับข้อจำกัดข้อตกลงของโมเดลที่ผู้วิจัยกำหนดไว้หรือไม่ หรือกล่าวโดยทั่วไปว่า ข้อมูลมีความสอดคล้องกับโมเดลที่สร้างขึ้นหรือไม่นั่นเอง
ข้อจำกัด : ถึงแม้ว่าเราสามารถศึกษาสหสัมพันธ์ระหว่างตัวประกอบที่เกิดขึ้นตามเงื่อนไขของโมเดลที่ผู้วิจัยสร้างขึ้น แต่ยังไม่สามารถศึกษาความสัมพันธ์ในขั้นของการทำนายหรืออิทธิพลระหว่างตัวประกอบ
3. การวิเคราะห์โครงสร้างความสัมพันธ์เชิงสาเหตุระหว่างตัวแปร
การนำข้อมูลความสัมพันธ์ระหว่างตัวแปร ซึ่งเก็บรวบรวมได้ในสภาพธรรมชาติมาใช้เพื่อการทดสอบสมมติฐานในเชิงสาเหตุนั้น จะต้องกระทำด้วยความรอบคอบและสมเหตุสมผล ผู้วิจัยจะต้องมีความรอบรู้ในเนื้อเรื่องและหลักการของทฤษฎีที่เกี่ยวข้อง โดยผู้วิจัยจะต้องมีความสามารถในการคัดเลือกตัวแปร/องค์ประกอบที่สำคัญที่เกี่ยวข้องได้อย่างเหมาะสม สามารถสร้างโมเดลซึ่งแสดงถึงโครงสร้างความสัมพันธ์ระหว่างตัวแปร/องค์ประกอบได้สอดคล้องกับทฤษฎีและจะต้องสามารถนำโครงสร้างความสัมพันธ์นั้น มาตรวจสอบกับข้อมูลจริงที่เก็บรวบรวมมาได้ โดยใช้เทคนิคการวิเคราะห์เชิงสาเหตุ ดังนั้นถ้าปราศจากพื้นฐานทางหลักการ เหตุผล ทฤษฎี และโมเดลที่เหมาะสมแล้ว เทคนิควิธีการวิเคราะห์เชิงสาเหตุก็ไม่สามารถนำไปใช้ได้อย่างมีประสิทธิภาพ
3.1 ประเภทของโมเดลเชิงสาเหตุ
การเขียนโมเดลเชิงสาเหตุ มีสัญลักษณ์ที่นิยมใช้กันโดยทั่วไป ดังแสดงในภาพที่ 4
ภาพที่ 4 สัญลักษณ์ที่ใช้ในโมเดลเชิงสาเหตุ
ภาพที่ 5 ตัวอย่างการใช้สัญลักษณ์ในโมเดลเชิงสาเหตุ
| e | แสดงว่าตัวแปรที่สังเกตได้ X มีอิทธิพลโดยตรง (ขนาด B) ต่อการเปลี่ยนแปลงของตัวแปรที่สังเกตได้ y โดยมีความคลาดเคลื่อนสุ่มในการทำนายขนาด e |
| แสดงว่าตัวแปรที่สังเกตได้ X1 และ X2 มีความสัมพันธ์กัน โดยมีค่าความแปรปรวนร่วมเท่ากับ 12 |
โมเดลเชิงสาเหตุ สามารถจำแนกประเภทอย่างกว้าง ๆ ได้ดังนี้
3.1.1 Manifest variable models V.S. Latent variable models
Manifest variable model เป็นโมเดลที่แสดงความสัมพันธ์เชิงสาเหตุระหว่างตัวแปร โดยสมมติว่าตัวแปรทั้งหมดเป็นตัวแปรที่สามารถสังเกตได้โดยตรง (observable variables) โมเดลนี้เป็นที่รู้จักกันดี และใช้กันอย่างแพร่หลายในการศึกษาความสัมพันธ์ระหว่างตัวแปร เช่น Multiple regression, Path analysis เป็นต้น
Latent variable model เป็นโมเดลที่แสดงความสัมพันธ์เชิงสาเหตุระหว่างตัวแปรแฝง ซึ่งไม่สามารถสังเกตได้โดยตรง แต่เชื่อว่ามีอิทธิพลโดยตรงต่อชุดของตัวแปรที่สามารถสังเกตได้ โมเดลนี้ตั้งอยู่บนพื้นฐานความเชื่อว่า มโนทัศน์ส่วนใหญ่ในทางพฤติกรรมศาสตร์มีความเป็นนามธรรม เช่น เชาวน์ปัญญา ผลสัมฤทธิ์ทางการเรียน ทัศนคติ สถานภาพทางเศรษฐกิจและสังคม เป็นต้น มโนทัศน์เหล่านี้ไม่สามารถสังเกตได้โดยตรง เนื่องจากเป็นสภาวะสันนิษฐานทางจิตวิทยา หรือเรียกว่าตัวแปรแฝง (latent variable) ซึ่งเป็นคุณลักษณะที่มีอิทธิพลต่อพฤติกรรมของมนุษย์ ถึงแม้ว่าตัวแปรดังกล่าวจะสังเกตไม่ได้โดยตรง แต่เราสามารถศึกษาได้โดยสังเกตจากอิทธิพลของตัวแปรแฝงนั้น ๆ ที่มีต่อตัวแปรทางพฤติกรรมบางตัวที่เราสามารถสังเกตและวัดค่าได้ วิธีการที่รู้จักกันแพร่หลายในการศึกษาตัวแปรแฝงคือ การวิเคราะห์ตัวประกอบ (factor analysis) ซึ่งเป็นการวิเคราะห์หาองค์ประกอบร่วมจากความสัมพันธ์ของชุดของตัวแปรที่สังเกตได้
ภาพที่ 6 ตัวอย่าง Manifest variable model ของตัวแปรที่สังเกตได้ 7 ตัวแปร
e5
e7
e6
ภาพที่ 7 ตัวอย่างของ Latent variable model ของตัวแปรแฝง 3 ตัวแปร
e1
e2
e
e3 ![]()
![]()
e4 ![]()
e5
3.1.2 Recursive models V.S. Non-recursive models
Recursive model เป็นโมเดลที่แสดงความสัมพันธ์เชิงสาเหตุระหว่างตัวแปรโดยทิศทางของการเป็นสาเหตุเป็นไปในทิศทางเดียวกันตลอด ไม่มีความสัมพันธ์ชนิดผกผันหรือย้อนกลับ รวมทั้งกรณีความสัมพันธ์ของตัวแปรเดียวกันแต่วัดต่างเวลา
Non-recursive model เป็นโมเดลที่แสดงความสัมพันธ์เชิงสาเหตุระหว่างตัวแปร โดยทิศทางของการเป็นสาเหตุระหว่างตัวแปรอย่างน้อยคู่ใดคู่หนึ่งมีทิศทางผกผันหรือย้อนกัล หรือมีอิทธิพลซึ่งกันและกัน
ภาพที่ 8 ตัวอย่างของ Recursive model
Model Model
ภาพที่ 9 ตัวอย่างของ Non-recursive model
e3 e3
Model 1 Model 2
e4 e4
3.2 โมเดลการวิเคราะห์เชิงสาเหตุ
การวิเคราะห์เชิงสาเหตุที่ใช้กันอยู่ในปัจจุบันมีอยุ่ 2 โมเดล ได้แก่ Path Model และ Covariance Structure Model ซึ่งมีรายละเอียดดังนี้
3.2.1 Path model
โมเดล : ตัวแปรที่อยู่ในรูปของคะแนนมาตรฐาน
Y = XB + e
ในเมื่อ Y = เวคเตอร์ของค่าสังเกตจากตัวแปรตาม
X = เมตริกซ์ของค่าสังเกตจากชุดของตัวแปรอิสระ
ฺBij= เวคเตอร์ของน้ำหนักความสัมพันธ์ระหว่างตัวแปรอิสระกับตัวแปรตาม
(Standardized regression coefficient) = (path coefficient)
e = เวคเตอร์ของค่าความคลาดเคลื่อนสุ่ม ซึ่งมี E(e) = 0
finite covariance matrix, E(ee) = ![]()
ตัวอย่าง : ความสัมพันธ์ระหว่าง X1 , X2 , X3 และ X4 โดย
X1 = ตัวแปรซึ่งไม่ได้ถูกกำหนดโดยตัวแปรใดในโมเดลหรือความ
ผันแปรของ X1 เกิดจากตัวแปรนอกโมเดล (Exogeneous variable)
X2 , X3 , X4 = ตัวแปรซึ่งถูกกำหนดโดยตัวแปรตัวใดตัวหนึ่งในโมเดล หรือ
ความผันแปรของ X2 , X3 , X4 เกิดจากอิทธิพลของตัวแปรตัวใด
ตัวหนึ่งที่อยู่ในโมเดล (endogeneous variables)
e2
P21 P42 e4
P32
P31 P43
e3
X2 = p21X1 + e2
X3 = p31X1 + p32X2 + e3
X4 = p42X2 + p43X3 + e4
ข้อตกลงเบื้องต้น : ทำนองเดียวกับ Regression model สำหรับแต่ละเส้นทางที่วิเคราะห์
ข้อดี :
ต้องมีการศึกษาค้นคว้าล่วงหน้าเกี่ยวกับกระบวนการของการเป็นสาเหตุระหว่างตัวแปรก่อนการเขียน path diagram
สามารถจำแนกความสัมพันธ์ระหว่างตัวแปรเป็นผลรวมของความสัมพันธ์อย่างง่ายและซับซ้อนภายในแต่ละเส้นทาง เช่น

ทำให้สามารถวัดค่าความสัมพันธ์ระหว่างตัวแปรทั้งอิทธิพลทางตรงและทางอ้อม (direct and indirect effects)
เช่น อิทธิพลของ X2 ต่อ X4 ประกอบด้วย
อิทธิพลทางตรง = P42
อิทธิพลทางอ้อม = P43P23
ข้อจำกัด :
ในการวัดค่าตัวแปรอิสระและตัวแปรตามจะมีความคลาดเคลื่อนเกิดขึ้นเสมอ โมเดลนี้ไม่ได้นำค่าความคลาดเคลื่อนดังกล่าวมาพิจารณา วิเคราะห์ หรือทดสอบ
การแยกประมาณค่าพารามิเตรอ์ทีละเส้นทาง เมื่อนำทุกเส้นทางมาพิจารณาพร้อมกัน ค่าที่ประมาณได้อาจจะไม่ใช่ค่าที่แท้จริงของภาพรวมทั้งระบบ
Covariances Structure Model
นักทฤษฎีทางสถิติได้พัฒนา Covariances Structure Model เพื่อศึกษาความสัมพันธ์เชิงโครงสร้าง (Structure relations) ระหว่างตัวประกอบหรือตัวแปรแฝง โดยการประยุกต์หลักการของ Path Analysis มาใช้ในการสรุปความสัมพันธ์เชิงสาเหตุระหว่างตัวประกอบที่ได้จาก CFM ปัจจุบันมีโปรแกรมคอมพิวเตอร์ที่รู้จักกันดีที่ใช้ในการวิเคราะห์ดังกล่าว เช่น Linear Structural Relationships (Lisrel ; Joreskog and Sorbom, 1985) , Analysis of Linear Structural Equation with Comprehensive Measurement Model (LISCOMP, Muthen, 1988) เป็นต้น สำหรับรายละเอียดและโปรแกรมการวิเคราะห์ที่จะกล่าวต่อไปนี้ จะยึดแนวทางของโปรแกรม LISCOMP เป็นหลัก เนื่องจากเป็นโปรแกรมที่มีขอบเขตการใช้งานได้อย่างกว้างขวาง
บรรณานุกรม
จากข่าวสารวิจัยการศึกษา
ปีที่ 16 ฉบับที่ 5
มิถุนายน-กรกฎาคม 2539