การวิเคราะห์ความผันแปรร่วมระหว่างตัวแปรในการวิจัย
รศ.ดร.ศิริชัย กาญจนวาสี

การวิเคราะห์เชิงปริมาณในงานวิจัยส่วนใหญ่เป็นการศึกษาความสัมพันธ์หรือความผันแปรร่วมกันระหว่างกลุ่มตัวแปร โดยนิยมให้ความสำคัญต่อการศึกษาความผันแปรของตัวแปรตาม (หนึ่งตัวหรือมากกว่า) อันเป็นผลเนื่องมาจากความผันแปรของตัวแปรอิสระอย่างน้อยหนึ่งตัว ถึงแม้ว่าการวิจัยบางลักษณะอาจจะไม่จำเป็นต้องจัดกลุ่มตัวแปรเป็นตัวแปรอิสระ/ตัวแปรตาม แต่ถ้าเป็นไปได้ ความพยายามของการจัดกลุ่มตัวแปรเป็นตัวแปรอิสระ/ตัวแปรตาม โดยอาศัยความรู้ แนวคิด ทฤษฎีที่เหมาะสมถือว่ามีความสำคัญต่อแนวทางของการวิจัยและการเลือกใช้สถิติวิเคราะห์ที่เหมาะสมเพื่อสนองตอบต่อเป้าหมายของการวิจัย

การแบ่งกลุ่มตัวแปรออกเป็นตัวแปรอิสระและตัวแปรตาม เป็นความเกี่ยวข้องที่แฝงความสัมพันธ์เชิงสาเหตุระหว่างตัวแปร (causal relationship) ซึ่งกลุ่มตัวแปรอิสระและตัวแปรตามทั้งหมดอาจเป็นตัวแปรที่สามารถสังเกตได้โดยตรง (Observable variables หรือ Manifest variables) อาจเป็นตัวแปรที่ไม่สามารถสังเกตได้โดยตรง (Unobservable variables) เนื่องจากเป็นสภาวะสันนิษฐานทางจิตวิทยา หรือเรียกว่าตัวแปรแฝง (Latent variables) ดังภาพที่1

ภาพที่ 1 ความสัมพันธ์เชิงสาเหตุระหว่างตัวแปร

กลุ่มเทคนิคทางสถิติที่ได้รับการพัฒนาขึ้นสำหรับใช้กับการวิจัยที่เกี่ยวข้องกับการวิเคราะห์ความผันแปรร่วมระหว่างตัวแปรที่สำคัญ ๆ มีดังสรุปในตารางที่ 1

ตารางที่ 1 ลักษณะความสัมพันธ์ระหว่างตัวแปรในการวิจัยและการวิเคราะห์ทางสถิติ

ความสัมพันธ์ระหว่างตัวแปร การวิเคราะห์
POSSIBLE
CAUSE
(X1, X2, … , X)
POSSIBLE
EFFECT
(Y1, Y2, … , Y)
UNVARIATE MULTIVARIATE
1. INDEPENDENT
VARIANLE
1 ตัว DICHOTOMOUS
1 ตัว POLYTOMOUS
WITH COVARIATE
>1 ตัว DICHO. OR POLY.
WITH COVARIATE
>1 ตัว CATEGORICAL
DEPENDENT
VARIANLE
CONTINUOUS
CONTINUOUS
CONTINUOUS
CONTINUOUS
CONTINUOUS
CONTINUOUS


TEST
ONE WAY ANOVA
ONE WAY ANOVA
FACTORIAL ANOVA
FACTORIAL ANOVA
LOGLINEAR


HOTELLING’S T2
ONE WAY MANOVA
ONE WAY MANOVA
FACTORIAL MANOVA
ONE WAY MANOVA
GENERAL LOGLINEAR
2. PREDICTOR VARIABLE

1 ตัว CATEG. or CONT.
>1 ตัว CATEG. or CONT.
>1 ตัว CATEG. or CONT.
CRITERION/
OUTCOME V.
CONTINUOUS
CONTINUOUS
DICHOTOMOUS
POLYTOMOUS


SIMPLE REG.
MULTIPLE REG.
LPM, PROBIT, LOGIT.
TOBIT, ANALYSIS


MULTIVAR. REG.
MULTIVAR. REG.
3. LATENT VARIABLE

> 1 ตัว CONTINUOUS
OBSERVED
VARIABLE
CONTINUOUS
CATEGORICAL
  EXPLORATORY FA.
CONFIRMATORY FA.
FACTOR ANALYSIS
MDS. IRT
4. CAUSAL VARIABLE
>1 ตัว CATEG. or CONT.




POSSIBLE
CAUSE
(X1, X2, … , X)
EFFECT VARIABLE
ALL CATEG.

ALL CONT.


MIXED:CATEG. &CONT.
POSSIBLE
EFFECT
(Y1, Y2, … , Y)





UNVARIATE

LPM, PROBIT
LOGIT, LISCOMP
PATH ANALYSIS
STRUC. EQ. MODELLING
LISREL, LISCOMP
?
MULTIVARIATE
5. DISCRIMINATING VAR.
>1 ตัว CATEG. or CONT.
GROUPING VARIABLE CATEGORICAL   DISCRIMINANT
ANALYSIS
6. DISCRIMINATING VAR.
>1 ตัว CATEG. or CONT.
CLASSIFICATION
CATEGORICAL
 
CLUSTER ANALYSIS

เทคนิคทางสถิติที่อยู่บนพื้นฐานของการวิเคราะห์ความผันแปรร่วมกันระหว่างตัวแปร โดยอาศัยโมเดลทางคณิตศาสตร์เชิงเส้นตรง (linear mathmatical model) และที่ไม่ใช่เชิงเส้นตรงที่สำคัญมีดังนี้

การทำนาย (PREDICTION)

โมเดลที่ใช้กันแพร่หลายในการทำนายได้แก่ Regression model ซึ่งสามารถแบ่งประเภทใหญ่ ๆ ได้ 2 ประเภท ดังนี้

  1. การวิเคราะห์ถดถอยอย่างง่าย (Simple Regression)

    สมการทำนายอย่างง่ายเป็นการทำนายตัวแปรตามครั้งละ 2 ตัว จากตัวแปรอิสระ 1 ตัว สมมติว่า Y ป็นตัวแปรตาม ซึ่งมีความเกี่ยวข้องสัมพันธ์อย่างเป็นระบบกับตัวแปรอิสระ X จึงเขียนเป็นฟังก์ชั่นทางคณิตศาสตร์ไว้ดังนี้

    Y = f(x)
    โมเดล :
    yi = a + bxi + ei
    ในเมื่อ yi = ค่าสังเกตของตัวแปรตาม
    xi = ค่าสังเกตของตัวแปรอิสระ หรือตัวแปรทำนาย
    a = ค่าคงที่ หรือ intercept
    b = ค่าสังเกตของตัวแปรตาม
    ei = ค่าความชัน (slope) หรือค่าเฉลี่ยของการเปลี่ยนแปลงใน y เมื่อ x เปลี่ยนแปลงไป 1 หน่วย (error)

    การประมาณค่า : การประมาณค่าพารามิเตอร์ a และ b นิยมใช้วิธี Ordinary Least Squares Technique (OLS) มีค่าน้อยที่สุด

    ดังนั้น หรือ
    สมการทำนาย : /

  2. การวิเคราะห์ถดถอยเชิงพหุ (Multiple Regression)

    สมการทำนายเชิงพหุเป็นการทำนายตัวแปรตามครั้งละ 1 ตัว จากชุดของตัวแปรอิสระมากกว่า 1 ตัว ดังนี้

    โมเดล :

    ตัวอย่าง : การทำนายตัวแปรตาม (y) จากชุดของตัวแปรอิสระ (X1, X2, X3) สามารถเขียนเป็นสมการเชิงเส้นตรงได้ดังนี้

ข้อตกลงเบื้องต้น :

  1. y มีความสัมพันธ์เชิงเส้นตรงกับ x’s
  2. ค่าความคลาดเคลื่อน (e) มีลักษณะดังนี้
    1. แจกแจงปกติสำหรับทุกค่าของ x’s
    2. ค่าเฉลี่ยเท่ากับ 0
    3. ความแปรปรวนคงที่
    4. เป็นอิสระจาก e อื่น ๆ แล x’s
  3. ไม่มีความคลาดเคลื่อนเกิดขึ้นในการวัดค่า x’s

การประมาณค่า : ใช้หลักการของ Ordinary Least Squares (OLS) ในการประมาณค่าพารามิเตอร์ (a และ bi) เพื่อให้ มีค่าน้อยที่สุด โดยปกติ Regression analysis จะมีความคงทนต่อการฝ่าฝืนข้อตกลงเบื้องต้น ยกเว้นการฝ่าฝืนเกี่ยวกับความคลาดเคลื่อนในการวัด (measurement errors) และความคลาดเคลื่อนในการกำหนดรูปแบบของโมเดล (specification errors)

ความคลาดเคลื่อนในการวัด : ถ้ามีความคลาดเคลื่อนในการวัดค่า X เกิดขึ้นอย่างสุ่ม (random measurement error) ค่าพารามิเตอร์ที่คำนวณได้จะมีค่าน้อยกว่าความเป็นจริงและลำเอียง

ถ้ามีความคลาดเคลื่อนในการวัดค่า y เกิดขึ้นอย่างสุ่ม การประมาณค่าพารามิเตอร์จะมีขนาดน้อยกว่าความเป็นจริงแต่ไม่ลำเอียง จะลำเอียงก็ต่อเมื่อความคลาดเคลื่อนในการวัดเกิดขึ้นอย่าง nonrandom หรือ systemic

ความคลาดเคลื่อนในการกำหนดโมเดล : เกิดขึ้นได้เนื่องจาก

  1. การละเว้นตัวแปรสำคัญในสมการ
  2. การรวมตัวแปรที่ไม่เกี่ยวข้องไว้ในสมการ
  3. การระบุความสัมพันธ์เชิงเส้นตรง ในเมื่อความสัมพันธ์ที่แท้จริงไม่ใช่เชิงเส้นตรง

การวิจัยโดยทั่วไปมักมีตัวแปรบางตัวมีลักษณะเป็นการจำแนกรายการ หรือตัวแปรเชิงคุณภาพ (Qualitative variable) เช่น เพศ อาชีพ เชื้อชาติ การนับถือศาสนา เป็นต้น ถ้ามีความจำเป็นต้องนำตัวแปรเหล่านี้มาใช้ในสมการทำนาย สามารถกระทำได้โดยจัดกระทำตัวแปรดังกล่าวให้เป็นตัวแปรจัดประเภท (catigorical variable) หรือ (dummy variable) ดังตัวอย่างต่อไปนี้

ตัวแปรอิสระเชิงคุณภาพ (qualitative independent variable)

ในกรณีที่ตัวแปรอิสระ (X) บางตัวเป็นตัวแปรจัดประเภท ตัวอย่างเช่น การทำนายผลสัมฤทธิ์ทางการเรียนคณิตศาสตร์ (y) จากตัวแปรอิสระ “ความตั้งใจเรียน” (X1) และ “เพศ” ของผู้เรียน (X2) ผู้วิจัยสามารถสร้างโมเดลการทำนายได้ดังนี้

โมเดล 1 Assumed ว่า Intercept ต่างกัน แต่ Slope เท่ากัน

โมเดล : yi = a + b1xi1 + b2xi2 + ei
เมื่อ
yi = คะแนนผลสัมฤทธิ์ทางการเรียนคณิตศาสตร์
xi1 = คะแนนความตั้งใจเรียน
xi2 = เพศของผู้เรียน เป็น Dummy variable โดยกำหนดให้เพศชาย = 1 และเพศหญิง = 0

สมการทำนาย y สามารถแยกออกได้เป็น 2 สมการ ได้แก่ สมการทำนาย y สำหรับเพศชาย และสมการทำนาย y สำหรับเพศหญิง ดังนี้

สำหรับเพศชาย

และ สำหรับเพศหญิง

โมเดล 2 Assumed ว่า Intercept และ Slope ต่างกัน

โมเดล : yi = a + b1xi1 + b2xi2 + b3(xi1+ xi2) + ei
ตัวแปร (xi1+ xi2) = xi1 สำหรับเพศชาย และเป็น 0 สำหรับเพศหญิง
สมการทำนาย y สามารถแยกออกได้เป็น 2 สมการสำหรับเพศชายและหญิง ดังน
สำหรับเพศชาย
และ สำหรับเพศหญิง

ตัวแปรตามเชิงคุณภาพ (qualitative dependent variable)

การวิเคราะห์ถดถอยพหุเชิงเส้นตรงเป็นโมเดลการวิเคราะห์มาตรฐานที่ใช้กันอย่างแพร่หลายสำหรับการวิจัยทางสังคมศาสตร์ ถึงแม้ว่าข้อตกลงเบื้องต้นบางข้อยังเป็นที่สงสัยกันอยู่ โดยเฉพาะอย่างยิ่งเมื่อตัวแปรตามไม่เป็นตัวแปรต่อเนื่อง การนำโมเดลการวิเคราะห์ถดถอยพหุเชิงเส้นตรงมาใช้ถือว่าเป็นการไม่เหมาะสม

ในกรณีที่ตัวแปรตาม (y) เป็นตัวแปรจัดประเภทแบบ dichotomous หรือ binary data เช่น การทำนายการเข้าร่วมกิจกรรมพิเศษของนักเรียน ซึ่งตัวแปรตามสามารถกำหนดได้เป็นเพียงเข้าร่วม = 1 และไม่เข้าร่วม = 0 เป็นต้น ลักษณะการทำนายแบบนี้ สามารถใช้ Discriminant function เนื่องจากค่า y อยู่ระหว่าง 1 กับ 0 จึงนิยมเรียก โมเดลการทำนายเชิงเส้นตรงแบบนี้ว่า Linear Probability Model (LPM)

ถ้าหากใช้เทคนิค OLS Regression สำหรับประมาณค่าพารามิเตอร์ของ LPM (Y เป็น dichotomous variable) มีข้อจำกัดที่สำคัญ 2 ประการ คือ

  1. ถึงแม้ว่า E(e) = 0 ตามข้อตกลงเบื้องต้น แต่ ไม่คงที่ โดยผันแปรไปกันตัวแปร y หรือ x
  2. ค่า ที่ทำนายได้อาจตกอยู่นอกช่วง 0-1 ซึ่งไม่สอดคล้องกับนิยามของความน่าจะเป็น

ทางแก้ไขสำหรับการวิเคราะห์ที่เหมาะสม คือ การเลือกใช้ฟังก์ชั่นที่เหมาะสมในรูปของ Non - linear Probability model ดังต่อไปนี้

Probit Model และ Logit Model
ทั้งสองโมเดลช่วยแก้ไขปัญหาของการใช้ OLS ในการทำนาย y ที่เป็น dichotomous variable โดยการแปลงค่าของความน่าจะเป็นเชิงเส้นตรงตามโมเดลเดิมให้เป็นค่าความน่าจะเป็นที่ไม่ใช่เชิงเส้นตรงตามโมเดลใหม่ เพื่อให้ค่าทำนาย ซึ่งเป็นความน่าจะเป็นให้ตกอยู่ในช่วง 0-1 เท่านั้น
 
โมเดลทั้งสองฟังก์ชั่นการแจกแจงเป็นรูปโค้งความถี่สะสมที่ใกล้เคียงกันมาก เพียงแต่โมเดล Logit มีความชันน้อยกว่าโค้งการแจกแจงปกติเล็กน้อย ซึ่งใกล้เคียงกับการแจกแจงที ( t - distribution)
 
Probit Model : ใช้ Commulative Normal Probability Function
โมเดล :
เมื่อ Zi เป็นคะแนนมาตรฐาน
มีค่าระหว่าง ถึง ซึ่งสามารถแปลงเป็นค่าความน่าจะเป็นได้ โดยการเปิดตารางพื้นที่ใต้โค้งการแจกแจงปกติ
จากค่า Zi สามารถเชื่อมโยงถึงตัวแปรตาม yi (1 = เข้าร่วม , 0 = ไม่เข้าร่วม) ได้โดยการกำหนดค่า Threshold Zi* ซึ่งแสดงด้วยสูตรดังนี้

ดังนั้นจากค่า a, และ b จึงเชื่อมโยงสู่การทำนาย Yi ได้
สมการทำนาย :
การประมาณค่า : ประมาณค่า a, bj โดยใช้หลักการ Maximum Likelihood

Logit Model : ใช้ Commulative Logistic Probability Function
Pi = (Zi) = (a + bxi)
เมื่อ Pi เป็น Probability ของการเกิดเหตุการณ์ เช่น การเข้าร่วมกิจกรรมพิเศษ เป็นต้น ส่วน f เป็นฟังก์ชั่นโลหิตโลจิสติคซึ่งสามารถเขียนเป็นสมการได้ดังนี้
โมเดล :
เมื่อ e = ค่าคงที่ซึ่งเป็นฐานของลอกการิทึมธรรมชาติ มีค่าประมาณ 2.718
สมการทำนาย :
การประมาณค่า : กระทำได้ 2 วิธี
วิธีที่ 1 ใช้ OLS Technique

ทำการแปลงสมการทำนาย Pi ให้เป็นเส้นตรง

พิจารณาแต่ละ Xi (หรือแบ่งช่วง Xi สำหรับจัดเป็นกลุ่มย่อย ๆ) เพื่อคำนวณค่า ของแต่ละ Xi

ทำการวิเคราะห์ OLS ตาม 1) เพื่อประมาณค่า และ

สร้างสมการทำนาย และคำนวณค่า ออกมาได้

วิธีที่ 2 ใช้ Maximum Likelihood Method

การประมาณค่าพารามิเตอร์ใช้หลักการเดียวกับ Probit Regression โดยการแทนค่า Zi ด้วย Yi กำหนดค่าประมาณของ , เพื่อประมาณค่า จนถึงจุดที่ Likelihood function มีค่าสูงสุด จึงรายงานค่า และ

Tobit Model

ในกรณีที่ตัวแปรตาม (y)เป็น discrete number เช่น จำนวนบุตร จำนวนวันของการขาดเรียน เป็นต้น การทำนายตัวแปรตาม y ลักษณะดังกล่าว สามารถกระทำได้ 2 วิธี คือ การประยุกต์ใช้ OLS และใช้ Tobit Model ซึ่งวิธีหลังมีความเหมาะสมมากกว่า

วิธีที่ 1 ประยุกต์วิธี OLS

1) แบ่งกลุ่มตัวอย่างออกเป็น 2 กลุ่ม ได้แก่ Y = 0 และกลุ่ม Y> 0 จากนั้นจึงใช้เทคนิค OLS สร้างสมการทำนายสมการแรก โดยใช้กลุ่มตัวอย่างทั้งหมดเพื่อทำนาย Y ( y = 0 และ y > 0 ซึ่ง Recode ให้ y = 1)

สร้างสมการทำนายสมการที่สองเฉพาะกลุ่ม Y > 0 โดยจัดกลุ่ม Y = 1 ให้เป็น Y = 0 และ Y > 1 ให้เป็น Y = 1 และสร้างสมการทำนายต่าง ๆ ไปจนครบ

วิธีที่ 2 ใช้ Tobit Model

มีลักษณะคล้าย Probit Model โดยใช้หลักการของ Maximum Likelihood ในการประมาณค่าพารามิเตอร์

โมเดลทำนายตัวแปรตามที่เป็นบวก :

เมื่อ เป็นส่วนเบี่ยงเบนมาตรฐานของ Likelihood function ดังนั้นค่าที่คาดหมายของตัวแปรตามจึงเป็น

เมื่อ = cummulative probability function

= density function ของอัตราส่วนระหว่าง และ

การวิเคราะห์โครงสร้างความสัมพันธ์ระหว่างตัวแปร

โมเดลที่ใช้กันแพร่หลายในการศึกษาโครงสร้างความสัมพันธ์ระหว่างตัวแปร ได้แก่ Factor Analytical model ซึ่งเป็นเทคนิคทางสถิติที่ใช้ในการลดปริมาณของข้อมูลทีสังเกตมาได้ให้น้อยลง โดยการศึกษาแบบแปนหรือการจับกลุ่มความสัมพันธ์ระหว่างตัวแปรที่สังเกตได้ เพื่อทราบถึงโครงสร้าง (structure) ของข้อมูลอันเป็นองค์ประกอบ (ภายใน) ร่วมกัน (common factor)

Exploratory Factor Model (EFM)

โมเดล : ตัวแปรอยู่ในรูปของคะแนนมาตรฐาน

 

ในเมื่อ Xik = คะแนนมาตรฐานของคนที่ เกี่ยวกับตัวแปร

F,S,E = คะแนนมาตรฐานของตัวประกอบร่วม ตัวประกอบเฉพาะ

และความคลาดเคลื่อน ตามลำดับ

a = น้ำหนักตัวประกอบ ( ) ซึ่งเป็นสัมประสิทธิ์การถดถอยของ

ตัวแปรที่สังเกตได้กับตัวประกอบร่วม

หรือ

(p x 1) (p x k) (k x 1) (p x 1)

ในเมื่อ X = เวคเตอร์ของตัวแปรที่สังเกตได้ p ตัวแปร

F = เวคเตอร์ของตัวประกอบร่วม k ตัวประกอบ

= เมตริกซ์ของน้ำหนักตัวประกอบ

U = เวคเตอร์ของค่าที่เหลือ (residual) ซึ่งประกอบด้วยผลรวมของ

ตัวประกอบเฉพาะและความคลาดเคลื่อนสุ่ม

ตัวอย่าง สมมติว่ามีตัวประกอบร่วมอยู่ 2 คุณลักษณะที่เป็นตัวแปรแฝงของตัวแปรที่สังเกตค่าได้ 6 ตัวแปร ดังภาพที่ 2

ภาพที่ 2 ตัวอย่าง โมเดล EFM

Common factors

X1   X2   X3   X4   X5   X6 Mainifest variables

ข้อตกลงเบื้องต้น

ตัวประกอบร่วมทุกตัวมีความสัมพันธ์กัน (oblique rotation) หรือตัวประกอบร่วมทุกตัวเป็นอิสระต่อกัน (orthogonal rotation)

2. ตัวแปรที่สังเกตค่าได้ทุกตัวได้รับอิทธิพลโดยตรงจากทุกตัวประกอบ

ตัวแปรที่สังเกตค่าได้ทุกตัวได้รับอิทธิพลจากตัวประกอบเฉพาะหรือความคลาดเคลื่อนเพียงตัวเดียว

ความคลาดเคลื่อนทุกตัวเป็นอิสระต่อกัน และเป็นอิสระจากตัวประกอบทุกตัว

ข้อจำกัด : ผลการวิเคราะห์อาจจะไม่ unique เนื่องจากอาจจะมีคำตอบหลายชุดที่เหมาะสมกับข้อมูล และไม่สามารถทดสอบความสอดคล้องระหว่างโมเดลกับข้อมูล

2.2 Confirmatory Factor Model (CGM)

ข้อจำกัดของ EFM ได้รับการแก้ไขโดยการพัฒนาโมเดลการวิเคราะห์ตัวประกอบเพื่อการตรวจสอบยืนยัน (CFM) (Joreskog, 1967, 1969) ใน CFM ผู้วิจัยสามารถยกเลิกข้อตกลงเบื้องต้นบางข้อของ EFM หรือเพิ่มข้อจำกัดบางประการที่สอดคล้องกับแนวคิด/ ทฤษฎีที่ต้องการทดสอบได้ เช่น ผู้วิจัยสามารถที่จะวางเงื่อนไขให้ตัวประกอบบางคู่มีความสัมพันธ์กัน เลือกตัวแปรที่สังเกตค่าได้บางตัวให้ได้รับอิทธิพลโดยตรงจากเพียงบางตัวประกอบ เลือกตัวแปรที่สังเกตได้เพียงบางตัวที่ได้รับอิทธิพลจากความคลาดเคลื่อน หรือกำหนดให้ความคลาดเคลื่อนของตัวแปรบางคู่ที่มีความสัมพันธ์กัน เป็นต้น

ตัวอย่าง สมมติว่ามีตัวประกอบอยุ่ 2 คุณลักษณะ ซึ่งต่างเป็นตัวแปรของตัวแปรทีสังเกตค่าได้ 3 ตัวแปร ดังภาพที่ 3

ภาพที่ 3 ตัวอย่างโมเดล CFM

X1   X2   X3   X4   X5   X6

 

ข้อดี : สามารถใช้การวิเคราะห์ทางสถิติทำการทดสอบว่าข้อมูลที่เก็บรวบรวมมาได้มีความสอดคล้องกับข้อจำกัดข้อตกลงของโมเดลที่ผู้วิจัยกำหนดไว้หรือไม่ หรือกล่าวโดยทั่วไปว่า ข้อมูลมีความสอดคล้องกับโมเดลที่สร้างขึ้นหรือไม่นั่นเอง

ข้อจำกัด : ถึงแม้ว่าเราสามารถศึกษาสหสัมพันธ์ระหว่างตัวประกอบที่เกิดขึ้นตามเงื่อนไขของโมเดลที่ผู้วิจัยสร้างขึ้น แต่ยังไม่สามารถศึกษาความสัมพันธ์ในขั้นของการทำนายหรืออิทธิพลระหว่างตัวประกอบ

3. การวิเคราะห์โครงสร้างความสัมพันธ์เชิงสาเหตุระหว่างตัวแปร

การนำข้อมูลความสัมพันธ์ระหว่างตัวแปร ซึ่งเก็บรวบรวมได้ในสภาพธรรมชาติมาใช้เพื่อการทดสอบสมมติฐานในเชิงสาเหตุนั้น จะต้องกระทำด้วยความรอบคอบและสมเหตุสมผล ผู้วิจัยจะต้องมีความรอบรู้ในเนื้อเรื่องและหลักการของทฤษฎีที่เกี่ยวข้อง โดยผู้วิจัยจะต้องมีความสามารถในการคัดเลือกตัวแปร/องค์ประกอบที่สำคัญที่เกี่ยวข้องได้อย่างเหมาะสม สามารถสร้างโมเดลซึ่งแสดงถึงโครงสร้างความสัมพันธ์ระหว่างตัวแปร/องค์ประกอบได้สอดคล้องกับทฤษฎีและจะต้องสามารถนำโครงสร้างความสัมพันธ์นั้น มาตรวจสอบกับข้อมูลจริงที่เก็บรวบรวมมาได้ โดยใช้เทคนิคการวิเคราะห์เชิงสาเหตุ ดังนั้นถ้าปราศจากพื้นฐานทางหลักการ เหตุผล ทฤษฎี และโมเดลที่เหมาะสมแล้ว เทคนิควิธีการวิเคราะห์เชิงสาเหตุก็ไม่สามารถนำไปใช้ได้อย่างมีประสิทธิภาพ

3.1 ประเภทของโมเดลเชิงสาเหตุ

การเขียนโมเดลเชิงสาเหตุ มีสัญลักษณ์ที่นิยมใช้กันโดยทั่วไป ดังแสดงในภาพที่ 4

ภาพที่ 4 สัญลักษณ์ที่ใช้ในโมเดลเชิงสาเหตุ

ภาพที่ 5 ตัวอย่างการใช้สัญลักษณ์ในโมเดลเชิงสาเหตุ

e แสดงว่าตัวแปรที่สังเกตได้ X มีอิทธิพลโดยตรง (ขนาด B) ต่อการเปลี่ยนแปลงของตัวแปรที่สังเกตได้ y โดยมีความคลาดเคลื่อนสุ่มในการทำนายขนาด e
  แสดงว่าตัวแปรที่สังเกตได้ X1 และ X2 มีความสัมพันธ์กัน โดยมีค่าความแปรปรวนร่วมเท่ากับ 12

โมเดลเชิงสาเหตุ สามารถจำแนกประเภทอย่างกว้าง ๆ ได้ดังนี้

3.1.1 Manifest variable models V.S. Latent variable models

Manifest variable model เป็นโมเดลที่แสดงความสัมพันธ์เชิงสาเหตุระหว่างตัวแปร โดยสมมติว่าตัวแปรทั้งหมดเป็นตัวแปรที่สามารถสังเกตได้โดยตรง (observable variables) โมเดลนี้เป็นที่รู้จักกันดี และใช้กันอย่างแพร่หลายในการศึกษาความสัมพันธ์ระหว่างตัวแปร เช่น Multiple regression, Path analysis เป็นต้น

Latent variable model เป็นโมเดลที่แสดงความสัมพันธ์เชิงสาเหตุระหว่างตัวแปรแฝง ซึ่งไม่สามารถสังเกตได้โดยตรง แต่เชื่อว่ามีอิทธิพลโดยตรงต่อชุดของตัวแปรที่สามารถสังเกตได้ โมเดลนี้ตั้งอยู่บนพื้นฐานความเชื่อว่า มโนทัศน์ส่วนใหญ่ในทางพฤติกรรมศาสตร์มีความเป็นนามธรรม เช่น เชาวน์ปัญญา ผลสัมฤทธิ์ทางการเรียน ทัศนคติ สถานภาพทางเศรษฐกิจและสังคม เป็นต้น มโนทัศน์เหล่านี้ไม่สามารถสังเกตได้โดยตรง เนื่องจากเป็นสภาวะสันนิษฐานทางจิตวิทยา หรือเรียกว่าตัวแปรแฝง (latent variable) ซึ่งเป็นคุณลักษณะที่มีอิทธิพลต่อพฤติกรรมของมนุษย์ ถึงแม้ว่าตัวแปรดังกล่าวจะสังเกตไม่ได้โดยตรง แต่เราสามารถศึกษาได้โดยสังเกตจากอิทธิพลของตัวแปรแฝงนั้น ๆ ที่มีต่อตัวแปรทางพฤติกรรมบางตัวที่เราสามารถสังเกตและวัดค่าได้ วิธีการที่รู้จักกันแพร่หลายในการศึกษาตัวแปรแฝงคือ การวิเคราะห์ตัวประกอบ (factor analysis) ซึ่งเป็นการวิเคราะห์หาองค์ประกอบร่วมจากความสัมพันธ์ของชุดของตัวแปรที่สังเกตได้

ภาพที่ 6 ตัวอย่าง Manifest variable model ของตัวแปรที่สังเกตได้ 7 ตัวแปร

e5

e7

e6

ภาพที่ 7 ตัวอย่างของ Latent variable model ของตัวแปรแฝง 3 ตัวแปร

e1

e2 e

e3

e4

e5

3.1.2 Recursive models V.S. Non-recursive models

Recursive model เป็นโมเดลที่แสดงความสัมพันธ์เชิงสาเหตุระหว่างตัวแปรโดยทิศทางของการเป็นสาเหตุเป็นไปในทิศทางเดียวกันตลอด ไม่มีความสัมพันธ์ชนิดผกผันหรือย้อนกลับ รวมทั้งกรณีความสัมพันธ์ของตัวแปรเดียวกันแต่วัดต่างเวลา

Non-recursive model เป็นโมเดลที่แสดงความสัมพันธ์เชิงสาเหตุระหว่างตัวแปร โดยทิศทางของการเป็นสาเหตุระหว่างตัวแปรอย่างน้อยคู่ใดคู่หนึ่งมีทิศทางผกผันหรือย้อนกัล หรือมีอิทธิพลซึ่งกันและกัน

ภาพที่ 8 ตัวอย่างของ Recursive model

Model Model

ภาพที่ 9 ตัวอย่างของ Non-recursive model

e3 e3

Model 1 Model 2

e4 e4

3.2 โมเดลการวิเคราะห์เชิงสาเหตุ

การวิเคราะห์เชิงสาเหตุที่ใช้กันอยู่ในปัจจุบันมีอยุ่ 2 โมเดล ได้แก่ Path Model และ Covariance Structure Model ซึ่งมีรายละเอียดดังนี้

3.2.1 Path model

โมเดล : ตัวแปรที่อยู่ในรูปของคะแนนมาตรฐาน

Y = XB + e

ในเมื่อ Y = เวคเตอร์ของค่าสังเกตจากตัวแปรตาม

X = เมตริกซ์ของค่าสังเกตจากชุดของตัวแปรอิสระ

ฺBij= เวคเตอร์ของน้ำหนักความสัมพันธ์ระหว่างตัวแปรอิสระกับตัวแปรตาม

(Standardized regression coefficient) = (path coefficient)

e = เวคเตอร์ของค่าความคลาดเคลื่อนสุ่ม ซึ่งมี E(e) = 0

finite covariance matrix, E(ee) =

ตัวอย่าง : ความสัมพันธ์ระหว่าง X1 , X2 , X3 และ X4 โดย

X1 = ตัวแปรซึ่งไม่ได้ถูกกำหนดโดยตัวแปรใดในโมเดลหรือความ

ผันแปรของ X1 เกิดจากตัวแปรนอกโมเดล (Exogeneous variable)

X2 , X3 , X4 = ตัวแปรซึ่งถูกกำหนดโดยตัวแปรตัวใดตัวหนึ่งในโมเดล หรือ

ความผันแปรของ X2 , X3 , X4 เกิดจากอิทธิพลของตัวแปรตัวใด

ตัวหนึ่งที่อยู่ในโมเดล (endogeneous variables)

e2

 

P21 P42 e4

P32

 

P31 P43

 

e3

X2 = p21X1 + e2

X3 = p31X1 + p32X2 + e3

X4 = p42X2 + p43X3 + e4

ข้อตกลงเบื้องต้น : ทำนองเดียวกับ Regression model สำหรับแต่ละเส้นทางที่วิเคราะห์

ข้อดี :

ต้องมีการศึกษาค้นคว้าล่วงหน้าเกี่ยวกับกระบวนการของการเป็นสาเหตุระหว่างตัวแปรก่อนการเขียน path diagram

สามารถจำแนกความสัมพันธ์ระหว่างตัวแปรเป็นผลรวมของความสัมพันธ์อย่างง่ายและซับซ้อนภายในแต่ละเส้นทาง เช่น

ทำให้สามารถวัดค่าความสัมพันธ์ระหว่างตัวแปรทั้งอิทธิพลทางตรงและทางอ้อม (direct and indirect effects)

เช่น อิทธิพลของ X2 ต่อ X4 ประกอบด้วย

อิทธิพลทางตรง = P42

อิทธิพลทางอ้อม = P43P23

ข้อจำกัด :

ในการวัดค่าตัวแปรอิสระและตัวแปรตามจะมีความคลาดเคลื่อนเกิดขึ้นเสมอ โมเดลนี้ไม่ได้นำค่าความคลาดเคลื่อนดังกล่าวมาพิจารณา วิเคราะห์ หรือทดสอบ

การแยกประมาณค่าพารามิเตรอ์ทีละเส้นทาง เมื่อนำทุกเส้นทางมาพิจารณาพร้อมกัน ค่าที่ประมาณได้อาจจะไม่ใช่ค่าที่แท้จริงของภาพรวมทั้งระบบ

Covariances Structure Model

นักทฤษฎีทางสถิติได้พัฒนา Covariances Structure Model เพื่อศึกษาความสัมพันธ์เชิงโครงสร้าง (Structure relations) ระหว่างตัวประกอบหรือตัวแปรแฝง โดยการประยุกต์หลักการของ Path Analysis มาใช้ในการสรุปความสัมพันธ์เชิงสาเหตุระหว่างตัวประกอบที่ได้จาก CFM ปัจจุบันมีโปรแกรมคอมพิวเตอร์ที่รู้จักกันดีที่ใช้ในการวิเคราะห์ดังกล่าว เช่น Linear Structural Relationships (Lisrel ; Joreskog and Sorbom, 1985) , Analysis of Linear Structural Equation with Comprehensive Measurement Model (LISCOMP, Muthen, 1988) เป็นต้น สำหรับรายละเอียดและโปรแกรมการวิเคราะห์ที่จะกล่าวต่อไปนี้ จะยึดแนวทางของโปรแกรม LISCOMP เป็นหลัก เนื่องจากเป็นโปรแกรมที่มีขอบเขตการใช้งานได้อย่างกว้างขวาง

บรรณานุกรม

  1. ศิริชัย กาญจนวาสี. โมเดลเชิงสาเหตุ : การสร้างและการวิเคราะห์ วิธีวิทยาการวิจัย. ปีที่ 4 ฉบับที่ 3, กันยายน - ธันวาคม, 2532, หน้า 1-24.
  2. Asher, H.B. Causal Modeling. Beverly Hills, CA : Sage Publication, 1976.
  3. Bentler, P.M. Multivariate Analysis with lalent variables : Causal modeling. Annual Review Psychology. 1980, 31 : 419-56.
  4. Bentler, P.M. Theory and implication of EQS:A Structural Equations Program. Los Angles, CA : BMDP Statistical Software ; Inc, 1985.
  5. Bentler, P.M. and Weeks, D.G. Linear Simulataneous equations with latent variables. Los Angeles : University of Califonia, 1979.
  6. Cook, T.C. and Cambell, D.T. Quasi-Experimentation : Design and Analysis Issues for Field Settings. Boston : Houghton Mifflin Company, 1979.
  7. Duncan, O.D. Introduction to Structural Equation Models. New York : Academic Press, 1975.
  8. Fisher, R.A. Statistical methods for research workers. (10th. ed.) Edinburgh : Oliver and Boyd, 1946.
  9. Goldberger, A.S. and Duncan, O.D. (Eds.) Structural Equation Models in the Social Sciences. New York : Academic Press, 1973.
  10. Heise, D.R. Causal Analysis. New York : Willey, 1975.
  11. Joreskog, K.G. A general approach to likelihood factor analysis. Psychometrika, 1969, 34 : 183-202.
  12. Joreskog, K.G. A general method for analysis of covariance structures. Biometrika, 1970, 57 : 239-51.
  13. Joreskog, K.G. Some contributions to maximum likelihood factor analysis. Psychometrika, 1969, 34 : 183-202.
  14. Joreskog, K.G. and Sorbom, D. LISREL VI : An Analysis of Linear Structural Relationship By Maximum Likelihood, Instrumental Variables, and Least
  15. Squares Methods. Uppsala : Senden, 1985.
  16. Kenny, D.A. A quasi-experimental approach to assessing treatment effects in the nonequivalent control group design. Psychological Bulletine, 1975 a, 82 : 345-62
  17. Kenny, D.A. Cross-lagged panel correlation : a test for spuriousness. Psychological Bulletine, 1975 b, 82 : 887-903.
  18. Linn, R.L. and Wests, C.E. Analysis implications of the choice of a structural model in the nonequivalent control group design. Psychological Bulletine, 1977, 64; 229-34.
  19. Long, J.C. Covariance Structure Models : An Introduction to LISREL. Beverly Hills, CA : Sage Publications, 1973.
  20. Long, J.C. Comfirmatory Factor Analysis. Beverly Hills, CA : Sage Publications, 1983.
  21. Muthen, B.O. LISCOMP (Analysis of Linear Structure Equations with a Comprehensive Measurement Model) : A Program for Advanced Research. Mooresville, IN : Scientific Software, Incorporated, 1988.
  22. Pedhazur, E.J. Multiple Regression in Behavioral Research : Explanation and Prediction. New York : CBS College Publishing, 1982.

จากข่าวสารวิจัยการศึกษา ปีที่ 16 ฉบับที่ 5
มิถุนายน-กรกฎาคม 2539