نموذج المعادلات الهيكلية
نظرة عامة شاملة على نمذجة المعادلات الهيكلية مع جولة كاملة لمثال باستخدام كل من R و Python
ما هو نمذجة المعادلة الهيكلية؟
نماذج المعادلات الهيكلية هي نماذج تشرح العلاقات بين المتغيرات المقاسة والمتغيرات الكامنة ، والعلاقات بين المتغيرات الكامنة. المتغيرات الكامنة هي متغيرات نفهمها كبشر كمفهوم ، لكن لا يمكن قياسها بشكل مباشر.
تعد نمذجة المعادلات الهيكلية (SEM) إطارًا واسعًا ومرنًا للغاية لتحليل البيانات ، وربما يُنظر إليه بشكل أفضل على أنه مجموعة من الأساليب ذات الصلة بدلاً من أسلوب الاحادي .
ويمكن تعريف نمذجة المعادلة الهيكلية على أنها فئة من المنهجيات التي تسعى إلى تمثيل الفرضيات حول الوسائل والتباينات والتغايرات في البيانات المرصودة من حيث عدد أقل من المعلمات "الهيكلية" المحددة بواسطة نموذج مفاهيمي أو نظري أساسي مفترض.
الذكاء هو مثال رائع على المتغير الكامن الذي لا يمكن قياسه بشكل مباشر. لدينا الكثير من الامتحانات المدرسية ، واختبارات الذكاء ، والاختبارات النفسية لقياس مفهوم مثل الذكاء ، لكنها دائمًا ما تنحصر في:
قياس درجة في استبيانات الاختيار من متعدد في مجالات متعددة
تحويل هذه الدرجات إلى تقدير
لذلك ستحتاج إلى نموذج لتحويل المتغيرات المقاسة (درجات الاختبار) إلى الذكاء المتغير الكامن. هذا هو المكان الذي تأتي فيه نمذجة المعادلات الهيكلية كأداة رائعة لتقدير تلك العلاقات على أفضل وجه!
متى تستخدم نمذجة المعادلات الهيكلية؟
إذن ، متى تستخدم نمذجة المعادلات الهيكلية؟ دعونا نناقش بعض الاعتبارات لمعرفة ما إذا كانت نمذجة المعادلات الهيكلية قد تكون مفيدة لحالة استخدام معينة.
إذا كنت تريد استخدام نمذجة المعادلات الهيكلية ، فمن الضروري أن يكون لديك مفهوم المتغيرات المقاسة والكامنة في حالة الاستخدام الخاصة بك. الهدف من نمذجة المعادلات الهيكلية هو نمذجة العلاقات بين المتغيرات المقاسة والكامنة ، أو بين المتغيرات الكامنة المتعددة. إذا كنت تريد استخدام نمذجة المعادلات الهيكلية ، فيجب أن تحاول تحديد المفهوم الأساسي المهم ولكن غير القابل للقياس.
ثانيًا ، يتم تطبيق نمذجة المعادلة الهيكلية في الغالب كطريقة تأكيد واختبار. كما سترى لاحقًا في هذه المقالة ، تبدأ مرحلة النمذجة من خلال تحديد فرضية للعلاقات التي تفكر فيها. على سبيل المثال ، إذا قمت بإنشاء نموذج على الذكاء ، فستحتاج إلى البدء بتحديد المتغيرات المختلفة المقاسة والكامنة التي تعتقد أنها قد تؤثر على الذكاء.
لذلك فإن نمذجة المعادلة الهيكلية ليست مناسبة كأداة استكشافية بحتة. إذا لم تكن لديك أي فكرة حتى الآن عن كيفية ربط العلاقات حول حالة الاستخدام الخاصة بك ، فسيكون من الأفضل لك استخدام الأساليب الأخرى المصممة لاستكشاف مشكلات المتغيرات الكامنة. يعد تحليل عامل الاستكشاف بديلاً رائعًا في هذه الحالة.
نماذج المعادلات الهيكلية رائعة للتحليل. إنها تساعدك على تعلم الكثير عن المفاهيم المختلفة التي تؤثر على ظاهرة كامنة. ومع ذلك ، لا تعمل نماذج المعادلات الهيكلية دائمًا من حيث الأداء التنبئي. إذا كنت تبحث فقط عن الأداء التنبئي وليس الفهم والتفسير ، فقد تكون نمذجة المعادلات الهيكلية هي الاختيار الخاطئ.
تمنحك نماذج المعادلات الهيكلية تقديرات للمعاملات بناءً على العلاقات المفترضة بين المتغيرات. لا يمكن العثور على علاقات أخرى غير تلك التي تحددها. تتمثل إحدى الطرق الرائعة لاستخدام نماذج المعادلات الهيكلية في توفير عدة نماذج افتراضية ، وتقدير كل منها ، ثم تحليل الاختلافات بينها للعمل نحو نموذج أفضل وأفضل.
أنواع نمذجة المعادلات الهيكلية
هناك أنواع مختلفة من نماذج المعادلات الهيكلية. قبل أن ندخل في تنفيذ الكود لاثنين من هؤلاء ، دعنا أولاً نناقش المشهد العام لنماذج التسويق عبر محرك البحث.
إذا نظرنا إلى التعريفات الرسمية ، فسيتعين علينا قبول الكثير من النماذج كأنواع من نمذجة المعادلات الهيكلية. على سبيل المثال ، النماذج التي يمكن رؤيتها على أنها أنواع من نمذجة المعادلات الهيكلية ستشمل:
- التحليل العاملي التوكيدي
- التحليل المركب التأكيدي
- تحليل المسار
- نمذجة مسار المربعات الصغرى الجزئية
- نمذجة النمو الكامن
ومع ذلك ، من أجل التبسيط في هذه المقالة ، دعونا لا ندخل في تفاصيل تلك النماذج والحفاظ على نطاق نماذج المعادلات الهيكلية لتكون نماذج مع:
- المتغيرات المقاسة
- المتغيرات الكامنة
- العلاقات المفترضة بين المتغيرات
مثال على نمذجة المعادلة الهيكلية
سنستخدم مثالاً لنمذجة المعادلات الهيكلية حول الأداء في العمل. أهم متغير لهذا المشروع هو الأداء الوظيفي. يعد الأداء الوظيفي متغيرًا كامنًا في مثالنا لأنه من المستحيل قياسه بشكل مباشر. احذر: تستخدم بعض أماكن العمل مؤشرات أداء رئيسية واضحة جدًا لتحديد الأداء الوظيفي وقد لا يكون متغيرًا كامنًا في ذلك الوقت.
في حالتنا ، ضع في اعتبارك وظيفة مكتبية يتم فيها تقدير الأداء الوظيفي بناءً على ثلاثة متغيرات مقاسة:
ClientSat: تصنيف رضا بين 1 و 100 من قبل عميلك الرئيسي
SuperSat: تصنيف على الأداء الوظيفي بين 1 و 100 من قبل رئيسك
ProjCompl: النسبة المئوية لمشاريعك التي تم تسليمها بنجاح
لنبدأ من الفرضية القائلة بأن الأداء الوظيفي يتأثر بشدة بثلاثة متغيرات كامنة أخرى: المهارات الاجتماعية للموظفين ، والمهارات الفكرية ، والتحفيز.
لا يمكن أيضًا قياس كل من هذه المتغيرات الكامنة بشكل مباشر. لذلك ، دعونا نحدد المتغيرات المقاسة لكل من المتغيرات الكامنة المستقلة أيضًا.
سوف تستند المهارات الاجتماعية المتغيرة الكامنة على المتغيرين التاليين:
PsychTest1: درجة بين 1–100
التقدير 2: أيضًا درجة بين 1–100
سوف تستند المهارات الفكرية المتغيرة الكامنة على المتغيرين التاليين:
YrsEdu: عدد سنوات التعليم العالي المتبعة
معدل الذكاء: يسجل في اختبار الذكاء
سيعتمد الدافع المتغير الكامن على المتغيرين المقاسين التاليين:
HrsTrain: عدد الساعات التي قضاها في التدريب
ساعات العمل: متوسط عدد الساعات في أسبوع العمل
مخطط نموذج المعادلة الهيكلية
دعونا نحاول جعل هذا المثال المعقد أسهل في المتابعة من خلال إنشاء الرسم التخطيطي لنموذج المعادلة الهيكلية. تعد نماذج المعادلات الهيكلية معقدة للغاية لأنها تحتوي على العديد من المعاملات في العديد من الاتجاهات والرسم التخطيطي هو بالفعل أفضل طريقة لفهم ما يفعله نموذج المعادلة الهيكلية.
غالبًا ما يتبع نموذج المعادلة الهيكلية بعض الممارسات العامة:
يتم الإشارة إلى المتغيرات الكامنة بواسطة دائرة
يتم الإشارة إلى المتغيرات المقاسة بواسطة مربع
يتم الإشارة إلى العلاقات بواسطة الأسهم
يتم الإشارة إلى الفروق والقيم المتبقية بواسطة الأسهم من متغير إلى نفسه
نظرًا لوجود العديد من المتغيرات والعلاقات ، فلنقم بتكبير / تصغير الجوانب المختلفة. في العادة ، لا توجد أي ألوان في الرسم التخطيطي لنمذجة المعادلات الهيكلية ، ولكن يمكن أن يساعد بالتأكيد في فهمه بشكل أفضل:
الأداء الوظيفي كمتغير خفي تابع ، مع المتغيرات الثلاثة المقاسة التي تتوافق معه على اليمين.
المتغيرات الكامنة الثلاثة المستقلة المهارات الاجتماعية ، والمهارات الفكرية ، والتحفيز على يسار JobPerf
الأسهم من المتغيرات الثلاثة الكامنة المستقلة للأداء الوظيفي لإظهار أنه من المتوقع أن تؤثر هذه المتغيرات الثلاثة الكامنة على الأداء الوظيفي.
من المتوقع أن تؤثر المتغيرات الستة المقاسة على اليسار على أحد المتغيرات المستقلة الكامنة. توضح الأسهم أي من المتغيرات الكامنة يتأثر بكل متغير تم قياسه
الآن ، الهدف من تقنيات نمذجة المعادلات الهيكلية هو تقدير المعاملات لكل سهم في الرسم التخطيطي الخاص بك. كل سهم هو معامل ، كما يجب تقدير الأخطاء المعيارية. ستسمح لك هذه التقديرات بتحديد العلاقات المعقدة بين المتغيرات المقاسة والمتغيرات الكامنة.
تقنيات نمذجة المعادلات الهيكلية
لتلائم نموذج المعادلة الهيكلية ، تحتاج إلى تقدير عدد كبير جدًا من المعاملات: واحد لكل سهم في الرسم التخطيطي. هناك العديد من منتجات وتقنيات البرامج لتقدير نماذج المعادلات الهيكلية ، بما في ذلك:
- ليزريل
- عاموس
- MPlus
- تطبيقات SEM في Stata أو SPSS
- حزم R sem و lavaan و OpenMx و LISREL و EQS و Mplus
- semopy حزمة بايثون
تعد نمذجة المعادلات الهيكلية أمرًا صعبًا ، لأنه لا يوجد تعريف مطلق للخوارزمية التي يجب استخدامها ، ويمكن أن تعطي حزم البرامج المختلفة نتائج مختلفة. عند الإبلاغ عن نماذج المعادلات الهيكلية ، يوصى دائمًا بالإبلاغ عن البرامج التي استخدمتها.
في الجزء التالي من المقالة ، دعنا نقدر معاملات نموذج الأداء الوظيفي لدينا باستخدام R وباستخدام Python.
SEM في R.
لقد قمت بتحميل البيانات في حاوية S3 لتسهيل المتابعة معك. يمكنك استخدام السطر التالي في R للحصول على البيانات:
SEM في R - استيراد البيانات
تبدو البيانات عبارة عن ملف CSV بألف سطر يبدو رأسه كما يلي:
SEM في R.
SEM في R - البيانات
الخطوة التالية هي تثبيت حزمة lavaan وهي حزمة رائعة لنمذجة المعادلات الهيكلية: فهي موثقة جيدًا وسهلة الاستخدام ومتماسكة مع بناء جملة حزم R الأخرى. يمكنك تثبيت المكتبة وفتحها بالسطرين التاليين:
SEM في R - تثبيت حزمة lavaan
الخطوة التالية هي وصف النموذج الذي نريد ملاءمته. يجب أن يمثل هذا الهيكل الذي رسمناه في الرسم التخطيطي من قبل. هناك ثلاثة أنواع مختلفة من العلاقات يمكننا تحديدها:
استخدم الرمز = ~ لتعريف المتغير الكامن كما يلي:
a_latent_variable = ~ مُقاس_الفار_1 + مُقاس_الفار_2
استخدم الرمز ~ للانحدار من متغير كامن في متغير واحد أو عدة متغيرات كامنة على النحو التالي:
latent_variable_1 ~ latent_variable_2 + latent_variable_3
استخدم الرمز ~~ إذا كنت تتوقع أن يكون لبعض المتغيرات المقاسة ارتباط غير ممثل في متغير كامن (ليس ضروريًا على سبيل المثال) على النحو التالي:
المقاس_الفار_1 ~~ المقاس_الفار_2
باستخدام بناء الجملة هذا ، يمكننا تحديد مخططنا باستخدام بناء جملة R التالي:
SEM في R - تحديد النموذج
كخطوة أخيرة ، تحتاج إلى ملاءمة النموذج وإظهار ملخص النموذج. يمكنك القيام بذلك باستخدام الكود التالي:
SEM في R - تركيب النموذج
سوف تحصل على جدول الملخص التالي ، والذي قمت فيه بتسليط الضوء على أهم ما تعلمته:
نموذج معادلة هيكلية
SEM في R - ملخص الإخراج
حالة هايوود
أول شيء نراه هو أن اللافان يبلغ عن تحذير. بعض الفروق سلبية. وهذا ما يسمى بحالة Heywood وهو نسبيًا
الشائع في نمذجة المعادلات الهيكلية. نماذج المعادلات الهيكلية ليست مثالية أبدًا ، لذلك إذا كانت الفروق السلبية في معلمات أقل أهمية ، فلا توجد مشكلة في المتابعة. بخلاف ذلك ، قد ترغب في اللعب على تعريف النموذج ومجموعة البيانات: أحد الأسباب الشائعة لحالة Heywood هو وجود متغيرات شديدة الارتباط.
اختبار Chi-Square لنموذج المعادلة الهيكلية الشامل
الشيء الثاني الذي يجب النظر إليه هو أهمية اختبار Chi-Square. يمنحك هذا الاختبار قيمة p توضح لك ما إذا كان نموذجك يبدو أنه يشرح جزءًا مهمًا بدرجة كافية من التباين في البيانات.
إذا لم تكن واثقًا من استخدام قيم p ، فقم بإلقاء نظرة على هذا الشرح البديهي لاختبار الفرضيات والقيم p. كالعادة ، يجب أن تكون القيمة الاحتمالية أقل من 0.05 لتكون كبيرة. هذه هي حالتنا ، لذا يمكننا أن نستنتج أن نموذجنا يعمل بشكل جيد بشكل عام.
معاملات الانحدار لنموذج المعادلة الهيكلية
الآن بعد أن علمنا أن النموذج يعمل بشكل جيد ، سنقوم بتحليل ما يخبرنا به. للقيام بذلك ، نحتاج بشكل أساسي إلى النظر إلى الجزء المتعلق بالانحدارات. هنا ، نكتشف كيف تؤثر المتغيرات الثلاثة الكامنة الاجتماعية والفكر والتحفيز على الأداء الوظيفي.
أول شيء يجب النظر إليه هو قيم P للمتغيرات الكامنة المستقلة التي يرمز إليها P (> | z |). كل متغير كامن مستقل له صف خاص به. إذا كانت قيمة P لمتغير كامن مستقل أقل من 0.05 ، فيمكننا أن نستنتج أن هذا المتغير الكامن المحدد يؤثر على المتغير الكامن التابع (أداء الوظيفة). في حالتنا ، كل من المتغيرات الكامنة الثلاثة المستقلة لها قيمة P أقل من 0.05 مما يعني أن كل من المتغيرات الكامنة المستقلة يظهر أن لها تأثير على أداء الوظيفة.
الآن بعد أن عرفنا ذلك ، يمكننا المضي قدمًا عن طريق السؤال عن مدى تأثير كل من المتغيرات المستقلة الكامنة على الأداء الوظيفي. نقوم بذلك من خلال النظر إلى عمود التقدير (تقديرات المعاملات). نحن نرى ذلك:
الدافع له أعلى معامل (2.758) ، مما يعني أن التغيير في الدافع سيكون له أكبر تأثير على الأداء الوظيفي.
يمتلك العقل ثاني أعلى معامل (0.725) ، مما يعني أن للعقل ثاني أعلى تأثير على الأداء الوظيفي.
تأتي المهارات الاجتماعية في المرتبة الأخيرة بمعامل 0.325. لا تزال المهارات الاجتماعية لها تأثير على الأداء الوظيفي ، فهي أقل من التحفيز والفكر.
في هذه المرحلة ، توصلنا إلى استنتاج نموذج المعادلة الهيكلية الخاص بنا. يتم التحقق من صحة نظريتنا من خلال البيانات: خبر رائع!
SEM في بايثون
إذا كنت أكثر راحة مع Python ، فيمكنك ملاءمة نفس النموذج تمامًا كما كان من قبل باستخدام semopy لحزمة Python. يمكنك استخدام بناء الجملة أدناه للبدء.
أولاً ، يمكنك استيراد البيانات مباشرةً من حاوية S3 باستخدام الكود التالي:
SEM في Python - استيراد البيانات
تقوم بعد ذلك بتثبيت واستيراد حزمة semopy كما يلي:
الخطوة التالية هي تحديد النموذج. يعمل هذا بنفس الطريقة تمامًا كما هو الحال مع رمز R. يمكنك بعد ذلك إنشاء النموذج وتناسبه واستخدام طريقة الفحص لإظهار الجدول الناتج:
SEM في Python - تحديد النموذج وملائمته
سوف تحصل على إطار بيانات مع تقديرات المعامل والقيم p. يتمثل الاختلاف في رمز R في أن إخراج Python أقل تنظيماً قليلاً ، لذلك تحتاج إلى إلقاء نظرة على أسماء المتغيرات (عمود lval و rval) للعثور على معاملاتك:
نموذج معادلة هيكلية
SEM في Python - ملخص الإخراج
يمكن العثور على معاملات الانحدار في السطور من 0 إلى 2. يمكنك أن ترى في العمود p-valu أن الثلاثة جميعها لها قيمة p أصغر من 0.05 ، لذا فهي جميعها ذات أهمية. هذا يؤكد نتيجة R.
في العمود التقدير ، يمكنك الحصول على تقديرات المعامل:
وجد semopy معاملًا قدره 2.96 للتحفيز ، وهو قريب من التقدير الذي قام به lavaan.
يأتي تقدير Intellect في المرتبة الثانية ، تمامًا كما هو الحال في رمز R ، على الرغم من أن تقديره أعلى قليلاً (1.04 في semopy مقابل 0.725 في lavaan).
كما هو الحال مع R ، تأتي المهارات الاجتماعية باعتبارها المتغير الكامن الأقل تأثيرًا. تقدير semopyestimate هو 0.527 مقابل 0.325 المقدرة بواسطة lavaan.
على الرغم من اختلاف التقديرات قليلاً ، إلا أن تطبيقات R و Python تعطي نفس النتيجة من حيث المتغيرات. هذه ليست مشكلة وتحدث للعديد من تقنيات النمذجة المتقدمة: ما عليك سوى الإبلاغ عن البرنامج الذي استخدمته.
الخلاصة
في الختام ، لقد تعلمت أولاً ماهية نمذجة المعادلات الهيكلية ومتى يمكن استخدامها. لقد رأيت أيضًا أن أنواعًا وتقنيات مختلفة موجودة.
قمت بعد ذلك بتطبيق نمذجة المعادلات الهيكلية على مجموعة بيانات في الأداء الوظيفي. استنادًا إلى تسعة متغيرات تم قياسها ، فقد افترضت أن الأداء الوظيفي يمكن تفسيره من خلال المتغيرات الكامنة المهارات الاجتماعية والمهارات الفكرية والتحفيز.
أظهرت المؤشرات الإحصائية أن النموذج المفروض مناسب جيدًا وتنتهي من خلال استنتاج أن الدافع هو الأهم للأداء الوظيفي ، يليه بالترتيب المهارات الفكرية والمهارات الاجتماعية.
آمل أن تكون هذه المقالة مفيدة لك.