مدل سازی معادلات ساختاری (SEM) به یکی از برجسته ترین رویکردهای آزمایش نظریه های اساسی در مورد روابط بین متغیرهای مشاهده شده و/یا بدون نظارت تبدیل شده است. با استفاده از این روش چند متغیره ، محققان با چندین تصمیم روش شناختی روبرو هستند ، از جمله درمان متغیرهای شاخص (به عنوان مثال در مقابل درمان مداوم) ، رسیدگی به داده های گمشده و انتخاب سطح مناسب تجزیه و تحلیل. داده های PIAAC موضوعات دیگری را ارائه می دهد ، مانند خوشه بندی داده های سطح فردی ، تعداد زیادی از کشورهای شرکت کننده ، بازنمایی نمرات عملکرد توسط مجموعه ای از مقادیر قابل قبول و تفاوت در احتمال انتخاب. بنابراین ، یک بسته نرم افزاری انعطاف پذیر برای رسیدگی به آنها لازم است. در این فصل خوانندگان به تجزیه و تحلیل داده های PIAAC با SEM در نرم افزار M Plus توسط (الف) ارائه مفاهیم کلیدی در پشت SEM ، (ب) بحث در مورد پیچیدگی های داده های PIAAC و رسیدگی احتمالی آنها ، (ج) نشان دهنده مشخصات و ارزیابی ازمدل های اندازه گیری و ساختاری ، و (د) با اشاره به تحولات فعلی در زمینه های آزمایش اندازه گیری اندازه گیری و SEM چند سطحی. پرونده های ورودی و خروجی نمونه ارائه شده است.
کلید واژه ها
- تجزیه و تحلیل عاملی تأییدی
- تغییر اندازه
- سام چند سطحی
- m plu s
- مدل سازی معادلات ساختاری
مدل سازی معادله ساختاری (SEM) طیف گسترده ای از رویکردهای چند متغیره را نشان می دهد که به محققان امکان می دهد فرضیه های مربوط به میانگین ، واریانس ها و متغیرهای متغیرهای آشکار و نهفته را آزمایش کنند (Kaplan 2009). این شامل رویکردهایی مانند تجزیه و تحلیل مسیر ، تجزیه و تحلیل عاملی تأییدی و مدل های ساختاری است که بر اساس فرضیه ها و نظریه های محققان در مورد روابط بین متغیرها است. کلین (2016) در کتاب اصلی خود تأکید کرد که SEM به سه ورودی نیاز دارد: اول ، مجموعه ای از فرضیه ها در مورد روابط بین متغیرها (بر اساس تئوری یا آگاهانه با نتایج مطالعات تجربی). دوم ، مجموعه ای از سؤالات خاص در مورد این روابط (به عنوان مثال ، تأثیر غیرمستقیم یک متغیر X بر روی یک متغیر Y از طریق یک متغیر وجود دارد؟) ؛و سوم ، مجموعه داده های مناسب برای آزمایش این فرضیه ها و پاسخ به این سؤالات. در نهایت ، فرآیند SEM سه خروجی تولید می کند (Kline 2016): برآورد عددی از پارامترهای مدل ، مجموعه ای از پیامدهای منطقی مدل و اطلاعات مربوط به میزان پشتیبانی از داده ها از مدل. با توجه به غنای خروجی ها ، SEM به ابزاری برجسته برای محققان تبدیل شده است تا تئوری ها و فرضیات اساسی را در مورد روابط بین متغیرها آزمایش کنند. علاوه بر این ، SEM یک رویکرد مدل سازی انعطاف پذیر در نظر گرفته می شود که امکان درج هر دو متغیرهای آشکار (قابل مشاهده) و نهفته (غیرقابل کنترل) را در مدلهای اندازه گیری و ساختاری فراهم می کند (Raykov and Marcoulides 2006). با توجه به این انعطاف پذیری ، محققان با چندین تصمیم روش شناختی ، از جمله درمان متغیرهای شاخص (به عنوان مثال در مقابل درمان مداوم) ، رسیدگی به داده های مفقود شده و انتخاب سطح مناسب تجزیه و تحلیل (به عنوان مثال سطح فردی در مقابل کشور ، روبرو هستند (به عنوان مثال). علاوه بر این تصمیمات ، داده های ارزیابی بین المللی در مقیاس بزرگ ، پیچیدگی های بیشتری مانند وزن گیری نمونه ها و استفاده از مقادیر قابل قبول به عنوان نمرات عملکرد را اضافه می کنند (روتکوفسکی و ژو 2014).
با توجه به این ملاحظات ، این فصل به دنبال (1) توجه به مسائل مربوط به داده های مرتبط با SEM از داده های PIAAC است.(2) روشهای پرداختن به این مسائل را در بسته نرم افزاری M Plus (نسخه 8. 2) نشان دهید. و (3) نمونه استفاده از کلاسهای معمولی مدل ها در SEM با استفاده از داده های PIAAC. تمام نمونه ها با توضیحات مربوط به نحو M به علاوه و تفسیر خروجی ها تکمیل می شوند. اگرچه در این فصل مقدمه ای مختصر در مورد کلاسهای رویکردهای SEM ارائه شده است ، اما مقدمه ای کامل برای SEM ارائه نمی دهد. خوانندگان تشویق می شوند تا برای کسب اطلاعات بیشتر در مورد مشخصات مدل ، شناسایی ، تخمین و تفسیر ، به ادبیات اصلی SEM مراجعه کنند (به عنوان مثال Hancock و Mueller 2013 ؛ Hoyle 2012 ؛ Kaplan 2009 ؛ Kline 2016 ؛ Loehlin and Beaujean 2017 ؛ Raykov and Marcoulides 2006). علاوه بر این ، این فصل مقدمه ای را برای نرم افزار M Plus ارائه نمی دهد. خوانندگان تشویق می شوند تا مطالب ارائه شده توسط Muthén و همکاران را مرور کنند.(2017) و Muthén و Muthén (2017-2017).
بخش اول این فصل پیچیدگی های مرتبط با داده های PIAAC را برجسته می کند و گزینه های M Plus را برای رسیدگی به آنها بررسی می کند. بخش دوم به طور خلاصه کاربرد SEM را با استفاده از داده های PIAAC بررسی می کند و توجه می کند که این پیچیدگی های داده در ادبیات موجود تا چه اندازه مورد توجه قرار گرفته است. بخش سوم بر مشخص کردن و تخمین مدل های اندازه گیری با استفاده از تجزیه و تحلیل عاملی تأیید کننده (CFA) متمرکز است. این بخش همچنین رویکردهایی را برای آزمایش عدم تغییر اندازه گیری در چند گروه یا بسیاری از گروه ها نشان می دهد. بخش چهارم و پایانی کلاسهای مدل های ساختاری ، از جمله مدل های مسیر ، مدل های معادله ساختاری و نسخه های چند گروهی آن را معرفی می کند. با این حال ، مثالها و رویکردهای مدل سازی معادلات ساختاری عمدتاً روی مدلهای اندازه گیری متمرکز خواهند شد. خلاصه کوتاه این فصل نتیجه می گیرد. تمام پرونده های نحوی در مواد تکمیلی موجود است.
8. 1 با SEM از داده های PIAAC شماره
همانطور که در فصل های قبلی در این جلد ذکر شد ، پیچیدگی داده های PIAAC توسط چندین عنصر هدایت می شود. این عناصر شامل استفاده از وزن های نظرسنجی ، اما محدود به آنها نیستند. ساختار داده های تو در تو با شرکت کنندگان در مطالعه ، به عنوان مثال ، در کشورها قرار گرفته است. استفاده از مجموعه ای از مقادیر قابل قبول برای نشان دادن عملکرد شرکت کنندگان در سواد ، عددی و ارزیابی های حل مسئله. و وقوع داده های مفقود شده در داده های پرسشنامه پس زمینه. گزارش فنی PIAAC خاطرنشان می کند که ‘استنتاج معتبر نخواهد بود مگر اینکه برآوردگرهای واریانس مربوطه به طور مناسب تمام ویژگی های پیچیده طراحی نمونه PIAAC را منعکس کنند" (OECD 2013 ، ص 26). این موضوعات به هیچ وجه منحصر به داده های PIAAC نیست-ارزیابی های بین المللی در مقیاس بزرگ ، از جمله برنامه ارزیابی بین المللی دانشجویان (PISA) ، بررسی بین المللی آموزش و یادگیری (TALIS) ، روند مطالعه بین المللی ریاضیات و علوم (TIMSS) ، مطالعه بین المللی سوادآموزی رایانه و اطلاعات (ICILS) و پیشرفت در مطالعه بین المللی سوادآموزی خواندن (PIRLS) ، از طرح های مطالعه مشابه پیروی می کنند (Rutkowski et al. 2010 ؛ Rutkowski and Zhou 2014). در ادامه ، من به طور خلاصه این موضوعات را مرور می کنم و راه های مقابله با آنها را در M Plus شرح می دهم. در جدول 8. 1 مروری بر دستورات مربوط به M Plus ارائه شده است.
وزنه برداریداده های PIAAC دارای دو نوع وزن ، وزن نهایی شرکت کنندگان (SPFWT0) و مجموعه ای از وزن های تکثیر (SPFWT1-SPFWT80) است. اولی با وزن پایه ایجاد شده است که شامل احتمال انتخاب خانوارها و چندین عامل تنظیم (OECD 2013) است. دومی مجموعه ای از وزنهای را نشان می دهد که می تواند برای بهبود تخمین واریانس از طریق جک و یا رویکردهای دیگر استفاده شود. چندین نویسنده پیشنهاد کرده اند که بررسی کنند که چگونه وزن نمونه برداری آموزنده قبل از آن در تجزیه و تحلیل داده های ارزیابی بین المللی در مقیاس بزرگ وجود دارد-به عنوان مثال ، با ارزیابی اندازه نمونه و اثرات طراحی مؤثر (Laukaityte and Wiberg 2018 ؛ Rutkowski و Svetina 2014). گنجاندن وزن نهایی و وزنهای تکثیر در M Plus ساده است: در بخش متغیر ، محققان می توانند وزن نهایی را با استفاده از گزینه وزنه و گزینه repweights برای وزنه های تکثیر مشخص کنند. وزنه های تکرار می توانند با چندین مشخصات اضافی مانند نوع تنظیم خطای استاندارد (Repse) همراه باشند. علاوه بر این ، وزن ها را می توان با استفاده از گزینه WTScale مقیاس بندی کرد.
ساختار داده های تو در تو. محققان برای پاسخ به خوشه بندی داده های فردی در ، به عنوان مثال ، مناطق یا کشورها ، حداقل دو گزینه دارند: اول ، ممکن است با تنظیم خطاهای استاندارد پارامترهای SEM با استفاده از گزینه Type = Complex ، ساختار داده های تو در تو را به حساب بیاورند. بشراین گزینه به دنبال یک مدل چند سطحی نیست که سطح لانه سازی را به صراحت مدل کند. این همراه با برآوردگر حداکثر احتمال قوی (MLR) و مشخصات متغیر خوشه بندی (به عنوان مثال خوشه = cntryid) همراه است. دوم ، محققان ممکن است بخواهند ساختار داده های تو در تو را از طریق مدل سازی چند سطحی به منظور تعیین کمیت و توضیح تنوع بین کشور در متغیرهای PIAAC یا روابط بین آنها مدل سازی کنند. دستورات مربوطه برای مدل های دو سطح با رهگیری های تصادفی و/یا دامنه ها نوع = دوقلوی و/یا نوع = تصادفی دوقلوی هستند.
مقادیر قابل قبولPIAAC از مقادیر قابل قبول برای نشان دادن سواد ، عددی و حل مسئله در محیط های غنی از فناوری استفاده می کند. در ادبیات موجود ، چندین روش اعمال شده است که شامل این مجموعه از نمرات عملکرد است. در میان این رویه ها ، معاملات زیر با تغییر در داخل و بین مجموعه مقادیر قابل قبول (Laukaityte و Wiberg 2017 ؛ Rutkowski و همکاران 2010) بهتر است: تجزیه و تحلیل SEM برای هر یک از ده مجموعه داده حاوی ده مقدار قابل قبول انجام می شود. پارامترهای مدل حاصل متعاقباً به عنوان وسیله ای در تمام ده مجموعه پارامترهای مدل جمع می شوند و واریانس آنها طبق قوانین ترکیبی روبین اندازه گیری می شود. این قوانین شامل واریانس های درون و بین مقادیر قابل قبول و تعداد مقادیر قابل قبول (به عنوان مثال Laukaityte و Wiberg 2017) است. M Plus یک گزینه راحتی (نوع = impitation) ارائه می دهد که SEM را برای هر مجموعه از مقادیر قابل قبول انجام می دهد و پارامترهای مدل حاصل را ترکیب می کند. اگرچه ترکیب میانگین ، واریانس ها ، متغیرها و ضرایب مسیر ممکن است با این روش ساده باشد (Enders 2010) ، آمار مناسب ترکیبی نیاز به تنظیمات بیشتر دارد (Enders and Mansolf 2018 ؛ Meng and Rubin 1992). تا آنجا که مستندات M Plus پیش می رود ، تنظیمات آماری مجذور کای و انحراف مدل به طور پیش فرض در نرم افزار با تخمین حداکثر احتمال مجاز انجام می شود (Asparouhov and Muthén 2010).
داده های گمشدهداده های گمشده ممکن است به دلایل مختلف در متغیرهای پس زمینه رخ دهد. بدون بررسی جزئیات در مورد مکانیسم های مفقود ، توجه داشته باشم که M Plus گزینه های مختلفی برای مقابله با داده های مفقود شده دارد. آنها شامل چندین روش و رویکردهای مبتنی بر مدل با یا بدون متغیرهای کمکی هستند (Enders 2010). محققان همچنین این فرصت را دارند که در بسته های نرم افزاری جایگزین (به عنوان مثال بسته R "موش") چندین ضربه را انجام دهند و مجموعه داده های کامل حاصل را به M Plus برای SEM ارسال کنند (به عنوان مثال Enders et al. 2016 ؛ Grund et al. 2018).
8. 2 بررسی مختصر از تجزیه و تحلیل داده های ثانویه PIAAC با استفاده از SEM
برای مرور وضعیت فعلی نحوه استفاده SEM برای تجزیه و تحلیل داده های PIAAC ، من با استفاده از اصطلاحات جستجو PIAAC و (مدل معادله ساختاری* یا مدل مسیر* یا تجزیه و تحلیل عاملی یا CFI یا RMSEA یا CFI یا RMSEA یا CFI یا RMSEA یا CFI یا RMSEA ، در پایگاه های داده psycinfo و اریک جستجو کردم. اثر غیرمستقیم یا میانجیگری) و هفت نشریه را بازیابی کرد (از 25 فوریه 2019). جستجوی اضافی برای اصطلاح "PIAAC" در پایگاه داده Elsevier Scopus ، 17 نشریه دیگر و مرجع متقابل را به دو نشریه دیگر ارائه داد. از این 26 نشریه ، 12 کاربرد SEM را به داده های PIAAC ارائه دادند. جدول 8. 2 توضیحی از این نشریات ، از جمله مدلهایی که نویسندگان مشخص کرده اند و میزان رسیدگی به پیچیدگی داده ها را نشان می دهد.
بیشتر تجزیه و تحلیل های ثانویه بر اساس نمونه های متعدد PIAAC (75 ٪) ، شامل 18-29 کشور شرکت کننده بود. انواع مدل های معادلات ساختاری مدل های مسیر تک سطح (33. 3 ٪) را پوشش می دهد. مدل های معادله ساختاری تک سطح (50. 0 ٪) ، از جمله اکتشافی (8. 3 ٪) و تجزیه و تحلیل عامل تأیید کننده (25. 0 ٪). و SEM چند سطحی (16. 7 ٪). بسته نرم افزاری M Plus بر لیست ابزارهای تحلیلی (80 ٪) ، کنار LISREL (10 ٪) و بسته R Lavaan (10 ٪) حاکم بود. فقط 1 از 12 نشریه صریح بیان نکرد که آیا و چگونه پیچیدگی داده های PIAAC در طول SEM در نظر گرفته شده است. با برخی از استثنائات (25 ٪) ، نویسندگان شامل نمونه برداری از وزن در تحلیل های خود بودند. در تجزیه و تحلیل های مربوط به مقادیر قابل قبول ، قوانین ترکیبی روبین عمدتاً اعمال می شد. با این حال ، یک مطالعه به طور متوسط ده مقدار قابل قبول ارائه شده توسط پایگاه داده PIAAC را به طور متوسط انجام داد ، و یک مطالعه از این مقادیر به عنوان شاخص های آشکار یک متغیر نهفته برای نشان دادن مهارت های شرکت کنندگان استفاده کرد. سرانجام ، روشهای رسیدگی به داده های مفقود شده به طور قابل توجهی متفاوت بود و شامل چندین مورد ، اطلاعات کامل برآورد حداکثر احتمال و رویه های حذف لیست در لیست است.
به طور کلی ، این مختصر و به هیچ وجه کامل ، بررسی نشان می دهد که SEM در حال تبدیل شدن به تجزیه و تحلیل ثانویه داده های PIAAC است. در عین حال ، روشهای رسیدگی به پیچیدگی های داده بین مطالعات متفاوت است و خواستار چارچوبی است که ممکن است محققان را در تجزیه و تحلیل SEM خود راهنمایی کند.
8. 3 داده های PIAAC و اقدامات مورد استفاده در نمونه های مصور
نمونه های مصور زیر از کلاس های مدل های معادله ساختاری بر اساس دو مجموعه داده است: اولین حاوی داده های نروژی (5128 = n) و آلمانی (5465 = n) داده های PIAAC. دوم شامل داده های 27 کشور شرکت کننده در PIAAC (N = 181،236) است که به استثنای داده های اتریش ، قبرس ، روسیه و ترکیه (استدلال برای این محرومیت را می توان در Borgonovi و Pokropek 2017b یافت). این داده ها توسط OECD (2016) در دسترس عموم قرار گرفته است و حاوی نمونه های کامل مطالعه در این کشورها است که دامنه سنی وسیع (16-65 سال) را پوشش می دهد. برای جزئیات بیشتر در مورد آمار نمونه توصیفی ، خوانندگان به پرونده های استفاده عمومی ارائه شده توسط OECD ارجاع می شوند. نمونه های مصور در این فصل به بررسی روابط بین چندین اقدامات مهارت شناختی در PIAAC و اقدامات از پرسشنامه پس زمینه PIAAC می پردازد (جدول 8. 3).
8. 4 مدل های اندازه گیری
8. 4. 1 تجزیه و تحلیل عاملی تأییدی با شاخص های طبقه بندی یا مداوم
برای ایجاد یک مدل اندازه گیری یک سازه ، محققان ممکن است از بین چندین روش انتخاب کنند. این موارد شامل ، اما محدود به تجزیه و تحلیل عاملی تأیید کننده (CFA) ، تجزیه و تحلیل عاملی اکتشافی (EFA) و مدل سازی معادلات ساختاری اکتشافی (ESEM) نیست - این دومی ویژگی های CFA و EFA را به همراه دارد (براون 2015 ؛ مارش و همکاران. 2014). در این بخش ، من به CFA به عنوان ابزاری برای تهیه یک مدل اندازه گیری مناسب که نشان دهنده متغیر علاقه نهفته (بدون نظارت) است ، تمرکز خواهم کرد.
یک مدل CFA شامل یک یا چند متغیر نهفته است که توسط مجموعه ای از شاخص های طبقه بندی یا مداوم مانند پاسخ های مورد ، نمرات خرده مقیاس یا بسته های مورد اندازه گیری می شود. برای نشانگر I و شخص j در مجموعه داده ها ، yIJ، یک مدل یک عاملی با تنها یک متغیر نهفته η به عنوان y مشخص شده استIJ= νمن+ λمنηj+ εIJ، جایی که λمنبارگذاری عامل این شاخص ، ν را نشان می دهدمنرهگیری مورد ، و εIJباقیماندهبا استفاده از نماد ماتریس ، مدل حاصل را می توان به عنوان y = ν + λη + ε با y توصیف کرد~n (0 ، σ) ، η~n (0 ، ψ) ، و ε~n (0 ، θ). ساختار کواریانس اساسی این مدل σ = λψλ ′ + θ است ، جایی که λ نشان دهنده ماتریس بارهای عاملی است ، ψ ماتریس واریانس های فاکتور و کواریانس ها ، و θ ماتریس واریانس های باقیمانده و کوارارها (برای اطلاعات بیشتر ، لطفاً مراجعه کنیدبراون 2015).
هنگام انجام CFA ، محققان با تصمیمات متعددی مانند درمان شاخص ها به عنوان متغیرهای طبقه بندی یا مداوم روبرو هستند. علیرغم گزینه برآورد حداکثر احتمال قوی (M به علاوه: برآوردگر = MLR) برای انحراف احتمالی از توزیع عادی شاخص های مداوم ، انتخاب یک برآوردگر مناسب به ویژه برای شاخص های نیمه مداوم مرتبط است. به طور خاص ، هنگامی که محققان قصد دارند از پاسخ های موردی استفاده کنند که مبتنی بر فرکانس ، توافق یا مقیاس رتبه بندی با مجموعه ای از گزینه های پاسخ (به عنوان مثال از 0 = نه به هیچ وجه تا 5 = همیشه) باشد ، آنها باید تصمیم بگیرند که آیا درمان کننداین پاسخ ها به صورت قاطع یا مداوم. بدون بررسی ادبیات موجود در مورد این موضوع تا حد کامل ، بدنه تحقیق موجود نشان می دهد که پنج گزینه پاسخ یا چند پاسخ قابل تحمل از توزیع پاسخ مورد از نرمال بودن ممکن است درمان پاسخ های مورد را به عنوان متغیرهای مداوم توجیه کند (به عنوان مثال فینی و دیستفانو2013). در چنین شرایطی ، مدل CFA ترسو تر می شود زیرا تنها یک مورد رهگیری به جای چندین آستانه بین دسته های پاسخ در مدل تخمین زده می شود (Kline 2016). در M Plus ، برآوردگرهای مبتنی بر حداکثر احتمال (به عنوان مثال ML قوی [MLR]) و برآوردگر حداقل مربع وزنی و واریانس تنظیم شده (WLSMV) برای درمان پاسخهای موردی به صورت قاطع در دسترس هستند (براون 2015). با این حال ، این دو برآوردگر ممکن است در CFA با داده های معمولی به همان اندازه عملکرد خوبی نداشته باشند. به عنوان مثال ، لی (2016) دریافت که برآوردگر WLSMV در برآورد بارهای عامل کمتر مغرضانه است اما همبستگی بین عوامل را بیش از حد ارزیابی کرده است (همچنین به Beauducel و Herzberg 2006 مراجعه کنید). مثال زیر مشخصات و عملکرد این دو رویکرد تخمین را نشان می دهد.

مدل های اندازه گیری کنجکاوی با شاخص های موردی با هم برخوردار (برآوردگر WLSMV) بر اساس (الف) شش و (ب) چهار مورد
نحو 8. 1: مدل CFA که ساختار عاملی کنجکاوی را توصیف می کند
UseVariables I_Q04D I_Q04J I_Q04L I_Q04M ؛
! کدگذاری داده ها از دست رفته است
مفقود شده همه (-99) هستند.
! وزن نهایی شرکت کننده
کنجکاو توسط i_q04d i_q04j i_q04l i_q04m ؛
سمپستات ؛! آمار نمونه
stdyx ؛! پارامترهای کاملاً استاندارد
mod (همه) ؛! شاخص های اصلاح

الگوی اندازه گیری مهارت های شرکت کنندگان در کار (Skills-W) و در زندگی روزمره (Skills-E)
مثال دوم نشان دهنده مشخصات و تخمین مدل های CFA در M به علاوه مربوط به قرار گرفتن در معرض شرکت کنندگان PIAAC در برابر مهارت های خاص است (جدول 8. 2 را ببینید). تمایز بین مهارت های مورد نیاز در محل کار و در زندگی روزمره ، محققان ممکن است یک مدل عاملی را با دو عامل همبسته مشخص کنند (شکل 8. 2). با توجه به اینکه موارد به طور مشابه برای کار و شرایط زندگی روزمره تدوین می شوند ، یک ساختار کواریانس به باقیمانده ها اضافه می شود تا پس از کنترل دو متغیر نهفته ، هرگونه روابط بین موارد را به خود اختصاص دهد. این متغیرهای باقیمانده در مدل دو عاملی همانطور که در نحو 8. 2 نشان داده شده است مشخص شده است.
نحو 8. 2: نحو مدل مدل اندازه گیری استفاده از مهارت ها
! مدل دو عاملی با باقیمانده های همبسته
کار توسط G_Q05A G_Q05C G_Q05E G_Q05F ؛
زندگی توسط H_Q05A H_Q05C H_Q05E H_Q05F ؛
G_Q05C با H_Q05C ؛
G_Q05E با H_Q05E ؛
G_Q05F با H_Q05F ؛
به طور کلی ، مشخصات مدل های اندازه گیری در M Plus به محققان این امکان را می دهد تا شاخص ها را بطور قاطع یا مداوم درمان کنند. انحراف از فرض عادی چند متغیره می تواند با برآورد ML قوی (حداقل تا حدی) جبران شود. انحراف از یک ساختار ساده-یعنی یک ساختار عاملی بدون هیچ گونه کواریانس باقیمانده و بارگیری های متقاطع-می تواند در بسته نرم افزاری نیز اجرا شود.
8. 4. 2 آزمایش اندازه گیری اندازه گیری با چند گروه
در بسیاری از سناریوها ، مقایسه های گروهی مورد توجه محققان است. چنین مقایسه هایی ممکن است به تفاوت در میانگین متغیرها یا تفاوت در روابط بین سازه ها اشاره داشته باشد. در هر دو مورد ، محققان باید ثابت کنند که متغیرهای مورد استفاده در مقایسه های گروهی با درجه کافی قابل مقایسه هستند. به طور خاص ، میانگین تفاوت یا تفاوت در روابط ساختاری در گروه ها می تواند چندین دلیل از جمله میانگین تفاوت ها و تفاوت های واقعی در روابط ساختاری ، بلکه تفاوت های احتمالی در عملکرد موارد ، مقیاس ها یا تست های کامل باشد (مریدیت 1993). برای بررسی میزان عملکرد کالاهای دیفرانسیل ممکن ممکن است بر تفاوتهای گروهی که توسط محققان یافت می شود ، تأثیر بگذارد ، چندین روش تحت چترهای "تغییر اندازه گیری" و "عملکرد آیتم دیفرانسیل" ایجاد شده است (Millsap 2011). در ادامه ، من نحوه اجرای این رویه ها را در M Plus نشان می دهم ، با تمرکز بر سناریوها با چند گروه. از طریق مواد تکمیلی می توان به پرونده های ورودی و خروجی کامل دسترسی پیدا کرد.
مدل های تقلید و عملکرد مورد دیفرانسیل
دلایل متعدد مدلهای شاخص چندگانه (MIMIC) معمولاً از یک متغیر نهفته (اندازه گیری شده توسط چندین شاخص) و یک یا چند متغیر (دلایل متعدد ؛ براون 2015) تشکیل شده است. این مدل ها احتمالاً ساده ترین مدل های معادله ساختاری را نشان می دهند و به محققان این امکان را می دهند تا اثرات متغیرهای متغیر را بر روی صفت نهفته بررسی کنند - برای مثال ، تفاوت های گروهی احتمالی را شناسایی کنند. دومی ، با این حال ، بر این فرض استوار است که مدل اندازه گیری برای گروه های مختلف در نظر گرفته شده است - به عبارت دیگر ، این مدل مبتنی بر فرضیات ناسازگاری اندازه گیری است که می تواند تفسیر معنی دار از عوامل فاکتور را تسهیل کند (کیم و همکاران 2012b).

(الف) مدل تقلید و (ب) مدل تقلید از کنجکاوی با آلمانی به عنوان متغیر
در مثال داده های زیر ، تفاوت در کنجکاوی شرکت کنندگان بین نمونه های نروژی و آلمانی PIAAC بررسی شده است. متغیر باینری آلمانی (1 = آلمان ، 0 = نروژ) به عنوان متغیر متغیر نهفته "کنجکاوی" عمل می کند (شکل 8. 3 (a)). با استفاده از دستور رگرسیون در M Plus ، کنجکاوی به سادگی بر روی متغیر متغیر قرار می گیرد (نحو 8. 3). با توجه به اینکه آلمانی باینری است ، ضریب رگرسیون γ1تا حدی استاندارد است (استاندارد سازی Stdy ؛ Muthén et al. 2017).
نحو 8. 3: نحو مدل مدل تقلید کنجکاوی با آلمانی به عنوان متغیر
کنجکاو توسط i_q04d i_q04j i_q04l i_q04m ؛
کنجکاو بر روی آلمانی ؛
استی! به دلیل پیش بینی باینری آلمانی
برای مشخص کردن اینکه آیا متغیرهای شاخص مانیفست خاص (یعنی موارد) عملکردهای دیفرانسیل را بین نمونه های آلمانی و نروژی نشان می دهند - این وضعیتی است که در آن احتمال پاسخ دادن به یک مورد بین گروه ها متفاوت است اگرچه آنها در متغیر نهفته یکسان هستند(Millsap 2011)-مدل تقلید را می توان با افزودن مسیرهای ساختاری به متغیرهای خاص به یک مدل تقلید گسترش داد (شکل 8. 3 (b) را ببینید). این مدل اطلاعات نه تنها در مورد تفاوتهای میانگین عامل احتمالی بلکه در مورد تفاوت در رهگیری های مورد را ارائه می دهد (کیم و همکاران 2012b). از این رو ، مدل MIMIC-DIF به محققان این امکان را می دهد تا DIF موارد خاص را آزمایش کنند و میانگین فاکتور عصاره کنترل کنترل مورد برای موارد مختلف. در M Plus ، رهگیری های مورد بر روی متغیر متغیر قرار می گیرند ، در این حالت با اضافه کردن خط فرمان I_Q04D در آلمانی برای به دست آوردن پارامتر βدبشر(توجه: برای شاخص های طبقه بندی ، آستانه های مورد بر روی همبستگی رکود می شوند.) در این مثال ، پارامتر DIF مورد D β بودد= 0. 140 . 140 ، SE = 0. 018 ، 95 ٪ CI [. 10. 176 ، -0. 105] ، P<0.001. The corresponding differences in the factor mean of curiosity were γ 1= - 0. 276 ، SE = 0. 025 ، 95 ٪ CI [0. 325 ، 0. 227] ، P<0.001. The MIMIC-DIF model outperformed the MIMIC model in terms of model fit, Δχ 2 (1) = 54.4, p <0.001. Hence, there is evidence for cross-country differences in curiosity favouring the Norwegian sample and the differential functioning of item D.
رویکرد MIMIC-DIF برای آزمایش نه تنها به اصطلاح اثرات DIF یکنواخت بلکه اثرات DIF غیر یکنواخت با شامل یک اصطلاح تعامل بین متغیر نهفته و متغیرهای متغیر ایجاد شده است (Woods and Grimm 2011). Bauer (2017) چارچوب کلی تر تجزیه و تحلیل عاملی تعدیل شده را برای بررسی اثرات مختلف یکنواخت و غیر یکنواخت از طبقه بندی ، مداوم یا هر دو نوع متغیرهای متغیر ارائه داد.
تجزیه و تحلیل عاملی تأییدی چند گروهی
علاوه بر آزمایش موارد دیفرانسیل عملکردی با کمک مدلهای تقلید و تقلید ، CFA چند گروهی وجود دارد ، روشی که به محققان امکان می دهد مجموعه ای از مدل ها را مشخص کنند و تخمین بزنند که پارامترهای موجود در مدل CFA می توانند محدود شوندبه برابری در بین گروه ها. CFA چند گروهی به رویکرد استاندارد برای آزمایش اندازه گیری در زمینه آموزش و روانشناسی تبدیل شده است (Putnick and Bostein 2016 ؛ Scherer and Greiff 2018) و پایه و اساس چندین پسوند ، مانند چند گروه ESEM ، روش بهینه سازی تراز و بیزی را تشکیل می دهد. تست اندازه گیری اندازه گیری (مارش و همکاران 2013 ، 2018 ؛ موتن و آسپاروهف 2012).
به طور معمول ، سه مدل CFA چند گروهی برای آزمایش عدم تغییر اندازه گیری بر اساس شاخص های موردی که به طور مداوم تحت درمان قرار می گیرند از یک متغیر نهفته η مشخص شده است (Van de Schoot et al. 2012): (1) مدل ثابت پیکربندی همان ساختار عامل را فرض می کند (یعنی ساختار عامل (یعنیتعداد عوامل و الگوی پیوندها بین متغیر نهفته و شاخص های مانیفست) در گروه ها. این مدل اغلب به عنوان مدل پایه مورد استفاده قرار می گیرد که در برابر آن همه مدل های دیگر با محدودیت پارامتر اضافی مقایسه می شوند. تمام پارامترهای مدل آزادانه در گروه ها تخمین زده می شوند. به طور خاص ، برای نشانگر مورد اول و شخص j در گروه K ، یک مدل یک عاملی پیکربندی برای متغیر شاخص مانیفست y مشخص شده استIJK، متغیر نهفته ηjk، رهگیری خاص گروه νIJ، و اصطلاح باقیمانده εIJKبه عنوان yIJK= νایک+ λایکηjk+ εIJK، جایی که λایکبارگذاری فاکتور بار مورد نظر برای گروه K را نشان می دهد. این فاکتور به صفر ثابت است و واریانس فاکتور برای همه گروه ها به 1 ثابت می شود.(2) مدل تغییر متریک بارگذاری فاکتور λ را محدود می کندایکبه برابری در گروه ها بر اساس مدل پیکربندی ، yIJK= νایک+ λمنηjk+ εIJKبشرمجدداً ، این فاکتور به صفر محدود می شود ، اما واریانس فاکتور آزادانه برای شناسایی مدل تخمین زده می شود. اگر تغییر متریک وجود داشته باشد ، می توان واریانس فاکتور و کواریانس را در بین گروه ها مقایسه کرد.(3) مدل عدم تغییر مقیاس بیشتر موارد را محدود می کندjبه برابری در گروه ها ، yIJK= νمن+ λمنηjk+ εIJKبشربرای شناسایی میانگین ساختار در مدل ، میانگین فاکتور آزادانه تخمین زده می شود. واریانس فاکتور نیز آزادانه تخمین زده می شود. اگر عدم تغییر مقیاس داشته باشد ، می توان فاکتور را در گروه ها مقایسه کرد. در کلیه مدل ها ، باقیمانده ها با متغیر نهفته ارتباط ندارند و میانگین صفر دارند (Muthén and Asparouhov 2018). مارش و همکاران.(2009) پیشنهاد گسترش این چارچوب تغییر اندازه گیری با آزمایش سیستماتیک محدودیت های پارامتر اضافی - این محدودیت ها شامل میانگین فاکتور ، واریانس ها ، متغیرها و باقیمانده های آیتم است. جدا از این برنامه های افزودنی ، ادبیات اندازه گیری اغلب شامل تغییر واریانس باقیمانده مورد (همزمان) θ علاوه بر محدودیت های نامتارچ مقیاس برای آزمایش اینکه آیا مدل های اندازه گیری نشانگر قابلیت اطمینان یکسانی هستند (Raykov and Marcoulides 2006). از مدل حاصل به عنوان مدل عدم تغییر دقیق گفته می شود. اگر ثابت بودن آن را داشته باشد ، مقیاس (مانیفست) می تواند در گروه ها مقایسه شود.
برای تعیین میزان عدم تغییر اندازه گیری برای یک مجموعه داده خاص ، چندین شاخص در دسترس است ، از جمله نتایج آزمایش اختلاف مجذور کای و تفاوت در شاخص های مناسب بین مدلها با محدودیت های پارامتر مختلف (براون 2015). به عنوان مثال ، اگر مقایسه مدل های تغییر شکل پیکربندی و متریک منجر به یک تست اختلاف ناچیز chi-your شود ، این می تواند به عنوان شواهدی تعبیر شود که محدودیت های موجود در بارهای فاکتور باعث بدتر شدن مدل کلی نمی شود-از این رو ، متریک تغییر می شود. با این حال ، در نمونه های بزرگ ، و برای مجموعه داده های پیچیده ، آزمون اختلاف مجذور کای ممکن است منجر به آمار تست قابل توجهی شود اگرچه محدودیت های مربوط به پارامترهای مدل به طور قابل توجهی متناسب با مدل خراب نمی شود (یوان و چان 2016). در نتیجه ، تفاوت در شاخص های مناسب منابع اطلاعات اضافی را ارائه می دهد. برای این اختلافات ، چندین معیار برش پیشنهاد شده است: (الف) ΔCFI کمتر از 0. 010-(Cheung and Rensvold 2002).(ب) ΔCFI کمتر از 0. 010 ، ΔRMSEA کمتر از 0. 015 و ΔSRMR کمتر از 0. 030 (چن 2007). و (ج) ΔCFI کمتر از 0. 008 (مید و همکاران 2008). با این حال ، این معیارها نباید به عنوان "قوانین طلایی" در نظر گرفته شود ، زیرا آنها به چندین عامل وابسته هستند ، مانند نوع مدل فاکتور (Khojasteh و LO 2015) ، انواع مدل های تغییر ناپذیر که مقایسه می شوند (Rutkowski و Svetina 2014) ، یا عدم تغییر ساختارهای میانگین یا کواریانس بررسی شده است (Fan and SIVO 2009). علاوه بر این ، استفاده از این دستورالعمل ها از این نظر متفاوت است که برخی از محققان تمام مدل ها را در برابر مدل پیکربندی مقایسه می کنند ، در حالی که برخی دیگر مدل های مجاور را برای شناسایی اثرات محدودیت های پارامتر اضافی با توجه به محدودیت های مدل قبلی مقایسه می کنند. توجه داشته باشید که معیارهای مشابه در مورد آزمایش اندازه گیری اندازه گیری در شرایطی که شاخص های مورد به صورت قاطع رفتار می شوند ، اعمال می شود. لطفا لیو و همکاران را مرور کنید.(2017) برای اطلاعات بیشتر.
مثال 1: جنسیت به عنوان متغیر گروه بندی
مثال زیر از متغیر زن به عنوان متغیر گروه بندی استفاده می کند و بر روی سه مدل تغییر اندازه گیری استاندارد (یعنی پیکربندی ، متریک و مقیاس مقیاس) با استفاده از مدل گزینه راحتی M Plus = مدل متریک پیکربندی متمرکز است. این گزینه هر سه مدل را با پاسخ های مداوم (برآوردگر MLR) یا پاسخهای موردی با یکدیگر (برآوردگر WLSMV) مشخص می کند و آنها را با کمک تست تفاوت مجذور کای مقایسه می کند. نحو 8. 4 دستورات مربوطه را نشان می دهد. این مدل ها همچنین می توانند با اعمال محدودیت های پارامتر به طور مستقیم مشخص شوند. پرونده های نحوی مربوطه بخشی از مواد تکمیلی (از پرونده ‘MM6C-Curiosity-MG-Gender. inp" تا "MM6F-Curiosity-MG-Gender. inp") است.
استراتژی برای تجارت گزینه های...
ما را در سایت استراتژی برای تجارت گزینه های دنبال می کنید
برچسب :
نویسنده : فریبا کامران
بازدید : 37
تاريخ : يکشنبه
11 تير
1402 ساعت: 19:54