۳-۹ روش تجزیه و تحلیل دادهها
در پژوهش های علمی، تجزیه و تحلیل داده های آماری مرحله مهمی از پژوهش تلقی می شود، زیرا پژوهشگر در این مرحله به نتیجه نهایی خواهد رسید. یعنی با بهره گرفتن از یک روش تحقیق، داده ها تجزیه و تحلیل، فرضیه ها آزمون و در نهایت نتیجه گیری انجام خواهد شد.(خاکی،۱۳۷۸).
فرایند تجزیه و تحلیل دادهها یک فرایند چند مرحلهای است که طی آن دادههای جمعآوری شده خلاصه، کدبندی، دسته بندی و درنهایت پردازش میشوند تا زمینه اجرای تحلیلها و انجام آزمونها فراهم گردد.
تجزیه و تحلیل دادههای این تحقیق و آزمون فرضیات آن توسط نرمافزارهای اکسل و ایویوز انجام شده است. به این ترتیب که اطلاعات فراهم شده توسط پایگاههای اطلاعاتی ابتدا در نرمافزار اکسل دسته بندی و مرتب سازی شده است و سپس به نرمافزار ایویوز منتقل گردیده تا آزمونهای آماری مورد نظر برروی آنها انجام شود. دانش آماری که در تحلیل آماری این تحقیق استفاده میشود، شامل آمار توصیفی جهت توصیف و ارائه مشخصات آماری متغیرها و پارامترها و آمار استنباطی شامل تخمین و برآورد ضرایب میباشد.
قبل از تخمین و اجرای مدلهای رگرسیونی لازم است از وجود برخی شرایط در بین متغیرها اطمینان حاصل شود، بنابراین به منظور اطلاع از برخورداری دادههای تحقیق از شرایط لازم، انجام تعدادی آزمون بر روی متغیرها ضروری میباشد که در ادامه به اختصار به کلیات آنها اشاره میشود.
۳- ۹ - ۱ انواع دادهها
در بررسی ارتباط بین یک متغیر وابسته با یک یا چند متغیر مستقل و با بهره گرفتن از داده های تاریخی از سه نوع داده می توان پارامترهای متغیر(متغیرهای) مستقل را برآورد و با ارائه مدل اقدام به پیشبینی نمود، این سه نوع داده را می توان به شرح زیر استخراج کرد:
الف) داده های سری زمانی
دادههایی هستند که در قالب یک یا چند متغیر خاصی در طول زمان رخ میدهند. به عبارت دیگر سری زمانی، مجموعهای از مشاهدات است که بر حسب زمان مرتب شده باشند.
ب) داده های مقطعی
دادههایی هستند که در یک مقطع مشخص از زمان محاسبه و جمعآوری می شوند. به عنوان مثال، اگر متغیر SDA برای ۱۰۰ شرکت و در یک مقطع خاصی از زمان (مثلا سال ۱۳۸۵ ) جمع آوری گردد، این داده ها را مقطعی گویند. در این حالت تعداد مشاهدات (N) برابر ۱۰۰ است.
ج) داده های تابلویی
دادههایی هستند که از ترکیب دو دسته داده های سری زمانی و مقطعی حاصل می شود. در بسیاری از موارد محققین از این روش برای مواردی که نمی توان مسائل را به صورت سری زمانی یا مقطعی بررسی کرد و یا زمانی که تعداد داده ها کم است استفاده می کنند. ادغام داده های سری زمانی و مقطعی و ضرورت استفاده از آن بیشتر به خاطر افزایش تعداد مشاهدات و بالا بردن درجه آزادی است. زیرا در بررسی امکان دارد تعداد مقاطع زیاد و دوره های زمانی کم باشد و یا برعکس تعداد دوره های زمانی نسبتا زیاد و تعداد مقاطع کم باشد. در این صورت تعداد مشاهدات (n ) برابر است با تعداد سالهای مورد نظر (t ) ضرب در تعداد داده های مقطعی در یک سال (n ) .در این تحقیق از تکنیک داده های تابلویی استفاده شده است.
۳-۹ – ۱ - ۱ مزایای استفاده از داده های تابلویی
استفاده از داده های تابلویی دارای مزایای فراوانی است. در ذیل پارهای از این مزایا معرفی می گردد:
۱- از آن جایی که داده های تابلویی به افراد، بنگاه ها، کشورها و … طی زمان ارتباط دارند، وجود ناهمسانی واریانس در این واحدها محدود میشود. تکنیک های تخمین با داده های تابلویی می توانند این ناهمسانی واریانس را با متغیرهای تکی خاص مورد بررسی و ملاحظه قرار دهند.
۲- با ترکیب مشاهدات سری زمانی و مقطعی، داده های تابلویی با اطلاعات بیشتر، تغییرپذیری بیشتر، هم خطی کمتر میان متغیرها، درجات آزادی بیشتر و کارایی بیشتر را ارائه می نمایند.
۳- داده های تابلویی، چارچوب مناسب برای تحلیل کلی داده ها فراهم نموده و در حذف یا کاهش خطای برآورد نقش مهمی را ایفا می نمایند.
۴- داده های تابلویی، تأثیراتی را که نمیتوان به سادگی در داده های مقطعی و سری زمانی مشاهده کرد، بهتر معین می کنند.
۵- داده های تابلویی ما را قادر می سازد تا مدلهای رفتاری پیچیدهتر را مطالعه کنیم.
بطور کلی باید گفت داده های تابلویی تحلیلهای تجربی را به شکلی غنی میسازند که در صورت استفاده از داده های سری زمانی و مقطعی این امکان وجود ندارد (گجراتی[۴۶]، ۱۳۸۵).
۳-۹-۲ تجزیه و تحلیل همبستگی
تحلیل همبستگی ابزار آماری است که به وسیله آن می توان درجه ای که یک متغیر به متغیر دیگر از نظر خطی مرتبط است را اندازه گیری کرد که معمولاً با تحلیل رگرسیون بکار می رود،در همبستگی درباره دو معیار بحث می شود: ضریب همبستگی و ضریب تعیین.(آذر و مومنی،۱۳۸۵).
۳-۹-۲-۱ ضریب همبستگی
برای تعیین شدت هبستگی بین دو متغیر X و Y بهتر است شاخصی مورد استفاده قرار گیرد که به واحدهای اندازه گیری دو متغیر بستگی نداشته باشد.شاخص مذکور R است که شدت رابطه بین دو متغیر و نوع رابطه (معکوس و مستقیم) را نشان می دهد.اندازه ضریب همبستگی همواره بین ۱+ و ۱- می باشد ضریب همبستگی ۱+ رابطه مستقیم و کامل و ضریب هبستگی ۱- رابطه معکوس و کامل می باشد.اگر
باشد رابطه مستقیم و ناقص و اگر باشد رابطه معکوس
و ناقص می باشد و اگر R = 0به معنی عدم وجود رابطه است.
۳-۹-۲-۲ ضریب تعیین
ضریب تعیین توان دوم ضریب همبستگی است و شاخصی می باشد که مشخص می کند چند درصد از تغییرات متغیر وابسته توسط متغیر مستقل بیان می شود R2 ویژگی های مثبت و کوچکتر از یک بودن را دارا می باشد.در حالت برازش کامل رگرسیون که معمولاً اتفاق نمی افتد R2 برابر با یک و در حالت عدم ارتباط بین متغیر وابسته و مستقل برابر صفر می باشد.بطور کلی هرچه مقدار این ضریب به یک نزدیکتر باشد نشان دهنده برازش بهتر مدل خواهد بود.
۳-۹-۳ آزمون F
برای تحلیل کلی رگرسیون از روش واریانس و در روش واریانس از آزمون F استفاده می گردد.منظور از کل رگرسیون ارزیابی همزمان کل رگرسیون به جز مقدار ثابت است.تابع آزمون F که معیار معنادار بودن و اعتبار کل رگرسیون می باشد تابع آزمونی برای معنادار بودن R2 نیز می باشد.هر چه R2 بزرگتر باشد،مقدار F نیز بزرگتر است.(آذر و مومنی،۱۳۸۵).برای آزمون فرضیه ها از آزمون F استفاده خواهد شد.
مقدار F برای مدل رگرسیون نمونه از رابطه زیر بدست می آید:
که در آن k تعداد پارامترهای الگو،n حجم نمونه، مجموع مربع انحرافات توجیه شده و مجموع مربعات انحراف توجیه نشده است.چنانچه F محاسبه شده از F جدول با خطای پیش بینی مورد نظر بزرگتر باشد فرض H0 رد می شود یعنی کل رگرسیون معنی دار است و بالعکس و یا اگر مقدار Prob (F) < 0.05 باشد بدین معنی است که Fدر ناحیه بحرانی قرار دارد لذا فرض رد شده بنابراین کل رگرسیون اعتبار دارد.
۳-۹- ۴تصمیم گیری برای رد یا پذیرش فرضیهها
با توجه به موارد عنوان شده فوق در این تخمین برای آزمون فرضیات ابتدا با بهره گرفتن از آزمون F، درستی ادغام دادهها مورد آزمون قرار گرفته و سپس براساس آزمون هاسمن نوع روش آزمون (اثرات ثابت یا اثرات تصادفی) تعیین گردیده و با توجه به نوع روش نسبت به برآورد مدل اقدام شده است. جهت بررسی معنیدار بودن کل مدل از آماره F استفاده شده است. به طوری که با مقایسه آماره F و F جدول که با درجات آزادی K-1 و N-K در سطح خطای ۵% محاسبه شده، کل مدل مورد بررسی قرار گرفته است. آماره t بهدست آمده با t جدول که با درجه آزادی N-K در سطح اطمینان ۹۵% محاسبه شده مقایسه میشود، چنانچه قدرمطلق t محاسبه شده از t جدول بزرگتر باشد، ضریب موردنظر معنادار خواهد بود که دلالت بر وجود ارتباط بین متغیرمستقل و وابسته دارد. همچنین به عنوان روشی جایگزین جهت تصمیم گیری در مورد پذیرش یا رد یک فرضیه براساس مقدار احتمالی یا سطح معناداری نیز عمل شده است. بدین صورت که اگر مقدار احتمال محاسبه شده بزرگتر یا مساوی مقدار خطای نوع اول باشد فرض صفر پذیرفته میشود و اگر مقدار احتمال کوچکتر از مقدار خطای نوع اول باشد فرض صفر رد میشود.
۳-۱۰ خلاصه فصل
این تحقیق به بررسی تأثیر ترکیب هیات مدیره بر کیفیت گزارشگری مالی و ریسک در شرکت های پذیرفته شده در بورس اوراق بهادار تهران پرداخته است.در همین راستا، پنج فرضیه تدوین گردید که برای آزمون آنها از مدل رگرسیون استفاده شد و نتایج آنها با بهره گرفتن از نرم افزارهای آماری مورد تجزیه و تحلیل قرار گرفت.
در این فصل ابتدا روش شناسی پژوهش، متغییرها، فرضیه ها، جامعه آماری و حجم نمونه، نحوه جمع آوری داده ها و روش تجزیه و تحلیل داده ها شرح داده شد.
فصل چهارم
تجزیه و تحلیل داده ها
۴-۱ مقدمه
در فصل سوم به معرفی فرضیههای پژوهش و متغیرهای مورد نیاز برای آزمون آنها به معرفی جامعه آماری، نحوه انتخاب نمونهها و گردآوری اطلاعات مورد نیاز پرداخته شد، تا بتوانیم تجزیه وتحلیل را انجام دهیم. در تجزیه و تحلیل دادهها ابتدا آمار توصیفی متغیرها شامل میانگین، میانه،انحراف استانداردو مینیمم و ماکزیمم محاسبه شده و سپس بوسیله آمار استنباطی کار پردازش اعداد را انجام میدهیم تا زمینه برقراری روابط بین دادهها وانجام تحلیلهای علمی به منظور آزمون فرضیهها فراهم شود. برای این کار روش های مختلف آماری در استنتاجها و تعمیم نتایج نقش بسزایی بر عهده دارند. به منظور تجزیه و تحلیل اطلاعات جمع آوری شده و تفسیر آنها و قبول یا رد فرضیههای مطرح شده، ابتدا وجود یا عدم وجود رابطه بین متغیرهای پژوهش بررسی میشود.
در راستای بررسی و تعیین رابطه (روابط) تعادلی بین چند متغیر اقتصادی سری زمانی از روش آزمون پانل دیتا[۴۷] استفاده میشود که در چند سال اخیر به سرعت تبدیل به یک ابزار اساسی در برآوردهای الگوهای اقتصادی سری زمانی شده است.
۴-۲ آمار توصیفی
در ابتدا آمارهای توصیفی را بررسی میکنیم. آمارهای توصیفی به صورت زیر هستند:
جدول ۴-۱: آمارهای توصیفی متغیرهای پژوهش
متغیر
میانگین