Microsofts populaire Excel programma heeft data-analysemogelijkheden die bevatten uitvoeren van regressie-analyse met dummy variabelen. Dummy variabelen zijn Categorische variabelen numeriek uitgedrukt als 1 of 0 om aan te geven de aanwezigheid of afwezigheid van een bepaalde kwaliteit of kenmerk. Excel vereist geen speciale functies wanneer een regressiemodel een dummy variabele tussen de onafhankelijke variabelen bevat. Echter, regressiemodellen met afhankelijke dummy variabelen vereisen aanvullende invoegtoepassingen, programma's die uit te de opties en functies van Excel breiden.
Regressie met Dummy variabelen met behulp van Excel
Laden van de data Analysetool uit de Excel-invoegtoepassingen, opgenomen in alle versies van Excel. Je moet dit gedrag van een regressie of een ander type van data-analyse. Klik op "Extra" opent een drop-down menu. Selecteer "Add-ins", uit het menu dat wordt geopend, controleren "Analysis ToolPak" en klik op 'OK'. "Data-analyse" moet worden weergegeven in het menu Extra.
Voer de gegevens die u wilt voor uw regressie in een Excel-werkblad gebruiken, codering van alle dummy variabelen met de waarde 1 of 0, afhankelijk van of het onderwerp het kenmerkende betrokken is. Het geslacht is een voorbeeld van een dummy variabele, omdat van een studie onderwerpen kunnen alleen mannelijk of vrouwelijk. Een studie van college ingang examen scores die onderwerpen geslacht opgenomen, bijvoorbeeld, kan code vrouwelijke studenten met een 1. Dummy variabelen onder uw onafhankelijke variabelen gebruiken, vereist geen speciale functies in Excel. Vergeet niet dat als een dummy variabele heeft slechts twee categorieën (zoals mannelijk of vrouwelijk), slechts één variabele nodig is om de twee categorieën vertegenwoordigen.
Categorische variabelen met meer dan twee categorieën als meerdere dummy variabelen code, ervoor te zorgen dat het aantal variabelen is één minder dan het aantal categorieën (n-1, statistisch gezien). Bijvoorbeeld, zou de categorie etniciteit uitgedrukt in vijf niveaus (witte, zwarte, Latino, Aziatische, Amerikaanse Indian) vier afzonderlijke dummy variabelen vereisen. Bijvoorbeeld, als u college ingang examen scores aan het bestuderen waren, kon u de volgende dummy variabelen: zwarte, Hispanic, Aziatische en Amerikaanse Indiaanse, codering elk een 1 als de betrokken student die etnische categorie past.
Excel's capaciteit voor regressie met dummy variabelen met een add-in waarmee het programma uit te voeren van regressies met dummy afhankelijke variabelen uit te breiden. Een dergelijke programma is XLStat, beschikbaar voor aankoop en downloaden van de maker, Addinsoft. Programma's zoals dit kunnen voeren regressies waarin de afhankelijke variabele de waarden of 1 of 0 neemt.
- Een veel voorkomende fout onder beginners is het gebruik van zoveel dummy-variabelen omdat er categorieën (zoals, bijvoorbeeld, twee dummy variabelen voor man en vrouw). Een dergelijke aanpak zou leiden tot multicollinearity, waarin twee onafhankelijke variabelen zijn sterk gecorreleerd, waardoor het bijna onmogelijk om te bepalen hun afzonderlijke effecten op de afhankelijke variabele. Vergeet niet dat het aantal dummy variabelen altijd één minder dan het aantal categorieën moet.