Er zijn twee manieren u kan het uitvoeren van statistische analyses op de computer. Een is het gebruik van een speciale statistisch pakket zoals SPSS, Minitab of SAS. De tweede is het gebruik van een meer veralgemeende gegevensbeheer of spreadsheetprogramma, zoals Microsoft Excel of Open Office-werkblad. De laatste hebben hun eigen voordelen, voornamelijk te wijten aan vrijstromend, wat betekent dat er is geen vaste structuur naar hun werkbladen en kunnen gegevens worden geordend, maar u wenst. Specifieke programma's zijn echter meer geschikt is voor data-analyse voor een aantal redenen.
Bereik van technieken
Omdat statistische analyse pakketten worden speciaal geproduceerd voor statistische gegevensanalyse, overwegende dat de algemene programma's ook betrekking hebben op andere procedures gebruik van gegevens zoals boekhoudkundige formulieren of facturering, bieden zij een breder scala van technieken, grafieken en diagrammen. Zij omvatten ook meer methoden voor het schoonmaken en screening van de data bij om te bereiden voor latere analyse. Ook spreadsheetprogramma's ondersteunen mogelijk alleen de meeste data-analyses direct na de installatie, en plug-ins kan worden vereist voor toegang tot meer complexe technieken.
Gegevensbeheer
Het is waar dat spreadsheetprogramma's geven meer controle over waar en hoe om uw gegevens te ordenen. Maar dit is ook een nadeel. Terwijl u kunt blokken met gegevens rond niet gewoon in een programma zoals SPSS verplaatsen, is dit om de gegevens in de meest optimale manier georganiseerd te houden. Een rij geeft altijd een draagtas, en een kolom van een enkele variabele. Dit maakt analyses sneller, omdat het programma al weet waar de variabelen en de gevallen zijn. In een werkblad, moet dit handmatig met elke analyse worden gedefinieerd.
Organisatie van Output
Data analyses programma's zijn ook bedoeld om de uitvoer gescheiden blijven van de gegevens zelf. In een programma zoals Excel, de resultaten van de analyse moeten worden geplaatst in een werkblad waar het loopt het risico van andere gegevens en uitgangen te overschrijven of wordt overschreven zelf per ongeluk op een later tijdstip. Meest toegewijde analyse programma's dit verder nemen een stap en uitgangen worden opgeslagen in afzonderlijke bestanden aan de belangrijkste gegevensset zelf.
Nauwkeurigheid
De nauwkeurigheid van standalone statistische analyse pakketten is over het algemeen meer betrouwbaar dan algemene toepassingen voor gegevensbeheer. Dit is om verschillende redenen, waaronder de mogelijkheid voor een cel in een werkblad een formule en een waarde, iets dat is niet mogelijk in een pakket van statistieken. Tests van Excel statistische analyse add-on, de Analysis ToolPak laten onnauwkeurige resultaten in analyses zoals regressie en meervoudige regressie. Dit probleem is vooral uitgesproken met meer complexe analyses, zoals die met betrekking tot Categorische variabelen.