Statistisk analyse: Typer af data

Se også: Forståelse af sammenhænge

Vores side på Observationsforskning og sekundære data beskrev to hovedkilder til data (din egen forskning og data, der tidligere er blevet offentliggjort). Der er dog også mange forskellige typer data - og data kan klassificeres på flere forskellige måder. Datatypen påvirker måderne, du kan bruge dem på, og hvilken statistisk analyse der er mulig. Det vil også påvirke konklusioner og slutninger, som du kan drage.

Valget af datatype er derfor meget vigtigt. Denne side beskriver nogle af forskellene i datatyper og konsekvenserne for forskningsmetoder og fund.

Kvantitative vs. kvalitative data

Den første og mest oplagte forskel er mellem kvantitative og kvalitative data:



  • Kvantitative data er numeriske: de kan samles og præsenteres som tal; og

  • Kvalitative data er ikke numeriske.

Vores side på kvalitativ og kvantitativ forskning forklarer denne sondring mere detaljeret og angiver fordele og ulemper ved begge.

Objektiv versus subjektiv data

Data kan også opdeles i objektiv og subjektiv.

  • Objektive data er observerbare og målbare . De inkluderer ting som højde, vægt eller antal elementer. De indsamles normalt gennem observationer eller direkte målinger.

  • Subjektive data indsamles fra personlig kommunikation fra enkeltpersoner . Dette kan være talt eller skrevet, men kan også tage andre former. For eksempel kan kropssprog give subjektiv information (“ Hun lå stille med lukkede øjne og munden stram [objektiv], som om hun havde smerter [subjektiv] ”).

Både objektive og subjektive data kan være både kvalitative og kvantitative. For eksempel kan du observere (objektiv) en farveændring (kvalitativ), og du kan bede folk om at udtrykke deres meninger om et emne (subjektivt) ved hjælp af en numerisk skala (kvantitativ).

beskrive flere retningslinjer for opbygning af selvtillid

Begge typer har fordele og ulemper. For eksempel kan subjektive data give en meget bredere vifte af information, fordi mange ting simpelthen er umålelige. Disse inkluderer variabler som niveauet for smerte, hvor alle har deres egen fortolkning. Selv ved at bruge en skala fra 1 til 10, hvilket gør dataene kvantitative, betyder det ikke, at de vil være direkte sammenlignelige mellem individer.

Men subjektive data afhænger også af, at folk husker og vurderer tingene nøjagtigt. Subjektive data er derfor sandsynligvis mere upålidelige, når folk skal huske begivenheder fra længere tid siden.

Hvor det er muligt, foretrækkes derfor objektive data, men der er en generel forståelse af, at der kun undertiden kun er tilgængelige data.



Langsgående vs. tværsnitsdata

Sondringen mellem længdedata og tværsnitsdata er faktisk mere en forskel i studere design end datatype.

  • Langsgående undersøgelser arbejde med den samme gruppe over tid. De kan derfor vise ændringer over tid og identificere årsagssammenhæng.

  • Tværsnitstudier kan indsamle data på forskellige tidspunkter, men fra forskellige grupper. De kan derfor kun nogensinde vise et øjebliksbillede eller en række snapshots i tide.

Den afgørende skelnen mellem de to typer undersøgelser og derfor data er, at data i længderetningen kan demonstrere årsagssammenhæng.

Det anses generelt for umuligt at påvise årsagssammenhæng fra tværsnitsdata, fordi du kun har oplysninger om et øjeblik i tiden. Det er derfor ikke muligt at ændre noget og se, hvilken effekt det har (dvs. hvis der er en årsagssammenhæng ).

Tværsnitstudier er imidlertid meget mere bekvemme. Du skal kun udføre en enkelt undersøgelse eller et stykke forskning i stedet for at følge en kohorte over tid. Langsgående undersøgelser kan give data af meget høj kvalitet og vise årsager, men lider af problemer som frafald af kohorten. Det er også svært at få finansiering til langsigtede langsgående undersøgelser af høj kvalitet.

Eksempel: Kombination af tværsnits- og længdeforskning


Det Surrey kommunikation og sprog i uddannelsesstudie (SCALES ) er et godt eksempel på en langsigtet langsgående undersøgelse, som også omfattede nogle tværsnitselementer.

Det første element i undersøgelsen var en omfattende undersøgelse af børn i receptionen på 180 grundskoler i Surrey. Alle børn i befolkningen blev screenet for sproglige evner ved skoletilgang via en undersøgelse udført af klasselærere for hvert barn. De blev spurgt om adfærd, sprog og sociale færdigheder. Dette gav et øjebliksbillede af sproglige evner ved skoletilgangen og gjorde det muligt for forskerne at vurdere, om læseplanen matchede evnen, og fastslå, at yngre børn var mere tilbøjelige til at have sprogproblemer.

hvad er de to målesystemer?

Den næste fase valgte en prøve på 590 børn fra de screenede, stratificeret ved hjælp af resultaterne fra første fase for at give en række sproglige evner. De blev set af en forsker i år 1 og igen i år 3, og deres sprogfærdigheder blev vurderet. Forældre blev også bedt om at give oplysninger om sprog og adfærd på begge punkter.

Den næste fase fulgte den oprindelige SCALES-kohorte i år 6 og 8 for at vurdere deres sociale, følelsesmæssige og mentale sundhedsresultater.

Forskerne var interesserede i forbindelsen mellem sprogudvikling i den tidlige barndom og social og følelsesmæssig udvikling i ungdomsårene. Denne form for information kan simpelthen ikke indsamles fra et tværsnitsstudie eller fra to separate studier i forskellige aldre. Du kan bede deltagere og forældre om at tænke tilbage, men tidsforskellen er sådan, at erindring sandsynligvis ikke er pålidelig.

Kategoriske, kontinuerlige, diskrete og klassificerede data

En anden skelnen er kategoriske, kontinuerlige, diskrete eller rangerede data:

  • Kategoriske data er opdelt i forskellige grupper eller kategorier .

    De inkluderer derfor f.eks. Køn, uanset om du kan lide is, og hvis du nogensinde har besøgt et bestemt land. De kan også omfatte alder, hvis den er grupperet i ti- eller fem-årige klumper.

  • Kontinuerlige data defineres som dem, der kan tage et uendeligt antal værdier mellem to værdier.

    Dette lyder kompliceret, men er faktisk simpelt. Dette er data som vægt eller højde, som kan være en hvilken som helst værdi inden for området af mulige vægte og højder, ikke faste værdier eller procentdel af en klasse, der kan lide is (enhver værdi inden for området 0-100%). Hvert datapunkt er et særskilt og separat nummer og falder ikke ind i en gruppe. Alder vil for eksempel være inkluderet, hvis du måler det meget præcist i dage eller brøkdele af et år snarere end hele år.

  • Diskrete data defineres som dem, der har et defineret antal mulige værdier mellem to værdier

    Diskrete data inkluderer derfor antallet af kundeklager eller antallet af mennesker, der kan lide is, dvs. du kan ikke have en halv klage eller en tredjedel af en person. Et andet eksempel ville være alder i hele år. Med henblik på analyse betragtes diskrete data som meget lig løbende data.

  • Rangerede data er sorteret og ordnet og derefter nummereret efter deres rangordning

    Hvis du for eksempel havde fire bits data med værdierne 4, 6, 3 og 7, kunne du rangere dem i stigende rækkefølge som 3, 4, 6 og 7. De ville derefter tage deres rangordning, så 3 ville være 1 (1.), 4 ville være 2 (2.) osv. Data rangeres generelt, når alt, hvad der interesserer dig, er rækkefølgen og ikke de absolutte værdier. Dette er normalt tilfældet, når to variabler skifter sammen, men ikke har et lineært forhold (det vil sige, de ændres i forskellige hastigheder). For eksempel viser grafen nedenfor denne type forhold (i dette tilfælde eksponentielt).

    Graf, der viser eksponentielt forhold mellem to variabler.

    Advarsel!


    Det er vigtigt at huske, at når du rangerer data, mister du oplysninger.

    Dette skal derfor kun gøres, når du virkelig har brug for det.


Disse fire typer data er velegnede til forskellige typer analyser - og du bliver nødt til at bruge forskellige statistiske tests og analyseformer til hver.

For mere om brug af forskellige typer data til analyse, kan du se på vores side på Korrelationer .

Konklusion

Der er mange forskellige typer data, som du muligvis indsamler som en del af din forskning. Valget af datatype er normalt drevet af dine forskningsmetoder, som igen er drevet af dit forskningsspørgsmål og din generelle tilgang til forskning. Valget af datatype har imidlertid også konsekvenser for typen af ​​analyse og de konklusioner, du kan drage.


Forsæt med:
Forståelse af sammenhænge
Enkel statistisk analyse