Organisering Av Datasett

Velge en godt gjennomtenkt system av data organisasjon kan bidra til å holde på sporet med dataene hvis det er flere versjoner av datasett eller endringer i datasett. Dette gjelder spesielt i større grupper. Til å begynne med dataorganisasjonen din må du definere strukturen til forskningsdataene dine. De viktigste strukturtyper er vist nedenfor:

Mulige måter å organisere data
Mulige måter å organisere data På. A: Rektangulær organisering av ikke-hierarkiske data. B: Data med to hierarkiske nivåer (emne og måling anledning) i «wide» format. C: Data med to hierarkiske nivåer i» lang » format. D: Mønster for en hierarkisk strukturert datafil. E: Relasjonsdatabase struktur.
  • Flat rektangulære filer eller tabelldata Er en klassisk og fortsatt ofte brukt datastruktur som kan leses av alle statistiske og regnearkprogrammer.
    • en vanlig måte å strukturere rektangulære filer på er bredformatet (tabell A i bildet ovenfor): kolonner representerer forskjellige variabler, mens linjer representerer forskjellige observasjoner (f.eks. emner). Imidlertid oppstår problemer i bredformat når data er hierarkisk strukturert, for eksempel i design med gjentatte mål (se tabell B i bildet ovenfor). Hvis antall målehendelser varierer mellom observasjoner, vil mange celler stå tomme ved design.
    • en løsning kan være å bruke det lange formatet for datasettet (se tabell C på bildet ovenfor). I langformat viser hver linje en observasjonsenhet (f. eks. en måling anledning for en bestemt person) og en variabel karakteriserer måling anledning (f. eks dag 1, pre-test etc.). Dette formatet tillater representasjon av hierarkiske data i en klassisk rektangulær fil. Filer i lang format vil inneholde noen oppsigelser, fordi funksjonene i de høyere ordensobservasjonsenhetene gjentas i hver linje (f.eks. tidsinvariante variabler som fagets kjønn eller fødselsår). Siden funksjoner i statistiske pakker vanligvis bare fungerer med ett av disse formatene, er transformasjoner mellom bredformat og langformat en hyppig oppgave ,og tilsvarende funksjoner eksisterer(f. eks.
  • Hierarkiske filer kan benyttes for å unngå oppsigelser, som oppstår, når du bruker rektangulære filer (se tabell E i bildet ovenfor). XML-filer oppfyller dette kravet og tillater å lagre data og metadata i en enkelt fil. MEN TIL tross FOR disse fordelene XML-filer er ikke vanlig i psykologi og statistisk programvare krever ofte tabelldata som input.
  • Relasjonsdatabaser organiserer data av forskjellige hierarkiske nivåer i separate rektangulære tabeller mens de forskjellige tabellene er koblet sammen gjennom definerte foreninger. Individuelle tabeller kan analyseres statistisk eller knyttes til nye tabeller. Relasjonsdatabaser kan skildre komplekse foreninger på en elegant måte, men de trenger mer administrasjon og kunnskap om databasespråk(F. EKS.

Organisering Av Forskningsdata

da det verken finnes beste praksis eller navnekonvensjoner som eksplisitt refererer til psykologiske forskningsdata, anbefaler Vi veiledningen utviklet i PROSJEKTNIVÅ: Undervisningsintegritet I Empirisk Forskning som utgangspunkt for mappe-og filorganisering i empiriske forskningsprosjekter.

videre kan den generelle veiledningen om utforming av navnekonvensjoner Fra Boston University Libraries (nd) være nyttig:

  • filnavnet du velger, skal brukes konsekvent i filene dine (inkluder alltid samme informasjon, i samme rekkefølge)

Vurder hvordan, fra et fremtidig synspunkt, filene dine skal organiseres, f. eks. project_instrument_location_date_time_version.

  • du bør alltid inkludere datoer i filnavnene dine slik at endringer kan spores tilbake; bruk format ÅÅÅÅ-MM-DD.
  • Unngå følgende symboler i filnavnene dine: «/ \ : * ? » < > & $. De har spesifikke betydninger i noen operativsystemer og dermed kan føre til misreadings eller sletting av filen.
  • ikke bruk mellomrom for å skille mellom termer, bruk i stedet understrek (_).
  • Prøv å navngi mapper på en beskrivende måte, slik at det er klart hva den inneholder, og hold navnene korte (maks 15-20 tegn.)
  • også prøve å holde filnavn kort og beskrivende (< 25 tegn)
  • hvis du ikke bruker en automatisk versjonskontroll programvare, inkludere versjonsnumre på slutten av filnavnet (f.eks v01, v02,..) og endre det hver gang filen er lagret (se også kunnskapsbasens seksjon om versjonskontroll). Dette er spesielt viktig hvis det er flere personer som jobber sammen på filene, slik at endringer kan spores.
  • for den endelige versjonen bruker du ORDET ENDELIG i stedet for et versjonsnummer. Dette er spesielt nyttig og viktig hvis du deler filene dine!
  • Filnavn bør bare inneholde en periode før filtypen, f. eks project_name_date.doc IKKE project.name.date.doc eller project_name_date..doc)
  • hvis du allerede har navngitt mange av filene dine, kan du endre navn på dem raskt ved å bruke en fil døpe program Som Bulk Rename Utility (Windows), ReNamer (Mac OS X) eller PSRenamer (Mac OS X, Windows, Unix, Linux), Og Zamzar (konvertere filer på nettet).

DataWiz webapplikasjonen hjelper deg med å organisere forskningsdataene dine ved å tilby en forhåndsdefinert struktur og dokumentasjonsordning for forskningsprosjektet ditt.

Ytterligere Ressurser

  • SQL er et programmeringsspråk som er spesialisert på å håndtere data i relasjonsdatabasebehandlingssystemer.
  • XML ER et interoperabelt menneske-og maskinlesbart kodespråk og er mye brukt i forskningsdatahåndtering på grunn av sin enkelhet og generiske brukervennlighet.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert.

lg