Før vi kan jobbe med dataene våre, må vi sørge for at de er gyldige, nøyaktige og pålitelige. I En Alder Av Store Data kan selskaper bruke like mye eller mer på å opprettholde helsen og rense dataene sine som de bruker på å samle inn eller kjøpe det i utgangspunktet. Vurder problemene som kan stamme fra manglende eller feil verdier, duplikater og skrivefeil. Gyldigheten, nøyaktigheten og påliteligheten til beregningene avhenger av din evne til å holde dataene oppdatert. Mange estimater viser at omtrent 30% av dataene dine kan bli unøyaktige over tid (JD Supra, 2019; Strategisk DB, 2019), og selv små datasett kan være kostbare å rengjøre, enn si filer som er titalls eller hundretusenvis av poster dype – eller mye mer hvis du bruker store databaser.

det finnes mange dataløsninger der ute for et bredt spekter av filformater, datamengder eller budsjetter. Det er imidlertid mange ting vi kan oppnå Ved Hjelp Av Excel-funksjoner og funksjoner, slik at du kan behandle dataene våre raskt og effektivt. I Stedet for å kjøpe et program, tildele datarensing til en ansatt, eller ansette en tjeneste for å skrubbe dataene dine, for poster under en million per ark, Kan Excel spare deg for mye tid og penger ved hjelp av en rekke funksjoner og funksjoner. Tabell 10.1 viser noen viktige funksjoner som kan hjelpe deg med å rydde opp dataene dine.

RENGJØR Fjerner alle tegn som ikke kan skrives ut fra tekst.
TRIM Fjerner alle mellomrom fra tekst, bortsett fra enkelt mellomrom mellom ord.
KJEDE sammen Slå sammen to eller flere tekststrenger i en streng.
LEFT Returnerer en streng som inneholder et angitt antall tegn fra venstre side av en streng.
HØYRE Returnerer en streng som inneholder et angitt antall tegn fra høyre side av en streng.
MID Returnerer et bestemt antall tegn fra en tekststreng.
SØK søk returnerer tallet for tegnet der et bestemt tegn eller tekststreng først ble funnet.
FINN og FINDB Finn en tekststreng i en annen tekststreng.
ØVRE Konverterer tekst til store bokstaver.
NEDRE Konverterer tekst til små bokstaver.
RIKTIG Kapitaliserer den første bokstaven i en tekststreng og eventuelle andre bokstaver i tekst som følger et annet tegn enn et brev. Konverterer alle andre bokstaver til små bokstaver.
TEKST Endre måten et tall vises på ved å bruke formatering på det med formatkoder.
VERDI Konverterer en tekststreng som representerer et tall til et tall.

Tabell 10.1 et utvalg av tekst-og datarengjøringsfunksjoner I Excel.

følgende avsnitt viser funksjonene ovenfor i aksjon. Ch10_Data_File inneholder fire ark. Dokumentasjonsarket noterer kildene til våre data. Text_FUNC sheet har en rekke vanlige feil du kan se i et datasett, inkludert linjeskift på feil sted, ekstra mellomrom eller ingen mellomrom mellom ord, ikke-utskrift tegn, feil store bokstaver eller alle små bokstaver tekst, dårlig formaterte dataverdier. DataGen_Companies-arket inneholder et sett med» dummy » (plausibel, men ikke ekte) data om selskaper generert på https://www.generatedata.com/ at forfatteren av dette kapittelet med vilje injisert med vanlige feil sett i data for å utfolde seg og behandle det for å praktisere Excel-funksjoner for Kapittelpraksis-delen. Mockaroo_cars-arket er et» dummy » datasett om forbrukere og deres adresser generert på https://mockaroo.com/, dette datasettet vil bli brukt til Utskriftsfletting-delen. Begge disse» dummy » datasettene arkiveres her for utdanningsformål.

Figur 10.1.1 nedenfor viser Text_FUNC-arket med en rekke vanlige feil sett i data du importerer fra andre kilder. KJEDE & TRIM området er et eksempel på hvordan en enkelt linje med tekst kan opprettes fra innholdet i tre rader ved å hekke to Excel-funksjoner. SAMMENKOBLE på egen hånd vil slå sammen de tre cellene i en, men alene gjør det ingenting om de ekstra mellomrom vi ser i teksten. TRIM vil fjerne alle mellomrom, noe som betyr at Vi må legge til «» For At Excel skal legge til de nødvendige tomme cellene mellom ord.

Figur 10.1.1 Text_FUNC-arket med originalt og renset innhold side ved side.

VENSTRE, HØYRE, midtområde i kolonne A: C illustrerer et annet vanlig sett med funksjoner som brukes til å behandle data. Ofte kommer data i store biter fusjonert sammen. Mens Vi kan bruke Data > Tekst Til Kolonner-funksjonen med skilletegn for å fortelle Excel hvor vi vil at dataene skal deles, VIL VENSTRE, HØYRE, midtfunksjoner behandle data fra bestemte retninger avhengig av hvor i strengen er teksten eller nummeret vi ønsker å trekke ut. B9 og B10 viser et delenummer vi kan trekke ut deler av VED HJELP AV mid-funksjonen I C9, C10. B12 og B13 viser kursnumre vi kan trekke ut deler av VED HJELP AV høyre og VENSTRE funksjoner I C12, C13.

Figur 10.1.2 viser formlene I kolonne A:C for å illustrere kombinasjonen AV KJEDE sammen og TRIM nestet på en rekke måter for å finne den beste konfigurasjonen for å sende ut slik vi vil at teksten skal vises med syntaksen FOR VENSTRE, HØYRE og MIDT viser under.

Figur 10.1.2 Text_FUNC-arket med alternativet» Vis Formler » aktivert for kolonne A:C.

Figur 10.1.3 nedenfor viser formlene I kolonner F: H for å illustrere det forskjellige MELLOM SØK og SØK, samt vise ØVRE, NEDRE, RIKTIGE, VERDI-OG TEKSTFUNKSJONER som brukes til å produsere innholdet for data i disse områdene.

Figur 10.1.3 Text_FUNC med alternativet» Vis Formler » aktivert for kolonner F: H.

Gå Til Det Offisielle Microsoft-nettstedet for en liste over vanlige tekstfunksjoner i Excel.

Observer rekke oppgaver du kan oppnå ved å bruke relativt enkle formler og nestede alternativer.

«Merk: SELV OM DU kan bruke TEKST-funksjonen til å endre formatering, er DET ikke den eneste måten. Du kan endre formatet uten en formel ved å trykke CTRL+1 (Eller Bilde av Mac-Kommandoknappikonet +1 på Mac), og deretter velge formatet du vil bruke i Dialogboksen Formater Celler > Tall (Kilde).»

Vurder mulig bruk av disse funksjonene for å rense dataene dine. Vi vil revidere disse funksjonene og bruken av avgrensere i Kapittelpraksis.

NAVNGIVELSE

Kapittel Av Emese Felvé. CC BY-NC-SA 3.0. Dummy datasett fra https://www.generatedata.com/ og fra https://mockaroo.com arkivert her for pedagogiske formål.

Medieattribusjoner

  • Figure_10-1
  • Figure_10-2
  • Figure_10-3

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert.

lg