데이터로 작업하기 전에 데이터가 유효하고 정확하며 신뢰할 수 있는지 확인해야 합니다. 빅데이터 시대에 기업들은 애초에 데이터를 수집하거나 구매하는 데 지출하는 만큼 건강을 유지하고 데이터를 정리하는 데 많은 돈을 쓸 수 있다. 누락되거나 잘못된 값,중복 및 오타가 발생할 수 있는 문제를 고려하십시오. 계산의 유효성,정확성 및 신뢰성은 데이터를 최신 상태로 유지하는 능력에 달려 있습니다. 많은 추정에 따르면 데이터의 약 30%가 시간이 지남에 따라 부정확해질 수 있으며(2019 년,2019 년,2019 년,2019 년,2019 년),심지어 작은 데이터 세트조차도 수십 또는 수십만 개의 레코드인 파일은 물론 대규모 데이터베이스를 사용하는 경우 훨씬 더 많은 비용이 소요될 수 있습니다.

다양한 파일 형식,데이터 볼륨 또는 예산을 위한 많은 데이터 정리 솔루션이 있습니다. 그러나,우리는 당신이 신속하고 효과적으로 우리의 데이터를 처리 할 수 있도록 엑셀 기능과 기능을 사용하여 수행 할 수있는 많은 일이있다. 대신,응용 프로그램을 구입 직원에게 데이터 청소를 할당하거나,시트 당 백만에서 기록을 위해,데이터를 스크럽 서비스를 고용,엑셀은 당신에게 시간과 다양한 기능과 기능을 사용하여 자금의 큰 거래를 절약 할 수 있습니다. 표 10.1 에서는 데이터를 정리하는 데 도움이 되는 몇 가지 중요한 기능을 보여 줍니다.

정리 텍스트에서 인쇄 할 수없는 모든 문자를 제거합니다.
트림 단어 사이의 단일 공백을 제외한 텍스트에서 모든 공백을 제거합니다.
연결 두 개 이상의 텍스트 문자열을 하나의 문자열로 결합합니다.
왼쪽 문자열의 왼쪽에서 지정된 문자 수를 포함하는 문자열을 반환합니다.
오른쪽 문자열의 오른쪽에서 지정된 문자 수를 포함하는 문자열을 반환합니다.
중간 은 텍스트 문자열에서 특정 문자 수를 반환합니다.
검색 검색은 특정 문자 또는 텍스트 문자열을 처음 찾은 문자 수를 반환합니다.
두 번째 텍스트 문자열 내에서 하나의 텍스트 문자열을 찾습니다.
상단 텍스트를 대문자로 변환합니다.
하위 은 텍스트를 소문자로 변환합니다.
적절한 는 텍스트 문자열의 첫 글자와 문자 이외의 문자 뒤에 오는 텍스트의 다른 문자를 대문자로 표시합니다. 다른 모든 문자를 소문자로 변환합니다.
텍스트 서식 코드로 서식을 적용하여 숫자가 나타나는 방식을 변경합니다.
숫자를 나타내는 텍스트 문자열을 숫자로 변환합니다.

표 10.1 엑셀의 텍스트 및 데이터 정리 기능 샘플.

다음 섹션에서는 위의 기능을 보여 줍니다. 네 개의 시트가 포함되어 있습니다. 문서 시트는 우리의 데이터의 소스를 지적한다. 데이터 세트에서 볼 수 있는 일반적인 오류에는 잘못된 위치의 줄 바꿈,단어 사이의 공백 또는 공백 없음,인쇄되지 않는 문자,잘못 대문자 또는 모든 대문자,모든 소문자 텍스트,잘못된 형식의 데이터 값 등이 있습니다. 2876>에서 생성된 회사에 대한”가짜”(그럴듯하지만 실제는 아님)데이터 세트가 포함되어 있습니다.이 장의 저자는 장 실습 섹션에서 엑셀 기능을 수행하기 위해 데이터를 펼치고 처리하기 위해 의도적으로 데이터에서 볼 수있는 일반적인 오류를 의도적으로 주입했습니다. 이 데이터 세트는 편지 병합 섹션에 사용됩니다. 이”더미”데이터 세트는 모두 교육 목적으로 여기에 보관됩니다.

아래 그림 10.1.1 은 다른 소스에서 가져온 데이터에 나타나는 다양한 일반적인 오류가 있는 텍스트 시트를 보여줍니다. 연결&트림 범위는 두 개의 엑셀 함수를 중첩하여 세 행의 내용에서 한 줄의 텍스트를 만들 수있는 방법의 예입니다. 하나에 세 개의 셀을 병합합니다 자체에 연결,하지만 혼자,그것은 우리가 텍스트에서 볼 수있는 여분의 공간에 대해 아무것도하지 않습니다. 트림은 우리가 엑셀이 단어 사이에 필요한 빈 셀을 추가하기 위해””추가 할 필요가 의미 모든 공백을 제거합니다.

그림 10.1.1 원본 및 정리된 콘텐츠가 나란히 있는 텍스트 시트.

열의 왼쪽,오른쪽,중간 범위는 데이터를 처리하는 데 사용되는 또 다른 공통 함수 집합을 보여줍니다. 종종 데이터는 함께 병합 된 큰 청크로 제공됩니다. 우리는 데이터를 사용할 수 있지만>열에 텍스트는 우리가 우리의 데이터 분할을 원하는 엑셀을 말할 구분 기호와 기능,왼쪽,오른쪽,중간 함수는 문자열의 위치에 따라 특정 방향에서 데이터를 처리합니다 우리가 추출하고자하는 텍스트 또는 숫자입니다. 중간 기능을 사용하는 부분을 씨 9,씨 10 으로 추출 할 수 있습니다. 비 12 과 비 13 코스 번호 표시 오른쪽 및 왼쪽 함수를 사용하여 일부를 추출 할 수 있습니다 씨 12,씨 13.

그림 10.1.2 는 열의 수식을 보여줍니다.:다양한 방법으로 중첩된 연결 및 트림의 조합을 설명하기 위해 왼쪽,오른쪽 및 중간 구문과 함께 텍스트를 표시하려는 방식으로 출력할 수 있는 최상의 구성을 찾습니다.

그림 10.1.3 아래 그림 10.1.3 은 열의 수식을 보여 줍니다.

그림 10.1.3 열에 대해”수식 표시”옵션이 활성화된 텍스트

엑셀의 일반적인 텍스트 기능 목록에 대한 공식 마이크로 소프트 사이트를 방문하십시오.

비교적 간단한 수식과 중첩 된 대안을 사용하여 달성 할 수있는 다양한 작업을 관찰하십시오.

“참고:텍스트 기능을 사용하여 서식을 변경할 수 있지만 유일한 방법은 아닙니다. 다음 서식 셀>숫자 대화 상자(소스)에서 원하는 형식을 선택 합니다.”

데이터를 정리하기 위해 이러한 함수의 가능한 사용을 고려하십시오. 우리는 장 연습에 이러한 기능과 구분 기호의 사용을 다시 방문합니다.

2018 년 10 월 15 일~2018 년 10 월 15 일~2018 년 10 월 15 일~2018 년 10 월 15 일 3.0. https://www.generatedata.com/과https://mockaroo.com의 더미 데이터 세트는 교육 목적으로 여기에 보관됩니다.

미디어 속성

  • 그림 _10-1
  • 그림 _10-2
  • 그림 _10-3

답글 남기기

이메일 주소는 공개되지 않습니다.

lg