SAS Data-sat?
안녕하세요
오늘은 데이터셋이란 무엇인지
데이터셋이 어떻게 구성되어있는지
그리고 그 안에 변수들은 어떤 특성을 가지고 있는지
알아보도록 하겠습니다.
1. 데이터셋(Data-set)이란?
컴퓨터에서 사용할 수 있도록 저장된 데이터 자료들의 집합체
그럼 SAS 프로그램에서는
이런 데이터 셋을 어떻게 표현할까요?
라이브러리 이름 : onelib
데이터셋 이름 : docjab으로
SAS에서 데이터셋을 표현해보겠습니다.
2. SAS 데이터셋(Data-set)?
library이름.dataset이름
(예시) onelib.docjab
느낌이 오시나요?
데이터셋이 위치한 라이브러리의 이름을 앞에 써주고
마침표( . )를 찍어준 후
뒤에는 데이터셋의 이름을 써주는 방식입니다.
참고로 영구 라이브러리인 work 라이브러리에
데이터셋이 있다면
마침표( . ) 앞에 라이브러리 이름을
생략해줄 수 있습니다
혹시 라이브러리에 대해 궁금하시면
라이브러리를 설명한 이전 포스트
를 참고해주세요
3. SAS 데이터셋 구성?
OBS | name(Var1) | customer_code(Var2) |
1 | HongGilDong | 20210105 |
2 | KimYoungHee | 20220308 |
* OBS = Observation(관측치, 행)
* Var = Variable(변수, 열)
SAS의 Data-set은 위와 같이
행과 열로 구성되어 있습니다.
위의 표는
2개의 관측치(obs) 행에
이름과 고객 코드를 변수(Var)로
가지고 있습니다.
그럼 변수(Var)의 종류에 대해
조금만 더 알아보겠습니다.
4. 변수의 종류?
종류 | 예시 |
문자형 | ex. 5veas, data1, casef |
숫자형 | ex. 5 , -1 , 0 |
* 결측치의 경우, 문자형은 마침표(.) 숫자형은 공백( )으로 표시됨
* 대소문자 구분 없음
변수의 종류는
문자형과 숫자형이 있습니다.
대소문자의 구분은 없으며
결측치의 경우
문자형은 마침표( . )
숫자형은 공백( )으로
표시되는 차이가 있습니다.
오늘은 데이터셋이란 무엇인지
sas에서 데이터셋은 어떻게 표현되는지
데이터셋을 구성하는 변수는
어떤 유형들이 있는지 알아보았습니다.
다음에는 좀 더 심화된 내용으로
찾아오겠습니다.
'SAS 쎄스' 카테고리의 다른 글
[SAS] 라이브러리란? (개념, 설정, 해제 방법) (0) | 2022.07.05 |
---|
댓글