SAS연습200제/SAS데이터셋활용하기

Q_02_03. SAS 데이터셋 재활용하기 - SET 문

sas 2025. 3. 18. 21:26

SAS에서 기존 데이터셋을 재활용하여 새로운 데이터셋을 생성하려면 SET 문을 활용할 수 있습니다. SET 문은 기존 데이터셋을 그대로 가져와 새로운 데이터셋을 만들거나 필요한 변수 또는 조건을 추가하여 새로운 데이터셋을 생성할 때 유용합니다.

기본 예제

기존의 data1 데이터셋을 재활용하여 새로운 데이터셋 data2를 생성하는 기본 예제입니다.

data data2;
    set data1;
run;

이 코드는 data1 데이터셋의 모든 데이터를 data2로 복사합니다. 즉, data2는 data1의 복제본이 됩니다.

데이터셋 재활용 시 추가 변형 적용하기

SET 문을 사용할 때 조건을 추가하거나 변수를 새롭게 정의하여 원본 데이터셋을 변형할 수도 있습니다.

1) 새로운 변수 추가

기존 데이터셋의 변수 외에도 새로운 변수를 추가할 수 있습니다. 예를 들어, 기존 data1 데이터셋에 total 변수를 추가하여 새로운 데이터셋을 생성합니다.

data data2;
    set data1;
    total = var1 + var2; /* 기존 변수 var1과 var2의 합계를 새 변수 total로 생성 */
run;

2) 조건에 따라 데이터 필터링

특정 조건에 맞는 관측치만 새로운 데이터셋에 포함하고자 할 때, IF 문을 활용할 수 있습니다.

data data2;
    set data1;
    if age >= 18; /* age 변수가 18 이상인 관측치만 포함 */
run;

3) 변수 선택 및 이름 변경

 

특정 변수만 선택하거나 변수명을 변경해서 새로운 데이터셋을 만들 수 있습니다.

data data2;
    set data1(keep=name age); /* name과 age 변수만 선택 */
    rename age = age_years;   /* age 변수를 age_years로 이름 변경 */
run;

여러 데이터셋 재활용 및 결합

SET 문을 사용하여 여러 데이터셋을 아래로 결합할 수도 있습니다.

data combined_data;
    set data1 data2;
run;

이 코드는 data1과 data2의 관측치를 모두 포함하는 combined_data 데이터셋을 생성합니다.