관계 대수(Relational Algebra), 데이터를 어떻게 얻을지를 명확히 정의하는 절차적 질의 언어입니다. 데이터를 조작하고 검색하기 위한 여러 연산자로 구성되어 있으며, 이러한 연산자를 조합하여 복잡한 질의도 구현할 수 있습니다.
관계 대수의 기본 개념
관계 대수는 릴레이션(Relation), 즉 테이블의 구조를 조작하여 원하는 결과를 얻기 위한 연산들의 집합입니다. 관계 대수의 연산은 크게 두 가지로 나뉩니다:
일반집합 연산자
일반집합 연산자는 집합 이론에서 차용된 연산자로, 데이터베이스 릴레이션 간의 집합 연산을 수행합니다.
합집합(Union, ∪)
합집합 연산은 두 테이블에서 모든 튜플을 결합하여 중복을 제거합니다.
표기법:
R ∪ S
예시
-
R과 S의 모든 튜플을 포함하는 집합 생성
교집합(Intersection, ∩)
교집합 연산은 두 테이블에서 공통으로 존재하는 튜플을 반환합니다.
표기법
R ∩ S
예시
-
R과 S 모두에 포함된 튜플 반환
차집합(Difference, -)
차집합 연산은 첫 번째 테이블에 존재하면서 두 번째 테이블에는 없는 튜플을 반환합니다.
표기법
R - S
예시
-
R에는 있지만 S에는 없는 튜플 반환
교차곱(Cartesian Product, ×)
교차곱은 두 테이블의 모든 가능한 튜플 쌍을 생성합니다.
표기법
R × S
예시
-
테이블 R의 각 튜플과 S의 각 튜플을 조합한 결과 반환
순수 관계 연산자
순수 관계 연산자는 관계형 모델에서 데이터 조작을 위해 고안된 연산자들로, 데이터베이스 특화 연산입니다.
선택(Selection, σ)
선택 연산은 테이블에서 주어진 조건을 만족하는 튜플(행)들을 선택합니다.
표기법:
σ_condition(R)
예시
-
테이블 R에서 ‘age > 30’인 튜플만 선택:
σ_age>30(R)
투영(Projection, π)
투영 연산은 테이블에서 특정 속성(열)만을 선택합니다.
표기법
π_attribute1,attribute2,...(R)
예시
-
테이블 R에서 이름(name)과 나이(age) 열만 선택:
π_name,age(R)
조인(Join)
조인은 두 테이블의 튜플을 특정 조건에 따라 결합합니다. 조인의 종류에는 여러 가지가 있습니다.
-
내부 조인(Inner Join): 공통 속성을 기준으로 결합
-
자연 조인(Natural Join): 동일한 속성을 자동으로 매칭하여 결합
-
세타 조인(Theta Join): 특정 조건(θ)을 만족하는 튜플만 결합
표기법
R ⋈ S
예시
-
테이블 R과 S를 공통 속성으로 결합
디비전(Division)
디비전 연산은 테이블 R에서 테이블 S에 있는 모든 속성을 포함하는 튜플만 반환합니다.
표기법
R ÷ S
예시
-
R에서 S의 속성 값을 모두 만족하는 튜플 반환
관계 대수와 SQL의 관계
관계 대수는 SQL의 이론적 기반으로, SQL에서 사용하는 SELECT, JOIN, WHERE, UNION과 같은 명령어가 관계 대수의 연산자와 대응됩니다. 관계 대수는 데이터베이스의 내부 처리 과정을 이해하는 데 도움을 주며, 효율적인 쿼리 작성에 기여합니다.
결론
관계 대수는 관계형 데이터베이스의 근간이 되는 강력한 이론적 도구입니다. 관계 대수의 연산을 이해하면 데이터베이스의 작동 원리를 더욱 명확히 이해할 수 있습니다. 데이터베이스 성능 최적화 및 문제 해결에 관심이 있다면 관계 대수의 원리를 깊이 탐구해 보시기 바랍니다.