[Programmers][MySQL] 멸종위기의 대장균 찾기
Lv.5 🔗멸종위기의 대장균 찾기
📝문제 요약
문제 설명
대장균들은 일정 주기로 분화하며, 분화를 시작한 개체를 부모 개체, 분화가 되어 나온 개체를 자식 개체라고 합니다.
다음은 실험실에서 배양한 대장균들의 정보를 담은 ECOLI_DATA
테이블입니다. ECOLI_DATA
테이블의 구조는 다음과 같으며, ID
, PARENT_ID
, SIZE_OF_COLONY
, DIFFERENTIATION_DATE
, GENOTYPE
은 각각 대장균 개체의 ID, 부모 개체의 ID, 개체의 크기, 분화되어 나온 날짜, 개체의 형질을 나타냅니다.
Column name | Type | Nullable |
---|---|---|
ID | INTEGER | FALSE |
PARENT_ID | INTEGER | TRUE |
SIZE_OF_COLONY | INTEGER | FALSE |
DIFFERENTIATION_DATE | DATE | FALSE |
GENOTYPE | INTEGER | FALSE |
최초의 대장균 개체의 PARENT_ID
는 NULL 값입니다.
문제
각 세대별 자식이 없는 개체의 수(COUNT
)와 세대(GENERATION
)를 출력하는 SQL문을 작성해주세요. 이때 결과는 세대에 대해 오름차순 정렬해주세요. 단, 모든 세대에는 자식이 없는 개체가 적어도 1개체는 존재합니다.
예시
예를 들어 ECOLI_DATA
테이블이 다음과 같다면
ID | PARENT_ID | SIZE_OF_COLONY | DIFFERENTIATION_DATE | GENOTYPE |
---|---|---|---|---|
1 | NULL | 10 | 2019/01/01 | 5 |
2 | NULL | 2 | 2019/01/01 | 3 |
3 | 2 | 100 | 2020/01/01 | 4 |
4 | 2 | 16 | 2020/01/01 | 4 |
5 | 2 | 17 | 2020/01/01 | 6 |
6 | 4 | 101 | 2021/01/01 | 22 |
7 | 4 | 101 | 2022/01/01 | 23 |
8 | 6 | 1 | 2022/01/01 | 27 |
각 세대별 대장균의 ID는 다음과 같습니다.
1 세대 : ID 1, ID 2
2 세대 : ID 3, ID 4, ID 5
3 세대 : ID 6, ID 7
4 세대 : ID 8
이 때 각 세대별 자식이 없는 대장균의 ID는 다음과 같습니다.
1 세대 : ID 1
2 세대 : ID 3, ID 5
3 세대 : ID 7
4 세대 : ID 8
따라서 결과를 세대에 대해 오름차순 정렬하면 다음과 같아야 합니다.
COUNT | GENERATION |
---|---|
1 | 1 |
2 | 2 |
1 | 3 |
1 | 4 |
✏️문제 풀이
WITH
WITH RECURSIVE ECOLI_TREE AS (
SELECT ID, 0 AS GENERATION
FROM ECOLI_DATA
WHERE PARENT_ID IS NULL
UNION ALL
SELECT E.ID, GENERATION + 1
FROM ECOLI_DATA E INNER JOIN ECOLI_TREE ET ON E.PARENT_ID = ET.ID
),
NO_CHILD_ECOLI AS (
SELECT E.ID, GENERATION
FROM ECOLI_TREE ET LEFT JOIN ECOLI_DATA E ON ET.ID = E.PARENT_ID
WHERE E.ID IS NULL
)
WITH RECURSIVE ECOLI_TREE AS (...)
-
ECOLI_DATA
테이블에서PARENT_ID
가 NULL인 레코드들을 시작으로 (세대 0)SELECT ID, 0 AS GENERATION FROM ECOLI_DATA WHERE PARENT_ID IS NULL
-
부모(
PARENT_ID
)를 따라가면서 자식들을 계속 이어서 트리처럼 확장해 나가면서 각 세포가 몇 세대(GENERATION
)에 해당하는지 구함(세대 = 부모 세대 + 1)UNION ALL SELECT E.ID, GENERATION + 1 FROM ECOLI_DATA E INNER JOIN ECOLI_TREE ET ON E.PARENT_ID = ET.ID
-
이 과정이 재귀적으로 반복되면서 전체 세포 가계도가 만들어짐
-
NO_CHILD_ECOLI AS (...)
-
ECOLI_TREE
결과에서 자식이 없는 세포만 따로 뽑음SELECT E.ID, GENERATION FROM ECOLI_TREE ET LEFT JOIN ECOLI_DATA E ON ET.ID = E.PARENT_ID WHERE E.ID IS NULL
LEFT JOIN
으로 각 세포의 자식을 찾음- 자식이 없으면(
E.ID
가NULL
) => 이 세포는 자식이 없는 세포
-
SELECT
SELECT COUNT(*) AS COUNT, GENERATION + 1 AS GENERATION
COUNT(*)
: 자식 없는 세포 개수GENERATION
GENERATION + 1
: 세대 번호를 1 더해서 표시(가장 부모 세포는 1부터 시작)
FROM
FROM NO_CHILD_ECOLI
NO_CHILD_ECOLI
테이블. 즉, 자식이 없는 세포가 저장되어 있는 테이블을 가져옴
GROUP BY
GROUP BY 2
- 2번 컬럼(
GENERATION
) 기준으로 그룹화
ORDER BY
ORDER BY 2
- 2번 컬럼(
GENERATION
) 기준으로 오름차순 정렬
💯제출 코드
WITH RECURSIVE ECOLI_TREE AS (
SELECT ID, 0 AS GENERATION
FROM ECOLI_DATA
WHERE PARENT_ID IS NULL
UNION ALL
SELECT E.ID, GENERATION + 1
FROM ECOLI_DATA E INNER JOIN ECOLI_TREE ET ON E.PARENT_ID = ET.ID
),
NO_CHILD_ECOLI AS (
SELECT E.ID, GENERATION
FROM ECOLI_TREE ET LEFT JOIN ECOLI_DATA E ON ET.ID = E.PARENT_ID
WHERE E.ID IS NULL
)
SELECT COUNT(*) AS COUNT, GENERATION + 1 AS GENERATION
FROM NO_CHILD_ECOLI
GROUP BY 2
ORDER BY 2
댓글남기기