[Programmers][MySQL] 멸종위기의 대장균 찾기

April 28, 2025

📝문제 요약

문제 설명

대장균들은 일정 주기로 분화하며, 분화를 시작한 개체를 부모 개체, 분화가 되어 나온 개체를 자식 개체라고 합니다.

다음은 실험실에서 배양한 대장균들의 정보를 담은 ECOLI_DATA 테이블입니다. ECOLI_DATA 테이블의 구조는 다음과 같으며, ID, PARENT_ID, SIZE_OF_COLONY, DIFFERENTIATION_DATE, GENOTYPE 은 각각 대장균 개체의 ID, 부모 개체의 ID, 개체의 크기, 분화되어 나온 날짜, 개체의 형질을 나타냅니다.

Column name	Type	Nullable
ID	INTEGER	FALSE
PARENT_ID	INTEGER	TRUE
SIZE_OF_COLONY	INTEGER	FALSE
DIFFERENTIATION_DATE	DATE	FALSE
GENOTYPE	INTEGER	FALSE

최초의 대장균 개체의 PARENT_ID 는 NULL 값입니다.

문제

각 세대별 자식이 없는 개체의 수(COUNT)와 세대(GENERATION)를 출력하는 SQL문을 작성해주세요. 이때 결과는 세대에 대해 오름차순 정렬해주세요. 단, 모든 세대에는 자식이 없는 개체가 적어도 1개체는 존재합니다.

예시

예를 들어 ECOLI_DATA 테이블이 다음과 같다면

ID	PARENT_ID	SIZE_OF_COLONY	DIFFERENTIATION_DATE	GENOTYPE
1	NULL	10	2019/01/01	5
2	NULL	2	2019/01/01	3
3	2	100	2020/01/01	4
4	2	16	2020/01/01	4
5	2	17	2020/01/01	6
6	4	101	2021/01/01	22
7	4	101	2022/01/01	23
8	6	1	2022/01/01	27

각 세대별 대장균의 ID는 다음과 같습니다.

1 세대 : ID 1, ID 2

2 세대 : ID 3, ID 4, ID 5

3 세대 : ID 6, ID 7

4 세대 : ID 8

이 때 각 세대별 자식이 없는 대장균의 ID는 다음과 같습니다.

1 세대 : ID 1

2 세대 : ID 3, ID 5

3 세대 : ID 7

4 세대 : ID 8

따라서 결과를 세대에 대해 오름차순 정렬하면 다음과 같아야 합니다.

COUNT	GENERATION
1	1
2	2
1	3
1	4

✏️문제 풀이

WITH

WITH RECURSIVE ECOLI_TREE AS (
    SELECT ID, 0 AS GENERATION
    FROM ECOLI_DATA
    WHERE PARENT_ID IS NULL
    
    UNION ALL
    
    SELECT E.ID, GENERATION + 1
    FROM ECOLI_DATA E INNER JOIN ECOLI_TREE ET ON E.PARENT_ID = ET.ID
),
NO_CHILD_ECOLI AS (
    SELECT E.ID, GENERATION
    FROM ECOLI_TREE ET LEFT JOIN ECOLI_DATA E ON ET.ID = E.PARENT_ID
    WHERE E.ID IS NULL
)

WITH RECURSIVE ECOLI_TREE AS (...)
- ECOLI_DATA 테이블에서 PARENT_ID가 NULL인 레코드들을 시작으로 (세대 0)
```
  SELECT ID, 0 AS GENERATION
  FROM ECOLI_DATA
  WHERE PARENT_ID IS NULL
```
- 부모(PARENT_ID)를 따라가면서 자식들을 계속 이어서 트리처럼 확장해 나가면서 각 세포가 몇 세대(GENERATION)에 해당하는지 구함(세대 = 부모 세대 + 1)
```
  UNION ALL
        
  SELECT E.ID, GENERATION + 1
  FROM ECOLI_DATA E INNER JOIN ECOLI_TREE ET ON E.PARENT_ID = ET.ID
```
- 이 과정이 재귀적으로 반복되면서 전체 세포 가계도가 만들어짐
NO_CHILD_ECOLI AS (...)
- ECOLI_TREE 결과에서 자식이 없는 세포만 따로 뽑음
```
  SELECT E.ID, GENERATION
  FROM ECOLI_TREE ET LEFT JOIN ECOLI_DATA E ON ET.ID = E.PARENT_ID
  WHERE E.ID IS NULL
```
  - LEFT JOIN으로 각 세포의 자식을 찾음
  - 자식이 없으면(E.ID가 NULL) => 이 세포는 자식이 없는 세포

SELECT

SELECT COUNT(*) AS COUNT, GENERATION + 1 AS GENERATION

COUNT(*): 자식 없는 세포 개수
GENERATION
- GENERATION + 1: 세대 번호를 1 더해서 표시(가장 부모 세포는 1부터 시작)

FROM

FROM NO_CHILD_ECOLI

NO_CHILD_ECOLI 테이블. 즉, 자식이 없는 세포가 저장되어 있는 테이블을 가져옴

GROUP BY

GROUP BY 2

2번 컬럼(GENERATION) 기준으로 그룹화

ORDER BY

ORDER BY 2

2번 컬럼(GENERATION) 기준으로 오름차순 정렬

💯제출 코드

WITH RECURSIVE ECOLI_TREE AS (
    SELECT ID, 0 AS GENERATION
    FROM ECOLI_DATA
    WHERE PARENT_ID IS NULL
    
    UNION ALL
    
    SELECT E.ID, GENERATION + 1
    FROM ECOLI_DATA E INNER JOIN ECOLI_TREE ET ON E.PARENT_ID = ET.ID
),
NO_CHILD_ECOLI AS (
    SELECT E.ID, GENERATION
    FROM ECOLI_TREE ET LEFT JOIN ECOLI_DATA E ON ET.ID = E.PARENT_ID
    WHERE E.ID IS NULL
)

SELECT COUNT(*) AS COUNT, GENERATION + 1 AS GENERATION
FROM NO_CHILD_ECOLI
GROUP BY 2
ORDER BY 2

Lee Hyun Ji