Image

Lv.2 🔗연도별 대장균 크기의 편차 구하기

📝문제 요약

문제 설명

대장균들은 일정 주기로 분화하며, 분화를 시작한 개체를 부모 개체, 분화가 되어 나온 개체를 자식 개체라고 합니다.

다음은 실험실에서 배양한 대장균들의 정보를 담은 ECOLI_DATA 테이블입니다. ECOLI_DATA 테이블의 구조는 다음과 같으며, IDPARENT_IDSIZE_OF_COLONYDIFFERENTIATION_DATEGENOTYPE 은 각각 대장균 개체의 ID, 부모 개체의 ID, 개체의 크기, 분화되어 나온 날짜, 개체의 형질을 나타냅니다.

Column name Type Nullable
ID INTEGER FALSE
PARENT_ID INTEGER TRUE
SIZE_OF_COLONY INTEGER FALSE
DIFFERENTIATION_DATE DATE FALSE
GENOTYPE INTEGER FALSE

최초의 대장균 개체의 PARENT_ID 는 NULL 값입니다.


문제

분화된 연도(YEAR), 분화된 연도별 대장균 크기의 편차(YEAR_DEV), 대장균 개체의 ID(ID) 를 출력하는 SQL 문을 작성해주세요. 분화된 연도별 대장균 크기의 편차는 분화된 연도별 가장 큰 대장균의 크기 - 각 대장균의 크기로 구하며 결과는 연도에 대해 오름차순으로 정렬하고 같은 연도에 대해서는 대장균 크기의 편차에 대해 오름차순으로 정렬해주세요.


예시

예를 들어 ECOLI_DATA 테이블이 다음과 같다면

ID PARENT_ID SIZE_OF_COLONY DIFFERENTIATION_DATE GENOTYPE
1 NULL 10 2019/01/01 5
2 NULL 2 2019/01/01 3
3 1 100 2020/01/01 4
4 2 10 2020/01/01 4
5 2 17 2020/01/01 6
6 4 101 2021/01/01 22

분화된 연도별 가장 큰 대장균의 크기는 다음과 같습니다.

2019 : 10

2020 : 100

2021 : 101

따라서 각 대장균의 분화된 연도별 대장균 크기의 편차는 다음과 같습니다.

ID 1 : 10 - 10 = 0

ID 2 : 10 -2 = 8

ID 3 : 100 - 100 = 0

ID 4 : 100 - 10 = 90

ID 5 : 100 - 17 = 83

ID 6 : 101 -101 - 0

이를 분화된 연도에 대해 오름차순으로 정렬하고 같은 연도에 대해서는 대장균 크기의 편차에 대해 오름차순으로 정렬하면 결과는 다음과 같아야 합니다.

YEAR YEAR_DEV ID
2019 0 1
2019 8 2
2020 0 3
2020 83 5
2020 90 4
2021 0 6


✏️문제 풀이

WITH

WITH MAX_SIZE_BY_YEAR AS (
    SELECT 
        EXTRACT(YEAR FROM DIFFERENTIATION_DATE) AS YEAR,
        MAX(SIZE_OF_COLONY) AS MAX_SIZE
    FROM ECOLI_DATA
    GROUP BY EXTRACT(YEAR FROM DIFFERENTIATION_DATE)
)
  • 임시 테이블 MAX_SIZE_BY_YEAR를 만듦
  • SELECT
    • EXTRACT(YEAR FROM DIFFERENTIATION_DATE) : 연도만 추출해서 YEAR 컬럼으로 사용
    • MAX(SIZE_OF_COLONY) : 대장균들 중 가장 큰 크기를 구함
  • FROM : ECOLI_DATA
  • GROUP BY
    • EXTRACT(YEAR FROM DIFFERENTIATION_DATE) : 연도별로 그룹화

SELECT

SELECT 
    EXTRACT(YEAR FROM E.DIFFERENTIATION_DATE) AS YEAR,
    M.MAX_SIZE - E.SIZE_OF_COLONY AS YEAR_DEV,
    E.ID
  • YEAR
    • EXTRACT(YEAR FROM ...) : 개별 대장균의 분화 연도를 다시 추출해서 YEAR 컬럼으로 출력
  • YEAR_DEV
    • 해당 연도의 최대 크기에서 각 대장균의 크기를 뺀 값. 즉, 편차
  • E.ID: 대장균 개체의 고유 ID

FROM

FROM ECOLI_DATA E JOIN MAX_SIZE_BY_YEAR M
    ON EXTRACT(YEAR FROM E.DIFFERENTIATION_DATE) = M.YEAR
  • ECOLI_DATA 테이블과 임시로 만든 테이블 MAX_SIZE_BY_YEAR 를 연도를 기준으로 JOIN

ORDER BY

ORDER BY YEAR, YEAR_DEV
  • YEAR : 연도 기준으로 오름차순 정렬
  • YEAR_DEV : 같은 연도 내에서는 편차를 기준으로 오름차순 정렬


💯제출 코드

WITH MAX_SIZE_BY_YEAR AS (
    SELECT 
        EXTRACT(YEAR FROM DIFFERENTIATION_DATE) AS YEAR,
        MAX(SIZE_OF_COLONY) AS MAX_SIZE
    FROM ECOLI_DATA
    GROUP BY EXTRACT(YEAR FROM DIFFERENTIATION_DATE)
)

SELECT 
    EXTRACT(YEAR FROM E.DIFFERENTIATION_DATE) AS YEAR,
    M.MAX_SIZE - E.SIZE_OF_COLONY AS YEAR_DEV,
    E.ID
FROM ECOLI_DATA E JOIN MAX_SIZE_BY_YEAR M
    ON EXTRACT(YEAR FROM E.DIFFERENTIATION_DATE) = M.YEAR
ORDER BY YEAR, YEAR_DEV

댓글남기기