λ³Έλ¬Έ λ°”λ‘œκ°€κΈ°

Database/SQLD & SQLP

[SQLD] 제 1절. 데이터 λͺ¨λΈμ˜ 이해 - 3. 데이터 λͺ¨λΈλ§μ˜ μ€‘μš”μ„± 및 유의점

[좜처 : SQL μ „λ¬Έκ°€ κ°€μ΄λ“œ(2013 EDITION)]

 

3. 데이터 λͺ¨λΈλ§μ˜ μ€‘μš”μ„± 및 유의점

  κ°€. 데이터 λͺ¨λΈμ΄ μ€‘μš”ν•œ 이유

  • νŒŒκΈ‰νš¨κ³Ό (Leverage) : μ‹œμŠ€ν…œ ꡬ좕이 μ™„μ„±λ˜μ–΄ κ°€λŠ” μ‹œμ μ—μ„œ 데이터 λͺ¨λΈμ˜ 변경이 λΆˆκ°€ν”Όν•œ 상황이 λ°œμƒν•œλ‹€λ©΄, λ³€κ²½ν•΄μ•Όν•˜λŠ” 데이터 λͺ¨λΈμ˜ ν˜•νƒœμ— 따라 κ·Έ 영ν–₯ μ •λ„λŠ” 차이가 μžˆκ² μ§€λ§Œ 이 μ‹œκΈ°μ˜ 데이터 ꡬ쑰의 λ³€κ²½μœΌλ‘œ μΈν•œ 일련의 λ³€κ²½μž‘μ—…μ€ 전체 μ‹œμŠ€ν…œ ꡬ좕 ν”„λ‘œμ νŠΈμ—μ„œ 큰 μœ„ν—˜μš”μ†Œκ°€ 될 수 있음. μ΄λŸ¬ν•œ 이유둜 인해 μ‹œμŠ€ν…œ ꡬ좕 μž‘μ—… μ€‘μ—μ„œ λ‹€λ₯Έ μ–΄λ–€ 섀계 과정보닀 데이터 섀계가 더 μ€‘μš”ν•˜λ‹€κ³  λ³Ό 수 있음
  • λ³΅μž‘ν•œ 정보 μš”κ΅¬μ‚¬ν•­μ˜ κ°„κ²°ν•œ ν‘œν˜„ (Conciseness) : 데이터 λͺ¨λΈμ€ ꡬ좕할 μ‹œμŠ€ν…œμ˜ 정보 μš”κ΅¬μ‚¬ν•­κ³Ό ν•œκ³„λ₯Ό κ°€μž₯ λͺ…ν™•ν•˜κ³  κ°„κ²°ν•˜κ²Œ ν‘œν˜„ν•  수 μžˆλŠ” 도ꡬ. λ°μ΄ν„° λͺ¨λΈμ€ κ±΄μΆ•λ¬Όλ‘œ λΉ„μœ ν•˜μžλ©΄ 섀계 도면에 ν•΄λ‹Ή. μ΄μƒμ μœΌλ‘œ 역할을 ν•  수 μžˆλŠ” λͺ¨λΈμ΄ κ°–μΆ”μ–΄μ•Ό ν•  κ°€μž₯ μ€‘μš”ν•œ 점은 정보 μš”κ΅¬μ‚¬ν•­μ΄ μ •ν™•ν•˜κ³  κ°„κ²°ν•˜κ²Œ ν‘œν˜„λ˜μ–΄μ•Όν•œλ‹€λŠ” 것
  • 데이터 ν’ˆμ§ˆ (Data Quality) : λ°μ΄ν„°λ² μ΄μŠ€μ— λ‹΄κ²¨μžˆλŠ” λ°μ΄ν„°λŠ” κΈ°μ—…μ˜ μ€‘μš”ν•œ μžμ‚°. μ˜€λž˜λ„둝 μ €μž₯λ˜μ–΄μ§„ 데이터가 κ·Έμ € 그런 데이터, 정확성이 λ–¨μ–΄μ§€λŠ” 데이터라고 ν•˜λ©΄ μ΄λŠ” ν•΄λ‹Ή λ°μ΄ν„°λ‘œ 얻을 수 μžˆμ—ˆλ˜ μ†Œμ€‘ν•œ λΉ„μ¦ˆλ‹ˆμŠ€μ˜ 기회λ₯Ό 상싀할 μˆ˜λ„ μžˆλŠ” 문제. λ°μ΄ν„° ν’ˆμ§ˆμ˜ λ¬Έμ œκ°€ μ•ΌκΈ°λ˜λŠ” μ€‘λŒ€ν•œ 이유 쀑 ν•˜λ‚˜κ°€ λ°”λ‘œ 데이터 ꡬ쑰의 문제(쀑볡 λ°μ΄ν„°μ˜ λ―Έμ •μ˜, 데이터 ꡬ쑰의 λΉ„μ¦ˆλ‹ˆμŠ€ μ •μ˜μ˜ λΆˆμΆ©λΆ„, λ™μΌν•œ μ„±κ²©μ˜ 데이터λ₯Ό ν†΅ν•©ν•˜μ§€ μ•Šκ³  λΆ„λ¦¬ν•¨μœΌλ‘œμ¨ λ‚˜νƒ€λ‚˜λŠ” 데이터 뢈일치 λ“±)

λ‚˜. 데이터 λͺ¨λΈλ§ μ‹œ 유의점

  • 쀑볡 (Duplication) : 데이터 λͺ¨λΈμ€ 같은 데이터λ₯Ό μ‚¬μš©ν•˜λŠ” μ‚¬λžŒ, μ‹œκ°„, 그리고 μž₯μ†Œλ₯Ό νŒŒμ•…ν•˜λŠ”λ° 도움을 제곡. μ΄λŸ¬ν•œ 지식 μ‘μš©μ€ λ°μ΄ν„°λ² μ΄μŠ€κ°€ μ—¬λŸ¬ μž₯μ†Œμ— 같은 정보λ₯Ό μ €μž₯ν•˜μ§€ μ•Šλ„λ‘ 함.
  • λΉ„μœ μ—°μ„± (Inflexibility) : 데이터 μ •μ˜λ₯Ό λ°μ΄ν„°μ˜ μ‚¬μš© ν”„λ‘œμ„ΈμŠ€μ™€ λΆ„λ¦¬ν•¨μœΌλ‘œμ¨ 데이터 λͺ¨λΈλ§μ€ 데이터 ν˜Ήμ€ ν”„λ‘œμ„ΈμŠ€μ˜ μž‘μ€ λ³€ν™”κ°€ μ• ν”Œλ¦¬μΌ€μ΄μ…˜κ³Ό λ°μ΄ν„°λ² μ΄μŠ€μ— μ€‘λŒ€ν•œ λ³€ν™”λ₯Ό μΌμœΌν‚¬ 수 μžˆλŠ” κ°€λŠ₯성을 μ€„μž„.
  • 비일관성 (Inconsistency) : λ°μ΄ν„°μ˜ 쀑볡이 없더라도 비일관성은 λ°œμƒν•¨. 데이터 λͺ¨λΈλ§μ„ ν•  λ•Œ 데이터와 데이터 κ°„ μƒν˜Έ μ—°κ΄€ 관계에 λŒ€ν•œ λͺ…ν™•ν•œ μ •μ˜λŠ” μ΄λŸ¬ν•œ μœ„ν—˜μ„ 사전에 μ˜ˆλ°©ν•  수 μžˆλ„λ‘ λ„μ™€μ€Œ.