머신러닝 & 딥러닝

[머신러닝 & 딥러닝] 기본 용어와 표기법

beginner-in-coding 2025. 2. 18. 08:20

01. 표기법과 규칙

  • (row): 샘플, 인스턴스, 관측
  • (column): 특성, 속성, 측정값, 차원
  • 클래스 레이블: 타깃, 즉 학습으로 인한 결과

 

02. 머신러닝과 선형대수학 (liner algebra)

  • 머신러닝에서 자주 등장
  • 간단하게 표기하고 효율적인 코드로 구현하기에 적합
  • 행렬(matrix)벡터(vector) 표기로 데이터를 표현
    • 행: 샘플
    • 열: 특성
    • 아래의 엑셀을 행렬로 표현한 것과 같음
  • X의 아래 숫자 의미: 열(특성)의 위치
  • X의 위에 () 숫자 의미: 행(샘플)의 번호 
  • 굵은 소문자 x: 벡터(특성) 의미
  • 굵은 대문자 X: 행렬(샘플) 의미
  • 이탤릭체: 벡터나 행렬에 있는 특정 하나의 원소를 나타낼 때 사용

엑셀로 된 데이터셋

 

선형대수학으로 표현한 머신러닝


03. 머신러닝 용어와 동의어

  • 훈련 샘플
    • 의미: 데이터 셋을 나타내는 테이블의 행
    • 샘플이란: 훈련 예시의 집합
    • 동의어: 관측(observation), 레코드(record), 인스턴스(instance), 예시(example)
  • 훈련
    • 의미: 새로운 데이터를 예측하기 위해 데이터셋을 이용해 모델(알고리즘)을 만드는 것
    • 동의어: 모델 피팅(fitting), 모수 모델(parametric model), 파라미터 추정(parameter estimation)
  • 특성(x)
    • 의미: 데이터 테이블이나 데이터 행렬의 열
    • 동의어: 예측 변수(predictor), 변수, 입력, 속성(attribute), 공변량(covariate)
  • 타깃(y)
    • 의미: 머신러닝 알고리즘의 결과로 나오는 값들
    • 동의어: 결과(outcome), 출력(output), 반응 변수, 종속 변수(dependent variable), 클래스 레이블(label), 정답(ground truth)
  • 손실 함수(loss function)
    • 의미: 머신러닝 혹은 딥러닝 모델의 출력값과 사용자가 원하는 출력값의 오차를 의미
    • 비용 함수(cost function)와의 의미 차이
      • 손실 함수: 하나의 데이터 포인트에서 측정한 손실
      • 비용 함수: 전체 데이터셋에 대해 측정한 손실(평균 or 합)