01. 표기법과 규칙
- 행 (row): 샘플, 인스턴스, 관측
- 열 (column): 특성, 속성, 측정값, 차원
- 클래스 레이블: 타깃, 즉 학습으로 인한 결과
02. 머신러닝과 선형대수학 (liner algebra)
- 머신러닝에서 자주 등장
- 간단하게 표기하고 효율적인 코드로 구현하기에 적합
- 행렬(matrix)와 벡터(vector) 표기로 데이터를 표현
- 행: 샘플
- 열: 특성
- 아래의 엑셀을 행렬로 표현한 것과 같음
- X의 아래 숫자 의미: 열(특성)의 위치
- X의 위에 () 숫자 의미: 행(샘플)의 번호
- 굵은 소문자 x: 벡터(특성) 의미
- 굵은 대문자 X: 행렬(샘플) 의미
- 이탤릭체: 벡터나 행렬에 있는 특정 하나의 원소를 나타낼 때 사용
03. 머신러닝 용어와 동의어
- 훈련 샘플
- 의미: 데이터 셋을 나타내는 테이블의 행
- 샘플이란: 훈련 예시의 집합
- 동의어: 관측(observation), 레코드(record), 인스턴스(instance), 예시(example)
- 훈련
- 의미: 새로운 데이터를 예측하기 위해 데이터셋을 이용해 모델(알고리즘)을 만드는 것
- 동의어: 모델 피팅(fitting), 모수 모델(parametric model), 파라미터 추정(parameter estimation)
- 특성(x)
- 의미: 데이터 테이블이나 데이터 행렬의 열
- 동의어: 예측 변수(predictor), 변수, 입력, 속성(attribute), 공변량(covariate)
- 타깃(y)
- 의미: 머신러닝 알고리즘의 결과로 나오는 값들
- 동의어: 결과(outcome), 출력(output), 반응 변수, 종속 변수(dependent variable), 클래스 레이블(label), 정답(ground truth)
- 손실 함수(loss function)
- 의미: 머신러닝 혹은 딥러닝 모델의 출력값과 사용자가 원하는 출력값의 오차를 의미
- 비용 함수(cost function)와의 의미 차이
- 손실 함수: 하나의 데이터 포인트에서 측정한 손실
- 비용 함수: 전체 데이터셋에 대해 측정한 손실(평균 or 합)
'머신러닝 & 딥러닝' 카테고리의 다른 글
[머신러닝 & 딥러닝] K-최근접 이웃(K-Nearest Neighbor, KNN) (2) | 2025.04.14 |
---|---|
[머신러닝 & 딥러닝] 적응형 선형 뉴런(ADAptive Linear NEuron, ADALINE) (0) | 2025.04.14 |
[머신러닝 & 딥러닝] 퍼셉트론(perceptron) - 이론 (2) | 2025.04.11 |
[머신러닝 & 딥러닝] 전체적인 작업 흐름 (0) | 2025.02.19 |
[머신러닝 & 딥러닝] 머신러닝을 시작하기 전에 (0) | 2025.02.13 |