일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 케라스
- Ai
- Transformer
- 설명가능성
- ChatGPT
- 지피티
- 머신러닝
- AI Fairness
- XAI
- GPT
- 챗지피티
- nlp
- fairness
- Bert
- GPT-3
- DevOps
- 인공지능
- Tokenization
- 딥러닝
- 자연어
- 챗GPT
- gpt2
- 신뢰성
- ML
- cnn
- trustworthiness
- MLOps
- word2vec
- 트랜스포머
- 인공지능 신뢰성
- Today
- Total
목록머신러닝 (14)
research notes
위 예는 과소적합과(Underfitting) 과적합의(Overfitting) 문제를 보여줌과 동시에 비선형(non-linear) 함수를 근사화하기 위해 어떻게 다항 선형 회귀를 사용할 수 있는지 방법을 보여준다. 플롯은 근사화하려는 코사인 함수의 일부, 실제 함수의 샘플 및 다른 근사하려는 모델을 표시하고 있다. 먼저 선형함수(차수가 1인 다항식)가 훈련 샘플에 적합하지 않음을 알 수 있는데 이것을 과소적합이라고 한다. 차수가 4인 다항식은 실제 함수에 거의 완벽하게 근사하지만, 더 높은 차수의 모델은 훈련 데이터에 과적합된다. 즉, 훈련 데이터의 노이즈를 학습한다. 교차검증을(cross-validation) 이용하여 과적합/과소적합을 정량적으로 평가할 수 있다. 검증세트에서 평균 제곱 오차(MSE)를 ..
- 일반적으로 모델이 분류냐 회귀냐에 따라 성능평가지표는 여러 종류로 나뉜다. - 회귀의 경우 대부분 실제값과 예측값의 오차평균에 기반 ex) MAE, MSE 등 - 분류의 경우 회귀와는 다른 성능평가지표가 사용된다. - ex) 정확도(Accuracy), 오차행렬(Confusion Matrix), 정밀도(Precision), 재현율(Recall), F1-Score, ROC-AUC 1. 정확도 - 정확도(Accuracy) = 실제 데이터와 예측결과가 동일한 데이터 건수 / 전체 예측 데이터 건수 = (TN+TP) / (TN+FP+FN+TP) - 정확도 평가 지표는 불균형한 레이블 데이터 세트에서는 성능 수치로 사용돼서는 안 된다. 즉, 정확도는 불균형한(imblanced) 레이블 값 분포에서 ML 모델의 ..
1. Estimator 이해 및 fit(), predict() 메서드 사이킷런은 매우 많은 유형의 Classifier와 Regressor 클래스를 제공한다. 이들 Classifier와 Regressor를 합쳐서 Estimator 클래스라고 부른다. 즉, 지도학습의 모든 알고리즘을 구현한 클래스를 통칭해서 Estimator라고 부른다. 2. 교차검증 ① 홀드아웃 교차검증(holdout cross-validation) 데이터를 학습 데이터 세트와 테스트 데이터 세트 두 개로 나누는 것이며, 보통 데이터의 2/3을 학습 데이터 세트로 사용하고 1/3을 테스트 세트로 사용한다. ② k-겹 교차검증(k-fold cross-validation) 가장 보편적으로 사용되는 교차검증 기법으로 먼저 k개의 데이터 폴드 세..
1. type() and .shape array1 = np.array([1, 2, 3]) array2 = np.array([[1, 2, 3]]) print('array1 type: ', type(array1)) print('array1 shape: ', array1.shape) print('array2 shape: ', array2.shape) array1 type: array1 shape: (3,) array2 shape: (1, 3) 2. ndarray data type - ndarray 내의 데이터 타입은 같은 데이터 타입만 가능 - ndarray 데이터 값의 타입변경은 astype() 메서드를 사용 array_int = np.array([1, 2, 3]) array_float = array_int..