일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 챗GPT
- ChatGPT
- 신뢰성
- GPT-3
- cnn
- 인공지능 신뢰성
- 챗지피티
- 트랜스포머
- gpt2
- 케라스
- Transformer
- 설명가능성
- DevOps
- Ai
- GPT
- MLOps
- AI Fairness
- Bert
- Tokenization
- word2vec
- XAI
- 딥러닝
- 머신러닝
- ML
- fairness
- 인공지능
- nlp
- 자연어
- trustworthiness
- 지피티
Archives
- Today
- Total
목록토큰 임베딩 (1)
research notes
BERT(Bidirectional Encoder Representation from Transformer)
BERT는 구글에서 발표한 최신 임베딩 모델이며 트랜스포머를 이용하여 구현되었다. 또한, 위키피디아(25억 단어)와 BooksCorpus(8억 단어)와 같은 레이블이 없는 텍스트 데이터로 사전 훈련된 언어 모델이다. BERT가 높은 성능을 얻을 수 있었던 것은, 레이블이 없는 방대한 데이터로 사전 훈련된 모델을 가지고, 레이블이 있는 다른 작업(Task)에서 추가 훈련과 함께 하이퍼파라미터를 재조정하여 이 모델을 사용하면 성능이 높게 나오는 기존의 사례들을 참고하였기 때문이다. 다른 작업에 대해서 파라미터 재조정을 위한 추가 훈련 과정을 파인 튜닝(Fine-tuning)이라고 한다. 아래 그림은 BERT의 파인 튜닝 사례를 보여준다. 우리가 하고 싶은 태스크가 스팸 메일 분류라고 하였을 때, 이미 위키피..
GPT/개념정의
2022. 10. 25. 21:44