모델 (Model)
모델은 특정 문제를 해결하기 위해 설계된 딥러닝 전체의 시스템
포괄적인 용어로 특정 상황에 따라 아키텍쳐나 체크포인트(모델의 학습 중간 상태를 저장한 파일)둘다 의미할 수도 있다.
- 구성요소
- 아키텍쳐 : 모델의 구조나 설계도
- 가중치: 학습과정에서 최적화된 파라미터
아키텍쳐 (Architecture)
모델의 설계 구조
레이어(layer)와 노드(node)들이 어떻게 연결되었는지 설명함
- 특정 문제(예: 이미지 분류, 자연어 처리 등)에 적합한 아키텍쳐를 선택해야 한다
- 동일한 아키텍쳐 라고 다른 하이퍼파라미터(예: 뉴런 수, 레이어 수)에 따라 성능이 달라질 수 있음.
가중치(Weights)
학습 과정에서 최적화된 매개변수(parameter)로,
데이터와 목표(예: 손실 함수의 값을 최소화, 예측값과 실제값 사이의 차이를 최소화)를 기반으로 계산된 값
입력과 출력 간의 "연결강도"를 나타내는 것
=> 각 입력이 출력을 만드는데 얼마나 영향을 미치는 지 결정하는 값
- 초기에는 랜덤하게 설정되며, 학습 과정(optimization)에서 조정됩니다.
- 동일한 아키텍쳐를 사용하더라도 가중치 값에 따라 성능이 달라질 수 있습니다
'ai' 카테고리의 다른 글
[Together.ai] 멀티턴 대화 파인튜닝 하는법 (0) | 2025.01.07 |
---|---|
[기술면접] 감정인식을 어떻게 할까요? (0) | 2025.01.06 |
[기술면접] 트랜스포머란 무엇인가요? (0) | 2025.01.06 |
[기술면접] 자연어 처리란 무엇인가요? (0) | 2025.01.05 |
[진행중] 기술면접 질문 리스트 (1) | 2025.01.04 |