4. 3
1. 멀티모달 데이터
N24News Dataset
• 이미지 : 뉴스 기사의 이미지
• 텍스트 : Headline, Caption, Abstract, Body
5. 4
1. 멀티모달 데이터
멀티모달 기반 모델
• 각각 분석을 위한 모델 적용 후 feature 단계 혹은 prediction 단계에서 융합하여 사용함
ViT
features
prediction
Roberta
features
prediction
6. 5
2. 모듈화 및 모델 통합
디렉토리 구조
• 실행은 main.py에서 진행하며, 각각의 활용요소들을 모듈화 시켜 필요할 때마다 사용
• 코드가 간소화되며, 타 모델 사용시 재활용이 가능하여 편리함
main.py
datasets dataset.py
models model.py
__init__.py
__init__.py
outputs
utils utlis.py
__init__.py
7. 6
2. 모듈화 및 모델 통합
utils.py
• 모델을 실행함에 있어 필요로 하는 소스코드의 집합
• ex) 전처리 함수, 시드 고정 함수, 학습 및 평가 함수
8. 7
2. 모듈화 및 모델 통합
utils.py
• RobertaTokenizer : 허깅페이스에서 제공하는 자연어 처리 라이브러리