- 문서 분류 태스크
- 이 프로젝트는 문서 분류 모델을 개발하는 것입니다.
- 이 문서 분류 모델은 품질 저하된 17종의 문서를 분류할 수 있도록 설계됩니다.
- 주 언어 : Python
- 주 프레임워크 : Pytorch
- 협업 툴 : Github, Slack, Zoom
-
Pytorch 프레임워크
- 딥러닝 파이썬 프레임워크
-
torchvision, pillow
- 컴퓨터비전용 데이터셋, 모델, 이미지 전처리 제공
- 이미지 라이브러리
-
scikit-learn
- 성능 평가 지표
-
effdet
- efficientDet 객체 탐지 모델 라이브러리
-
efficientnet_pytorch_b4
- efficientNet 분류 모델 라이브러리
-
ConvNext_tiny
- ConvNex_tiny 분류 모델 라이브러리
├── README.md
├── .gitignore
├── data_augmentation.ipynb
└── ensemble.ipynb
- 역할
- 조장, 데이터 전처리, 모델 구축 및 학습, 앙상블
- 기능
- 데이터 증강, 분류 모델 구축 및 학습, 앙상블 개발
- 역할
- 데이터 전처리, 모델 구축 및 학습, 실험관리
- 기능
- 데이터 증강, 분류 모델 구축 및 학습, 실험관리
- 역할
- 프로젝트를 진행하며 맡은 역할 작성
- 기능
- 프로젝트를 진행하며 개발한 기능 작성
- 역할
- 프로젝트를 진행하며 맡은 역할 작성
- 기능
- 프로젝트를 진행하며 개발한 기능 작성
- 역할
- 데이터 전처리, 모델 구축 및 학습, 앙상블
- 기능
- 데이터 증강, 분류 모델 구축 및 학습
- 전체 개발 기간 : 2024-10-28 ~ 2024-11-09
- 기능 구현 : 2024-11-04 ~ 2024-11-09
EfficientNet_b4모델, 손실함수 및 3/4클래스에 대한 online augmentation
문서 분류 태스크에서 데이터 분석, 데이터 증강, 모델 구조 선택, 학습, 앙상블 전체를 다루어 볼 수 있어서 좋았습니다.
CV 관련 대회는 이번이 처음이었으며, 이번 프로젝트를 통해 다양한 이미지 증강과 처리 방법을 배울 수 있었습니다. 모델 부분에서는 사전 학습된 모델을 활용해 직접 파인튜닝을 진행하며 성능 변화를 확인했습니다. 또한, 여러 모델을 사용하고 앙상블을 적용해 성능 개선을 이루었습니다. 실험 관리 측면에서는 가설을 세우고 결과를 확인하면서, 반복적인 개선을 통해 더 나은 방법을 찾아가는 경험을 할 수 있었습니다.
CV 프로젝트를진행하면서많이배웠습니다
CV 관련 모델들이 정말 다양하게 있고, 어느 특정 모델만 사용하는 것이 아니라 진행할 프로젝트 주제에 따라 다르게 선택할 수 있다는 점이 흥미로웠습니다
문서 분류 태스크를 통해 데이터 증강부터 모델 학습, 앙상블까지 전체를 경험할 수 있어 좋았습니다.