텍스트 설명으로 영상에서 원하는 장면을 자동으로 찾아 클립으로 추출하는 AI 영상 편집 도구.
- 영상 업로드
- 찾고 싶은 장면을 텍스트로 입력 (시나리오)
- CLIP 모델이 프레임별 유사도를 분석하여 해당 구간 자동 추출
- 웨이브폼 에디터에서 결과 확인 및 편집
ClipCraft/
├── api_server/ # FastAPI 백엔드
├── clip_search/ # CLIP 기반 영상 검색 파이프라인
├── audio/ # 오디오 파형 추출
└── clipcraft-web/ # React 프론트엔드
docker compose up -d --build기본 접속 주소:
- 프론트엔드: http://localhost:5174
- 백엔드: http://localhost:8001
다른 Docker 프로젝트가 8000, 5173 포트를 사용 중일 수 있어 호스트 포트는 각각 8001, 5174로 열립니다. 컨테이너 내부에서는 프론트엔드가 http://backend:8000으로 백엔드에 연결합니다.
분석할 영상은 백엔드 컨테이너의 /app/clip_search/ 아래에서 접근 가능해야 합니다. 기본 프론트 설정은 업로드한 파일명으로 /app/clip_search/{파일명} 경로를 만들어 백엔드에 전달합니다.
pip install -r requirements.txtCLIP은 pip 패키지가 없으므로 git으로 직접 설치:
pip install git+https://github.com/openai/CLIP.git
cp clipcraft-web/.env.example clipcraft-web/.env
# OPENAI_API_KEY 입력cd api_server
uvicorn server:app --reload --port 8000cd clipcraft-web
npm install
npm run dev| 역할 | 기술 |
|---|---|
| 영상 분석 | OpenAI CLIP (ViT-L/14) |
| 쿼리 확장 | OpenAI GPT API |
| 오디오 분석 | ffmpeg |
| 백엔드 | FastAPI |
| 프론트엔드 | React + TypeScript |