반응형
AI를 활용하여 유튜브 영상을 텍스트로 변환할 때, 2025년 10월 기준으로 Gemini가 속도와 정확도 면에서 가장 뛰어난 것 같습니다. 유튜브와 Gemini 모두 구글 서비스라 연동성이 좋은 것 같아요. Gemini에서 유튜브관련 API를 제공할 정도로 유튜브 연동에 적극적입니다.
사용하는 프롬프트
저는 docsbot에서 공개한 프롬프트를 사용중입니다. 모델은 Gemini flash를 사용합니다.
- 참고자료: https://docsbot.ai/prompts/writing/transcript-formatter
# instruction
가공되지 않은 영상 대본(transcript)을 잘 정리되고 쉽게 읽을 수 있는 문서로 변환하세요.
내용이 논리적으로 자연스럽게 흐르도록 하고, 명확성을 위해 서식을 지정해야 합니다. 내용에 가치를 더하지 않는 군더더기 단어나 구절은 삭제해야 합니다.
- youtube url:
# 단계 (Steps)
1. 읽고 이해하기: 전체 대본을 읽어 주요 주제와 내용의 흐름을 이해하는 것으로 시작합니다.
2. 군더더기 제거: '음(um)', '어(uh)', '그러니까(like)', '아시다시피(you know)' 등과 같은 군더더기 단어를 식별하여 제거합니다.
3. 내용 분할: 내용이나 주제의 전환을 나타내기 위해 적절한 곳에 제목(headings)을 사용하여 내용을 명확하고 논리적인 섹션이나 단락으로 나눕니다.
4. 구두점 및 문법: 가독성을 높이기 위해 모든 구두점 및 문법 오류를 수정합니다.
5. 명확성 향상: 필요한 경우 문장의 명확성을 위해 다시 작성하되, 대본이 원래의 의도를 반영하도록 합니다.
6. 화자 라벨 추가: 여러 화자가 있을 경우, 각 섹션에 화자의 이름이나 역할을 표시합니다.
7. 검토 및 편집: 흐름과 일관성을 위해 최종 서식이 지정된 문서를 주의 깊게 검토하고 필요한 최종 편집을 수행합니다.
# 출력 형식 (Output Format)
1. 최종적으로 서식이 지정된 대본을 깔끔하게 정리된 텍스트 문서 형태로 제공하며, 명확한 단락과 화자 라벨(해당하는 경우)을 포함해야 합니다.
2. 출력 언어는 한국어입니다.
프롬프트의 장점
1. 근거가 되는 타임스탬프 표시
AI가 글을 생성할 때 근거가 되는 타임스탬프를 제공합니다. 타임스탬프를 통해 원하는 부분을 유튜브 영상에서 바로 찾아볼 수 있습니다. 테스트 영상은 제가 동영상 편집툴로 사용하고 있는 다빈치리졸브 신규기능영상입니다.
- 테스트 유투브 영상: https://youtu.be/D33F1tktokg?si=Qna8V1xRsbpsSeKw

2. 여러 화자를 구분
영상에 여러 명의 화자가 등장하는 경우, 누가 어떤 말을 했는지 구분해줍니다. 테스트 영상은 두명의 사람이 AI를 어떻게 써서 코드작성을 하는지에 대한 내용입니다.
- 테스트 유투브 영상: https://youtu.be/0h6gfMqpx_0?si=GXlf1WMUeJoE4BWo

3. 자기의 의견을 추가하지 않음
프롬프트의 첫 번째 조건인 "읽고 이해하기" 덕분에 Gemini가 자신의 의견을 추가하지 않고 영상의 내용 그대로 글을 생성합니다.
- 조건: 읽고 이해하기: 전체 대본을 읽어 주요 주제와 내용의 흐름을 이해하는 것으로 시작합니다.
반응형
'기타영역 공부 기록' 카테고리의 다른 글
| 이미지가 포함되어 있는 notion 글을 티스토리에 옮기는 방법 (0) | 2025.10.09 |
|---|---|
| obsidian pandoc플러그인으로 word파일 변환할 때, 이미지 제외하는 방법 (0) | 2025.03.11 |
| obsidian copilot플러그인에서 LM studio 연동방법 (0) | 2025.01.05 |
| obsidian 문서를 word문서로 변환하는 방법 (0) | 2025.01.05 |
| 인공지능을 활용한 팟캐스트 썸네일 생성 과정 (0) | 2024.07.14 |