본문 바로가기
서비스 기획/✏️ 서비스 기획

사례와 함께 보는 생성형 AI 잘 쓰는 방법 (생성형 AI로 영화 키워드 만들기)

by 림뽀 2023. 7. 14.
반응형

들어가며

ChatGPT의 출시와 함께 생성형 AI가 화제가 된 지도 반년이 넘었다. 우리 팀에서도 생성형 AI를 활용한 새로운 과제를 발굴하기 위해 머리를 맞대고 있다.
 
IPTV에 맞는 서비스를 만들기 위해 생성형 AI로 VOD를 위한 정보를 생성하는 방향으로 아이디에이션을 진행했다. 그 과정에서 다양한 방법으로 생성형 AI에게 프롬프트를 입력했는데, 프롬프트를 사용했던 이력을 기록해놓으면 도움이 될 것 같아 이 글에 배운 것과 느낀 점을 정리했다.
 
<이 글에서 다루는 내용>
1. 생성형 AI를 잘 사용하는 방법 (영화 키워드 추출 사례, 영화 줄거리 한 줄 요약 사례)
2. BARD vs. ChatGPT 무엇이 더 낫나요?
3. 현재 생성형 AI의 한계
 

1. 생성형 AI로 영화 키워드와 한 줄 줄거리를 추출해 보자!

 
넷플릭스만큼 좋은 "영화 키워드" 만들기
넷플릭스는 콘텐츠 별로 다양한 메타 데이터 키워드를 운영한다. 메타 데이터란 콘텐츠의 제목과 출연진 같은 기본 정보부터 "로맨스", "성장 드라마"와 같은 콘텐츠의 특성까지 포함한다.
 
넷플릭스의 경우, 2018년까지 콘텐츠 시청하고 직접 키워드를 등록하는 "태거(tagger)"를 고용했다. 사람들이 수동으로 "태깅"한 키워드는 넷플릭스의 서비스에 노출되기도 하고, 추천과 검색에 활용된다.
 

넷플릭스 키워드 사례

 
콘텐츠 키워드를 생성형 AI가 만들 수 있다면, 태거를 고용하지 않고도 자동으로 좋은 퀄리티의 키워드를 얻을 수 있지 않을까? 넷플릭스가 오랜 기간 태거를 고용한 이유는 사람이 작성한 키워드의 퀄리티가 가장 높았기 때문이었을 것이다. 사람만큼 말을 잘 지어내는 생성형 AI는 높은 퀄리티의 키워드를 만들어낼 수 있을지 알아보고자 했다.
 
넷플릭스만큼 간단한 "줄거리" 만들기
나아가서, 넷플릭스가 제공하는 콘텐츠의 줄거리는 길이가 짧고 간결하다. 영상을 제공하는 서비스에 맞게 영상 영역을 최대화하고, 텍스트 영역은 최소화한다. 영상 서비스에서 효과적인 텍스트는 간결하다. 기존에 있는 긴 호흡의 줄거리를 생성형 AI를 통해 요약하고, 줄거리 텍스트를 더 효과적으로 제공할 수 있을지 테스트해 보았다.
 

2. 생성형 AI를 "잘" 사용하는 방법

생성형 AI에게 콘텐츠의 키워드를 뽑아달라고 하는 것은 쉽다. "영화 기생충의 키워드 뽑아줘"라는 프롬프트로 결과를 바로 받을 수 있다. 그러나 아래 결과가 좋은 키워드라고 할 수 있을까?
 

영화 기생충의 키워드

 
모두 영화 기생충에 관한 키워드는 맞지만, 각 키워드의 카테고리와 계위가 다르다. 질문을 더 구조화하고, 구체적으로 한다면 키워드의 퀄리티를 높일 수 있을 것이라고 생각하고 프롬프트를 개선해 보았다.
 

2-1. 최대한 구체적으로 질문하기

원하는 답변이 무엇인지 구체적으로 적지 않으면 생성형 AI는 자기 마음대로 답변을 제공한다. 원하는 답변의 포맷이 있다면 "문체", "글자수", "형식"까지 지정해야 한다.
 
- 문체: "설득력 있는 톤으로", "트위터 포스터처럼", "대화하는 것처럼"
- 글자수: "공백포함 100자 내로 보여줘", "한 문장으로 표현해 줘"
- 형식: "표로 나타내줘"
 
1차로는 별 다른 규칙 없이 영화 "기생충"의 줄거리를 한 문장으로 요약해 달라고 했다. 나쁘지는 않다. 그러나 영화 요약이 "~입니다"로 끝나는 것을 원하지 않기 때문에 문장의 형식 규칙을 추가했다.
 

기생충 줄거리 요약 v.1

 
줄거리의 형식을 한 가지 추가했다. 장르 + "영화"로 문장이 끝나게 요청했다. 글자 수도 제한했다. "다른 답안 보기"를 클릭해도 BARD가 제공하는 요약문은 모두 같은 형식으로 끝난다.
 

기생충 줄거리 요약 v.2

 
줄거리의 형식을 한 가지 더 추가했다. 요약 + 분위기 + 장르 + "영화"로 문장이 끝나게 요청했다. 글자 수는 조금 더 늘렸다. 
 

기생충 줄거리 요약 v.3

 
여러 버전을 한눈에 보고 싶다면 아래와 같이 요청할 수 있다. "세 가지 버전을 작성해서 표에 넣어줘"라는 형식을 추가한다.
 

 
 
구체적으로 질문하지 않았을 때 vs. 구체적으로 질문했을 때 비교
 
질문이 구체적이지 않은 경우
- 줄거리를 세 가지 스타일로 요약했다.
- 1) 일반적인 영화 줄거리 스타일, 2) 영화 마케팅 문구, 3) 트위터 포스트
- 버전 2), 3)의 경우, 고객에게 영화 시청을 설득하는 줄거리이길 바랐는데, 콘텐츠의 내용을 요약하는 데 그쳐 질문을 더 구체화했다.

 
질문이 구체적인 경우
- 각 버전에서 원하는 스타일에 맞게 요약문이 개선되었다.
- 버전 2), 3)에 설득과 관련된 프롬프트를 추가하여 고객에게 콘텐츠 시청을 소구하는 줄거리를 만들었다.
- 아쉬운 점은 버전 1)에 결말이 포함되어 있다는 점, 한 문장이 아니라는 점, 버전 2)의 답변이 매끄럽지 않다는 점이다. "운명"이라는 단어가 한 문장에서 2회 사용되었다.
 

 
 

2-2. 충분한 힌트 제공하기

유명한 영화의 경우, 힌트가 부족하더라도 생성형 AI가 영화에 관한 정보를 잘 찾는다. 그러나 유명하지 않은 영화는 힌트가 부족했을 때 정확한 정보를 가져오지 못하는 편이다. 생성형 AI가 정확한 정보를 찾지 못한 경우, 빈 공간을 환각 (hallucination; 없는 말 지어내기)로 채우기 때문에 정확한 정보를 찾기 위해선 힌트를 최대한 많이 제공해야 한다.
 
힌트가 부족한 경우 vs. 힌트가 충분한 경우 비교
 
힌트가 부족한 경우: 환각 발생
- 국내 콘텐츠인 경우 구글이 갖고 있는 정보가 적기 때문에 충분한 양의 힌트를 주지 않으면 환각이 발생할 확률이 높다.
- 해외 콘텐츠더라도 유명하지 않으면 국내 콘텐츠와 마찬가지로 힌트를 제공해야 한다.
- "화차(2012)"의 한국어 제목만 힌트로 제공했을 때 줄거리 요약, 분위기, 주인공의 성격, 메시지, 직업에서 틀린 답이 나온 것을 확인했다.
 

화차 예시1

 
힌트가 충분한 경우
- "화차"의 영어 제목, 제작국가, 개봉연도, 줄거리 정보를 추가했을 때 답변이 정확해졌다.
- 콘텐츠에 따라 충분한 양의 힌트가 다르기 때문에 가능한 많은 힌트를 제공하는 것이 좋다.
 

화차 예시2

 

3. BARD vs. ChatGPT 무엇이 더 낫나요?

BARD와 ChatGPT는 강점과 약점이 다르다. ChatGPT와 BARD를 모두 써본 결과, ChatGPT는 전반적으로 말을 더 잘 지내어내고, BARD는 정보를 수집해서 답변하는 것을 더 잘한다고 느꼈다.
 

3-1. "예시"에 따른 스타일 변화: ChatGPT 승!

ChatGPT는 적용하고 싶은 스타일의 문장을 예시로 제공했을 때, 문장 스타일이 변화하는 것을 확인할 수 있었다. 반면 BARD의 경우, 동일한 프롬프트가 적용되지 않았다. (아마 BARD에서 활용 가능한 프롬프트가 다를 것이다.)
 
현재까지는 ChatGPT에서만 예시에 따른 스타일 변화를 쉽게 확인할 수 있기 때문에 ChatGPT에게 승기를 들어주었다.
 

 
3-2. 자연스러운 한국어 작성 능력: BARD 승!
자연스러운 한국어 문장을 생성하는 능력은 BARD가 더 뛰어나다. BARD도 어색한 한국어 문장을 생성하는 경우가 있으나, 체감상 그 빈도가 ChatGPT보다 적다. 아래 예시에서 보면, ChatGPT의 타이타닉 요약이 BARD보다 영어 번역체에 가깝다.
 

BARD 타이타닉 요약
ChatGPT 타이타닉 요약

 
3-3. 신규 정보 이해 능력: BARD 승!
ChatGPT는 2021년까지의 정보만 학습되어 이후에 발생한 정보를 물어보면 환각이 일어난다. 예를 들어, 2023년에 개봉한 AI로봇 공포영화 "메간"에 대해 물으면, BARD는 적절한 답변을 하지만 ChatGPT는 마음대로 줄거리를 지어낸다.
 

BARD 메간 줄거리
ChatGPT 메간 줄거리

 

4. 현재 생성형 AI의 한계

1. 같은 프롬프트여도 새로고침을 할 때마다 다른 결과가 나와 일관적인 퀄리티를 보장할 수 없다.
현재 BARD와 ChatGPT 모두 같은 프롬프트로 새로운 결과를 받아볼 수 있게 새로고침하는 기능을 제공한다. BARD의 경우, 하나의 프롬프트로 3가지 버전의 답변을 한 번에 확인할 수 있다. 그런데 같은 프롬프트를 사용하더라도 답변의 버전에 따라 퀄리티 차이가 있다. 만일 내가 생성형 AI를 통해 1만 개 이상의 영화에서 키워드를 추출한다면, 콘텐츠마다 추출된 키워드의 퀄리티가 모두 다를 것이다. 생성형 AI로 만들어낸 결과물을 자동화하기 위해선 결과물의 퀄리티가 사용자가 원하는 수준만큼 보장되는 장치가 필요하다.
 
2. 프롬프트의 단어나 구조가 조금만 바뀌어도 결과가 완전히 달라지는 경우가 있다.
어떤 이유 때문에 생성형 AI의 답변이 변경되었는지 파악하기가 어렵다. 프로그래밍과 달리 코드/프롬프트 실행의 인과관계가 명확하지 않아 프롬프트를 어떻게 개선시켜야 하는지 확인하기 어렵다.
 
3. 생성형 AI마다 적용되는 프롬프트가 다르다.
BARD와 ChatGPT를 동시에 사용했을 때, 각 플랫폼마다 적합한 프롬프트가 달랐다. ChatGPT와 BARD의 장단점이 서로 다른 만큼 앞으로 사람들이 여러 개의 생성형 AI를 동시에 사용할 텐데, 생성형 AI별로 적합한 문법이 다르다는 사실이 아쉬웠다.
 
4. 환각으로 인해 어떤 정보가 진짜인지 판별하기 어려움
아래 첫 번째 이미지는 영화의 명대사를 한국어로 물어봤을 때 생성형 AI의 대답이다. 영화 "기생충"을 본 사람이라면 알겠지만, 생성형 AI가 영화에 나온 적이 없는 대사도 명대사라고 대답했다. 영화를 보지 않은 사람이라면 생성형 AI의 대답이 영화에 실제로 나온 대사인지 아닌지 구분하기 어렵다.
 
아래 두 번째 이미지는 영화의 명대사를 영어로 물었을 때의 대답인데, 한국어로 물었을 때보다 정확한 답변을 제공한다. 현재까지는 환각을 최소화하기 위해 한국어 콘텐츠에 관한 질문이더라도 영어로 프롬프트를 작성하는 편이 낫다.
 

기생충 명대사 한국어 prompt

 

기생충 명대사 영어 prompt

 

나가며

아직 생성형 AI가 출시된 지 얼마 되지 않았기 때문에 생성형 AI에 기반한 서비스도 초기 단계에 있다. 시간이 지나면서 더 높은 퀄리티의 결과를 일관적으로 얻을 수 있는 프롬프트도 보편화될 것이고, 기존 단점들도 보완이 되면서 생성형 AI가 매끄럽게 적용된 서비스들이 만들어질 것이다.
 
나도 시간이 지나면서 생성형 AI를 더 잘 다룰 수 있게 될 것 같다. 더 좋은 방법을 찾게 되면 다시 또 글로 정리하는 시간을 가져야지!
 

생성형 AI 잘 쓰는 방법 (원본 출처: Unsplash의 ilgmyzin)

 

반응형

댓글