AI에 대한 불신, 그리고 작은 호기심

솔직히 저는 AI 기술에 대해 반신반의하는 입장이었습니다. 챗GPT가 처음 등장했을 때의 뜨거운 반응 속에서도 긴 사용 대기 시간 때문에 시도해볼 기회를 놓쳤고, 안드로이드 스튜디오의 코파일럿 AI 성능에 대한 리뷰들을 보면서는 '아직은 시기상조'라고 생각했죠. 그렇게 AI는 제 관심 밖의 기술로 남아 있었습니다.

하지만 최근 구글의 제미나이(Gemini)와 이미지 생성 모델인 나노바나나(nano-banana)에 대한 긍정적인 미디어 리뷰들을 접하면서 '정말 그렇게 대단한가?'라는 호기심이 생겼습니다. 그래서 직접 테스트해보기로 마음먹고, 우리나라의 최신예 전투기 KF-21 보라매의 시제기 사진을 이용해 스케치 드로잉을 요청해 보았습니다.

KF-21 보라매 시제기 - 출처 세계일보


첫 결과물: 90%의 만족과 10%의 오류

AI가 내놓은 첫 번째 결과물은 정말 놀라웠습니다. 원본 사진의 구도와 질감을 완벽하게 이해하고, 마치 전문 드로잉 작가가 그린 듯한 멋진 스케치를 순식간에 만들어냈습니다. 꼬리날개의 그림자가 스케치 드로잉에 반영되지않도록 표현하지 말아달라고 한 요구 또한 잘 반영하었으며, 더나아가 드로잉된 각도에 맞게 새로 수직 꼬리날개의 그림자를 자연스럽게 표현하였습니다. 

하지만 감탄도 잠시, 그림을 자세히 보니 이상한 점이 눈에 띄었습니다. 원본 사진에는 분명히 없었던 '카나드(귀날개)'가 주익 앞에 떡하니 그려져 있었던 것입니다. 결과는 90% 만족스러웠지만, 결정적인 10%의 오류가 있었습니다.

KF-21 보라매 스케치 드로잉-첫번째


AI와의 소통, 생각보다 쉽지 않았다

저는 곧바로 "카나드 날개를 지워달라"고 다시 요청했습니다. 하지만 AI는 제 의도를 정확히 이해하지 못했던 것 같습니다. 카나드 날개는 그대로 둔 채, 스케치의 흑백 명암만 살짝 바꾼 결과물을 내놓았죠. AI와의 소통이 생각처럼 간단하지 않다는 것을 깨닫는 순간이었습니다.

"백문이 불여일견": 그림으로 소통하다

저는 소통 방식을 바꾸기로 했습니다. 명암만 살짝 바뀐 결과물이 첫번째 결과보다 좋지 않았기에 첫번째 결과물을 계속 이용하도록 명암만 살짝 바뀐 결과와 요청 메세지를 삭제한 다음, 그림판을 이용해 문제가 되는 카나드 날개 부분에 빨간색 동그라미를 그리고, "KF-21 보라매에는 주익 앞에 카나드 날개가 없으므로 원본과 비교해서 이 부분을 수정해 달라"는 구체적인 지시와 함께 이미지를 다시 전달했습니다.

KF-21 보라매 스케치 드로잉-수정요청

AI는 '도구'다: 나의 생각을 바꾸게 된 경험

결과는 완벽했습니다. AI는 시각적인 피드백을 정확히 이해하고, 제가 원했던 대로 카나드 날개가 없는 깔끔한 KF-21 스케치를 완성했습니다.

이번 경험을 통해 AI에 대한 저의 생각은 완전히 바뀌었습니다. AI는 단순히 명령만 수행하는 마법 상자가 아니라, 사용자가 어떻게 소통하고 피드백을 주느냐에 따라 결과가 달라지는 정교한 '도구'였습니다. 아직 완벽하지는 않지만, 명확한 소통을 통해 함께 결과물을 만들어가는 과정은 충분히 매력적이었습니다. 앞으로 AI 기술이 우리의 삶을 어떻게 바꿔나갈지 더욱 기대됩니다.

KF-21 보라매 스케치 드로잉-최종 결과물

 

구글 AI 스튜디오에서의 요청 및 결과

 

상기 작업을 하는데에는 토큰이 소모됩니다. 구글의 제미나이(Gemini)에 토큰의 항목 및 비용에 관해 문의해 보았습니다. 

상기 이미지는 KF-21 보라매의 스케치 드로잉을 만드는데 사용된 토큰값이야, 각 항목별 토큰의 의미를 알려두었으면해, 더 나아가 가능하다면 "배경을 제거하는데 사용한 토큰" 또는 "드로잉에 사용된 토큰" 등으로 비율 형식으로 자세하게 분류할 수있으면 알려주었으면해, 또한 현재 사용된 토큰을 비용으로 환산할 수 있으면 해주었으면해

 

요청하신 내용을 확인했습니다. 첨부해주신 이미지를 분석하여 토큰의 의미와 비용에 대해 자세히 설명해 드릴게요.

토큰 사용량 분석

첨부된 이미지에는 토큰 사용량과 비용 추정치가 나와 있습니다. 각 항목의 의미는 다음과 같습니다.

  • Input tokens (5,364): 사용자가 입력한 데이터(텍스트, 이미지 등)를 처리하는 데 사용된 토큰의 양입니다. 이 경우, KF-21 보라매의 원본 사진, 그리고 텍스트로 작성된 프롬프트 등을 처리하는 데 소요된 토큰입니다.
  • Output tokens (2,668): AI 모델이 응답(여기서는 스케치 드로잉)을 생성하는 데 사용된 토큰의 양입니다. 이미지 생성 모델인 나노바나나의 경우, 그림을 구성하는 데 필요한 정보량이 이 토큰 값에 포함됩니다.
  • Total tokens (8,032): 입력 토큰과 출력 토큰을 합한 총 토큰의 양입니다.

안타깝게도, "배경 제거에 사용된 토큰"이나 "드로잉에 사용된 토큰"과 같이 세부적인 작업별 토큰 사용량을 구분하는 것은 불가능합니다. 토큰은 입력 데이터 전체와 출력 결과물 전체에 대해 합산된 값으로 계산되기 때문입니다.

토큰 비용 환산

이미지 하단에 표기된 것처럼, 구글 AI 스튜디오(AI Studio)에서는 토큰 사용이 무료입니다. 하지만 API를 통해 같은 요청을 보낼 경우 예상 비용이 발생할 수 있습니다.

비용은 모델의 종류와 사용량에 따라 달라집니다. 현재 Gemini Pro Vision(멀티모달) 모델의 API 비용은 다음과 같습니다.

  • 이미지 토큰 비용: 이미지 1장당 0.0025달러
  • 프롬프트 토큰 비용 (입력): 1,000토큰당 0.000125달러
  • 생성 토큰 비용 (출력): 1,000토큰당 0.000375달러

만약 사용하신 모델이 Gemini Pro Vision이었다면, 계산된 토큰 비용은 다음과 같이 추정할 수 있습니다.

  • 입력 토큰 비용:
  • 출력 토큰 비용:
  • 총 비용:

따라서, AI 스튜디오에서 생성한 KF-21 스케치 드로잉은 API로 요청했을 때도 거의 0원에 가까운 매우 저렴한 비용으로 생성할 수 있습니다.


 

부연하자면 구글 AI의 API를 통해서 독립된 웹페이지에서 이미지를 스케치 드로잉으로 변환해주는 서비스를 제공하여 불특정 다수가 이용할 경우(구글 AI 스튜디오를 이용하지 않고) 비용이 발생할 수 있다는 얘기 인것 같습니다.  하지만 그 비용 역시 저렴하다는 것을 알 수 있습니다. 

 

이 블로그 내용은 구글의 제미나이(Gemini)에 요청하여 작성하였습니다. 아주 약간만 수정 및 추가해주었고, 아래 내용의 프롬프트(가이드 라인)로 요청하였습니다.

 

<KF-21 보라매 스케치 드로잉 요청 및 결과 사진 첨부>

"구글 AI 스튜디오에서 나노바나나를 사용하여 KF-21 보라매의 스케치 드로잉을 만들어 보았습니다" 라는 제목으로 포스트를 하고싶어

1. 나는 AI를 제대로 사용해 본적이 없어, 챗 GPT가 처음 나왔을때 테스트 해보려했지만 당시에는 사용대기 시간등 제약으로 인해 사용을 안했던거 같아, 또한 안드로이드 스튜디오의 코파일럿 AI 성능에 대해 리뷰하는 영상 및 글들을 보고, 아직은 AI의 기술이 무르익지 않았다고 생각하여 큰 관심이 없었어. 최근에 구글 AI 제미나이와 나노바나나의 성능에 대한 미디어 리뷰를 보고 테스트 삼아 kf-21 보라매 시제기 비행사진을 원본을 하는 KF-21 보라매의 스케치 드로잉을 만들어 달라고 했었지

2. 처음 만들어준 KF-21 보라매 스케치의 결과는 대단히 만족스러웠어, 다만 원본에는 없는 카나드 날개가 표현되어 있었던 거야. 그래서 카나드 날개를 지워달라고 요청했어 하지만 카나드 날개를 잘 이해하지 못했었나봐 같은 스케치의 흑백 명암만 약간 변경되었더군.

3. 좀더 자세히 의사를 전달하기 위해 그림판으로 해당 부분을 빨간색 동그라미로 지정하고 kf-21 보라매에는 주익 앞에 카나드 날개가 없으므로 원본과 비교해서 수정해달라고 했지

4. 정말 잘 수정된거 같아 

위의 내용으로 글을 작성해 주었으면해

 

KF-21 보라매가 노을 지는 하늘을 비행하는 스케치 드로잉 - 제미나이_이미지

 

반응형

+ Recent posts