Meet Our Team
home

AI 편집의 혁신: 나노바나나로 하이브리드 워크플로우 구축하기

황라현 (Rahyun Hwang)
황라현 (Rahyun Hwang)

개요

안녕하세요! wheres Marketing Service 팀의 황라현입니다.
이번에는 구글 AI 스튜디오에서 새롭게 공개된 '나노바나나(Gemini 2.5 Flash Image)'를 직접 써본 솔직한 경험담을 들려드리려고 합니다.
제가 직접 시도했던 여섯 가지 실험 결과를 바탕으로, 나노바나나의 놀라운 능력과 아직 남은 한계를 함께 분석해볼게요.
이 글이 AI를 처음 접하는 분들께는 친절한 가이드가 되고, 이미 AI를 활용하고 계신 분들께는 새로운 시야를 여는 데 도움이 되기를 바랍니다.
한국어 프롬프트는 거의 이해하지 못하는 것 같았고, 영문 프롬프트로 했을때 훨씬 매끄럽게 작동한다
아래 본문은 실제 영문 프롬프트로 생성한 결과물이지만, 편의상 짧은 프롬프트를 한국어로 기재함

#1 간단한 얼굴 수정

미드저니에서 생성한 이미지 중 분위기는 좋았지만 얼굴이 어색하게 나온 장면이 있었습니다. 그래서 나노바나나에게 해당 이미지를 레퍼런스로 첨부하여, 자연스럽게 수정해달라고 요청해보았습니다.
before
이 이미지를 활용해서, 여성을 한국인으로 바꿔줘.
after
어색했던 얼굴 부분이 정말 자연스럽게 수정되었고, 기존 이미지의 조명이나 분위기를 전혀 해치지 않았습니다.
전문가의 분석에 따르면, 이는 나노바나나의 가장 핵심적인 강점인 '일관성 유지(Consistency)' 능력 덕분이라고 해요. 모델이 단순한 픽셀 보정을 넘어, 이미지 내의 복잡한 문맥을 정확히 이해하고 부분 수정을 하면서도 전체적인 스타일을 자연스럽게 융합하는 능력이 탁월하다고 합니다.

#2 사진의 분위기 유지하며 특징 수정

미드저니로 생성한 두장의 이미지를 건네주고, 인물의 의상과 헤어 등 스타일링을 바꿔달라고 요청했습니다. 나노바나나는 제가 요구하지 않았는데도 두 인물의 특징을 적절히 섞어 새로운 인물을 창조해냈어요
또한 단정하고 미니멀한 옷차림과 악세사리 삭제를 요청하여 이미지를 생성했는데, 너무 정적인 것 같아 바람부는 디테일을 추가해보았습니다. 결과는 아래에서 확인해보세요!
sample1
sample2
위 이미지 (두장)을 활용해서, 여성의 옷을 단정하게 바꿔줘.
→ 여성의 옷을 여름에 적합한 민소매 원피스나 시폰스커트같은 느낌으로 바꿔줘.
→ 악세사리를 지워줘.
→ 여성의 눈을 감고있도록 변경하고, 바람에 머리나 치마가 휘날리는듯한 효과를 추가해줘.
'바람 부는' 효과와 같은 추상적인 요청을 추가했는데도 성공적으로 반영해낸 점이 정말 인상적이었습니다. 전문가는 이 결과를 나노바나나의 '이미지 융합(Image Fusion)' 능력 덕분이라고 분석했어요.
단순히 여러 이미지를 참조하는 것을 넘어, 그 안에 담긴 핵심 특징을 융합하여 완전히 새로운 결과물을 만들어내는 고차원적인 연산을 수행한다는 거죠.

#3 사진의 스타일 변경

미드저니로 만든 수채화풍의 이미지를 '실사 느낌'으로 바꿔달라고 요청해봤습니다.
original image (by midjourney)
원본의 수채화 느낌나는 이 사진을, 실제 사진처럼 만들어줘.
output
원본과 비교하면 엄청 나아지긴 했지만, 대뜸 수채화같은 사진을 카메라로 찍은 사진처럼 바꿔달라고 하니 한계가 있는 듯 했다..
여러 번 시도했지만, 실제 카메라로 찍은 사진처럼 완벽한 사실적임을 구현하는 데는 한계가 있었습니다.

#4 의상 변경하기

이번엔 두가지 이미지를 전달주고, 샘플이미지처럼 자연스럽게 옷을 변경하고자 하였습니다. 이미지를 전달줄때에는 이미지 전달순서와 프롬프트를 특히 유의해야합니다.
1번째 순서로 전달하는 이미지를 기준점으로 잡기 때문입니다.
sample image
original image (by midjourney)
인물의 옷차림을 샘플이미지처럼 심플한 디자인의 래시가드로 변경해줘.
저는 AI가 당연히 고화질의 원본 이미지를 기준으로 삼을 거라고 생각했지만, AI는 주어진 순서와 정보를 있는 그대로 따르는 기계라는 점을 다시 한번 깨달았습니다.
정확하게 설명해주지 않는 한, AI는 판단하지 않고 있는 그대로를 받아들이기 때문입니다.
하지만 놀랍게도, AI는 저해상도 이미지였음에도 불구하고 이를 고화질로 선명하게 복원해내는 뛰어난 능력을 보여주었습니다. AI와의 소통 오류로 잘못 생성한 이미지이지만, 개인적으로는 놀라운 결과라고 느꼈습니다.
샘플이미지와 원본이미지가 바뀌었어. 원본을 샘플을 참고해서 다시 생성해줘!
비슷한 색상에 톤만 다른 래쉬가드를 세트로 차려입은 모습이 어색했는데, 색상만 바꾸어줘도 훨씬 자연스럽게 보이는 것 같습니다.

#5 프롬프트를 주고 생성해보기

이번에는 레퍼런스 없이, 프롬프트만 주어졌을 때 과연 어떻게 생성할 것인가? 궁금해져서 프롬프트만으로 이미지를 생성해보고자 하였습니다.
기존에는 구글의 윤리 정책 상 imageFX에서 아동을 묘사하는 프롬프트는 잘 생성하지 않는 경향이 있었기때문에, 어린이 관련 이미지는 미드저니에 의존했었는데요. 어린이 + colorful의 단어 조합 때문인지 몰라도, 의도와는 다르게 과하게 화려하거나 촌스럽거나 복잡한 이미지가 생성되었습니다.
a back of cheerful young korean child playing at an indoor kids pension playground, standing on a trampoline in a bright and colorful play area, surrounded by slides, climbing structures, and soft play equipment, natural lighting, vibrant and clean atmosphere, realistic photography style
구글 AI studio에서 같은 프롬프트를 넣고 이미지를 생성하자, 현실적으로 정말 있을 법한 공간과 상황이 연출되었습니다.
Google AI studio 생성 이미지
색보정, 심도보정 등을 거친 최종 이미지
결과물은 자연스럽지만 약간 밋밋한 느낌이 들기도 하여, 포토샵으로 색보정과 심도보정을 추가로 진행했습니다. 그 결과 정말로 아이가 노는 장면을 촬영한 사진처럼 자연스러운 장면을 만들어낼 수 있었습니다.

#6 참고이미지와 프롬프트를 주고 생성해보기

이번에는 참고 이미지 + 프롬프트의 조합으로 구글 AI를 통한 이미지 생성을 시도해 보았습니다.
여름시즌이 지나가면서 긴팔 수영복을 입은 가족들이 실내워터파크에서 노는 장면을 생성하고 싶었고, 생각하는 장면이 잘 표현된 실제 사진과 그 사진을 토대로 chatGPT가 생성해준 프롬프트를 함께 넣어 이미지 생성을 요청해보았습니다.
a happy korean family enjoying an indoor hot water park, children riding colorful inflatable tubes, parents smiling and splashing together, surrounded by rainbow water arches and fun slides, bright and lively atmosphere, natural lighting, vibrant colors, realistic photography style
AI에게 참고자료를 건네주니, 다시 그 사진을 그대로 복사하여 이미지를 생성했습니다.
이또한 의도한 결과물은 아니었지만, 이번에도 저해상도 이미지를 주었더니 선명한 사진으로 복원해준 점이 놀라웠습니다.
몇년 전까지만 해도 AI 기술을 활용한 업스케일을 시도했을 때, 살짝 뭉개지는듯한 질감으로 표현되는 경우가 많았었는데 이제는 뭐가 원본인지 헷갈릴정도로 이질감 없이 업스케일을 잘 해주는 것 같습니다.
하지만 놀라운 성능과는 별개로, 그저 구성요소들을 참고하라고 보내준 사진을 그대로 베낀점은 아쉬웠습니다.
아무래도 프롬프트가 해당 사진을 묘사한 내용인데다, 참고자료가 함께 주어지니 AI가 ‘이미지=프롬프트 둘은 같은 내용’ 이라고 판단해서 창작을 하지 않은 것 같았습니다.
사진을 그대로 베끼지 말고, 레퍼런스 사진을 확인해서 느낌을 참고해줘.
이번에는 여러가지 실제 워터파크의 장면들을 레퍼런스로 보여주고 참고하라고 다시 이야기 해주었습니다. 그랬더니 …
인물들의 퀄리티 자체는 나쁘지 않으나, 실내 + 실외 구조물들이 혼합되어 비현실적이고 어수선한 공간을 생성해주었음
제시한 레퍼런스의 요소들을 최대한 섞어서 전달한 것 같았습니다.
출처 : Travis davids @X
나노바나나 관련 글들을 리서치하다보면 일관성과 자연스러운 합성 성능을 테스트하기위해 여러가지 오브젝트를 주고 한 장면에 넣어달라! 는 예제를 많이 보게되는데요.
제가 한 장면에 다 넣어달라! 라고 요구하지 않았지만, 마치 그런 요구를 한 것 처럼 여러가지 요소가 어지럽게 뒤엉켜있는 결과물을 만들어냈습니다.
실내/외 구조물이 혼합되어있는데, 레퍼런스 이미지(맨처음 씨랄라 이미지)를 참고해서, 실내 워터파크의 유수풀과 낮은 돌담 알록달록한 아치 등을 구현해줘.
지난 대화의 맥락을 놓지 않으려는 필사적인 노력중인 나노바나나… 하지만 원하던건 이런게 아니었는데…
레퍼런스 이미지(씨랄라이미지)를 참고해서, 비슷한 구도로 보이게 해줘. 초점은 가족들에게 맞춰져있어야 하고 다른 환경적인 부분(구조물)은 아웃포커싱 되어야해.
최종 결과물
처음보다는 훨씬 자연스러운 결과물이 나온것을 확인할 수 있었습니다.
제가 ‘사진을 그대로 베끼지 말고, 레퍼런스 사진을 확인해서 느낌을 참고해줘’라고 추가적인 지시를 내리자, AI는 비로소 창작 모드로 전환되었습니다. 이 과정은 프롬프트에 '역할 분담'을 명확히 제시하는 것이 얼마나 중요한지 보여주는 중요한 교훈을 남겼습니다.

결론

레퍼런스 이미지를 제시하면 그 이미지안에서 요구사항을 구현하려고 해주는 부분이 인상적이었다.
일관성 부분에서는 확실히 만족스러운 결과물을 보여주고 있다.
AI가 넘겨짚을 필요가 없을만큼 명확한 지시사항을 담아, 프롬프트를 잘 쓰는것이 가장 중요한 듯.
벌써 감 좋은 AI 크리에이터들은 여러가지 AI 툴들을 병용하며 장점만 쏙쏙 골라서 사용하는중.
나노바나나가 공개된 이후, 이제 포토샵의 종말이다 라는 자극적인 헤드라인도 많이 보이긴 합니다만, 현실은 거리가 멀다는 것을 깨달았습니다.
오히려 어도비는 이미 포토샵 베타버전에 나노바나나 모델(Gemini 2.5 Flash Image)을 비롯한 여러 생성형 AI모델들을 생성형 채우기(Generative Fill) 기능에 직접 통합하고 있습니다.
출처 : Adobe Blog
직접 사용해 보니 확실히 전문가급의 스킬 없이도 프롬프트만으로 포토샵 이상의 퍼포먼스를 보이는 부분도 있고, 아닌부분도 있는 것 같아 목적과 활용 방법에 따라 다르지 않을까? 라는 생각이 들었습니다.
제 경우는 생성형AI를 통해 실사의 자연스러움과 과장되지 않은 현장감, 공감유도와 같은 가치들을 추구하기때문에 미드저니로 이미지를 생성하고, 이 부분은 좀 아쉽네… 라는 생각이 드는 이미지를 부분 변형 하는 방식으로 잘 활용할 수 있을 것 같습니다.
이때까지는 원본을 해치지 않으며 일부만 원하는대로 변형하기가 까다로워서 포기하고 새로 생성하거나 계속 AI와 끝없는 피드백 전쟁을 해야했는데, 이제는 프롬프트 한줄로 뚝딱 수정이 가능하다는 점은 주목할 만 합니다.
출처 : Adobe Blog
많은 크리에이터들을 통해 AI는 인간의 창의성을 대체하는것이 아니라, 오히려 이를 강화하는 ‘창의적 촉매제’임을 확인했는데요. 동시에 전문가들 사이에서는 각 AI 모델의 고유한 강점을 조합하여 사용하는 ‘하이브리드 워크플로우’가 이미 자연스럽게 확산되고 있습니다.
이 글을 읽고 계신 여러분도 나노바나나의 가능성과 한계를 직접 탐색하며, 자신만의 최적화된 하이브리드 워크플로우를 구축해 보시는 것을 추천합니다.
AI 기술의 발전은 정말 빠르고 놀랍지만, 그 방향을 결정하고 시너지를 만들어내는 것은 결국 인간의 몫이니까요.

참고자료

작성자
작성자
관련된 글 더 보기