결론 요약

학습 데이터(너무 커서 해상도만 4k로 리사이징)

여기서 태그를 추출한 뒤 그대로 생성하였습니다.

여기서 태그를 추출한 뒤 그대로 생성하였습니다.

기존 학습 없이 만든 이미지 (anima+4k업스케일)

esr_anime_x4_6_00001_.jpeg

LoRA 적용한 이미지 (anima+LoRA+4k업스케일)

Seed는 2번 이미지와 같도록 고정하였습니다.
(자세히 보면 구성 요소는 같음을 알 수 있습니다.)

Seed는 2번 이미지와 같도록 고정하였습니다. (자세히 보면 구성 요소는 같음을 알 수 있습니다.)

상단 3개 이미지를 모아 분포를 측정했을 때, 크게 차이가 발생하지는 않아, 유사도 등을 기반으로 필터링하는 것은 불가능함을 확인하였습니다.

상단 3개 이미지를 모아 분포를 측정했을 때, 크게 차이가 발생하지는 않아, 유사도 등을 기반으로 필터링하는 것은 불가능함을 확인하였습니다.

seethrough_20260410_091043_c31349ea.mp4


자세한 수행 과정

방향 설정

먼저, 던파를 선택한 것은 특정 게임에 대한 선호가 있다기 보다는, 가장 데이터셋을 구하기 용이하였기 때문임을 말씀드립니다.

비전 AI 는 텍스트 기반 딥러닝보다 훨씬 어렵기 때문에, 여러 과업을 다양하게 수행하는 모델보다, 경험상 각 작업을 잘 하는 여러 모델을 만들어 오케스트레이션 하는 것이 낫다고 느꼈습니다.

이에, 1개의 캐릭터를 학습한 모델 vs 그림체 자체를 학습한 모델

이 두가지를 고민하였는데,

기본적으로 1개 캐릭터의 LoRA 는, nano banana의 성능이 압도적이라,

원본

원본

prompt : A 360 turnaround full body view of the subject, straight in 4 different angles. Front view, half turn, side profile, back view.
Full-body shots, all white background.

prompt : A 360 turnaround full body view of the subject, straight in 4 different angles. Front view, half turn, side profile, back view. Full-body shots, all white background.

원본

원본

Generate an image featuring the same character smiling shyly, all rendered in the same art style. Please ensure consistent character details and art style across all images. The background should remain a simple, solid color.

Generate an image featuring the same character smiling shyly, all rendered in the same art style. Please ensure consistent character details and art style across all images. The background should remain a simple, solid color.

Generate an image featuring the same character looks sad,  rendered in the same art style. Please ensure consistent character details and art style across all images. The background should remain a simple, white color.

Generate an image featuring the same character looks sad, rendered in the same art style. Please ensure consistent character details and art style across all images. The background should remain a simple, white color.

“그림체” 학습으로 방향성 설정하였습니다.

더 알아보기_나노바나나 활용