본문 바로가기

AI 프롬프트

6장. 정확한 시각 표현이 어려운 예시들 – 요가, 종이접기, 조립 설명서

들어가며

이번 장에서는 생성형 AI가 이미지화하기에 특히 어려운 상황들을 구체적으로 살펴본다. 간단한 명사 위주 설명은 잘 구현되지만, 인간 동작, 순차 행동, 정밀 구조물 등은 여전히 난제다. 사용자가 겪는 문제를 실제 예시를 통해 확인하며, 어떤 공통된 한계가 있는지를 파악해 본다.


요가 자세 – 유연성과 해부학의 함정

프롬프트:
“견상자세에서 오른쪽 다리를 하늘로 뻗고 시선은 왼쪽 발끝을 향함”

결과 문제:
  • 해부학적으로 불가능한 비틀린 자세로 생성됨
  • 시선이 뒤쪽을 향해 있거나 정면을 응시함
  • 손이나 다리가 왜곡되거나 중첩되어 이상한 인물 형상이 됨

요점: 시선, 중심 축, 팔다리 각도는 실제 관절 가동 범위나 무게 중심 고려가 어려워 현실적인 자세 구현이 어렵다.


종이접기 – 단순하지만 순서와 각도에 민감

프롬프트:
“색종이를 대각선으로 접고, 오른쪽 윗모서리를 중앙선에 맞춰 접는다.”

결과 문제:
  • 시점 불명: 위에서 본 건지, 옆에서 본 건지 알 수 없음
  • 선이 어긋나고 종이의 중심이 일그러짐
  • 각 단계가 분리되지 않고 최종 결과만 출력되거나 애매하게 혼합됨

요점: 종이의 두께나 방향성이 고려되지 않으며, 각 단계를 구분해 시각적으로 구현하는 데 어려움이 있다.


프라모델 조립 – 물리적 상호작용의 시각화 실패

프롬프트:
“B 부품을 A 홈에 끼우고 45도 회전한 뒤, C를 결합함”

결과 문제:
  • 부품의 상대적 위치가 불일치함
  • 홈이 잘 보이지 않거나 엉뚱한 방향으로 삽입됨
  • 중간 회전 단계가 생략되고 바로 완성 모습만 보여짐

요점: 부품 간 결합 관계, 구조적 연결 방식은 단순한 텍스트로 설명되어도 이미지화 시에는 자주 왜곡된다.


공통적인 시각적 어려움 요약

문제 유형 설명
상대적 위치 왼쪽/오른쪽, 앞/뒤 등의 관계가 이미지에서 틀리게 생성됨
순차적 과정 단계의 분리 없이 한 장면에 모두 섞여 나오는 경우가 많음
관절 가동 범위 실제로는 불가능한 동작이 생성되는 경우가 있음
구성 요소 왜곡 실제 부품, 종이 구조 등이 왜곡되거나 결합에 실패함

이 장의 요약

  • 요가 자세, 종이접기, 조립 설명서 같은 콘텐츠는 구조적/동적 설명을 요구하므로 오류가 빈번하다.
  • 문장의 명확성보다 이미지 생성 모델의 공간·관계 추론 능력이 부족한 것이 근본 원인이다.
  • 복잡한 설명일수록 텍스트와 그림 간 격차가 벌어질 수밖에 없다.