
들어가며
이번 장에서는 생성형 AI가 이미지화하기에 특히 어려운 상황들을 구체적으로 살펴본다. 간단한 명사 위주 설명은 잘 구현되지만, 인간 동작, 순차 행동, 정밀 구조물 등은 여전히 난제다. 사용자가 겪는 문제를 실제 예시를 통해 확인하며, 어떤 공통된 한계가 있는지를 파악해 본다.
요가 자세 – 유연성과 해부학의 함정
프롬프트:
“견상자세에서 오른쪽 다리를 하늘로 뻗고 시선은 왼쪽 발끝을 향함”
결과 문제:
- 해부학적으로 불가능한 비틀린 자세로 생성됨
- 시선이 뒤쪽을 향해 있거나 정면을 응시함
- 손이나 다리가 왜곡되거나 중첩되어 이상한 인물 형상이 됨
요점: 시선, 중심 축, 팔다리 각도는 실제 관절 가동 범위나 무게 중심 고려가 어려워 현실적인 자세 구현이 어렵다.
종이접기 – 단순하지만 순서와 각도에 민감
프롬프트:
“색종이를 대각선으로 접고, 오른쪽 윗모서리를 중앙선에 맞춰 접는다.”
결과 문제:
- 시점 불명: 위에서 본 건지, 옆에서 본 건지 알 수 없음
- 선이 어긋나고 종이의 중심이 일그러짐
- 각 단계가 분리되지 않고 최종 결과만 출력되거나 애매하게 혼합됨
요점: 종이의 두께나 방향성이 고려되지 않으며, 각 단계를 구분해 시각적으로 구현하는 데 어려움이 있다.
프라모델 조립 – 물리적 상호작용의 시각화 실패
프롬프트:
“B 부품을 A 홈에 끼우고 45도 회전한 뒤, C를 결합함”
결과 문제:
- 부품의 상대적 위치가 불일치함
- 홈이 잘 보이지 않거나 엉뚱한 방향으로 삽입됨
- 중간 회전 단계가 생략되고 바로 완성 모습만 보여짐
요점: 부품 간 결합 관계, 구조적 연결 방식은 단순한 텍스트로 설명되어도 이미지화 시에는 자주 왜곡된다.
공통적인 시각적 어려움 요약
| 문제 유형 | 설명 |
| 상대적 위치 | 왼쪽/오른쪽, 앞/뒤 등의 관계가 이미지에서 틀리게 생성됨 |
| 순차적 과정 | 단계의 분리 없이 한 장면에 모두 섞여 나오는 경우가 많음 |
| 관절 가동 범위 | 실제로는 불가능한 동작이 생성되는 경우가 있음 |
| 구성 요소 왜곡 | 실제 부품, 종이 구조 등이 왜곡되거나 결합에 실패함 |
이 장의 요약
- 요가 자세, 종이접기, 조립 설명서 같은 콘텐츠는 구조적/동적 설명을 요구하므로 오류가 빈번하다.
- 문장의 명확성보다 이미지 생성 모델의 공간·관계 추론 능력이 부족한 것이 근본 원인이다.
- 복잡한 설명일수록 텍스트와 그림 간 격차가 벌어질 수밖에 없다.
'AI 프롬프트' 카테고리의 다른 글
| 8장. 언어모델과 이미지모델의 분리 문제 – 통합은 가능할까? (2) | 2025.07.08 |
|---|---|
| 7장. 언어로 설명하기 어려운 행동 표현 – AI 모델이 '못 보는' 장면들 (1) | 2025.07.08 |
| 5장. 생성형 AI의 이미지 생성 방식 – 왜 디테일이 빠질까 (3) | 2025.07.08 |
| 4장. 복합 문서 작성자의 좌절 – 글과 그림의 동시 제작 문제 (1) | 2025.07.08 |
| 3장. 글로 그림을 설명하기 – 사용자가 겪는 실제 어려움들 (0) | 2025.07.08 |