name	do-ai-nano-banana
description	콘텐츠 생성, 이미지 생성 및 AI 기반 워크플로우를 위한 Nano-Banana AI 서비스 통합. AI 서비스를 콘텐츠 생성에 통합할 때 사용
version	1.1.0
category	integration
allowed-tools	Read, Write, Edit, Bash, Grep, Glob
tags	ai, content-generation, image-generation, nano-banana, ai-service, gemini-3-pro
related-skills	do-docs-generation, do-domain-uiux
updated	Tue Dec 23 2025 00:00:00 GMT+0000 (Coordinated Universal Time)
status	active
author	Do Team
user-invocable	false

Nano-Banana AI 서비스 통합

빠른 참조

Nano Banana Pro (gemini-3-pro-image-preview) 통합으로 고품질 이미지 생성, 1K/2K/4K 해상도 지원, 스타일 프리픽스, 배치 처리 제공

핵심 기능:

이미지 생성: 1K, 2K, 4K 해상도 및 10가지 종횡비 지원
스타일 제어: 일관된 미학을 위한 스타일 프리픽스 지원
배치 처리: JSON/YAML 설정을 통한 동시 생성
스마트 재시도: API 할당량 처리를 위한 지수 백오프
Google 검색: 사실 기반 콘텐츠를 위한 그라운딩 생성

CLI 빠른 시작:

단일 이미지: generate_image.py -p "Dashboard UI design" -o ui.png -r 4K
스타일 포함: generate_image.py -p "Logo" -o logo.png --style "minimalist, vector"
배치 생성: batch_generate.py -c prompts.json -d output/ --concurrency 2

사용 시점:

문서화를 위한 고품질 이미지 생성
일관된 스타일링을 가진 시각적 자산 생성
다중 이미지 프롬프트 배치 처리
자동화된 이미지 생성 파이프라인 구축

구현 가이드

CLI 스크립트 (권장)

단일 이미지 생성 (scripts/generate_image.py):

기본 사용: generate_image.py -p "A fluffy cat" -o cat.png
고해상도 및 종횡비: generate_image.py -p "Dashboard UI" -o ui.png -r 4K -a 16:9
일관된 미학을 위한 스타일 프리픽스: generate_image.py -p "Mountain landscape" -o landscape.png --style "photorealistic, dramatic lighting"
Google 검색 그라운딩: generate_image.py -p "Mount Fuji at sunset" -o fuji.png -g
상세 모드: generate_image.py -p "Tech logo" -o logo.png -r 4K -a 1:1 --style "minimalist, vector art" -v

배치 생성 (scripts/batch_generate.py):

JSON 설정에서: batch_generate.py -c prompts.json -d output/
YAML 설정에서 동시성 포함: batch_generate.py -c prompts.yaml -d output/ --concurrency 3
명령줄 프롬프트에서: batch_generate.py --prompts "Cat" "Dog" "Bird" -d output/ --style "watercolor painting"
보고서 생성 포함: batch_generate.py -c prompts.json -d output/ --report report.json

배치 설정 파일 예제

prompts.json 형식:

defaults 객체: style, resolution, aspect_ratio 기본값 정의
images 배열: 문자열 프롬프트 또는 상세 객체 포함

상세 이미지 객체 필드:

prompt: 이미지 설명 (필수)
filename: 출력 파일명
resolution: 1K, 2K, 4K
aspect_ratio: 종횡비
style: 스타일 프리픽스

모델 사양

모델명: gemini-3-pro-image-preview (Nano Banana Pro)

지원 해상도:

1K: 표준 품질, 빠른 생성
2K: 품질과 속도의 균형 (기본값)
4K: 최고 품질, 상세한 출력

지원 종횡비:

정사각형: 1:1
세로: 2:3, 3:4, 4:5, 9:16
가로: 3:2, 4:3, 5:4, 16:9, 21:9

특수 기능:

Thinking 모드 기본 활성화
최대 14개 참조 이미지 혼합 지원
로고용 고급 텍스트 렌더링
Google 검색 그라운딩 옵션

스타일 프리픽스 예제

일반적인 스타일 프리픽스:

"photorealistic, 8K, detailed" - 사진 같은 품질
"minimalist, vector art, clean" - 간단한 그래픽
"watercolor painting, soft colors" - 예술적 스타일
"3D render, cinematic lighting" - 3D 외관
"anime style, vibrant colors" - 애니메이션 풍
"professional photography, studio lighting" - 제품 촬영
"digital art, fantasy, ethereal" - 창의적 일러스트레이션
"infographic, data visualization" - 차트 및 다이어그램

오류 처리

스크립트에 지수 백오프를 통한 자동 재시도 포함:

최대 5회 재시도 (설정 가능)
기본 지연: 2초, 매 시도마다 2배 증가
최대 지연: 60-120초
할당량 오류 시 지터 추가로 일시적 폭주 방지

재시도 불가능한 오류 (즉시 실패):

잘못된 API 키
잘못된 인수 (잘못된 종횡비/해상도)

고급 패턴

프로그래밍 방식 사용

generate_image 모듈 활용:

prompt: 이미지 설명
output_path: 출력 파일 경로
aspect_ratio: 종횡비
resolution: 해상도 (1K, 2K, 4K)
style: 스타일 프리픽스
enable_grounding: Google 검색 그라운딩 활성화
max_retries: 최대 재시도 횟수
verbose: 상세 로그 출력

결과 객체:

success: 성공 여부 (bool)
output_path: 생성된 파일 경로
generation_time_seconds: 생성 소요 시간

batch_generate 모듈 활용:

ImageTask 객체: prompt, output_path, resolution, aspect_ratio, style, task_id
run_batch_generation: tasks, concurrency, max_retries, verbose
save_batch_report: 결과를 JSON으로 저장

설정

환경 변수:

GOOGLE_API_KEY: Google AI API 키 (필수)
python-dotenv 설치 시 .env 파일 지원

API 키 발급: https://aistudio.google.com/apikey

의존성:

google-genai
python-dotenv
pyyaml

AI 콘텐츠 생성 워크플로우

문서 생성 파이프라인

사양 데이터에서 완전한 문서 생성:

Phase 1 - API 참조 생성:

입력: API 엔드포인트, 요구사항
모델: claude-3-5-sonnet
온도: 0.3 (일관성 중시)
출력: 포괄적 API 문서

Phase 2 - 사용 예제 생성:

입력: Phase 1 API 문서
포함: 다중 언어 예제 (Python, TypeScript, curl)
온도: 0.5 (적절한 창의성)

Phase 3 - 튜토리얼 생성:

입력: API 문서 및 예제
대상: 초급~중급 개발자
온도: 0.7 (설명적 스타일)

Phase 4 - 다이어그램 설명 생성:

포함: 아키텍처, 시퀀스, 흐름 다이어그램
형식: Mermaid 다이어그램 구문

다국어 콘텐츠 생성

기본 콘텐츠를 여러 언어로 생성:

번역 요구사항:

기술적 정확성 유지
문화적 참조 적응
서식 유지
코드 예제는 영어로 유지

디자인 자산 생성

완전한 디자인 자산 세트 생성:

프로세스:

각 사양에 대해 기본 이미지 생성
스타일 가이드 (시각적 스타일, 색상 팔레트) 적용
요청 시 변형 생성 (variation_strength 조정)

결과 메타데이터:

생성 타임스탬프
적용된 스타일 가이드
원본 사양

콘텐츠 품질 평가

포괄적 콘텐츠 품질 분석:

Phase 1 - 가독성 분석:

분석 유형: readability
메트릭 포함

Phase 2 - 기술적 정확성:

분석 유형: technical_accuracy
기준: 기술 표준

Phase 3 - 완전성 점검:

분석 유형: completeness
필수 섹션 확인

Phase 4 - 스타일 일관성:

분석 유형: style_consistency
스타일 가이드 적용

최종 결과:

전체 품질 점수 산출
각 분야별 상세 분석
개선 권장사항

배치 처리

자동화된 콘텐츠 파이프라인

여러 콘텐츠 항목 병렬 처리:

설정 옵션:

batch_size: 배치당 항목 수 (기본: 5)
max_retries: 최대 재시도 횟수 (기본: 3)
batch_delay: 배치 간 지연 (기본: 1.0초)

처리 흐름:

입력 항목을 배치로 분할
각 배치 내 항목 동시 처리
성공/실패 결과 분리
배치 간 속도 제한 적용

결과 객체:

total_items: 총 항목 수
successful: 성공 수
failed: 실패 수
results: 성공 결과 목록
errors: 오류 목록 (항목, 오류 메시지, 타임스탬프)
processing_time: 총 처리 시간

단일 항목 처리:

지수 백오프로 재시도 로직 적용
각 시도 간 대기 시간: 2의 시도 횟수 제곱 초

사용 예제

콘텐츠 생성

API 문서 생성:

프롬프트: REST API 문서 생성 요청
엔드포인트 목록: 인증, 사용자 프로필 조회/수정
포함 항목: 요청/응답 예제, 오류 코드, 인증

코드 예제 생성:

프롬프트: JWT 인증 코드 예제
언어: Python, TypeScript
포함: 토큰 생성, 검증, 갱신 흐름

이미지 생성

히어로 이미지:

프롬프트: Modern SaaS dashboard hero image, clean UI, gradient background
크기: 1920x1080
스타일: digital_art
품질: high

아이콘 세트:

각 아이콘 설명에 대해 반복 생성
크기: 256x256
스타일: vector
배경: transparent

아이콘 예제:

User profile icon, minimal line art
Settings gear icon, modern design
Notification bell icon, clean style

텍스트 분석

감정 분석:

입력: 사용자 피드백
분석 유형: sentiment
점수 포함

요약:

입력: 긴 문서
분석 유형: summary
최대 길이: 200
핵심 포인트 포함

엔티티 추출:

입력: 기술 문서
분석 유형: entity_extraction
엔티티 유형: technology, framework, tool, concept

보완 Skill

보완 Skill:

do-docs-generation: 이미지를 포함한 자동화된 문서 생성
do-domain-uiux: UI/UX 디자인 자산 생성
do-domain-frontend: 프론트엔드 시각적 컴포넌트
do-workflow-templates: 템플릿 기반 이미지 워크플로우

통합 포인트:

문서 일러스트레이션 파이프라인
디자인 시스템 자산 생성
마케팅 자료 생성
자동화된 시각적 콘텐츠 워크플로우

리소스

Skill 파일:

SKILL.md: 메인 문서 (이 파일)
scripts/generate_image.py: 단일 이미지 생성 CLI
scripts/batch_generate.py: 배치 생성 CLI
examples.md: 추가 워크플로우 예제

외부 문서:

Google AI Studio: https://aistudio.google.com/
Gemini API Reference: https://ai.google.dev/gemini-api/docs

Version: 1.1.0 Last Updated: 2025-12-23 Status: Active

Install Skill

SKILL.md