슬라이드 이미지 수정 딸깍 v1.2
1. 소개
슬라이드 이미지 수정 딸깍은 슬라이드 이미지 안의 글자를 AI로 자동 인식하고, 원하는 텍스트로 바꾼 다음 다시 이미지나 PPT로 내보낼 수 있는 도구입니다.
- AI로 생성된 슬라이드 이미지의 글자를 수정해야 하는 분
- 스캔된 자료의 글자를 다른 글자로 덮어써야 하는 분
- PPT 원본은 없고 이미지만 있는 자료를 수정해야 하는 분
2. 시작하기
2.1 이미지 열기
다음 중 하나의 방법으로 시작할 수 있습니다:
- 상단 [열기] 버튼 클릭 → 파일 선택
- 화면 가운데 "이미지 열기" 버튼 클릭
- 이미지 파일을 화면에 드래그&드롭
- 이전에 저장한
.iete프로젝트 파일도 같은 방법으로 열 수 있습니다 (레이어가 그대로 복원됨)
지원 형식: PNG, JPG, WebP, BMP 등 브라우저가 인식하는 모든 이미지 포맷.
2.2 API 키 등록
AI 기능(자동 텍스트 감지, 인페인팅 등)을 쓰려면 외부 서비스의 API 키가 필요합니다. 상단 툴바의 🔑 API 설정 버튼을 누르면 통합 모달에서 한 번에 입력·저장할 수 있습니다 (브라우저에만 저장, 외부로 전송되지 않음).
| 항목 | 발급처 | 용도 | 요금 |
|---|---|---|---|
| Stability AI API Key | platform.stability.ai | 배경 제거 (자동 누끼) · 인페인팅 (채우기 도구) | 유료, 작업당 약 30~100원 |
| Replicate Worker URL | — | OCR(Surya) · 정밀 누끼(SAM) · 이미지 글자 지우기(LaMa) · 업스케일(Real-ESRGAN) | 유료 (사전 설정됨) |
| Real-ESRGAN 로컬 서버 URL | 본인 PC | 업스케일 4× (무료, 옵션) | 무료 (Portable 패키지 별도 다운로드) |
대부분의 작업은 Stability AI 키 하나만 발급받으면 충분합니다. Replicate Worker URL 은 사전 설정되어 있어 그대로 사용 가능. OCR(Surya), 정밀 누끼(SAM), 인페인팅(LaMa) 모두 Worker 경유로 자동 동작.
기본 Worker URL https://gdi-replicate-proxy.sobjil.workers.dev 는 WKYEO 가 비용을 부담하여 운영합니다. Worker 변경이 필요하면 문의해주세요.
2.3 화면 구성
화면은 크게 네 영역으로 나뉩니다:
- 상단바 — 열기, 저장, 실행취소, 줌, 내보내기 등 전역 기능
- 좌측 도구바 — 도구 선택 (손 / 영역 / 도장 / 업스케일 / 조정 / 누끼 / AI / 자동교체)
- 가운데 캔버스 — 이미지 표시 및 편집 영역
- 우측 패널 — 선택한 도구에 따라 옵션이 바뀜. 레이어 목록도 여기.
3. 도구별 사용법
좌측 도구바에서 도구를 클릭하면 그에 맞는 옵션이 우측에 나타납니다. 각 도구는 단축키로도 전환 가능합니다.
이미지에서 글자가 있는 모든 영역을 AI가 자동으로 찾아 레이어로 만들어줍니다. 가장 핵심 기능.
사용 방법
- 좌측 도구바에서 ⭐ AI 자동 감지 선택
- 상단 🔑 API 설정에서 Replicate Worker URL 확인 (사전 설정됨, 그대로 사용 가능)
- [✦ 텍스트 영역 자동 감지 + OCR] 버튼 클릭
- 약 10~30초 후 검출된 텍스트 영역들이 캔버스에 표시됨 (Replicate cold start 시 더 걸릴 수 있음)
- 각 박스 위치/크기가 만족스럽지 않으면 마우스로 직접 조정 가능
OCR 모델 — Surya
Surya는 OCR 전용 트랜스포머 모델(Detection + Recognition)로 좌표·글자 모두 매우 정확합니다.
| 특성 | 설명 |
|---|---|
| 정확도 | 박스가 글자에 픽셀 단위로 fit. 좌표·크기 거의 완벽. |
| 지원 언어 | 90+ 언어 (한국어 우수) |
| 속도 | 이미지당 약 10~30초 (Replicate cold start 시 더 길어짐) |
| 비용 | 유료 (기본 Worker 는 WKYEO 부담) |
적용되는 자동 처리 (백그라운드)
- 색상 자동 감지 — 배경색과 글자색을 자동으로 추출해 새 텍스트에 적용
- 폰트 크기 자동 계산 — 박스 안에 텍스트가 깔끔하게 들어가도록 크기 자동 결정
- 중앙 정렬 자동 적용 — 가로/세로 중앙 정렬이 시각적으로 자연스러움
- Bold 디폴트 — 슬라이드 원본은 대부분 bold 강조라 매칭 향상
- 자동 맞춤 — 박스 안에 텍스트가 넘치면 장평 100→90→80% → 폰트 95~50% 자동 축소
Surya 가 인식 못 하는 경우는 거의 없지만, 매우 작은 글자(높이 < 10px)는 누락 가능. 그땐 좌측 도구바의 ▢ 블록 그리기 도구로 직접 만들 수 있습니다.
AI 자동 감지로 못 잡은 글자나 새로 추가하고 싶은 텍스트의 영역을 마우스로 직접 그리는 도구입니다.
사용 방법
- 도구바에서 ▢ 블록 선택 (또는 B)
- 이미지 위에서 드래그하여 사각 영역 그리기
- 마우스를 떼면 텍스트 레이어가 생성됨
- 우측 패널의 텍스트 섹션에서 내용·폰트·색상 설정
OCR 으로 만든 텍스트 박스의 원본 글자를 한 번에 제거 하거나, 그 위에 새 텍스트를 올리는 자동화 도구. 두 가지 그룹이 있습니다.
두 가지 그룹
| 그룹 | 방식 | 비용 | 적합한 경우 |
|---|---|---|---|
| ① 레이어 덮기 | 박스 주변 배경색 추출 → 텍스트 레이어 fill 단색 적용. 원본 이미지는 안 건드림. | 무료·즉시 | 대부분의 슬라이드 (단색 또는 그라데이션 배경) |
| ② 이미지 글자 지우기 (LaMa) | 박스 사각 마스크 → AI 인페인팅 1회 → 원본 이미지에 베이크 | 유료 (LaMa) | 사진형 배경 · 복잡한 디자인 |
① 레이어 덮기 사용법 (기본 권장)
- 먼저 AI 텍스트 자동 감지로 박스 검출 (Surya)
- 각 박스 위치 검수·수정 (Surya 는 정확하지만 가끔 미세 조정 필요)
- 각 박스 텍스트 더블클릭해서 새 텍스트 입력 (선택)
- 좌측 도구바 자동 텍스트 교체 선택
- 우측 패널 레이어 덮기 그룹의 [텍스트 교체] 버튼 클릭
- 각 박스 주변에서 배경색 자동 추출 → 텍스트 레이어 fill 적용
핵심 동작:
- 박스 외부 4면에서 stripe sampling → median 으로 배경색 추출 (outlier 강건)
- 글자색이 배경과 거의 같으면 자동 대비색으로 교체 (검정/흰색)
- 이미지 자체는 1픽셀도 안 건드림 — 원본 화질 100% 보존
② 이미지 글자 지우기 (LaMa) 사용법
레이어 덮기만으로 부족한 케이스 (사진 배경, 복잡한 디자인) 에서 사용. 유료.
- OCR 박스 만들기까지는 동일
- 좌측 도구바 자동 텍스트 교체 선택
- 우측 패널 이미지 글자 지우기 (LaMa, 유료) 그룹
- 전체 박스 또는 선택된 박스 선택
- 마스크 여백 조정 (기본 10px, 박스 외부 안전 마진)
- [🎨 전체 박스] 또는 [🔧 선택된 글상자] 클릭
- 박스 사각 마스크 통합 → LaMa 호출 1회 → 결과를 베이스 이미지에 베이크
- 0px: 박스 외부 안전 마진 없음 — 글자 일부 잔존 위험
- 10px (기본): 안전·자연스러움 균형
- 20px+: 디자인 선·아이콘 침범 위험
박스가 30개여도 모두 사각 마스크로 통합 → LaMa API 1번만 호출. 비용은 박스 수 무관하게 슬라이드 1장당 약 1원 수준.
이미지의 해상도를 2배·4배로 키웁니다. 저화질 자료를 인쇄용으로 쓸 때 유용.
3가지 엔진 비교
| 엔진 | 품질 | 속도 | 비용 | 특징 |
|---|---|---|---|---|
| Lanczos | 보통 | 즉시 | 무료 | 브라우저 내장, 인터넷 불필요 |
| Stability AI | 매우 좋음 | 10~30초 | 유료 (작업당 약 100원) | 사진·일러스트 모두 우수 |
| ESRGAN (로컬) | 매우 좋음 | 수십 초~수 분 | 무료 | 본인 PC 서버 필요 (설치법) |
사용 방법
- 도구바에서 ↑ 업스케일 선택 (또는 U)
- 우측 패널에서 엔진 선택
- 해상도 선택: 2× / 4× / 2K / 4K
- [업스케일 실행] 버튼 클릭
업스케일 후 자동으로 Before/After 비교 모드가 활성화됩니다. 결과가 마음에 안 들면 실행 취소 가능.
이미지나 선택된 레이어를 회전·반전(플립)하고, 팔레트 스왑으로 전체 색상 계통을 바꿉니다.
레이어를 선택한 상태면 그 레이어만 변환됩니다. 아무것도 선택하지 않은 상태면 전체 이미지에 적용. 우측 패널 상단의 "대상" 표시로 어디에 적용되는지 확인 가능합니다.
↻ 회전
- 90° / 180° / 270° 버튼으로 빠른 직각 회전
- 원위치 버튼으로 회전값 0°로 리셋
- 자유 각도 입력 — -360 ~ 360 사이 숫자 입력 후 [적용] 클릭
↔ 반전 (플립)
- ↔ 좌우 — 가로축 대칭 반전 (거울상)
- ↕ 상하 — 세로축 대칭 반전
변환 관리 버튼
- ↺ 선택 레이어 변환 초기화 — 현재 선택된 레이어의 회전·플립을 모두 0으로 되돌림
- ✓ 변환 병합 (전체 이미지) — 전체 이미지에 적용된 변환을 베이스 이미지에 영구히 베이크. 이후엔 되돌릴 수 없습니다 (Ctrl+Z는 가능)
🎨 팔레트 스왑
이미지에서 한 색상 계통을 다른 색상 계통으로 옮깁니다. 예: 베이지 톤의 도표를 푸른 톤으로 바꾸기. 같은 입력을 넣으면 항상 같은 결과가 나오고, 적용 버튼을 여러 번 눌러도 제멋대로 누적되지 않습니다.
사용 순서
- "원본" 색상을 지정. 두 가지 방법:
- 🔍 자동 감지 버튼 — 이미지에서 가장 많이 쓰인 유채색을 자동으로 추출 (권장)
- 색상 선택기로 직접 지정
- "목표" 색상을 지정. 프리셋·커스텀 버튼 클릭 또는 색상 선택기 직접 지정.
- [→ 적용] 버튼 클릭 — 원본 색상 계통의 모든 픽셀이 목표 색상 계통으로 변환됨
프리셋과 커스텀
- 프리셋 8종: 베이지·블루·그린·핑크·퍼플·오렌지·그레이·레드 — 클릭 시 목표 색상에 자동 입력
- ★ 추가 버튼: 현재 목표 색상을 커스텀 즐겨찾기에 저장 (최대 12개, 브라우저에 영구 저장)
- 커스텀 항목 클릭: 목표 색상에 자동 입력
- 커스텀 항목 Shift+클릭: 해당 항목 삭제
변환은 HSL 색공간에서 ΔH(색상 차이) / 채도 비율 / 명도 차이를 한 번에 계산해 모든 픽셀에 동일하게 적용합니다. 즉 무채색에 가까운 픽셀(글자·테두리)은 거의 그대로 유지되고, 색이 있는 영역만 자연스럽게 변환됩니다.
적용 결과가 마음에 안 들면 Ctrl+Z로 즉시 원복. 매 적용마다 히스토리에 저장되므로 다른 목표 색상으로 여러 번 비교해볼 수 있습니다.
이미지의 배경을 투명하게 만듭니다. 네 가지 모드를 제공:
| 모드 | 적합 케이스 | 비용 |
|---|---|---|
| 단색 누끼 ★ | 이미지 내 같은 색을 한꺼번에 제거 (흰 배경 + 흰색이 다른 곳에 있어도 같이 제거) | 무료·즉시 |
| 영역 누끼 🪄 | 클릭한 곳에서 연결된 영역만 제거 (포토샵 마법봉. 같은 색 다른 곳은 안 건드림) | 무료·즉시 |
| 자동 누끼 (Stability) | 인물·제품 사진 (단일 피사체) | 키 비용 |
| 정밀 누끼 (SAM) | 사진형 이미지에서 특정 객체 정밀 분리 | ₩4/회 |
모드 1: 단색 누끼 ★
지정한 색 (기본 흰색)과 비슷한 픽셀을 모두 투명화. 슬라이드 작업·로고·일러스트의 단색 배경 제거에 최적.
- 도구바에서 👤 누끼 선택 (또는 K) → 단색 누끼 라디오 (기본값)
- 색상 표시(기본 흰색)가 맞으면 그대로. 다른 색을 제거하려면 🎯 캔버스에서 색 추출 클릭 후 캔버스의 해당 부분 클릭
- 유사도 슬라이더로 어느 정도 비슷한 색까지 제거할지 조절 (기본 60, 0~250 범위)
- [✂ 배경 제거 실행] 버튼 클릭 → 즉시 결과
- 결과가 부족하면 Undo 후 유사도 값을 올려서 다시 실행
슬라이드 흰 배경: 기본값(흰색, 유사도 60)이면 대부분 OK. 그라데이션 가장자리도 같이 빼려면 유사도 120~180.
살리고 싶은 영역에 같은 색이 포함되면 같이 사라짐 (예: 흰 셔츠). 그땐 유사도 낮추거나 다른 모드 사용.
모드 2: 영역 누끼 🪄
포토샵의 마법봉(Magic Wand)과 같음. 캔버스에서 클릭한 위치의 색과 연결된 영역만 제거. 같은 색이 다른 곳에 있어도 안 건드림.
- 누끼 도구에서 영역 누끼 라디오 선택
- 유사도 슬라이더 조절 (기본 40) — 같은 영역으로 볼 색 차이 정도
- 캔버스에서 제거할 영역을 직접 클릭. 즉시 그 영역이 투명화됨.
- 다른 영역도 빼려면 한 번 더 클릭. 반복 가능. Undo로 한 단계씩 되돌리기.
예시: 흰 배경에 빨간 원, 다른 곳에 빨간 사각형.
단색 누끼로 빨간 원을 클릭하면 빨간 원도 빨간 사각형도 함께 제거.
영역 누끼로 빨간 원을 클릭하면 빨간 원만 제거, 빨간 사각형은 그대로.
모드 3: 자동 누끼 (Stability AI)
AI가 알아서 피사체를 인식. 빠르고 간단하지만 영역 지정 X.
- 누끼 도구에서 자동 누끼 라디오 선택
- Stability AI 키 입력 (이미 저장돼 있으면 생략)
- [✂ 배경 제거 실행] → 10~20초 후 결과
모드 4: 정밀 누끼 (SAM)
캔버스에 직접 점을 찍어 살릴/제거할 영역을 정확히 지정. 사진형 이미지의 단일 객체 누끼에 적합 (인물·동물·제품). 디자인 슬라이드 누끼에는 부적합 — 단색 누끼 사용 권장.
- 누끼 도구에서 정밀 누끼 라디오 선택
- 점 종류를 ⊕ 살릴 영역으로 두고, 살리고 싶은 한 객체에 점 5~10개 클릭 (중심부·가장자리에 분산). 너무 많이 X.
- 잘못 잡힌 영역이 있으면 ⊖ 제거 영역으로 바꿔서 그 영역 클릭
- [✂ 배경 제거 실행] → ~5초 후 결과
- 결과가 부족하면 [점 모두 지우기] 후 다시 시도
⊕ 점은 살릴 객체의 중심·가장자리에 5~10개. 너무 많이 찍으면 SAM이 객체를 잘게 쪼개 결과가 깨질 수 있음.
Cloudflare Worker가 설정돼 있어야 작동 (업스케일 도구에서 Worker URL 확인).
공통: 결과 저장
- 내보낼 때 PNG 형식으로 저장해야 투명도가 유지됨
JPG는 투명도를 지원하지 않아서 배경이 흰색으로 채워집니다. 반드시 PNG로 내보내세요.
이미지의 한 영역을 다른 영역에 그대로 복제합니다. 작은 흠집·로고 가리기 등에 유용.
사용 방법
- 도구바에서 ⊙ 도장 선택 (또는 S)
- 우측 패널에서 크기·경도·투명도 설정
- 이미지 위에서 Alt + 클릭 — 복제할 소스 위치 지정
- 다른 곳에 클릭/드래그하여 그 자리에 소스를 찍기
- 완료되면 [확정] 버튼으로 베이스 이미지에 합치기
큰 이미지를 보다가 캔버스를 움직이고 싶을 때 사용. 다른 도구를 선택한 상태에서도 Ctrl+드래그로 동일 동작 가능.
줌은 Ctrl+휠 또는 상단바의 +/− 버튼.
이미지의 특정 픽셀에서 색상을 추출해 텍스트 색상이나 배경 색상에 적용합니다. 색상 입력란 옆의 스포이드 아이콘 버튼을 누르면 자동으로 활성화되며, 이미지 클릭 시 그 색을 가져옵니다.
활성화 중에는 마우스 따라 돋보기가 표시되어 정확한 픽셀을 고를 수 있습니다.
4. 텍스트 편집
레이어를 선택하면 우측 패널의 텍스트 섹션에서 다음을 조정할 수 있습니다.
| 항목 | 설명 |
|---|---|
| 텍스트 내용 | 여러 줄 입력 가능 (Enter로 줄바꿈) |
| 폰트 | Malgun Gothic, NanumGothic, Batang(명조) 등 시스템 폰트 |
| 크기 | px 단위 (1~500). AI 자동 감지는 자동 계산해줌 |
| 색상 | 색상 선택기 또는 스포이드로 추출 |
| 굵게 / 기울임 / 밑줄 | B / I / U 버튼 |
| 가로 정렬 | 왼쪽 / 가운데 / 오른쪽 |
| 세로 정렬 | 위 / 가운데 / 아래 |
| 자간 | letter-spacing (PPT 내보내기엔 적용 안 됨) |
| 장평 | 가로 폭 비율 (PPT 내보내기엔 적용 안 됨) |
| 줄간격 | line-height 비율 |
| 외곽선·그림자 | 토글 |
줄바꿈 처리
박스 폭에 맞춰 자동 줄바꿈됩니다. 한글·일본어는 글자 단위, 영문은 단어 단위. 또한 마지막 줄이 한두 글자만 남는 고아 줄은 자동으로 윗줄과 합쳐지며, 줄 첫머리에 오면 어색한 부호(), 。, , 등)는 앞 줄 끝으로 자동 이동합니다.
5. 매직 완드 (배경 채우기)
레이어 영역 안의 특정 색(주로 원본 글자)만 골라서 채워 넣는 기능입니다. 단색 배경 위의 텍스트를 깔끔하게 가릴 때 유용합니다.
사용 방법
- 레이어를 선택
- 우측 배경 채우기 섹션에서 매직 완드 체크
- 완드 색상이 자동으로 글자색으로 설정됨 (수동 변경 가능)
- 허용 범위 슬라이더: 색 차이 허용 정도 (15~80 권장)
- 팽창 슬라이더: 글자 테두리 영역 확장 (1~5 권장)
- 채우기 색상을 지정 (배경색에 맞춤)
- [👁 마스크 미리보기] 버튼으로 어느 부분이 선택되었는지 확인
매직 완드: 단색 배경 + 단순 글자 → 빠르고 무료
인페인팅 (자동 교체): 복잡한 배경 + 사진 → 느리지만 자연스러움
6. 저장과 내보내기
6.1 프로젝트 저장 (작업 중인 상태 그대로)
상단바의 [저장] 버튼을 누르면 .iete 파일이 다운로드됩니다. 이 파일에는 원본 이미지와 모든 레이어 정보가 들어 있어서, 나중에 같은 상태에서 작업을 이어갈 수 있습니다.
불러올 때는 상단바의 [불러오기] 버튼 또는 파일을 캔버스에 드래그&드롭.
6.2 이미지 내보내기 (PNG / JPG / WebP)
상단바의 [내보내기] 버튼 옆 드롭다운으로 형식을 선택한 후 클릭. 작업 결과가 단일 이미지 파일로 다운로드됩니다.
| 형식 | 사용 시기 |
|---|---|
| PNG | 일반적 용도, 투명도 필요한 경우(누끼 결과 등) |
| JPG | 파일 크기 작게 필요한 경우 (사진 위주) |
| WebP | 웹용, PNG보다 작고 화질 비슷 |
6.3 PPT로 내보내기
상단바의 [PPT 내보내기] 버튼을 누르면 .pptx 파일이 생성됩니다. 이미지가 배경에 깔리고, 텍스트는 PowerPoint에서 편집 가능한 텍스트 박스로 들어갑니다.
- 자간(letter-spacing) — OOXML 표준
spc속성으로 출력. PowerPoint 2007 이상에서 정상 표시. - 장평(가로 폭)은 여전히 적용 안 됨 — OOXML(DrawingML)에 글자 단독 가로 폭 조정 속성이 없음. 장평이 꼭 필요하면 PNG로 내보내서 PPT에 이미지로 삽입하세요.
- 폰트는 시스템에 설치된 것만 정상 표시 — 받는 사람 PC에 같은 폰트가 없으면 다른 폰트로 대체됨
7. 고품질 업스케일 (Real-ESRGAN / Replicate)
본인 PC에서 Real-ESRGAN 업스케일을 무료로 쓰려면 작은 서버를 한 번 실행해두어야 합니다. Portable 패키지로 제공 — Python 설치도, pip도, 별도 다운로드도 필요 없습니다. ZIP 받아서 풀고 start.bat 더블클릭 한 번이면 끝.
7.1 한 줄 요약 (Windows)
- esrgan-server-windows-portable.zip 다운로드 (~60MB)
- 압축 풀기 (어디든 OK, 예: 바탕화면)
- 나온 폴더의
start.bat더블클릭
7.2 자세한 설치 (Windows)
Embeddable Python 3.11 + Real-ESRGAN ncnn-vulkan + server.py 가 한 ZIP 에 포함되어 있어 받자마자 바로 동작합니다.
시스템에 영향 X — Windows PATH·레지스트리 안 건드리고, 폴더 통째로 삭제하면 흔적 없이 사라집니다. 사내에서 Python 설치가 막혀있어도 사용 가능.
① 다운로드
esrgan-server-windows-portable.zip (~60MB)
② 압축 풀기
적당한 위치에 압축 푸세요. 예: C:\esrgan-server\ 또는 바탕화면. 풀면 다음 구조가 나옵니다:
esrgan-server/
├── start.bat ← 더블클릭할 파일
├── server.py ← HTTP 서버
├── README.txt ← 짧은 사용 안내
├── python/ ← Embeddable Python 3.11 (시스템과 분리)
│ └── python.exe
└── realesrgan/ ← Real-ESRGAN ncnn-vulkan
├── realesrgan-ncnn-vulkan.exe
└── models/
├── realesrgan-x4plus.bin
├── realesrgan-x4plus.param
└── ...
③ start.bat 더블클릭
검은 창이 뜨면서 서버가 시작됩니다. 다음과 같은 메시지가 보이면 정상:
============================================================
딸깍 개발실 — Real-ESRGAN 로컬 업스케일 서버
============================================================
서버 주소 : http://localhost:8765
실행 파일 : ...\realesrgan\realesrgan-ncnn-vulkan.exe
[OK] 발견됨
이 창을 켜둔 채로 두세요 — 창을 닫으면 서버도 종료됩니다.
④ 에디터에서 연결
- 에디터(슬라이드 이미지 수정 딸깍) → 업스케일 도구
- 엔진을 "Real-ESRGAN 로컬 서버 (무료)"로 선택
- 서버 URL이
http://localhost:8765인지 확인 - [연결 확인] → ✅ 연결됨 표시되면 완료
최초 1회만 ZIP을 받고 압축 풀면 됩니다. 이후 업스케일을 쓸 때마다 start.bat 더블클릭 한 번. 자주 쓰신다면 바탕화면에 start.bat의 바로가기를 만들어두면 편합니다.
PC 켤 때마다 자동으로 서버를 띄우려면 start.bat의 바로가기를 Win+R → shell:startup 폴더에 넣으세요. 백그라운드에서 항상 켜져있게 됩니다.
자주 묻는 문제
- Q.
start.bat이 깜빡이고 사라져요. - ZIP을 다시 풀어보세요. 압축 푸는 도중 일부 파일이 빠졌을 수 있습니다. 또는 백신/방어 프로그램이
python.exe나realesrgan-ncnn-vulkan.exe를 차단했는지 확인하세요. - Q. 에디터에서 "연결 안 됨"으로 나와요.
- ①
start.bat의 검은 창이 떠있는지 확인 (닫혀있으면 서버 종료된 상태). ② 브라우저에서http://localhost:8765/ping직접 열어보세요."ok": true가 나오면 서버는 정상이고 에디터 설정 문제입니다. ③ 방화벽이 8765 포트를 막을 수도 있습니다 (사내망의 경우 보안팀 문의). - Q. macOS / Linux는 안 되나요?
- 현재 Portable ZIP은 Windows 전용입니다. macOS/Linux 사용자는 GitHub 저장소의
image-editor/esrgan-server/폴더를 직접 받아서./setup.sh→./start.sh순서로 실행하시면 됩니다 (Python 3 필요).
7.3 Cloudflare Worker로 Replicate 업스케일
개인 PC가 아니라 클라우드(Replicate API)에서 업스케일을 실행하는 옵션입니다. Real-ESRGAN 모델을 사용합니다. 한글 텍스트도 잘 보존되고 안정적입니다.
GDI 공용 Worker가 사전 설정되어 있습니다. 업스케일 도구에서 엔진을 "Replicate Real-ESRGAN (유료)"로 선택만 하면 바로 동작합니다.
해상도 안내
Real-ESRGAN은 4× 배율로 처리하고, 에디터에서 선택한 해상도(2K/4K 등)는 후처리 리사이징으로 적용됩니다.
월 비용 시뮬레이션 (직원 5명 × 30장 = 150장 기준)
| 모델 | 월 비용 |
|---|---|
| Real-ESRGAN | 약 ₩600 |
사내가 아닌 별도 사이트에서 사용하거나 비용을 본인 계정으로 분리하고 싶으면 직접 Worker를 만들 수 있습니다. 저장소의 cloudflare-worker/README.md에 단계별 안내가 있습니다. 만든 후 에디터의 Worker URL 입력란에 본인 Worker 주소를 넣으면 됩니다.
GDI 공용 Worker는 ALLOWED_ORIGINS 환경변수로 https://sobjil-gdi-apps.mycafe24.ai에서만 호출 가능하도록 제한되어 있습니다. 외부 사이트에서 URL을 알아도 CORS로 차단됨.
8. 단축키
| 키 | 동작 |
|---|---|
| Ctrl+O | 이미지 열기 |
| Ctrl+Z | 실행 취소 |
| Ctrl+Y / Ctrl+Shift+Z | 다시 실행 |
| Ctrl+C / Ctrl+V | 레이어 복사 / 붙여넣기 |
| Delete | 선택된 레이어 삭제 |
| Ctrl+휠 | 줌 인/아웃 |
| Ctrl+드래그 | 캔버스 이동 (어느 도구에서나) |
| H | 손 도구 |
| B | 블록(영역 그리기) 도구 |
| S | 도장 도구 |
| U | 업스케일 |
| A | 이미지 조정 |
| K | 누끼 |
| Ctrl+B / I | (텍스트 선택 시) 굵게 / 기울임 |
| Alt+클릭 | (도장 도구) 소스 지정 |
9. 배치 처리 (풀파이프라인)
여러 이미지를 한 번에 OCR → 업스케일 → 텍스트 교체 → 통합 PPT 까지 풀파이프라인 처리하는 기능입니다. 상단바의 [📚 배치] 버튼을 누르면 모달이 열립니다.
9.1 풀파이프라인 자동 동작
배치 모드는 매우 단순합니다. 파일 선택 → 시작 만 누르면 나머지는 자동:
| 단계 | 처리 | 비고 |
|---|---|---|
| 1. OCR | Surya 자동 호출 (좌표 정확) | 모델 선택 X — Surya 고정 |
| 2. 업스케일 | Real-ESRGAN 로컬 4× 고정 | 본인 PC ESRGAN 서버 필요 |
| 3. 텍스트 교체 | 레이어 덮기 (배경색 fill 자동 적용) | 이미지 안 건드림, 무료·즉시 |
| 4. PPT 통합 | 모든 이미지를 하나의 .pptx 로 패키징 | 슬라이드별 fill·정렬·워드아트 모두 보존 |
9.2 사용 순서
- 상단바 [📚 배치] 클릭 → 배치 처리 모달 열림
- ① 파일 선택: 드롭존 클릭 또는 드래그&드롭으로 이미지 여러 장 추가
- ② [▶ 시작] 클릭 → 자동 진행
- 진행 중에 일시정지 / 취소 가능
- 완료 후 [⬇ PPT 다운로드] → 모든 슬라이드 통합 .pptx 생성
- Stability AI API Key 등록 (상단 🔑 API 설정)
- Real-ESRGAN 로컬 서버 실행 (start.bat) — 무료 4× 업스케일용
- Replicate Worker URL 은 사전 설정됨
잠시 다른 작업을 해야 할 때 일시정지하면 큐는 멈추지만 모달은 그대로 유지됩니다. 다시 재개하면 멈춘 지점부터 이어집니다.
10. 자주 묻는 문제
Q. 페이지가 흰 화면만 뜨고 아무것도 안 보여요
F12로 개발자 도구를 열어 Console 탭의 빨간색 에러 메시지를 확인해주세요. 브라우저는 최신 Chrome/Edge/Firefox 권장.
Q. 자동 감지 후 박스 위치가 글자와 안 맞아요
Surya OCR 은 좌표가 매우 정확합니다 (Detection 모델이 픽셀 단위로 글자 경계 감지). 그래도 미세하게 어긋나면 마우스로 직접 박스를 끌어서 위치·크기를 조정하면 됩니다. 매우 작은 글자(높이 < 10px)는 누락될 수 있는데, 그땐 좌측 도구바의 ▢ 블록 그리기 도구로 직접 만들 수 있습니다.
Q. PPT 가 PowerPoint 에서 안 열려요
라이브 사이트의 PPT export 는 정상 동작합니다 (OOXML 표준 준수). 그래도 안 열리면:
- Ctrl+F5 로 강력 새로고침 후 다시 export
- 워드아트 옵션 OFF 로 다시 시도 (가장 안전한 일반 텍스트 박스)
- 그래도 안 되면 GitHub 이슈로 신고 (PPT 파일 첨부)
Q. ESRGAN 서버 연결이 안 돼요
start.bat이 실행 중인지 확인 (검은 창이 떠 있어야 함)- 방화벽이 막고 있지 않은지 확인
- 주소가
http://localhost:8765인지 확인 (다른 PC라면 IP 변경 필요) - 저장소의
esrgan-server/README.md의 트러블슈팅 참조
Q. PPT 로 내보낸 글자 모양이 캔버스와 달라 보여요
이 경우 상단 툴바의 🅦 워드아트 체크박스 상태를 확인하세요:
- 워드아트 ON (기본): PPT 의 워드아트 변형으로 텍스트가 박스에 정확히 fit. 캔버스의 장평·정렬 모두 재현. 단, PPT 에서 박스 크기 변경 시 글자도 함께 stretch 됨.
- 워드아트 OFF: 일반 텍스트 박스. fontSize × 장평(%) 미리 계산해서 전달. 자연스러운 글자지만 캔버스의 "가로만 좁은" 효과는 없음.
Q. API 키가 안전한가요?
키는 본인 브라우저의 localStorage(또는 Chrome 익스텐션 환경에서는 chrome.storage)에만 저장됩니다. 외부 서버로 전송되거나 다른 사이트에서 읽을 수 없습니다. 다만 PC를 여러 명이 공유한다면 다른 사용자가 같은 브라우저로 접속하면 키를 볼 수 있으니 주의하세요.
Q. 작업 중에 실수로 페이지를 닫으면?
현재 작업 중인 내용은 사라집니다. 주기적으로 상단바의 [저장] 버튼으로 .iete 파일을 만들어 두는 것을 권장합니다.
Q. 한 번에 여러 이미지를 처리하고 싶어요
배치 처리는 풀파이프라인을 지원합니다. 상단바 [📚 배치] 버튼 → 이미지 여러 장 드래그 → 시작 → OCR(Surya) → 업스케일(ESRGAN) → 텍스트 교체(레이어 덮기) → 통합 PPT 까지 자동 진행. 자세한 사용법은 9. 배치 처리 섹션 참고.
Q. Surya OCR 비용이 얼마나 나오나요
기본 Worker 는 WKYEO 가 비용을 부담하여 운영합니다. 회사·외부 배포 시 별도 Worker 가 필요하면 문의해주세요. 직접 Cloudflare Worker + Replicate 계정 만들어서 비용 부담하는 옵션도 가능합니다.
슬라이드 이미지 수정 딸깍 · 최신 정보: GitHub 저장소 · 변경 이력