슬라이드 이미지 수정 딸깍 v1.2

슬라이드 이미지의 글자를 AI로 자동 인식·교체하는 에디터 — 사용 설명서

1. 소개

슬라이드 이미지 수정 딸깍은 슬라이드 이미지 안의 글자를 AI로 자동 인식하고, 원하는 텍스트로 바꾼 다음 다시 이미지나 PPT로 내보낼 수 있는 도구입니다.

💡 이런 분께 적합합니다

AI로 생성된 슬라이드 이미지의 글자를 수정해야 하는 분
스캔된 자료의 글자를 다른 글자로 덮어써야 하는 분
PPT 원본은 없고 이미지만 있는 자료를 수정해야 하는 분

2. 시작하기

2.1 이미지 열기

다음 중 하나의 방법으로 시작할 수 있습니다:

상단 [열기] 버튼 클릭 → 파일 선택
화면 가운데 "이미지 열기" 버튼 클릭
이미지 파일을 화면에 드래그&드롭
이전에 저장한 .iete 프로젝트 파일도 같은 방법으로 열 수 있습니다 (레이어가 그대로 복원됨)

지원 형식: PNG, JPG, WebP, BMP 등 브라우저가 인식하는 모든 이미지 포맷.

2.2 API 키 등록

AI 기능 대부분(자동 텍스트 감지·인페인팅·자동 누끼·OCR·업스케일)은 사전 설정된 서버를 통해 별도 키 없이 바로 동작합니다. 상단 툴바의 🔑 API 설정 버튼에서 관리할 수 있는 것은 아래 항목뿐입니다 (브라우저에만 저장, 외부로 전송되지 않음).

항목	발급처	용도	요금
Replicate Worker URL	—	OCR(Surya) · 이미지 글자 지우기(LaMa) · 업스케일(Real-ESRGAN)	사전 설정됨 (키 입력 불필요)
Real-ESRGAN 로컬 서버 URL	본인 PC	업스케일 4× (무료, 옵션)	무료 (Portable 패키지 별도 다운로드)

💡 시작 추천 조합

발급할 키가 없습니다. 자동 누끼·인페인팅·OCR·업스케일 모두 사전 설정된 서버로 자동 동작합니다(2026-06 부터 Stability AI 키 불필요). 본인 PC 에서 무료 4× 업스케일을 쓰려면 Real-ESRGAN 로컬 서버만 선택적으로 설치하세요.

ℹ️ Replicate Worker 정보

기본 Worker URL https://gdi-replicate-proxy.sobjil.workers.dev 는 WKYEO 가 비용을 부담하여 운영합니다. Worker 변경이 필요하면 문의해주세요.

2.3 화면 구성

화면은 크게 네 영역으로 나뉩니다:

상단바 — 열기, 저장, 실행취소, 줌, 내보내기 등 전역 기능
좌측 도구바 — 도구 선택 (손 / 영역 / 도장 / 업스케일 / 조정 / 누끼 / AI / 자동교체)
가운데 캔버스 — 이미지 표시 및 편집 영역
우측 패널 — 선택한 도구에 따라 옵션이 바뀜. 레이어 목록도 여기.

3. 도구별 사용법

좌측 도구바에서 도구를 클릭하면 그에 맞는 옵션이 우측에 나타납니다. 각 도구는 단축키로도 전환 가능합니다.

⭐

AI 텍스트 자동 감지

단축키 없음

이미지에서 글자가 있는 모든 영역을 AI가 자동으로 찾아 레이어로 만들어줍니다. 가장 핵심 기능.

사용 방법

좌측 도구바에서 ⭐ AI 자동 감지 선택
상단 🔑 API 설정에서 Replicate Worker URL 확인 (사전 설정됨, 그대로 사용 가능)
[✦ 텍스트 영역 자동 감지 + OCR] 버튼 클릭
약 10~30초 후 검출된 텍스트 영역들이 캔버스에 표시됨 (Replicate cold start 시 더 걸릴 수 있음)
각 박스 위치/크기가 만족스럽지 않으면 마우스로 직접 조정 가능

OCR 모델 — Surya

Surya는 OCR 전용 트랜스포머 모델(Detection + Recognition)로 좌표·글자 모두 매우 정확합니다.

특성	설명
정확도	박스가 글자에 픽셀 단위로 fit. 좌표·크기 거의 완벽.
지원 언어	90+ 언어 (한국어 우수)
속도	이미지당 약 10~30초 (Replicate cold start 시 더 길어짐)
비용	유료 (기본 Worker 는 WKYEO 부담)

적용되는 자동 처리 (백그라운드)

색상 자동 감지 — 배경색과 글자색을 자동으로 추출해 새 텍스트에 적용
폰트 크기 자동 계산 — 박스 안에 텍스트가 깔끔하게 들어가도록 크기 자동 결정
중앙 정렬 자동 적용 — 가로/세로 중앙 정렬이 시각적으로 자연스러움
Bold 디폴트 — 슬라이드 원본은 대부분 bold 강조라 매칭 향상
자동 맞춤 — 박스 안에 텍스트가 넘치면 장평 100→90→80% → 폰트 95~50% 자동 축소

⚠️ 처음 사용 시 주의

Surya 가 인식 못 하는 경우는 거의 없지만, 매우 작은 글자(높이 < 10px)는 누락 가능. 그땐 좌측 도구바의 ▢ 블록 그리기 도구로 직접 만들 수 있습니다.

▢

텍스트 영역 그리기 (블록)

AI 자동 감지로 못 잡은 글자나 새로 추가하고 싶은 텍스트의 영역을 마우스로 직접 그리는 도구입니다.

사용 방법

도구바에서 ▢ 블록 선택 (또는 B)
이미지 위에서 드래그하여 사각 영역 그리기
마우스를 떼면 텍스트 레이어가 생성됨
우측 패널의 텍스트 섹션에서 내용·폰트·색상 설정

T↔

자동 텍스트 교체 파이프라인

단축키 없음

OCR 으로 만든 텍스트 박스의 원본 글자를 한 번에 제거 하거나, 그 위에 새 텍스트를 올리는 자동화 도구. 두 가지 그룹이 있습니다.

두 가지 그룹

그룹	방식	비용	적합한 경우
① 레이어 덮기	박스 주변 배경색 추출 → 텍스트 레이어 fill 단색 적용. 원본 이미지는 안 건드림.	무료·즉시	대부분의 슬라이드 (단색 또는 그라데이션 배경)
② 이미지 글자 지우기 (LaMa)	박스 사각 마스크 → AI 인페인팅 1회 → 원본 이미지에 베이크	유료 (LaMa)	사진형 배경 · 복잡한 디자인

① 레이어 덮기 사용법 (기본 권장)

먼저 AI 텍스트 자동 감지로 박스 검출 (Surya)
각 박스 위치 검수·수정 (Surya 는 정확하지만 가끔 미세 조정 필요)
각 박스 텍스트 더블클릭해서 새 텍스트 입력 (선택)
좌측 도구바 자동 텍스트 교체 선택
우측 패널 레이어 덮기 그룹의 [텍스트 교체] 버튼 클릭
각 박스 주변에서 배경색 자동 추출 → 텍스트 레이어 fill 적용

핵심 동작:

박스 외부 4면에서 stripe sampling → median 으로 배경색 추출 (outlier 강건)
글자색이 배경과 거의 같으면 자동 대비색으로 교체 (검정/흰색)
이미지 자체는 1픽셀도 안 건드림 — 원본 화질 100% 보존

② 이미지 글자 지우기 (LaMa) 사용법

레이어 덮기만으로 부족한 케이스 (사진 배경, 복잡한 디자인) 에서 사용. 유료.

OCR 박스 만들기까지는 동일
좌측 도구바 자동 텍스트 교체 선택
우측 패널 이미지 글자 지우기 (LaMa, 유료) 그룹
전체 박스 또는 선택된 박스 선택
마스크 여백 조정 (기본 10px, 박스 외부 안전 마진)
[🎨 전체 박스] 또는 [🔧 선택된 글상자] 클릭
박스 사각 마스크 통합 → LaMa 호출 1회 → 결과를 베이스 이미지에 베이크

⚠️ 마스크 여백 가이드

0px: 박스 외부 안전 마진 없음 — 글자 일부 잔존 위험
10px (기본): 안전·자연스러움 균형
20px+: 디자인 선·아이콘 침범 위험

✓ 효율 — LaMa 1회 호출

박스가 30개여도 모두 사각 마스크로 통합 → LaMa API 1번만 호출. 비용은 박스 수 무관하게 슬라이드 1장당 약 1원 수준.

↑

업스케일 (해상도 향상)

이미지의 해상도를 2배·4배로 키웁니다. 저화질 자료를 인쇄용으로 쓸 때 유용.

3가지 엔진 비교

엔진	품질	속도	비용	특징
Lanczos	보통	즉시	무료	브라우저 내장, 인터넷 불필요
Replicate Real-ESRGAN	매우 좋음	10~30초	사전 설정됨 (키 불필요)	사진·일러스트 모두 우수
ESRGAN (로컬)	매우 좋음	수십 초~수 분	무료	본인 PC 서버 필요 (설치법)

사용 방법

도구바에서 ↑ 업스케일 선택 (또는 U)
우측 패널에서 엔진 선택
해상도 선택: 2× / 4× / 2K / 4K
[업스케일 실행] 버튼 클릭

💡 결과 비교 모드

업스케일 후 자동으로 Before/After 비교 모드가 활성화됩니다. 결과가 마음에 안 들면 실행 취소 가능.

↻

이미지 조정 (회전·반전·팔레트)

이미지나 선택된 레이어를 회전·반전(플립)하고, 팔레트 스왑으로 전체 색상 계통을 바꿉니다.

💡 적용 대상

레이어를 선택한 상태면 그 레이어만 변환됩니다. 아무것도 선택하지 않은 상태면 전체 이미지에 적용. 우측 패널 상단의 "대상" 표시로 어디에 적용되는지 확인 가능합니다.

↻ 회전

90° / 180° / 270° 버튼으로 빠른 직각 회전
원위치 버튼으로 회전값 0°로 리셋
자유 각도 입력 — -360 ~ 360 사이 숫자 입력 후 [적용] 클릭

↔ 반전 (플립)

↔ 좌우 — 가로축 대칭 반전 (거울상)
↕ 상하 — 세로축 대칭 반전

변환 관리 버튼

↺ 선택 레이어 변환 초기화 — 현재 선택된 레이어의 회전·플립을 모두 0으로 되돌림
✓ 변환 병합 (전체 이미지) — 전체 이미지에 적용된 변환을 베이스 이미지에 영구히 베이크. 이후엔 되돌릴 수 없습니다 (Ctrl+Z는 가능)

🎨 팔레트 스왑

이미지에서 한 색상 계통을 다른 색상 계통으로 옮깁니다. 예: 베이지 톤의 도표를 푸른 톤으로 바꾸기. 같은 입력을 넣으면 항상 같은 결과가 나오고, 적용 버튼을 여러 번 눌러도 제멋대로 누적되지 않습니다.

사용 순서

"원본" 색상을 지정. 두 가지 방법:
- 🔍 자동 감지 버튼 — 이미지에서 가장 많이 쓰인 유채색을 자동으로 추출 (권장)
- 색상 선택기로 직접 지정
"목표" 색상을 지정. 프리셋·커스텀 버튼 클릭 또는 색상 선택기 직접 지정.
[→ 적용] 버튼 클릭 — 원본 색상 계통의 모든 픽셀이 목표 색상 계통으로 변환됨

프리셋과 커스텀

프리셋 8종: 베이지·블루·그린·핑크·퍼플·오렌지·그레이·레드 — 클릭 시 목표 색상에 자동 입력
★ 추가 버튼: 현재 목표 색상을 커스텀 즐겨찾기에 저장 (최대 12개, 브라우저에 영구 저장)
커스텀 항목 클릭: 목표 색상에 자동 입력
커스텀 항목 Shift+클릭: 해당 항목 삭제

💡 적용 방식

변환은 HSL 색공간에서 ΔH(색상 차이) / 채도 비율 / 명도 차이를 한 번에 계산해 모든 픽셀에 동일하게 적용합니다. 즉 무채색에 가까운 픽셀(글자·테두리)은 거의 그대로 유지되고, 색이 있는 영역만 자연스럽게 변환됩니다.

⚠️ 되돌리기

적용 결과가 마음에 안 들면 Ctrl+Z로 즉시 원복. 매 적용마다 히스토리에 저장되므로 다른 목표 색상으로 여러 번 비교해볼 수 있습니다.

👤

배경 제거 (누끼)

이미지의 배경을 투명하게 만듭니다. 세 가지 모드를 제공:

모드	적합 케이스	비용
단색 누끼 ★	이미지 내 같은 색을 한꺼번에 제거 (흰 배경 + 흰색이 다른 곳에 있어도 같이 제거)	무료·즉시
영역 누끼 🪄	클릭한 곳에서 연결된 영역만 제거 (포토샵 마법봉. 같은 색 다른 곳은 안 건드림)	무료·즉시
자동 누끼 (AI)	인물·제품 사진 (단일 피사체) — AI가 자동 인식	무료 · 키 불필요

모드 1: 단색 누끼 ★

지정한 색 (기본 흰색)과 비슷한 픽셀을 모두 투명화. 슬라이드 작업·로고·일러스트의 단색 배경 제거에 최적.

도구바에서 👤 누끼 선택 (또는 K) → 단색 누끼 라디오 (기본값)
색상 표시(기본 흰색)가 맞으면 그대로. 다른 색을 제거하려면 🎯 캔버스에서 색 추출 클릭 후 캔버스의 해당 부분 클릭
유사도 슬라이더로 어느 정도 비슷한 색까지 제거할지 조절 (기본 60, 0~250 범위)
[✂ 배경 제거 실행] 버튼 클릭 → 즉시 결과
결과가 부족하면 Undo 후 유사도 값을 올려서 다시 실행

💡 단색 누끼 사용 팁

슬라이드 흰 배경: 기본값(흰색, 유사도 60)이면 대부분 OK. 그라데이션 가장자리도 같이 빼려면 유사도 120~180.

살리고 싶은 영역에 같은 색이 포함되면 같이 사라짐 (예: 흰 셔츠). 그땐 유사도 낮추거나 다른 모드 사용.

모드 2: 영역 누끼 🪄

포토샵의 마법봉(Magic Wand)과 같음. 캔버스에서 클릭한 위치의 색과 연결된 영역만 제거. 같은 색이 다른 곳에 있어도 안 건드림.

누끼 도구에서 영역 누끼 라디오 선택
유사도 슬라이더 조절 (기본 40) — 같은 영역으로 볼 색 차이 정도
캔버스에서 제거할 영역을 직접 클릭. 즉시 그 영역이 투명화됨.
다른 영역도 빼려면 한 번 더 클릭. 반복 가능. Undo로 한 단계씩 되돌리기.

💡 단색 누끼 vs 영역 누끼 차이

예시: 흰 배경에 빨간 원, 다른 곳에 빨간 사각형.

단색 누끼로 빨간 원을 클릭하면 빨간 원도 빨간 사각형도 함께 제거.

영역 누끼로 빨간 원을 클릭하면 빨간 원만 제거, 빨간 사각형은 그대로.

모드 3: 자동 누끼 (AI)

AI가 알아서 피사체를 인식해 배경만 투명하게. 빠르고 간단하지만 영역 지정 X. 별도 키가 필요 없습니다(사전 설정된 Replicate 서버 사용, 2026-06 부터 Stability AI 키 불필요).

누끼 도구에서 자동 누끼 라디오 선택
[✂ 배경 제거 실행] → 5~20초 후 결과 (큰 이미지는 업로드 시간 추가)

공통: 결과 저장

내보낼 때 PNG 형식으로 저장해야 투명도가 유지됨

⚠️ JPG로 저장하면 안 됨

JPG는 투명도를 지원하지 않아서 배경이 흰색으로 채워집니다. 반드시 PNG로 내보내세요.

⊙

도장 툴 (Clone Stamp)

이미지의 한 영역을 다른 영역에 그대로 복제합니다. 작은 흠집·로고 가리기 등에 유용.

사용 방법

도구바에서 ⊙ 도장 선택 (또는 S)
우측 패널에서 크기·경도·투명도 설정
이미지 위에서 Alt + 클릭 — 복제할 소스 위치 지정
다른 곳에 클릭/드래그하여 그 자리에 소스를 찍기
완료되면 [확정] 버튼으로 베이스 이미지에 합치기

✋

손 도구 (이동)

큰 이미지를 보다가 캔버스를 움직이고 싶을 때 사용. 다른 도구를 선택한 상태에서도 Ctrl+드래그로 동일 동작 가능.

줌은 Ctrl+휠 또는 상단바의 +/− 버튼.

⊕

스포이드 (색상 추출)

자동 호출

이미지의 특정 픽셀에서 색상을 추출해 텍스트 색상이나 배경 색상에 적용합니다. 색상 입력란 옆의 스포이드 아이콘 버튼을 누르면 자동으로 활성화되며, 이미지 클릭 시 그 색을 가져옵니다.

활성화 중에는 마우스 따라 돋보기가 표시되어 정확한 픽셀을 고를 수 있습니다.

4. 텍스트 편집

레이어를 선택하면 우측 패널의 텍스트 섹션에서 다음을 조정할 수 있습니다.

항목	설명
텍스트 내용	여러 줄 입력 가능 (Enter로 줄바꿈)
폰트	Malgun Gothic, NanumGothic, Batang(명조) 등 시스템 폰트
크기	px 단위 (1~500). AI 자동 감지는 자동 계산해줌
색상	색상 선택기 또는 스포이드로 추출
굵게 / 기울임 / 밑줄	B / I / U 버튼
가로 정렬	왼쪽 / 가운데 / 오른쪽
세로 정렬	위 / 가운데 / 아래
자간	letter-spacing (PPT 내보내기엔 적용 안 됨)
장평	가로 폭 비율 (PPT 내보내기엔 적용 안 됨)
줄간격	line-height 비율
외곽선·그림자	토글

줄바꿈 처리

박스 폭에 맞춰 자동 줄바꿈됩니다. 한글·일본어는 글자 단위, 영문은 단어 단위. 또한 마지막 줄이 한두 글자만 남는 고아 줄은 자동으로 윗줄과 합쳐지며, 줄 첫머리에 오면 어색한 부호(), 。, ， 등)는 앞 줄 끝으로 자동 이동합니다.

5. 매직 완드 (배경 채우기)

레이어 영역 안의 특정 색(주로 원본 글자)만 골라서 채워 넣는 기능입니다. 단색 배경 위의 텍스트를 깔끔하게 가릴 때 유용합니다.

사용 방법

레이어를 선택
우측 배경 채우기 섹션에서 매직 완드 체크
완드 색상이 자동으로 글자색으로 설정됨 (수동 변경 가능)
허용 범위 슬라이더: 색 차이 허용 정도 (15~80 권장)
팽창 슬라이더: 글자 테두리 영역 확장 (1~5 권장)
채우기 색상을 지정 (배경색에 맞춤)
[👁 마스크 미리보기] 버튼으로 어느 부분이 선택되었는지 확인

💡 인페인팅 vs 매직 완드

매직 완드: 단색 배경 + 단순 글자 → 빠르고 무료
인페인팅 (자동 교체): 복잡한 배경 + 사진 → 느리지만 자연스러움

6. 저장과 내보내기

6.1 프로젝트 저장 (작업 중인 상태 그대로)

상단바의 [저장] 버튼을 누르면 .iete 파일이 다운로드됩니다. 이 파일에는 원본 이미지와 모든 레이어 정보가 들어 있어서, 나중에 같은 상태에서 작업을 이어갈 수 있습니다.

불러올 때는 상단바의 [불러오기] 버튼 또는 파일을 캔버스에 드래그&드롭.

6.2 이미지 내보내기 (PNG / JPG / WebP)

상단바의 [내보내기] 버튼 옆 드롭다운으로 형식을 선택한 후 클릭. 작업 결과가 단일 이미지 파일로 다운로드됩니다.

형식	사용 시기
PNG	일반적 용도, 투명도 필요한 경우(누끼 결과 등)
JPG	파일 크기 작게 필요한 경우 (사진 위주)
WebP	웹용, PNG보다 작고 화질 비슷

6.3 PPT로 내보내기

상단바의 [PPT 내보내기] 버튼을 누르면 .pptx 파일이 생성됩니다. 이미지가 배경에 깔리고, 텍스트는 PowerPoint에서 편집 가능한 텍스트 박스로 들어갑니다.

⚠️ PPT 내보내기 제약

자간(letter-spacing) — OOXML 표준 spc 속성으로 출력. PowerPoint 2007 이상에서 정상 표시.
장평(가로 폭)은 여전히 적용 안 됨 — OOXML(DrawingML)에 글자 단독 가로 폭 조정 속성이 없음. 장평이 꼭 필요하면 PNG로 내보내서 PPT에 이미지로 삽입하세요.
폰트는 시스템에 설치된 것만 정상 표시 — 받는 사람 PC에 같은 폰트가 없으면 다른 폰트로 대체됨

7. 고품질 업스케일 (Real-ESRGAN / Replicate)

본인 PC에서 Real-ESRGAN 업스케일을 무료로 쓰려면 작은 서버를 한 번 실행해두어야 합니다. Portable 패키지로 제공 — Python 설치도, pip도, 별도 다운로드도 필요 없습니다. ZIP 받아서 풀고 start.bat 더블클릭 한 번이면 끝.

7.1 한 줄 요약 (Windows)

esrgan-server-windows-portable.zip 다운로드 (~60MB)
압축 풀기 (어디든 OK, 예: 바탕화면)
나온 폴더의 start.bat 더블클릭

7.2 자세한 설치 (Windows)

✨ Portable 패키지

Embeddable Python 3.11 + Real-ESRGAN ncnn-vulkan + server.py 가 한 ZIP 에 포함되어 있어 받자마자 바로 동작합니다.

시스템에 영향 X — Windows PATH·레지스트리 안 건드리고, 폴더 통째로 삭제하면 흔적 없이 사라집니다. 사내에서 Python 설치가 막혀있어도 사용 가능.

① 다운로드

esrgan-server-windows-portable.zip (~60MB)

② 압축 풀기

적당한 위치에 압축 푸세요. 예: C:\esrgan-server\ 또는 바탕화면. 풀면 다음 구조가 나옵니다:

esrgan-server/
├── start.bat              ← 더블클릭할 파일
├── server.py              ← HTTP 서버
├── README.txt             ← 짧은 사용 안내
├── python/                ← Embeddable Python 3.11 (시스템과 분리)
│   └── python.exe
└── realesrgan/            ← Real-ESRGAN ncnn-vulkan
    ├── realesrgan-ncnn-vulkan.exe
    └── models/
        ├── realesrgan-x4plus.bin
        ├── realesrgan-x4plus.param
        └── ...

③ `start.bat` 더블클릭

검은 창이 뜨면서 서버가 시작됩니다. 다음과 같은 메시지가 보이면 정상:

============================================================
 딸깍 개발실 — Real-ESRGAN 로컬 업스케일 서버
============================================================
 서버 주소  : http://localhost:8765
 실행 파일  : ...\realesrgan\realesrgan-ncnn-vulkan.exe
              [OK] 발견됨

이 창을 켜둔 채로 두세요 — 창을 닫으면 서버도 종료됩니다.

④ 에디터에서 연결

에디터(슬라이드 이미지 수정 딸깍) → 업스케일 도구
엔진을 "Real-ESRGAN 로컬 서버 (무료)"로 선택
서버 URL이 http://localhost:8765인지 확인
[연결 확인] → ✅ 연결됨 표시되면 완료

💡 두 번째부터는

최초 1회만 ZIP을 받고 압축 풀면 됩니다. 이후 업스케일을 쓸 때마다 start.bat 더블클릭 한 번. 자주 쓰신다면 바탕화면에 start.bat의 바로가기를 만들어두면 편합니다.

💡 자동 시작

PC 켤 때마다 자동으로 서버를 띄우려면 start.bat의 바로가기를 Win+R → shell:startup 폴더에 넣으세요. 백그라운드에서 항상 켜져있게 됩니다.

자주 묻는 문제

Q. start.bat이 깜빡이고 사라져요.: ZIP을 다시 풀어보세요. 압축 푸는 도중 일부 파일이 빠졌을 수 있습니다. 또는 백신/방어 프로그램이 python.exe나 realesrgan-ncnn-vulkan.exe를 차단했는지 확인하세요.
Q. 에디터에서 "연결 안 됨"으로 나와요.: ① start.bat의 검은 창이 떠있는지 확인 (닫혀있으면 서버 종료된 상태). ② 브라우저에서 http://localhost:8765/ping 직접 열어보세요. "ok": true가 나오면 서버는 정상이고 에디터 설정 문제입니다. ③ 방화벽이 8765 포트를 막을 수도 있습니다 (사내망의 경우 보안팀 문의).
Q. macOS / Linux는 안 되나요?: 현재 Portable ZIP은 Windows 전용입니다. macOS/Linux 사용자는 GitHub 저장소의 image-editor/esrgan-server/ 폴더를 직접 받아서 ./setup.sh → ./start.sh 순서로 실행하시면 됩니다 (Python 3 필요).

7.3 Cloudflare Worker로 Replicate 업스케일

개인 PC가 아니라 클라우드(Replicate API)에서 업스케일을 실행하는 옵션입니다. Real-ESRGAN 모델을 사용합니다. 한글 텍스트도 잘 보존되고 안정적입니다.

✓ GDI 직원은 별도 설정 없이 바로 사용 가능

GDI 공용 Worker가 사전 설정되어 있습니다. 업스케일 도구에서 엔진을 "Replicate Real-ESRGAN (유료)"로 선택만 하면 바로 동작합니다.

해상도 안내

Real-ESRGAN은 4× 배율로 처리하고, 에디터에서 선택한 해상도(2K/4K 등)는 후처리 리사이징으로 적용됩니다.

월 비용 시뮬레이션 (직원 5명 × 30장 = 150장 기준)

모델	월 비용
Real-ESRGAN	약 ₩600

📖 본인 Worker를 따로 만들고 싶다면 (관리자용)

사내가 아닌 별도 사이트에서 사용하거나 비용을 본인 계정으로 분리하고 싶으면 직접 Worker를 만들 수 있습니다. 저장소의 cloudflare-worker/README.md에 단계별 안내가 있습니다. 만든 후 에디터의 Worker URL 입력란에 본인 Worker 주소를 넣으면 됩니다.

⚠️ 보안 / 비용 어뷰즈 방지

GDI 공용 Worker는 ALLOWED_ORIGINS 환경변수로 https://sobjil-gdi-apps.mycafe24.ai에서만 호출 가능하도록 제한되어 있습니다. 외부 사이트에서 URL을 알아도 CORS로 차단됨.

8. 단축키

키	동작
`Ctrl`+`O`	이미지 열기
`Ctrl`+`Z`	실행 취소
`Ctrl`+`Y` / `Ctrl`+`Shift`+`Z`	다시 실행
`Ctrl`+`C` / `Ctrl`+`V`	레이어 복사 / 붙여넣기
`Delete`	선택된 레이어 삭제
`Ctrl`+휠	줌 인/아웃
`Ctrl`+드래그	캔버스 이동 (어느 도구에서나)
`H`	손 도구
`B`	블록(영역 그리기) 도구
`S`	도장 도구
`U`	업스케일
`A`	이미지 조정
`K`	누끼
`Ctrl`+`B` / `I`	(텍스트 선택 시) 굵게 / 기울임
`Alt`+클릭	(도장 도구) 소스 지정

9. 배치 처리 (풀파이프라인)

여러 이미지를 한 번에 OCR → 업스케일 → 텍스트 교체 → 통합 PPT 까지 풀파이프라인 처리하는 기능입니다. 상단바의 [📚 배치] 버튼을 누르면 모달이 열립니다.

9.1 풀파이프라인 자동 동작

배치 모드는 매우 단순합니다. 파일 선택 → 시작 만 누르면 나머지는 자동:

단계	처리	비고
1. OCR	Surya 자동 호출 (좌표 정확)	모델 선택 X — Surya 고정
2. 업스케일	Real-ESRGAN 로컬 4× 고정	본인 PC ESRGAN 서버 필요
3. 텍스트 교체	레이어 덮기 (배경색 fill 자동 적용)	이미지 안 건드림, 무료·즉시
4. PPT 통합	모든 이미지를 하나의 .pptx 로 패키징	슬라이드별 fill·정렬·워드아트 모두 보존

9.2 사용 순서

상단바 [📚 배치] 클릭 → 배치 처리 모달 열림
① 파일 선택: 드롭존 클릭 또는 드래그&드롭으로 이미지 여러 장 추가
② [▶ 시작] 클릭 → 자동 진행
진행 중에 일시정지 / 취소 가능
완료 후 [⬇ PPT 다운로드] → 모든 슬라이드 통합 .pptx 생성

✓ 사전 준비 — 한 번만

AI 기능(자동 누끼·인페인팅·OCR·업스케일)은 사전 설정된 서버로 키 없이 작동 — 발급할 키 없음
(선택) Real-ESRGAN 로컬 서버 실행 (start.bat) — 무료 4× 업스케일용

💡 일시정지 활용

잠시 다른 작업을 해야 할 때 일시정지하면 큐는 멈추지만 모달은 그대로 유지됩니다. 다시 재개하면 멈춘 지점부터 이어집니다.

10. 자주 묻는 문제

Q. 페이지가 흰 화면만 뜨고 아무것도 안 보여요

F12로 개발자 도구를 열어 Console 탭의 빨간색 에러 메시지를 확인해주세요. 브라우저는 최신 Chrome/Edge/Firefox 권장.

Q. 자동 감지 후 박스 위치가 글자와 안 맞아요

Surya OCR 은 좌표가 매우 정확합니다 (Detection 모델이 픽셀 단위로 글자 경계 감지). 그래도 미세하게 어긋나면 마우스로 직접 박스를 끌어서 위치·크기를 조정하면 됩니다. 매우 작은 글자(높이 < 10px)는 누락될 수 있는데, 그땐 좌측 도구바의 ▢ 블록 그리기 도구로 직접 만들 수 있습니다.

Q. PPT 가 PowerPoint 에서 안 열려요

라이브 사이트의 PPT export 는 정상 동작합니다 (OOXML 표준 준수). 그래도 안 열리면:

Ctrl+F5 로 강력 새로고침 후 다시 export
워드아트 옵션 OFF 로 다시 시도 (가장 안전한 일반 텍스트 박스)
그래도 안 되면 GitHub 이슈로 신고 (PPT 파일 첨부)

Q. ESRGAN 서버 연결이 안 돼요

start.bat이 실행 중인지 확인 (검은 창이 떠 있어야 함)
방화벽이 막고 있지 않은지 확인
주소가 http://localhost:8765 인지 확인 (다른 PC라면 IP 변경 필요)
저장소의 esrgan-server/README.md의 트러블슈팅 참조

Q. PPT 로 내보낸 글자 모양이 캔버스와 달라 보여요

이 경우 상단 툴바의 🅦 워드아트 체크박스 상태를 확인하세요:

워드아트 ON (기본): PPT 의 워드아트 변형으로 텍스트가 박스에 정확히 fit. 캔버스의 장평·정렬 모두 재현. 단, PPT 에서 박스 크기 변경 시 글자도 함께 stretch 됨.
워드아트 OFF: 일반 텍스트 박스. fontSize × 장평(%) 미리 계산해서 전달. 자연스러운 글자지만 캔버스의 "가로만 좁은" 효과는 없음.

Q. API 키가 안전한가요?

키는 본인 브라우저의 localStorage(또는 Chrome 익스텐션 환경에서는 chrome.storage)에만 저장됩니다. 외부 서버로 전송되거나 다른 사이트에서 읽을 수 없습니다. 다만 PC를 여러 명이 공유한다면 다른 사용자가 같은 브라우저로 접속하면 키를 볼 수 있으니 주의하세요.

Q. 작업 중에 실수로 페이지를 닫으면?

현재 작업 중인 내용은 사라집니다. 주기적으로 상단바의 [저장] 버튼으로 .iete 파일을 만들어 두는 것을 권장합니다.

Q. 한 번에 여러 이미지를 처리하고 싶어요

배치 처리는 풀파이프라인을 지원합니다. 상단바 [📚 배치] 버튼 → 이미지 여러 장 드래그 → 시작 → OCR(Surya) → 업스케일(ESRGAN) → 텍스트 교체(레이어 덮기) → 통합 PPT 까지 자동 진행. 자세한 사용법은 9. 배치 처리 섹션 참고.

Q. Surya OCR 비용이 얼마나 나오나요

기본 Worker 는 WKYEO 가 비용을 부담하여 운영합니다. 회사·외부 배포 시 별도 Worker 가 필요하면 문의해주세요. 직접 Cloudflare Worker + Replicate 계정 만들어서 비용 부담하는 옵션도 가능합니다.

슬라이드 이미지 수정 딸깍 · 최신 정보: GitHub 저장소 · 변경 이력

슬라이드 이미지 수정 딸깍 v1.2

1. 소개

2. 시작하기

2.1 이미지 열기

2.2 API 키 등록

2.3 화면 구성

3. 도구별 사용법

사용 방법

OCR 모델 — Surya

적용되는 자동 처리 (백그라운드)

사용 방법

두 가지 그룹

① 레이어 덮기 사용법 (기본 권장)

② 이미지 글자 지우기 (LaMa) 사용법

3가지 엔진 비교

사용 방법

↻ 회전

↔ 반전 (플립)

변환 관리 버튼

🎨 팔레트 스왑

사용 순서

프리셋과 커스텀

모드 1: 단색 누끼 ★

모드 2: 영역 누끼 🪄

모드 3: 자동 누끼 (AI)

공통: 결과 저장

사용 방법

4. 텍스트 편집

줄바꿈 처리

5. 매직 완드 (배경 채우기)

사용 방법

6. 저장과 내보내기

6.1 프로젝트 저장 (작업 중인 상태 그대로)

6.2 이미지 내보내기 (PNG / JPG / WebP)

6.3 PPT로 내보내기

7. 고품질 업스케일 (Real-ESRGAN / Replicate)

7.1 한 줄 요약 (Windows)

7.2 자세한 설치 (Windows)

① 다운로드

② 압축 풀기

③ start.bat 더블클릭

④ 에디터에서 연결

자주 묻는 문제

7.3 Cloudflare Worker로 Replicate 업스케일

해상도 안내

월 비용 시뮬레이션 (직원 5명 × 30장 = 150장 기준)

8. 단축키

9. 배치 처리 (풀파이프라인)

9.1 풀파이프라인 자동 동작

9.2 사용 순서

10. 자주 묻는 문제

Q. 페이지가 흰 화면만 뜨고 아무것도 안 보여요

Q. 자동 감지 후 박스 위치가 글자와 안 맞아요

Q. PPT 가 PowerPoint 에서 안 열려요

Q. ESRGAN 서버 연결이 안 돼요

Q. PPT 로 내보낸 글자 모양이 캔버스와 달라 보여요

Q. API 키가 안전한가요?

Q. 작업 중에 실수로 페이지를 닫으면?

Q. 한 번에 여러 이미지를 처리하고 싶어요

Q. Surya OCR 비용이 얼마나 나오나요

③ `start.bat` 더블클릭