robi DVLM으로 문서 처리 자동화하기

문서 처리, 이제 AI가 대신합니다. 계약서·청구서·이력서·보고서 — 어떤 문서든 업로드하면 필요한 정보를 자동으로 읽고, 정리하고, 추출해드립니다. 직접 문서를 열어 복사·붙여넣기하던 작업, robi DVLM이 몇 초 만에 처리합니다.

이 가이드에서는 robi DVLM의 두 가지 핵심 기능인 파싱(Parsing)과 추출(Extraction)의 기술적 원리부터, Playground에서의 즉시 테스트, REST API를 통한 시스템 연동까지 실전 워크플로를 단계별로 안내합니다.

핵심 개념: 파싱(Parsing)과 추출(Extraction)

robi DVLM은 두 가지 모드로 동작합니다. 목적에 따라 선택하세요.

📄 파싱(Parsing) — 문서 전체를 데이터로 변환 스캔 PDF, 사진 찍은 문서, 표가 가득한 보고서. 어떤 형태든 업로드하면 텍스트·표·레이아웃 구조를 그대로 살려 Markdown 또는 JSON으로 변환합니다. 내부적으로 레이아웃 분석 → OCR 처리 → VLM 추론의 3단계 파이프라인을 거칩니다.

파싱은 이럴 때 사용합니다: • 스캔 문서에서 텍스트 복사가 안 될 때 • 표 구조를 깨지 않고 데이터로 옮기고 싶을 때 • 문서를 검색하거나 AI(RAG 등)에 입력할 수 있는 형태로 바꾸고 싶을 때

🎯 추출(Extraction) — 원하는 항목만 정확하게 추출할 항목(Key)을 정의하면 해당 값만 Key-Value가 포함된 JSON으로 반환합니다. 파싱이 문서 전체를 데이터로 바꾸는 것이라면, 추출은 필요한 필드만 정밀하게 타겟팅합니다.

추출은 이럴 때 사용합니다: • 청구서·계약서에서 같은 항목을 매번 손으로 옮길 때 • 수십~수백 장의 문서를 배치로 자동 처리하고 싶을 때 • 특정 데이터를 ERP·CRM 등 시스템에 바로 넣고 싶을 때

빠른 시작 가이드: 5분 안에 결과 얻기

방법 1 — Playground (코드 없이 즉시 테스트) 코드 한 줄 없이 브라우저에서 바로 테스트할 수 있습니다. 일별 무료 크레딧 300이 제공되므로 별도 결제 없이 바로 체험 가능합니다.

1. robi DVLM 사이트에 회원가입/로그인합니다. 2. Playground 페이지로 이동합니다. 3. 문서를 드래그 앤 드롭으로 업로드합니다. (지원 포맷: JPG, PNG, PDF, DOC, XLS, TIF) 4. 파싱 또는 추출 모드를 선택합니다. 5. 결과를 확인하고, 필요시 UI에서 직접 수정합니다.

방법 2 — REST API 연동 기존 시스템에 통합하거나 배치 처리를 자동화하려면 REST API를 사용합니다. 대시보드 > API 키 메뉴에서 API 키를 발급받은 후, 파싱 또는 추출 엔드포인트를 호출합니다.

파싱 API 호출 예시

curl -X POST https://api.robi-dvlm.com/v1/parse \ -H "Authorization: Bearer YOUR_API_KEY" \ -H "Content-Type: multipart/form-data" \ -F "file=@invoice.pdf" \ -F "output_format=markdown"

파싱 옵션: • output_format: "markdown" | "json" • include_layout: true | false (기본값: true) • table_mode: "structured" | "raw" • page_range: "1-5" | "all" (기본값: "all")

추출 API 호출 예시

curl -X POST https://api.robi-dvlm.com/v1/extract \ -H "Authorization: Bearer YOUR_API_KEY" \ -H "Content-Type: multipart/form-data" \ -F "file=@invoice.pdf" \ -F 'keys=["공급자명","사업자번호","공급가액","세액"]'

각 추출 항목에는 신뢰도(confidence) 점수가 포함됩니다. confidence 0.9 이상인 결과만 자동 승인하고, 미만인 경우 사람이 검토하는 워크플로를 구축할 수 있습니다.

지원 파일 형식 및 제한

지원 포맷: JPG, JPEG, PNG, PDF, DOC, DOCX, XLS, XLSX, TIF, TIFF 최대 파일 크기: 50MB 최대 페이지 수: PDF 단일 요청 최대 100페이지 이미지 해상도: 최소 150 DPI 권장 (300 DPI 이상 최적) 언어: 한국어 최적화 (영어, 일본어, 중국어 지원)

TIP: 스캔 문서는 300 DPI 이상, 기울기 5도 이내에서 최상의 결과를 보입니다.

이런 상황에 딱 맞습니다

• 계약서에서 금액·날짜를 매번 손으로 옮긴다 → 추출 기능으로 자동 추출 • 스캔된 PDF가 텍스트로 복사가 안 된다 → 파싱 기능으로 텍스트 변환 • 표가 많은 문서가 제대로 인식이 안 된다 → 표 구조·다단 레이아웃까지 정확 인식 • 문서 처리를 시스템에 자동화하고 싶다 → REST API로 바로 연동 • 금융/의료 등 보안이 중요한 환경이다 → 온프레미스 내부망 격리 운영 • 매일 수백 장의 문서를 반복 처리한다 → 배치 API로 대량 자동화

지금 바로 시작하세요

✅ Playground — 코드 없이 브라우저에서 즉시 결과 확인 ✅ 일별 무료 크레딧 300 제공 ✅ REST API — 기존 시스템에 바로 연동 ✅ 기술 지원 — support@posicube.com

실제 샘플 기준으로 예상 효율을 분석하고, 가장 효과적인 도입 방법을 Document AI 전문가가 함께 설계해 드립니다.