amkt
AI도구

Databricks GPT-5.5 — 엔터프라이즈 에이전트 운영 흐름 해설

유형: 엔터프라이즈 에이전트 워크플로 / 모델 게이트웨이 / 멀티 에이전트 오케스트레이션

주의: 엔터프라이즈 에이전트는 내부 문서, 업무 시스템, 고객 데이터, OAuth 토큰, MCP 서버와 연결될 수 있으므로 권한·보안·개인정보·감사 관련 내용은 정보 제공 범위로만 다룬다.

Codex·2026.05.24·읽기 시간 12··OpenAI, Databricks brings GPT-5.5 to enterprise agent workflows
Databricks GPT-5.5 — 엔터프라이즈 에이전트 운영 흐름 해설

한눈에 보기

OpenAI는 2026년 5월 15일 Databricks가 GPT-5.5를 고객용 에이전트 워크플로에 제공한다고 발표했다. 발표의 핵심은 벤치마크 수치보다 운영 위치다. GPT-5.5가 Databricks의 AI Unity Gateway, AgentBricks, Agent Supervisor API 흐름 안에서 문서 파싱, 검색, 추론, 실행을 조율하는 역할로 들어간다는 뜻이다. 실무에서는 "모델이 좋아졌다"보다 "누가 어떤 데이터와 도구를 쓸 수 있고, 실행 결과를 어떻게 추적하느냐"가 더 중요해졌다.

항목내용
유형엔터프라이즈 에이전트 워크플로 / 모델 게이트웨이 / 멀티 에이전트 오케스트레이션
카테고리AI도구 / agentic workflows / 데이터 플랫폼 AI
설치Databricks 워크스페이스, Unity Catalog, Unity AI Gateway, `databricks-openai` Python 패키지 필요
가격공개 발표에는 GPT-5.5 가격 조건이 없다. Databricks 계약, 워크스페이스 리전, Preview 사용 가능 여부 확인 필요
GitHubhttps://github.com/databricks/databricks-ai-bridge, https://github.com/databricks/cli
공식문서https://openai.com/index/databricks/, https://docs.databricks.com/aws/en/generative-ai/agent-bricks/supervisor-api

이 도구가 하는 일

  • 오래된 PDF, 스캔 문서, 긴 업무 문서에서 필요한 값을 읽고 검색·추론 단계로 넘긴다.
  • AgentBricks와 Supervisor API 흐름에서 여러 도구와 하위 에이전트를 조율한다.
  • Unity AI Gateway를 통해 모델 호출, 권한, 사용량, 레이트 리밋, 추적을 중앙에서 관리하게 한다.
  • Genie Spaces, Unity Catalog 함수, Knowledge Assistant, Apps, MCP 연결 같은 Databricks 도구를 에이전트 실행 표면으로 묶는다.
  • 긴 작업은 background mode로 비동기 실행하고, 필요한 경우 사람이 MCP 도구 호출을 승인하게 한다.

설치 & 빠른 시작

npm/npx로 바로 실행하는 방식보다, 이 사례는 Databricks 워크스페이스 권한과 Python 패키지 고정이 먼저다. 특히 Supervisor API는 Beta라서 계정 또는 워크스페이스의 Preview 활성화, Unity Catalog, Unity AI Gateway 조건을 먼저 확인해야 한다.

# 권장: 가상환경에서 Python 패키지 버전 고정
python -m venv .venv
source .venv/bin/activate
python -m pip install --upgrade pip
python -m pip install "databricks-openai"

# Databricks CLI가 필요한 운영팀은 릴리스 바이너리나 사내 패키지 저장소로 배포 버전을 고정
databricks auth login --host https://<workspace-url>
databricks current-user me
from databricks_openai import DatabricksOpenAI

client = DatabricksOpenAI(use_ai_gateway=True)

response = client.responses.create(
    model="<workspace-gpt-5-5-model-id>",
    input=[
        {
            "type": "message",
            "role": "user",
            "content": "최근 고객 리뷰를 요약하고 긴급 처리 후보만 근거와 함께 분리해줘.",
        }
    ],
    tools=[
        {
            "type": "knowledge_assistant",
            "knowledge_assistant": {
                "knowledge_assistant_id": "<knowledge-assistant-id>",
                "description": "내부 고객지원 문서와 정책을 검색한다.",
            },
        },
        {
            "type": "uc_function",
            "uc_function": {
                "name": "<catalog>.<schema>.<function_name>",
                "description": "리뷰를 긴급 처리 대상으로 분류한다.",
            },
        },
    ],
    extra_body={
        "trace_destination": {
            "catalog_name": "<catalog>",
            "schema_name": "<schema>",
            "table_prefix": "agent_review_trace",
        }
    },
)

print(response.output_text)

주의: OpenAI 발표는 GPT-5.5가 Databricks 고객 에이전트 워크플로에 제공된다고 설명하지만, 확인 시점의 Databricks Supervisor API 문서의 지원 모델 목록은 GPT-5.4까지 표시되어 있었다. 예시 코드의 모델 ID는 자리표시자이며, 실제 모델 문자열과 사용 가능 리전은 워크스페이스의 모델 카탈로그와 계약 조건에서 다시 확인해야 한다.

실제 사용 후기

이런 에이전트 흐름을 실무에 붙여보면, 모델 성능보다 먼저 부딪히는 건 데이터와 권한이다. "고객 리뷰를 요약해줘"라는 요청도 실제로는 리뷰 테이블, CRM 티켓, 정책 문서, 환불 규칙, 담당자 권한이 한꺼번에 걸린다. 모델이 문서를 더 잘 읽어도, 어떤 테이블을 읽었는지와 어떤 함수가 실행됐는지 추적하지 못하면 운영팀은 결과를 믿기 어렵다.

이번 업데이트에서 흥미로운 지점은 OfficeQA Pro 결과다. OpenAI는 GPT-5.5가 Databricks의 복잡한 기업 문서 태스크 벤치마크에서 50% 정확도에 도달했고, GPT-5.4 대비 오류를 46% 줄였다고 밝혔다. 이 수치는 만능 자동화를 뜻하지 않는다. 다만 스캔 PDF, 오래된 파일, 긴 문서처럼 에이전트가 자주 무너지는 구간에서 개선 신호가 있다는 의미로 읽는 편이 맞다.

Databricks 문서를 같이 보면 운영 그림이 더 선명하다. Supervisor API는 모델, 도구, 지시문을 한 번에 넘기면 Databricks가 모델 호출, 도구 선택, 도구 실행, 최종 응답 생성을 반복해준다. Unity AI Gateway는 에이전트, LLM 엔드포인트, MCP 서버, 코딩 에이전트에 대한 중앙 거버넌스 층으로 설명된다. 즉 도입 포인트는 "GPT-5.5를 부른다"가 아니라 "게이트웨이, 도구 권한, 추적 테이블, 사람 검수까지 한 운영 흐름으로 묶는다"에 있다.

시각화로 보는 실무 해석

독자적용 영역검증 기준리스크성과지표
데이터 플랫폼팀Unity AI Gateway, Unity Catalog, 모델 엔드포인트리전, Preview, 권한, 추적 테이블워크스페이스별 기능 차이승인된 엔드포인트 비율, 정책 예외 건수
개발팀Supervisor API, 함수 도구, MCP 연결도구 호출 로그, 실패 재현, 테스트 가능성에이전트 루프가 과도하게 길어짐처리 시간, 재작업률, 실패 원인 분류
보안팀OAuth, U2M 인증, MCP 승인, 감사사용자별 토큰 분리, 명시적 권한내부 문서·고객 데이터 과다 노출차단 이벤트, 감사 대응 시간
기획·마케팅팀리뷰 분류, 리드 선별, 리포트 초안출처 링크, 미확인 항목 분리요약을 확정 사실로 오해분류 정확도, 처리 리드타임
경영진업무 자동화 투자 판단파일럿 범위, 비용, 책임자벤치마크를 즉시 ROI로 해석반복 업무 절감, 파일럿 전환율

운영 흐름도

  1. 대상 업무를 고른다: 스캔 문서 처리, 고객 리뷰 분류, 정책 Q&A처럼 반복성과 검수 기준이 있는 업무부터 시작한다.
  2. 데이터 권한을 나눈다: Unity Catalog 객체, Genie Space, Knowledge Assistant, 함수, MCP 연결별로 사용자 권한을 따로 확인한다.
  3. 게이트웨이를 통과시킨다: Unity AI Gateway에서 모델 엔드포인트, 레이트 리밋, 추적, 비용 모니터링 기준을 잡는다.
  4. 도구 설명을 쓴다: Supervisor가 잘못 위임하지 않도록 각 도구의 역할, 입력, 금지 범위를 짧고 구체적으로 적는다.
  5. 추적을 켠다: `trace_destination`을 설정해 모델 호출과 도구 실행 흐름을 Unity Catalog 테이블에 남긴다.
  6. 사람 승인 지점을 둔다: MCP나 외부 시스템 호출, 고객 데이터 접근, 자동 실행 함수는 승인 또는 재검토 단계를 둔다.
  7. 결과를 평가한다: 정확도뿐 아니라 누락, 오분류, 비용, 지연 시간, 사람이 다시 확인한 비율을 같이 본다.

장점

  1. 기업 문서 처리에서 실제로 아픈 지점인 파싱, 검색, 근거 기반 추론을 정면으로 다룬다.
  2. Databricks 환경의 권한, 함수, 지식 검색, MCP 연결을 하나의 에이전트 운영 표면으로 묶기 좋다.
  3. 추적 테이블과 Gateway 운영을 함께 설계하면 "에이전트가 뭘 했는지"를 감사 가능한 형태로 남길 수 있다.

한계

  1. GPT-5.5 가격, 일반 제공 범위, 리전별 제공 조건은 공개 글만으로 확정하기 어렵다.
  2. Supervisor API와 Unity AI Gateway 일부 기능은 Beta라서 운영 보증, 제한, 사용 가능 계정이 달라질 수 있다.
  3. 벤치마크 성능이 높아도 기업 데이터 품질, 도구 설명, 권한 설계가 나쁘면 실무 품질은 빠르게 떨어진다.

체크리스트: 바로 실행할 질문

  • 우리 워크스페이스에서 Unity AI Gateway와 Supervisor API Preview가 켜져 있는가?
  • GPT-5.5 모델 문자열과 사용 가능 리전이 실제 모델 카탈로그에 표시되는가?
  • 에이전트가 읽을 수 있는 Unity Catalog 객체와 실행할 수 있는 함수가 분리되어 있는가?
  • MCP 서버나 외부 커넥터 호출에 명시적 사용자 승인 흐름이 있는가?
  • `trace_destination`으로 모델 호출과 도구 실행 로그를 남기는가?
  • 오래된 PDF, 스캔 문서, 긴 문서 같은 실패 가능성이 큰 샘플을 테스트 세트로 만들었는가?
  • 성과지표를 "자동 생성 건수"가 아니라 오분류율, 검수 시간, 재작업률, 비용으로 잡았는가?

추천 활용법

첫 파일럿은 고객 데이터 전체를 열어두는 방식보다 폐쇄형 샘플셋이 낫다. 예를 들어 스캔 계약서 100건, 고객 리뷰 500건, 내부 정책 문서 20개처럼 사람이 정답을 검수할 수 있는 범위로 시작한다. GPT-5.5의 장점이 문서 파싱과 맥락 검색에 있다면, 평가도 예쁜 데모가 아니라 숫자·날짜·조건을 정확히 뽑는지로 해야 한다.

두 번째 단계는 도구 위임 품질이다. Supervisor가 Genie Space를 불러야 할 때 Knowledge Assistant를 부르거나, 함수 실행이 필요한데 문서 검색으로 끝내면 자동화는 느려진다. 도구 설명을 구체화하고, 실패 사례를 Guidelines나 테스트 질문으로 누적해야 한다.

세 번째 단계에서 운영 자동화를 넓힌다. 리드 선별, VOC 라우팅, 내부 정책 Q&A, 보고서 초안은 모두 가능성이 있지만, 결론을 바로 확정하게 두면 위험하다. 출처, 미확인 가정, 실행한 도구, 다음 승인자를 분리해 보여주는 출력 형식을 먼저 고정하는 편이 낫다.

관련 읽기 경로

비슷한 도구 비교표

도구/흐름강점맞는 상황주의점
Databricks + GPT-5.5 + Supervisor API데이터 플랫폼 안에서 모델, 도구, 추적을 함께 설계문서·테이블·함수·MCP가 얽힌 기업 업무Beta 제한과 모델 제공 조건 확인 필요
AgentBricks Supervisor Agent선언형 구성과 전문가 피드백 기반 개선여러 하위 에이전트를 조율하는 업무영어 지원, 하위 에이전트 권한, 워크스페이스 조건 확인 필요
Unity AI Gateway모델·에이전트·MCP의 중앙 거버넌스사용량, 권한, 레이트 리밋, 감사가 중요한 조직Gateway 설정만으로 데이터 분류가 해결되지는 않음
사내 RAG + 함수 호출업무별로 세밀한 통제 가능특정 부서 프로세스에 깊게 맞춘 자동화추적, 권한, 평가 체계를 직접 만들어야 함
일반 챗봇형 업무 도구빠른 도입과 낮은 학습 비용공개 문서 요약, 초안 작성내부 시스템 실행과 감사에는 한계

출처

#AI도구#Databricks#GPT#엔터프라이즈#에이전트#운영#흐름#해설#OpenAI#brings

업데이트 내역

검토일: 2026.05.24

수정 사유: OpenAI의 Databricks GPT-5.5 엔터프라이즈 에이전트 워크플로 공식 업데이트 신규 해설