OpenAI Codex Record & Replay: 한 번 보여준 업무를 재사용 가능한 스킬로 만들기

OpenAI Codex가 점점 “코드를 고치는 에이전트”에서 업무 흐름을 배우고 반복하는 에이전트로 넓어지고 있습니다. 이번에 특히 눈에 띄는 기능은 Record & Replay입니다.

말 그대로 사용자가 Mac에서 업무를 한 번 시연하면, Codex가 그 과정을 관찰하고 재사용 가능한 skill로 정리합니다. 다음부터는 날짜, 파일, 이슈 제목, 업로드 대상처럼 바뀌는 값만 알려주면 Codex가 같은 패턴을 다시 실행할 수 있습니다.

이 글은 작성 시점 2026-06-20 · OpenAI Release Notes ↗, Record & Replay 문서 ↗, Codex 플랜 안내 ↗, Codex Browser 문서 ↗, Remote connections 문서 ↗ 기준으로 정리했습니다.

기준 Record & Replay는 macOS용 Codex app에서 제공됩니다. Computer Use가 사용 가능하고 활성화되어 있어야 하며, 초기 제공 지역에서는 EEA, 영국, 스위스가 제외됩니다.

Record & Replay가 하는 일

Record & Replay의 핵심은 “프롬프트로 설명하기 애매한 반복 업무”를 Codex에게 직접 보여주는 것입니다.

예를 들어 이런 작업은 말로 설명하면 길어집니다.

매주 같은 사이트에서 리포트를 다운로드하고 파일명을 규칙대로 바꾸기
내부 도구에서 정해진 필드 구성으로 이슈 만들기
영상이나 문서를 정해진 순서로 업로드하고 설명 템플릿 채우기
비용 정산 화면에서 특정 카테고리와 태그를 선택하기
고객 계정 리뷰 전에 여러 웹앱을 돌며 체크리스트 채우기

이런 업무는 “복잡한 문제 해결”이라기보다 “사람마다 선호와 규칙이 섞인 절차”에 가깝습니다. 그래서 자연어 프롬프트만으로는 빠지는 디테일이 생기기 쉽습니다.

Record & Replay는 사용자가 실제로 수행하는 모습을 캡처한 뒤, Codex가 다음 요소를 skill로 정리합니다.

항목	skill에 담기는 내용
사용 조건	언제 이 workflow를 써야 하는지
입력값	매번 달라지는 파일, 날짜, 계정, 제목, 범위
단계	어떤 앱과 화면에서 무엇을 클릭하고 입력하는지
판단 기준	중간에 선택지가 나왔을 때 어떤 규칙을 따르는지
검증	업무가 제대로 끝났는지 확인하는 방법

flowchart TD
    A[사용자가 workflow 시연] --> B[Codex가 화면과 행동 관찰]
    B --> C[반복 패턴 추출]
    C --> D[재사용 가능한 skill 초안 작성]
    D --> E[사용자가 규칙과 예외 보완]
    E --> F[다음 작업에서 skill 호출]
    F --> G[Codex가 새 입력값으로 workflow 실행]

중요한 점은 녹화 파일을 그대로 매크로처럼 재생하는 기능이 아니라는 것입니다. Codex는 시연을 바탕으로 “무엇을 왜 했는지”를 skill 문서로 정리하고, 이후 환경에서 사용할 수 있는 도구에 맞춰 실행합니다. Computer Use, browser actions, 설치된 plugins를 조합할 수 있다는 점이 일반 화면 녹화 매크로와 다릅니다.

어떻게 쓰는가

공식 문서의 흐름은 단순합니다.

Codex app에서 Plugins를 엽니다.
+ 메뉴에서 Record a skill을 선택합니다.
Codex가 제안한 프롬프트를 검토하고 필요한 맥락을 덧붙입니다.
녹화 권한을 승인합니다.
Mac에서 실제 workflow를 수행합니다.
메뉴 바나 overlay에서 녹화를 멈추거나, Codex에게 끝났다고 말합니다.
Codex가 캡처한 과정을 분석해 skill 초안을 만듭니다.

이후에는 새 스레드에서 생성된 skill을 사용하라고 요청하면 됩니다.

이번 달 2026-06 리포트 파일로 지난번에 만든 리포트 다운로드/업로드 skill을 실행해줘.
파일명은 team-metrics-2026-06.csv로 맞추고, 완료 후 업로드 URL을 알려줘.

좋은 녹화의 핵심은 짧고 완결된 시연입니다. 녹화를 켜놓고 관련 없는 정리 작업까지 계속하면 skill이 흐려집니다. 반대로 “이 값은 매번 바뀐다”, “이 옵션은 항상 체크한다”, “오류가 나오면 여기서 멈춘다” 같은 규칙을 미리 알려주면 skill 품질이 좋아집니다.

주의 녹화 중에는 Codex가 workflow를 배우는 데 필요한 행동과 창 내용을 관찰합니다. 비밀번호, 토큰, 민감한 고객 정보처럼 skill에 남으면 안 되는 값은 녹화에 넣지 않는 편이 안전합니다.

변화 1: 프롬프트 자동화에서 시연 기반 자동화로

지금까지 Codex의 반복 자동화는 주로 텍스트 중심이었습니다.

AGENTS.md에 규칙을 적는다.
slash command나 custom prompt를 만든다.
skill을 직접 작성한다.
script나 MCP server로 구조화된 작업을 연결한다.

이 방식은 개발자에게는 자연스럽지만, 업무 절차가 GUI와 개인 습관에 묶여 있으면 장벽이 높습니다. “이 버튼을 누르고, 여기서 드롭다운 세 번째 항목을 고르고, 파일명을 회사 규칙에 맞춰 바꿔서 업로드한다” 같은 일은 문서화가 귀찮습니다.

Record & Replay는 이 문서화 비용을 줄입니다. 사용자는 한 번 보여주고, Codex는 그 시연을 skill로 바꿉니다. 이후 사용자는 skill을 수정하면서 숨은 규칙만 보강하면 됩니다.

flowchart LR
    Old["예전 방식<br/>절차를 말로 길게 설명"] --> Prompt["프롬프트·스크립트·문서 작성"]
    Prompt --> Run["반복 실행"]

    New["Record & Replay<br/>한 번 직접 시연"] --> Skill["Codex가 skill 초안 생성"]
    Skill --> Refine["규칙·예외 보완"]
    Refine --> Replay["새 입력값으로 반복 실행"]

여기서 skill은 단순 개인 매크로보다 넓은 단위입니다. 업무의 목적, 입력, 단계, 검증 방법이 같이 들어가기 때문에 나중에 더 안정적인 plugin으로 발전시킬 수도 있습니다. 팀에 배포할 정도로 안정적인 workflow라면 별도 plugin으로 패키징하고, 개인 반복 업무나 초기 탐색 단계라면 Record & Replay가 더 빠른 출발점입니다.

변화 2: Browser Developer mode로 웹 디버깅이 깊어진다

같은 Codex 흐름에서 같이 봐야 할 변화가 Developer mode입니다. OpenAI Release Notes는 2026년 6월 11일 Codex 업데이트로 Browser use의 Developer mode를 소개했습니다.

Developer mode는 Codex가 Chrome DevTools Protocol에 통제된 방식으로 접근해 콘솔 출력, 네트워크 트래픽, DOM, 적용된 스타일, JavaScript 성능 같은 정보를 볼 수 있게 합니다. Codex in-app browser와 Chrome extension 기반 browser use에서 사용할 수 있습니다.

이 기능은 Record & Replay와 역할이 다릅니다.

기능	잘 맞는 일
Record & Replay	반복되는 업무 절차를 skill로 만들기
Developer mode	웹앱의 실제 렌더링, 콘솔, 네트워크 문제 추적
Computer Use	CLI나 API만으로는 확인하기 어려운 GUI 조작
Chrome extension	로그인된 브라우저 상태가 필요한 웹 작업
In-app browser	로컬 개발 서버나 공개 페이지 검증

예를 들어 프론트엔드 버그를 고칠 때는 이렇게 요청할 수 있습니다.

@Browser로 http://localhost:3000/settings를 열고,
Developer mode로 콘솔 에러와 네트워크 요청을 확인한 뒤
모바일에서 저장 버튼이 비활성화되는 원인을 찾아 고쳐줘.

기존에는 Codex가 코드를 보고 추론하거나, 사용자가 DevTools에서 본 내용을 복사해줘야 했습니다. Developer mode가 켜지면 Codex가 실제 브라우저 상태를 더 직접적으로 확인할 수 있습니다. 다만 full CDP access는 민감한 브라우저 내부 상태에 접근할 수 있으므로, Codex가 사이트를 inspect하려 할 때 명시적으로 승인해야 합니다.

변화 3: 원격 제어와 Computer Use가 업무 범위를 넓힌다

Record & Replay가 의미 있으려면 Codex가 실제 업무 환경에 닿을 수 있어야 합니다. 이 지점에서 Remote connections와 Computer Use가 같이 중요해집니다.

Remote connections는 ChatGPT 모바일 앱이나 다른 Codex app에서 연결된 Mac, Windows 기기, SSH host의 Codex 작업을 이어갈 수 있게 합니다. 연결된 host의 프로젝트, 파일, 터미널, credentials, plugins, browser setup, Computer Use 설정을 그대로 사용합니다.

즉 휴대폰은 입력과 승인 화면이고, 실제 작업 환경은 연결된 컴퓨터입니다.

sequenceDiagram
    participant Phone as ChatGPT mobile
    participant Relay as Secure relay
    participant Host as Codex app host
    participant Tools as Files / Shell / Browser / Computer Use

    Phone->>Relay: 새 지시·승인·후속 메시지
    Relay->>Host: 연결된 host의 Codex thread로 전달
    Host->>Tools: 로컬 프로젝트와 앱에서 작업
    Tools-->>Host: diff·테스트·스크린샷·결과
    Host-->>Phone: 진행 상황과 승인 요청 표시

이 구조는 긴 작업에서 유용합니다. Mac에서 Record & Replay로 만든 workflow를 등록해두고, 나중에 이동 중에는 모바일에서 “이번 주 리포트로 실행해줘”라고 지시할 수 있습니다. 필요한 승인은 모바일에서 보고 처리하고, 실제 파일 접근이나 브라우저 조작은 host가 맡습니다.

Computer Use는 이 범위를 데스크톱 앱까지 넓힙니다. Codex가 macOS나 Windows의 GUI를 보고 클릭하고 입력할 수 있으므로, CLI와 API가 없는 앱도 제한적으로 다룰 수 있습니다. 물론 시스템 상태를 바꿀 수 있으니, 앱 접근 승인과 민감 작업 확인은 그대로 중요합니다.

언제 써볼 만한가

Record & Replay는 모든 자동화의 정답은 아닙니다. 안정적인 API가 있고, 입력과 출력이 명확한 작업이라면 스크립트나 MCP server가 더 낫습니다. 팀 전체에 배포할 워크플로우라면 plugin이 더 적합합니다.

반대로 다음 조건이면 Record & Replay가 꽤 잘 맞습니다.

작업이 자주 반복된다.
GUI 클릭, 로그인된 브라우저, 데스크톱 앱이 섞여 있다.
절차를 문서로 쓰는 것보다 직접 보여주는 편이 빠르다.
사람의 선호나 조직 규칙이 단계 중간에 들어간다.
성공 여부를 화면이나 결과 파일로 확인할 수 있다.

좋지 않은 대상도 있습니다.

피해야 할 대상	이유
자주 바뀌는 UI	skill이 금방 낡을 수 있음
결제, 삭제, 전송 업무	잘못 실행됐을 때 되돌리기 어려움
민감 정보 입력	녹화와 실행 맥락에 남을 위험
복잡한 일회성 판단	반복 패턴이 아니라 문제 해결에 가까움
불안정한 외부 사이트	화면 변화, 팝업, 인증 흐름에 취약할 수 있음

처음에는 공개 가능한 샘플 데이터로 작은 workflow를 녹화하는 편이 좋습니다. 잘 작동하면 skill을 다듬고, 실패 조건과 검증 절차를 추가한 뒤 실제 업무에 붙이는 순서가 안전합니다.

블로그 운영에 적용해보면

이 블로그 작업에도 Record & Replay를 붙일 수 있는 지점이 있습니다.

예를 들어 지금 블로그 포스팅 흐름은 대략 이렇습니다.

공유 링크나 원문을 확인한다.
공식 문서를 찾아 사실관계를 고정한다.
기존 포스트 톤과 중복 글을 확인한다.
Markdown 포스트를 작성한다.
날짜 lint와 build를 돌린다.
GitHub Discussions 자동 생성을 확인한다.
커밋, push, Netlify 배포 URL을 확인한다.

이 중 코드 작성과 빌드는 Codex가 잘합니다. 그런데 “공유 링크에서 주제 단서를 뽑고, 공식 출처만 골라 확인하고, 포스트 마지막에 참고 자료를 붙이는 편집 습관”은 매번 말로 설명하기 귀찮습니다.

Record & Replay가 직접 이 저장소의 빌드까지 대신한다기보다, 반복되는 편집 절차를 skill로 남기는 출발점이 될 수 있습니다. 예를 들어 “OpenAI/Claude 기능 업데이트를 블로그 포스트로 만드는 workflow”를 녹화해두면, 다음부터는 주제 링크만 바뀌어도 같은 검증-작성-빌드-배포 절차를 더 일관되게 반복할 수 있습니다.

마무리

Record & Replay는 Codex의 방향을 잘 보여주는 기능입니다. 이제 Codex는 코드를 읽고 수정하는 데서 멈추지 않고, 사용자가 실제로 일하는 방식을 관찰해 재사용 가능한 skill로 바꾸려 합니다.

이번 변화에서 볼 만한 포인트는 세 가지입니다.

Record & Replay로 “한 번 보여준 반복 업무”를 skill로 만들 수 있다.
Developer mode로 브라우저 디버깅과 프론트엔드 검증이 더 깊어진다.
Remote connections와 Computer Use로 Codex가 작업하는 장소와 앱의 범위가 넓어진다.

아직은 지원 지역, macOS 중심 제공, Computer Use 의존성, 민감 정보 처리 같은 제약이 있습니다. 그래도 방향은 분명합니다. AI 코딩 에이전트의 다음 경쟁력은 단순 코드 생성 속도가 아니라, 사람이 매번 반복하던 업무 절차를 얼마나 잘 배우고, 검증 가능하게 다시 실행하느냐에 가까워지고 있습니다.