사용법 튜토리얼

GPT-4 Vision으로 로봇 시각 검사 구현하는 법 — 제조 불량 탐지 튜토리얼

zeus0317 2026. 3. 25. 10:28

AI 눈으로 불량품을 잡아낸다

제조 공장에서 불량품 검사는 품질 관리의 핵심이에요. 기존에는 사람이 눈으로 확인하거나 규칙 기반의 비전 시스템을 사용했지만, 정확도와 속도에 한계가 있었죠. 이제 GPT-4 Vision(GPT-4V) 같은 멀티모달 AI를 활용하면 이미지를 보고 자연어로 불량 여부를 판단할 수 있어요.

오늘은 GPT-4 Vision API를 활용해서 로봇 카메라로 촬영한 제품 이미지의 불량을 자동으로 탐지하는 시스템을 만들어 보겠습니다. 코딩 경험이 조금 있다면 충분히 따라할 수 있어요!

Step 1 — 개발 환경과 API 키 준비

필요한 준비물

먼저 OpenAI API 키가 필요해요. OpenAI 플랫폼에서 API 키를 발급받으세요. GPT-4 Vision은 gpt-4o 모델에서 사용할 수 있습니다.

터미널에서 필요한 라이브러리를 설치합니다: pip install openai pillow requests

openai 라이브러리로 API를 호출하고, Pillow로 이미지를 처리하며, requests로 이미지를 전송할 거예요.

Step 2 — 이미지를 API에 전송하는 방법

GPT-4 Vision에 이미지를 보내는 방법은 두 가지예요. URL로 이미지를 전달하거나, base64로 인코딩해서 직접 전달할 수 있습니다.

로봇 시각 검사에서는 카메라로 실시간 촬영한 이미지를 사용하기 때문에 base64 인코딩 방식이 더 적합해요. 파이썬에서 이미지 파일을 열어 base64로 변환하는 함수를 만들어 둡니다.

변환된 이미지 데이터를 OpenAI API의 messages 파라미터에 image_url 형태로 포함시킵니다. content 배열 안에 텍스트 프롬프트와 이미지를 함께 넣는 구조예요.

Step 3 — 불량 탐지 프롬프트 설계하기

효과적인 프롬프트 작성법

GPT-4 Vision의 성능은 프롬프트에 크게 좌우돼요. 불량 탐지에 최적화된 프롬프트를 설계하는 것이 핵심입니다.

좋은 프롬프트의 핵심 요소는 다음과 같아요. 첫째, 역할을 명확히 지정합니다. 당신은 전자제품 품질 검사 전문가입니다처럼 구체적인 역할을 부여해요. 둘째, 검사 기준을 구체적으로 명시합니다. 스크래치, 찍힘, 변색, 부품 누락 같은 불량 유형을 열거해요. 셋째, 출력 형식을 지정합니다. JSON 형태로 불량 여부, 불량 유형, 위치, 심각도를 반환하도록 요청합니다.

이렇게 구조화된 프롬프트를 사용하면 API 응답을 프로그래밍적으로 파싱해서 자동화 시스템에 바로 연결할 수 있어요.

Step 4 — 검사 자동화 파이프라인 구축

실제 제조 현장에서 사용하려면 자동화 파이프라인이 필요해요. 전체 흐름은 이렇습니다.

로봇 카메라가 제품을 촬영하면, 이미지를 base64로 인코딩한 후 GPT-4 Vision API로 전송합니다. API 응답을 JSON으로 파싱해서 불량 여부를 판단하고, 불량이면 해당 제품을 제거 라인으로 보내는 신호를 로봇에게 전달합니다. 동시에 불량 정보를 데이터베이스에 기록해서 추후 분석에 활용해요.

파이썬에서 이 파이프라인을 함수로 구현합니다. inspect_product 함수는 이미지 경로를 받아서 API를 호출하고, 결과를 딕셔너리로 반환합니다. 이 함수를 반복 루프 안에서 호출하면 연속적인 검사가 가능해요.

응답 속도 최적화 팁

API 호출에는 네트워크 지연이 있기 때문에 실시간 고속 검사에는 한계가 있을 수 있어요. 이를 해결하기 위한 팁을 알려드릴게요. 이미지 해상도를 적절히 낮추면 전송 속도가 빨라집니다. detail 파라미터를 low로 설정하면 처리 속도가 향상돼요. 비동기 요청(async)을 사용하면 여러 이미지를 동시에 처리할 수 있습니다.

Step 5 — 검사 결과 시각화와 리포트

검사 결과를 시각적으로 보여주면 관리자가 상황을 더 쉽게 파악할 수 있어요. Pillow를 사용해서 원본 이미지 위에 불량 위치를 표시하는 기능을 구현합니다.

또한 하루치 검사 결과를 종합해서 불량률, 불량 유형별 분포, 시간대별 불량 발생 추이 같은 통계 리포트를 자동으로 생성할 수 있어요. matplotlib이나 plotly로 차트를 그리고, 생성형 AI로 텍스트 분석 보고서까지 자동 작성하면 품질 관리가 한 단계 업그레이드됩니다.

마무리 — GPT-4V 시각 검사의 가능성

GPT-4 Vision을 활용한 시각 검사는 기존 비전 시스템에 비해 설정이 훨씬 간단하고 유연하다는 장점이 있어요. 새로운 불량 유형이 추가되어도 프롬프트만 수정하면 되니까 빠르게 대응할 수 있죠.

다만 API 비용과 응답 속도는 고려해야 해요. 초고속 대량 검사에는 전용 비전 모델이 더 적합할 수 있고, GPT-4V는 다품종 소량 생산이나 정밀 검사에 특히 효과적입니다. 두 가지를 결합하면 최고의 품질 관리 시스템을 만들 수 있을 거예요!