'geminiapi' 태그의 글 목록

Gemini API로 로봇 멀티모달 인식 구현하는 법 — 텍스트+이미지 통합 가이드

로봇이 보고 듣고 이해하는 멀티모달 AI 시스템 만들기로봇이 진정으로 스마트해지려면, 텍스트만 이해해서는 부족해요. 눈앞의 사물을 보고, 사람의 말을 듣고, 상황을 종합적으로 판단할 수 있어야 하죠. 이렇게 여러 형태의 정보를 동시에 처리하는 것을 멀티모달 AI라고 합니다. Google의 Gemini API는 바로 이 멀티모달 능력이 가장 강력한 AI 도구 중 하나예요.오늘은 Gemini API를 활용해서 로봇이 카메라 이미지를 인식하고, 자연어로 설명하며, 상황에 맞는 행동을 결정하는 멀티모달 인식 시스템을 만드는 방법을 단계별로 알려드릴게요.Step 1 — Google AI Studio에서 API 키 발급받기무료로 시작할 수 있어요Gemini API를 사용하려면 먼저 API 키가 필요해요. Googl..

사용법 튜토리얼 2026.03.24

일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30

zeus0317 님의 블로그

geminiapi 2

티스토리툴바