'AI' 태그의 글 목록

로컬 LLM 가속 엔진 비교: llama.cpp vs vLLM vs MLX

오픈소스 대형 언어 모델(LLM)이 가파르게 발전하면서, 모델을 로컬 환경이나 자체 서버에서 빠르고 효율적으로 서빙하기 위한 '추론(Inference) 가속 엔진'의 중요성이 커지고 있습니다. 각 도구들은 태생적인 개발 목적과 메인으로 타겟팅하는 하드웨어가 다르기 때문에 상황에 맞는 엔진을 선택하는 것이 필수적입니다.이 글에서는 현재 로컬 구동 및 서버 LLM 서빙 체계의 3대장이라 부를 수 있는 llama.cpp, vLLM, 그리고 MLX의 개발 목적, 기술적 장점, 지원 모델 포맷, 간단한 실행 방법을 비교해 보겠습니다.1. llama.cpp📌 개발 목적 및 플랫폼 언어개발 목적: 초기에는 Apple M시리즈 맥북에서 순수 C/C++만으로 메타(Meta)의 LLaMA 모델을 빠르고 가볍게 구동하기 ..

devops 2026.04.15

Karpathy의 LLM Wiki: RAG를 넘어 지식이 쌓이는 위키 만들기

Andrej Karpathy가 남긴 LLM Wiki는 단순한 아이디어 메모가 아닙니다. 이 글은 "LLM을 검색기처럼 쓰는 방식"에서 한 단계 더 나아가, LLM이 지식을 계속 정리하고 갱신하는 누적형 위키(compounding wiki) 를 어떻게 만들 수 있는지 보여줍니다.DevOps 관점에서 이 아이디어가 흥미로운 이유는 분명합니다. 운영 문서, 장애 보고서, 러닝 노트, 회의록, 런북은 시간이 갈수록 쌓이지만, 그 가치는 자동으로 커지지 않습니다. 오히려 오래될수록 흩어지고, 서로 충돌하고, 찾기 어려워집니다. Karpathy가 제안한 방식은 이 문제를 LLM이 대신 정리하도록 설계합니다.이 글에서는 다음 세 가지를 중심으로 정리합니다.RAG 지식 집적 방식과 Karpathy식 위키 방식의 차이K..

devops 2026.04.05

agent-browser: AI 에이전트를 위한 브라우저 자동화 CLI

agent-browser는 AI 에이전트가 웹 브라우저를 직접 다루도록 만든 CLI 도구입니다. 단순히 클릭과 입력만 하는 자동화 스크립트가 아니라, 페이지 구조를 스냅샷으로 읽고, ref 기반으로 요소를 조작하고, 세션과 상태를 유지하고, 네트워크와 디버그 정보까지 함께 다룰 수 있도록 설계되어 있습니다.DevOps 관점에서 보면 이 도구의 매력은 분명합니다. 사람이 브라우저에서 하던 반복 작업을 쉘 명령으로 옮길 수 있고, AI 에이전트가 사용할 수 있는 안정적인 웹 조작 인터페이스를 제공합니다. 특히 Playwright를 직접 코드로 짜는 방식보다, 탐색과 검증을 훨씬 빠르게 시도해볼 수 있습니다.1. agent-browser란 무엇인가?agent-browser는 Vercel Labs가 공개한 브라..

devops 2026.04.03

프롬프트, 컨텍스트, 하네스 엔지니어링: AI 제어 기술의 진화

생성형 AI 모델(LLM)이 발전함에 따라, 단순히 모델에 질문을 던지는 것을 넘어 AI의 성능을 끌어올리고 원하는 결과를 안전하게 얻어내기 위한 방법론도 빠르게 진화해 왔습니다. 처음에는 AI와 '대화하는 법'을 조율했다면, 이제는 AI에게 '지식을 주입'하고, 나아가 능동적인 AI 에이전트가 활동할 수 있는 '안전하고 자동화된 운영 환경'을 구축하는 단계에 이르렀습니다.이 글에서는 인공지능 제어의 핵심 발전 흐름인 프롬프트 엔지니어링(Prompt Engineering), 컨텍스트 엔지니어링(Context Engineering), 그리고 자율 에이전트의 부상과 함께 각광받는 하네스 엔지니어링(Harness Engineering)의 정의와 특징, 발전 과정, 그리고 핵심 요소를 정리해 보겠습니다. 또한 ..

devops 2026.04.02

AI 에이전트를 길들이는 기술: 하네스 엔지니어링(Harness Engineering)의 모든 것

하네스 엔지니어링(Harness Engineering)이란?최근 AI 에이전트(AI Agent)의 발전과 함께 소프트웨어 개발 생태계에서 새롭게 대두되고 있는 개념이 바로 하네스 엔지니어링(Harness Engineering)입니다. 말과 마차를 연결하는 장비인 '하네스(마구)'에서 유래한 이 용어는, 강력하지만 예측이 어려운 AI 에이전트가 안전하고 신뢰할 수 있는 방식으로 목표를 수행하도록 환경을 조성하고 관리하는 기술을 의미합니다. 통제되지 않은 야생마 같은 AI 모델에 안장을 얹어 목적지까지 안전하게 이끄는 일련의 과정이라 할 수 있습니다.궁극적인 목표하네스 엔지니어링의 궁극적인 목표는 "AI를 단순한 조수(Copilot) 수준을 넘어, 신뢰할 수 있고 자율적인 동료(Agent)로 운영하는 시스템..

devops 2026.03.30

AI Agent 구현의 두 갈래: 일반 Tool Calling vs MCP 비교

AI 에이전트를 구축할 때, LLM이 외부 도구를 사용하게 만드는 과정은 필수적입니다. 하지만 최근 등장한 MCP(Model Context Protocol)와 기존의 Function/Tool Calling은 비슷해 보이면서도 구조적으로 큰 차이가 있습니다. 오늘은 이 두 방식의 특징과 실제 구현 관점에서의 차이를 상세히 비교해 보겠습니다.1. 한눈에 보는 비교 요약구분일반 Tool Calling (기존 방식)MCP (Model Context Protocol)핵심 개념함수 정의와 실행 로직의 수동 연결도구의 정의와 실행이 결합된 표준화된 서버실행 주체에이전트 애플리케이션 (Local, Tightly Coupled)독립된 MCP 서버 (Remote/Isolated)통신 규격모델별 전용 API (OpenAI,..

devops 2026.03.10

AI 에이전트(OpenClaw 등)의 LLM 인터페이스 구현 및 툴 콜링 기술 개요

OpenClaw, Claude 데스크톱 앱, 혹은 로컬 기반의 여러 AI 에이전트들은 내부적으로 LLM(대형 언어 모델)과 어떻게 소통하고, 로컬 환경의 도구(Tool)들을 사용할까요? 이 글에서는 에이전트가 LLM과 인터페이스를 맺는 기술적 구현 내용과 핵심 요소들을 살펴봅니다.1. 지침 파일(agent.md 등) 적용 방법AI 에이전트의 페르소나, 역할, 기본 규칙을 정의하기 위해 주로 .md 형태의 지침 파일을 사용합니다. (예: agent.md, system_prompt.txt, SOUL.md 등)기술적 구현:이러한 지침 파일은 LLM에 전달되는 시스템 프롬프트(System Prompt)로 로드됩니다. 에이전트 프로그램이 실행될 때 혹은 세션이 시작될 때 파일 시스템에서 문서를 읽어 LLM의 sy..

devops 2026.03.10

2026 글로벌 LLM 생태계 비교: 파운데이션 모델부터 인프라 서비스까지

2026년 현재 LLM 시장은 모델을 직접 학습시켜 배포하는 파운데이션 모델 제공자(Builders) 와, 이 모델들을 기업 및 개발자가 쉽게 도입·최적화할 수 있도록 돕는 인프라 및 통합 서비스 제공자(Enablers) 로 생태계가 양분되어 있습니다.북미의 프론티어 모델과 중국의 고효율 모델들이 치열하게 경쟁하는 가운데, Provider 관점에서 각 모델의 세부 특징과 인프라 서비스를 총정리합니다.1. 파운데이션 모델 생태계 (Builders): 북미 vs 중국LLM의 원천 지능을 제공하는 기업들입니다.북미는 범용적 에이전트와 멀티모달에, 중국은 극강의 가성비와 오픈소스 생태계에 집중하고 있습니다.지역Provider대표 모델핵심 특징 (추론 / Tool / Vision)북미OpenAIo3 / GPT-5..

devops 2026.03.10

LLM 핵심 능력 해부: 추론 vs 코드 생성 vs Tool Calling, 그리고 자율 에이전트

LLM은 모두 같은 방식으로 작동하는 것일까요? 최근 OpenAI o3, DeepSeek R1 같은 추론 모델(Reasoning Model) 이 등장하면서, 기존 LLM과는 근본적으로 다른 사고 방식이 주목받고 있습니다. 또한 코드 생성이나 Tool Calling 능력은 추론과 어떤 관계에 있을까요?이 글에서는 LLM의 세 가지 핵심 능력 — 일반 생성, 추론, 코드/Tool Calling — 이 어떻게 다르고, 서로 어떤 관계를 갖는지 정리합니다.1. 일반 LLM: "직감으로 답하기" (System 1)일반 LLM(GPT-4o, Claude 3.5 Sonnet 등)은 본질적으로 다음 토큰 예측기(Next-Token Predictor) 입니다. 학습된 수십억 개의 파라미터 속에서 패턴을 매칭하여, 입력에..

devops 2026.03.10

LLM의 뇌 구조 해부: 파라미터(지식의 숲)와 어텐션(길을 찾는 빛)

최근 GPT, Claude, DeepSeek 같은 대규모 언어 모델(LLM)이 보여주는 놀라운 추론 능력은 어디에서 기인할까요?단순히 데이터를 많이 읽어서일까요? 그 핵심은 방대한 정보를 저장하는 '파라미터(Parameter)'와, 그 정보들 사이에서 맥락을 짚어내는 '어텐션(Attention)'의 상호작용에 있습니다.오늘은 이 두 개념이 어떻게 '연관 지식의 중첩'을 만들고, 실시간으로 변별력 있는 답변을 생성하는지, 나아가 우리가 왜 프롬프트를 잘 써야 하는지 심층적으로 살펴보겠습니다.1. 파라미터(Parameter): 지식이 중첩된 '다차원 도서관'많은 분이 파라미터 개수(예: 7B, 70B 등)를 단순히 'AI의 용량 혹은 크기'로 이해합니다. 하지만 더 정확한 표현은 '지식의 밀도와 중첩도'입니..

devops 2026.03.10

일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

devopslog

AI 18

티스토리툴바