저자: BlockBooster 연구원 Kevin
산업 발전을 위한 핵심 퍼즐 조각으로서 AI 에이전트 프레임워크에는 기술 구현과 생태적 성숙도를 촉진하는 이중 잠재력이 포함될 수 있습니다. 시장에서 뜨겁게 논의되는 프레임워크로는 Eliza, Rig, Swarms, ZerePy 등이 있습니다. 이러한 프레임워크는 Github Repo를 통해 개발자의 관심을 끌고 명성을 쌓습니다. 이러한 프레임워크는 빛이 파동과 입자의 특성을 모두 갖는 것과 유사한 "라이브러리" 코인 형태로 발행됩니다. Agent 프레임워크는 심각한 외부 효과와 Memecoin의 특성을 동시에 갖습니다. 이 기사에서는 프레임워크의 "파동-입자 이중성"과 에이전트 프레임워크가 마지막 코너가 될 수 있는 이유를 설명하는 데 중점을 둘 것입니다.
에이전트 프레임워크로 인해 발생하는 외부 효과는 거품이 가라앉은 후에도 봄 새싹을 남길 수 있습니다.
GOAT 탄생 이후 에이전트 내러티브가 시장에 미치는 영향은 쿵푸 마스터처럼 왼쪽 주먹 "Memecoin"과 오른쪽 손바닥 "Industry Hope"를 사용하여 항상 두 번째 동작에서 패배하게 됩니다. . 실제로 AI Agent의 애플리케이션 시나리오는 엄격하게 구분되지 않고 플랫폼, 프레임워크, 특정 애플리케이션 간의 경계가 모호하지만 여전히 토큰이나 프로토콜의 선호도에 따라 대략적으로 분류할 수 있습니다. 그러나 토큰이나 프로토콜의 개발 선호도에 따라 여전히 다음 범주로 나눌 수 있습니다.
런치패드: 자산 헤어 플랫폼. 기본 체인의 Virtuals Protocol 및 클랭커, Solana 체인의 Dasha.
AI Agent 애플리케이션: Agent와 Memecoin 간 무료이며 GOAT, aixbt 등 메모리 메모리 구성에 뛰어난 기능을 가지고 있습니다. 이러한 애플리케이션은 일반적으로 단방향 출력과 매우 제한된 입력 조건을 갖습니다.
AI 에이전트 엔진: 솔라나 체인의 그리핀과 베이스 체인의 스펙터 AI. Griffain은 읽기 및 쓰기 모드에서 읽기, 쓰기 및 작업 모드로 진화할 수 있습니다. Spectre AI는 RAG 엔진이자 온체인 검색입니다.
AI 에이전트 프레임워크: 프레임워크 플랫폼의 경우 에이전트 자체가 자산이므로 에이전트 프레임워크는 에이전트의 자산 발행 플랫폼이자 에이전트의 런치패드입니다. 현재 대표적인 프로젝트로는 지난 이틀간 뜨거운 논의가 있었던 ai16, Zerebro, ARC, Swarms 등이 있습니다.
기타 작은 방향: 종합 에이전트 Simmi, 위조 에이전트 Seraph, 입찰.
Agent 프레임워크에 대해 더 자세히 논의하면 충분한 외부 효과가 있음을 알 수 있습니다. 주요 퍼블릭 체인 및 프로토콜과 달리 개발자는 다양한 개발 언어 환경에서만 선택할 수 있으며 업계의 총 개발자 수는 그에 따른 시장 가치 성장을 보여주지 못했습니다. Github Repo는 Web2 및 Web3 개발자가 합의를 구축하는 장소입니다. 여기에 설립된 개발자 커뮤니티는 프로토콜만으로 개발된 "플러그 앤 플레이" 패키지보다 Web2 개발자에게 더 매력적이고 영향력이 있습니다.
이 기사에 언급된 네 가지 프레임워크는 모두 오픈 소스입니다. ai16z의 Eliza 프레임워크는 6200개의 별을 받았습니다. Zerebro의 ZerePy 프레임워크는 191개의 별을 받았습니다. ARC의 RIG 프레임워크는 1700개의 별을 받았습니다. 현재 Eliza 프레임워크는 다양한 Agent 애플리케이션에서 널리 사용되고 있으며 가장 넓은 적용 범위를 가진 프레임워크입니다. ZerePy의 개발 수준은 높지 않고 개발 방향은 주로 X에 있으며 아직 로컬 LLM 및 통합 메모리를 지원하지 않습니다. RIG는 상대적으로 개발하기 어렵지만 개발자에게 성능을 최적화할 수 있는 최대한의 자유를 제공할 수 있습니다. Swarms는 팀이 MC를 출시하는 것 외에는 다른 사용 사례가 없지만 Swarms는 다양한 프레임워크를 통합할 수 있고 상상의 여지가 많습니다.
또한, 위 분류에서는 Agent 엔진과 프레임워크가 분리되어 있어 혼동을 초래할 수 있습니다. 하지만 나는 둘 사이에 차이가 있다고 생각한다. 첫째, 왜 엔진인가? Lenovo와 실제 검색 엔진 간의 유사점은 상대적으로 일관됩니다. 동종 에이전트 애플리케이션과 달리 에이전트 엔진의 성능은 그 이상이지만 동시에 API 인터페이스를 통해 조정할 수 있는 완전히 캡슐화된 블랙박스입니다. 사용자는 포크 형태로 에이전트 엔진의 성능을 경험할 수 있지만 기본 프레임워크와 같은 전체 그림과 사용자 정의의 자유를 가질 수는 없습니다. 각 사용자의 엔진은 조정된 에이전트에서 이미지를 생성하고 이미지와 상호 작용하는 것과 같습니다. 프레임워크는 본질적으로 체인에 적응하는 것인데, Agent에서 Agent 프레임워크를 만드는 궁극적인 목표는 해당 체인과의 통합이기 때문에 데이터 상호작용 방법을 정의하는 방법, 데이터 검증 방법을 정의하는 방법, 블록을 정의하는 방법 규모, 합의와 성능의 균형을 맞추는 방법 등은 프레임워크에서 고려해야 할 사항입니다. 그리고 엔진은 어떻습니까? 모델을 완전히 미세 조정하고 데이터 상호 작용과 메모리 간의 관계를 특정 방향으로 설정하기만 하면 됩니다. 성능은 유일한 평가 기준이지만 프레임워크는 그렇지 않습니다.
에이전트 프레임워크를 평가하기 위해 "파동-입자 이중성"의 관점을 사용하는 것은 우리가 올바른 방향으로 움직이고 있는지 확인하는 전제 조건일 수 있습니다.
입력과 출력을 실행하는 에이전트의 수명주기에는 세 부분이 필요합니다. 먼저 기본 모델이 사고의 깊이와 방식을 결정한 다음 메모리는 사용자 정의의 장소입니다. 기본 모델이 출력된 후 메모리를 기반으로 수정되고 최종적으로 다른 클라이언트에서 출력 작업이 완료됩니다.
출처: @SuhailKakar
Agent 프레임워크에 "파동-입자 이중성"이 있음을 증명하기 위해 "wave"는 커뮤니티 문화와 개발자 활동을 나타내는 "Memecoin"의 특성을 가지며 Agent의 매력과 의사소통 능력을 강조합니다. 기대" 기본 성능, 실제 사용 사례 및 기술적 깊이를 나타내는 기능입니다. 세 가지 프레임워크를 예로 결합하여 두 가지 측면에서 개발 튜토리얼을 설명하겠습니다.
신속하게 조립된 Eliza 프레임
환경 설정
출처: @SuhailKakar
엘리자 설치
출처: @SuhailKakar
3. 구성 파일
출처: @SuhailKakar
4. 상담원 성격 설정
출처: @SuhailKakar
Eliza의 프레임워크는 비교적 사용하기 쉽습니다. 이는 대부분의 웹 및 Web3 개발자에게 친숙한 언어인 TypeScript를 기반으로 합니다. 프레임워크는 간결하고 지나치게 추상적이지 않아 개발자가 원하는 기능을 쉽게 추가할 수 있습니다. 3단계를 통해 Eliza가 여러 클라이언트와 통합될 수 있음을 알 수 있으며, 다중 클라이언트 통합을 위한 어셈블러로 이해할 수 있습니다. Eliza는 DC, TG와 같은 플랫폼을 지원합니다.
프레임워크의 단순성과 인터페이스의 풍부함으로 인해 Eliza는 액세스 임계값을 크게 낮추고 상대적으로 통일된 인터페이스 표준을 달성했습니다.
원클릭 ZerePy 프레임워크
1.Fork ZerePy 라이브러리
출처: https://replit.com/@blormdev/ZerePy?v=1
2. X 및 GPT 구성
출처: https://replit.com/@blormdev/ZerePy?v=1
3.에이전트 성격 설정
출처: https://replit.com/@blormdev/ZerePy?v=1
성능 최적화된 Rig 프레임워크
RAG(Retrieval Enhanced Generation) 에이전트 구축을 예로 들어보겠습니다.
1. 환경 및 OpenAI 키 구성
출처: https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
2. OpenAI 클라이언트를 설정하고 청킹을 사용하여 PDF 처리
출처: https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
3. 문서 구조 및 임베딩 설정
출처: https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
4. 벡터 스토리지 및 RAG 에이전트 생성
출처: https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
Rig(ARC)는 LLM 워크플로우 엔진을 위한 Rust 언어 기반의 AI 시스템 구축 프레임워크입니다. 즉, ARC는 AI 호출 및 성능 최적화를 제공하는 AI 엔진 "도구 상자"입니다. 데이터 저장, 예외 처리 및 기타 백그라운드 지원 서비스.
Rig가 해결하고자 하는 것은 개발자가 LLM을 더 잘 선택하고, 프롬프트 단어를 더 잘 최적화하고, 토큰을 더 효과적으로 관리하고, 동시 처리 처리, 리소스 관리, 대기 시간 단축 등을 수행하는 방법을 돕는 "호출" 문제입니다. Rig의 초점은 AI에 있습니다. LLM 모델 AI Agent 시스템과 협력할 때 "잘 활용"하는 방법.
Rig 는 LLM 기반 애플리케이션(RAG Agent 포함) 개발을 단순화하도록 설계된 오픈 소스 Rust 라이브러리입니다. Rig는 더 개방적이기 때문에 개발자에 대한 요구 사항이 더 높고 Rust 및 Agent에 대한 이해도가 더 높습니다. 여기에 있는 튜토리얼은 가장 기본적인 RAG 에이전트 구성 프로세스입니다. RAG는 LLM과 외부 지식 검색을 결합하여 LLM을 향상시킵니다. 공식 웹사이트의 다른 데모에서 Rig의 특징은 다음과 같습니다.
통합 LLM 인터페이스: 다양한 LLM 제공업체의 일관된 API를 지원하여 통합을 단순화합니다.
추상 작업 흐름: 사전 구축된 모듈식 구성 요소를 통해 Rig는 복잡한 AI 시스템 설계를 수행할 수 있습니다.
통합 벡터 저장소: 카테고리 저장소에 대한 지원이 내장되어 RAG 에이전트와 같은 유사한 검색 에이전트에서 효율적인 성능을 제공합니다.
유연한 임베딩: 임베딩 처리를 위해 사용하기 쉬운 API를 제공하여 RAG Agent와 같은 유사한 검색 에이전트를 개발할 때 의미 이해의 어려움을 줄입니다.
Eliza와 비교하여 Rig는 개발자에게 성능 최적화를 위한 추가 공간을 제공하여 개발자가 LLM 및 에이전트 호출 및 협업 최적화를 더 효과적으로 디버깅할 수 있도록 돕는다는 것을 알 수 있습니다. Rig는 Rust 기반 성능을 사용하여 Rust의 무료 추상화와 메모리 안전, 고성능, 저지연 LLM 작업을 활용합니다. 이는 기본 수준에서 더 풍부한 자유도를 제공할 수 있습니다.
결합된 Swarms 프레임워크 분해
Swarms는 엔터프라이즈 수준의 프로덕션 수준 다중 에이전트 오케스트레이션 프레임워크를 제공하는 것을 목표로 합니다. 공식 웹 사이트는 수십 개의 워크플로와 에이전트 병렬 및 직렬 아키텍처를 제공합니다.
순차적 작업 흐름
출처: https://docs.swarms.world
순차적 Swarm 아키텍처는 작업을 선형 순서로 처리합니다. 각 에이전트는 결과를 체인의 다음 에이전트에 전달하기 전에 작업을 완료합니다. 이 아키텍처는 순차적인 처리를 보장하며 작업에 종속성이 있는 경우 유용합니다.
사용 사례:
워크플로우의 각 단계는 조립 라인이나 순차 데이터 처리와 같은 이전 단계에 따라 달라집니다.
작업 순서를 엄격하게 따라야 하는 시나리오.
계층적 아키텍처:
출처: https://docs.swarms.world
하향식 제어를 달성하기 위해 상위 에이전트는 하위 에이전트 간의 작업을 조정합니다. 에이전트는 작업을 동시에 수행한 다음 최종 집계를 위해 결과를 루프에 다시 제공합니다. 이는 고도로 병렬화 가능한 작업에 유용합니다.
스프레드시트 형식 아키텍처:
출처: https://docs.swarms.world
동시에 작동하는 여러 에이전트를 관리하기 위한 대규모 스웜 아키텍처입니다. 수천 개의 에이전트를 동시에 관리할 수 있으며 각 에이전트는 자체 스레드에서 실행됩니다. 대규모 에이전트 출력을 감독하는 데 이상적입니다.
Swarms는 에이전트 프레임워크일 뿐만 아니라 위에서 언급한 Eliza, ZerePy 및 Rig 프레임워크와도 호환됩니다. 모듈식 아이디어를 통해 다양한 워크플로 및 아키텍처에서 에이전트 성능을 극대화하여 해당 문제를 해결합니다. Swarms의 개념과 개발자 커뮤니티의 발전은 모두 괜찮습니다.
Eliza: 가장 사용하기 쉽고 초보자와 빠른 프로토타입 제작에 적합하며 특히 소셜 미디어 플랫폼에서의 AI 상호 작용에 적합합니다. 프레임워크는 간단하고 통합 및 수정이 쉽고 과도한 성능 최적화가 필요하지 않은 시나리오에 적합합니다.
ZerePy: Web3 및 소셜 플랫폼용 AI Agent 애플리케이션의 신속한 개발에 적합한 원클릭 배포입니다. 간단한 프레임워크와 유연한 구성을 갖춘 경량 AI 애플리케이션에 적합하며 빠른 구성 및 반복에 적합합니다.
Rig: 성능 최적화에 중점을 두고 있으며 특히 동시성이 높고 성능이 뛰어난 작업에서 좋은 성능을 발휘하며 세부적인 제어 및 최적화가 필요한 개발자에게 적합합니다. 프레임워크는 상대적으로 복잡하고 어느 정도의 Rust 지식이 필요하므로 경험이 많은 개발자에게 적합합니다.
Swarms: 다중 에이전트 협업 및 복잡한 작업 관리를 지원하는 엔터프라이즈 수준 애플리케이션에 적합합니다. 프레임워크는 유연하고 대규모 병렬 처리를 지원하며 여러 아키텍처 구성을 제공하지만 복잡성으로 인해 효과적인 적용을 위해서는 더 강력한 기술 배경이 필요할 수 있습니다.
전반적으로 Eliza와 ZerePy는 사용 편의성과 빠른 개발 속도라는 장점이 있는 반면, Rig와 Swarms는 고성능 및 대규모 처리가 필요한 전문 개발자나 엔터프라이즈 애플리케이션에 더 적합합니다.
이것이 Agent 프레임워크에 "업계 희망" 기능이 있는 이유입니다. 위 프레임워크는 아직 초기 단계이며, 선점자 우위를 확보하고 활발한 개발자 커뮤니티를 구축하는 것이 최우선입니다. 프레임워크 자체의 성능과 널리 사용되는 Web2 애플리케이션보다 뒤떨어지는지 여부는 주요 모순이 아닙니다. 꾸준히 개발자가 유입되는 프레임워크만이 궁극적으로 승리할 수 있습니다. 왜냐하면 Web3 산업은 항상 시장의 관심을 끌어야 하기 때문입니다. 프레임워크의 성능이 아무리 뛰어나고 기본이 아무리 탄탄하더라도 시작하기 어렵고 그렇지 않다면 말이죠. 신경쓰면 말보다 수레를 먼저 놓는다. 프레임워크 자체가 개발자의 관심을 끌 수 있다는 전제 하에, 보다 성숙하고 완전한 토큰 경제 모델을 갖춘 프레임워크가 눈에 띌 것입니다.
Agent 프레임워크에는 "Memecoin" 기능이 있는데 이는 이해하기 매우 쉽습니다. 위에서 언급한 프레임워크 토큰 중 어느 것도 합리적인 토큰 경제 설계를 갖고 있지 않습니다. 토큰에는 사용 사례가 없거나 매우 단일한 사용 사례가 없으며, 효과적인 토큰 플라이휠도 없습니다. 완전한 유기적 결합으로 인해 토큰 가격의 상승은 FOMO 외에는 근본적인 지원을 얻기 어렵고, 안정적이고 지속적인 가치 성장을 보장할 수 있는 해자가 부족합니다. 동시에, 위에서 언급한 프레임워크 자체는 상대적으로 투박해 보이고 실제 가치가 현재 시장 가치와 일치하지 않으므로 "미메코인" 특성이 강합니다.
Agent 프레임워크의 "파동-입자 이중성"은 단점이 아니며, 순수한 Memecoin도 아니고 토큰 사용 사례도 아닌 반쯤 비어 있는 물병으로 대략적으로 이해될 수 없다는 점은 주목할 가치가 있습니다. 이전 기사에서 언급했듯이 경량 에이전트는 모호한 Memecoin 베일로 덮여 있으며 커뮤니티 문화와 기본은 더 이상 모순되지 않으며 에이전트 초기 단계에는 거품과 불확실성이 있지만 새로운 자산 개발 경로가 점차 등장하고 있습니다. 하지만 개발자를 유치하고 애플리케이션 구현을 촉진할 수 있는 잠재력은 무시할 수 없습니다. 미래에는 완전한 토큰 경제 모델과 강력한 개발자 생태계를 갖춘 프레임워크가 이 트랙의 핵심 기둥이 될 수 있습니다.