에이전트 개발: ‘목적’과 ‘경험’의 본질적 탐구

최근 에이전트 개발을 진행하며 고민 했던 부분을 메모로 간단하게 남겨 봅니다. 에이전트 개발의 핵심은 단순히 ‘만드는 기술’을 넘어, ‘무엇을 위해 존재하는가?’라는 본질적인 질문에서 시작해야 합니다. 특히 서비스 에이전트는 ‘사용자’와 ‘서비스’에 대한 깊은 이해가 선행되지 않으면 그 가치를 제대로 발휘하기 어렵습니다. 진정으로 의미 있는 에이전트를 만들기 위해서는 다음의 과정들을 끊임없이 순환하며 발전시켜 나가야 합니다. 1단계: 본질 […]

계속 읽기

P&G 실험으로 확인한 AI와의 협업의 미래 – 팀의 적정 규모는?

1. 연구 소개: 왜 P&G는 AI와 팀워크에 주목했는가 글로벌 소비재 거인 프록터 앤 갬블(P&G)은 최근 하버드 비즈니스 스쿨, 워튼스쿨, ESSEC 비즈니스 스쿨 등의 연구진과 협력하여 생성형 AI가 팀워크에 미치는 영향을 탐구하는 대규모 현장 실험을 진행했습니다. 디지털 데이터 디자인 연구소(Digital Data Design Institute at Harvard)에서 주도한 이 연구는 실제 업무 환경에서 AI의 영향력을 정확히 파악하기 위해 […]

계속 읽기

AI 에이전트 능력 예측 리포트 분석: 기술의 수명을 바라보며

최근 METR에서 발표한 “Measuring AI Ability to Complete Long Tasks” 보고서는 AI 발전 추세에 대한 흥미로운 관점을 제시했습니다. 이 분석은 AI 기술을 활용하는 우리 모두에게 중요한 시사점을 던져주고 있어 오늘은 이 보고서의 핵심 내용과 제 생각을 공유하고자 합니다. METR 보고서의 핵심: 작업 길이를 통한 AI 능력 예측 METR 연구진은 AI 성능을 측정하는 새로운 접근법을 제시했습니다. […]

계속 읽기

2024년 2월 28일 AI 동향: Alexa+부터 SmolLM까지

주요 기술 발전 동향 1. 음성 AI와 개인 비서의 진화 Alexa+ 개발의 어려움에 대한 기사가 나온지 3달 정도 되었던거 같은데, 만족할만한 결과가 나오는 가 봅니다. 스피커에서 답변의 형식 및 길이가 기존 쳇 기반의 응답하고 다소 다를것 같은데, 어떤 형식으로 구성이 되고 서비스 될지 궁금하네요. 2. 소형 언어 모델의 발전 바로 노트북에서 실행시켜 봤습니다. 튜닝을 하면 […]

계속 읽기

2024년 2월 26일 동향: Claude 3.7 Sonnet 출시와 검색 시장 변화

주요 AI 모델/기술 동향 AI 모델의 진화 이미 Cursor나 VSCode에서 사용가능하군요. 구글 모델은 VSCode에서 Gemini Code Assist로 개별로 설치해서 사용 가능합니다. o1 대비 영상 생성 및 처리 기술 AI 인프라 변화 AI 거품론의 시작일지…앞으로 있을 NVIDIA 실적 발표가 슬슬 기대가 됩니다. 과학기술 혁신 핵융합 연구 생명과학 발전 시장 동향 및 전망 AI 검색 시장 변화 […]

계속 읽기

2024년 2월 18일AI/기술 동향: 우수한 o3-mini 수학 성능과 AI 서비스/플랫폼의 영향력 확대

주요 기술 발전 동향 AI 플랫폼의 영향력 확대 검색 -> SNS -> AI, AI 서비스의 일상화 시작일까? 경량 AI 모델의 성능 입증 대형 모델과 경량 모델의 균형적 발전이 가속화될 전망이며, 특화된 도메인에서는 경량 모델이 더 효과적일 수 있음을 알 수 있다. EU 방위산업 기술 투자 급증 참고 링크

계속 읽기

2024년 2월 14일 AI 기술 동향: OpenAI의 계획과 Adobe의 Firefly

주요 기술 발전 동향 Sam Altman CEO가 X에서 발표한 OpenAI의 새로운 AI 모델 로드맵이 AI 업계의 주목을 받고 있습니다. 이번 발표는 인공지능 기술의 패러다임을 전환할 만한 중요한 의미를 담고 있습니다. 먼저 2025년 출시 예정인 GPT-4.5(코드명 ‘Orion’)는 기존 아키텍처의 정점을 찍는 마지막 클래식 모델이 될 전망입니다. 주목할 만한 특징은 컨텍스트 윈도우가 256,000 토큰까지 확장된다는 점이고 이는 […]

계속 읽기

GenAI 시대의 UX 설계: 피드백 루프 설계와 이를 위한 인간의 비판적 사고의 중요성

어제 Carnegie Mellon의 AI 사용에 대한 비판적 사고 연구 논문을 읽으며, 작년 말 GenAI 기반 서비스의 UX 프로토타입을 만들었던 경험이 떠올랐습니다. 당시 고민했던 많은 부분들이 이 연구에서 실증적으로 확인되었고, 이를 기존에 봤던 GhostWriter 연구, Cursor vs Copilot 개인적 사용 사례, 그리고 Science Advances의 AI 기반 글쓰기 생산성 연구와 함께 종합해보니 뭔가 통합된 통찰을 얻을 수 […]

계속 읽기

OpenAI의 Deliberative Alignment

OpenAI가 오늘 AI 안전성 확보를 위한 새로운 접근 방식인 Deliberative Alignment(DA)를 공개했습니다. 이는 AI 모델의 윤리적 판단과 안전성 확보에 있어 의미있는 진전을 보여주는 발표이고 리즈닝으로 성능을 극대화 하는 최근 추세와도 딱 맞는 접근 방법이라 생각합니다. 또한 DA는 안전성, 견고성, 일반화 능력 등 대부분의 중요 지표에서 기존 방식들을 크게 개선했으며, 특히 Jailbreak 방어를 위해 과도하게 응답을 […]

계속 읽기