About Me

안녕하세요, 고감자입니다. LLM + AI 제품 개발을 전문으로 하는 모델러이자 개발자입니다.

현실 문제를 정의하고 이것을 어떻게 하면 AI로 풀 수 있는지 디자인하고 구현하고 튜닝하는걸 주로 하고 있습니다. 리더 직무를 맡은 이후 모델 튜닝 경험이 줄어 손에 꼽지만 요즘 입으로 튜닝(프롬프트 튜닝)하는 게 대세가 된 걸 한 켠 다행이라 생각하고 있습니다.^^

AI가 앞으로 우리에게 어떠한 영향을 끼칠지에 대해서 관심이 많고 또한 아이를 키우는 입장에서 아이들의 세계에는 어떠한 영향을 줄지 항상 고민하고 예측하고 이런 이야기를 아이들과 하는 걸 좋아합니다.

현재

NAVER CLOUD(NAVER CLOVA)에서 HyperScale AI 팀의 리더로 일하며 CLOVA X의 Skill System을 총괄하고 있습니다. CLOVA Note의 AI 기능 개발을 담당하고 있으며, CLOVA Studio, CLOVA X 등 LLM 기반 제품/서비스 개발과 네이버 광고에서 쓰일 수 있는 AI 기능 개발을 이끌고 있습니다.

주요 성과

  • CLOVA X Skill System 개발 총괄 (2023)
  • CLOVA Note AI 요약 기능 개발 및 적용 (MAU 16만+)
  • 네이버 카페 Communication AD 모델 개발 (월 10억+ 매출)
  • KoBERT, KoGPT2, KoBART 등 한국어 NLP 오픈소스 모델 개발
  • AWS ML Hero 활동 중

오픈소스 활동

한국어 NLP 저자

  • KoBERT: BERT 기반의 한국어 사전학습 모델
  • KoGPT2: GPT-2 기반의 한국어 언어생성 모델
  • KoBART: BART 기반의 한국어 시퀀스-투-시퀀스 모델
  • PyKoSpacing: 한국어 띄어쓰기 교정 패키지
  • KoNLP: R 기반 한국어 자연어처리 패키지

딥러닝 프레임워크 기여

  • DMLC(XGBoost, GluonNLP) 개발 그룹 멤버
  • PyTorch Lightning Contributor
    • Pipeline parallelism 기반 멀티노드 학습 코드 기여
  • GluonNLP Committer
    • MXNet BERT 학습 코드 개발

저서 및 번역서

  • 「구글 BERT의 정석」 (한빛미디어, 번역서)
  • 「R로하는 데이터 시각화」(한빛미디어)
  • 「실전 예제로 살펴보는 집단지성 프로그래밍」(인사이트, 번역서)

주요 발표 및 강연

  • 서울대학교, 경찰청, KISA 등 딥러닝 NLP 강의
  • Everyone’s Lab 딥러닝 NLP 강의
  • 2018 뉴욕 Text Analytics Workshop 패널 초청 발표
  • 2017 런던 Text Analytics Workshop 패널 초청 발표

학술 활동

  • HyperCLOVA X Technical Report
  • DSTC8 대화 시스템 챌린지 Track 2 2위 (2019)
  • EMNLP2020 Findings 논문 채택
  • “한글 검색 질의어 오타 패턴 분석과 사용자 로그를 이용한 오타 교정 시스템 구축” (2010 한글 및 한국어 정보처리 학술대회 우수 논문)

관심 분야

  • Large Language Models (LLM)
  • Natural Language Processing (NLP)
  • Machine Learning Systems
  • Open Source Development

경력

  • NAVER CLOUD (2022-현재): HyperScale AI 리더
  • NAVER CLOVA (2021-2022): AI 리더
  • SK Telecom (2013-2021): Research Engineer
  • NexR (2011-2013): Data Scientist
  • Yahoo! (2007-2011): Software Engineer

Links

언론 보도

  • [AI타임즈] “SKT AI, 한국어 자연어처리 오픈소스 ‘KoBART’ 공개”
  • [아주경제] KoBERT, KoGPT2 관련 다수 인터뷰

연락처