
안녕하세요, 고감자입니다. LLM + AI 제품 개발을 전문으로 하는 모델러이자 개발자입니다.
현실 문제를 정의하고 이것을 어떻게 하면 AI로 풀 수 있는지 디자인하고 구현하고 튜닝하는걸 주로 하고 있습니다. 리더 직무를 맡은 이후 모델 튜닝 경험이 줄어 손에 꼽지만 요즘 입으로 튜닝(프롬프트 튜닝)하는 게 대세가 된 걸 한 켠 다행이라 생각하고 있습니다.^^
AI가 앞으로 우리에게 어떠한 영향을 끼칠지에 대해서 관심이 많고 또한 아이를 키우는 입장에서 아이들의 세계에는 어떠한 영향을 줄지 항상 고민하고 예측하고 이런 이야기를 아이들과 하는 걸 좋아합니다.
현재
NAVER CLOUD(NAVER CLOVA)에서 HyperScale AI 팀의 리더로 일하며 CLOVA X의 Skill System을 총괄하고 있습니다. CLOVA Note의 AI 기능 개발을 담당하고 있으며, CLOVA Studio, CLOVA X 등 LLM 기반 제품/서비스 개발과 네이버 광고에서 쓰일 수 있는 AI 기능 개발을 이끌고 있습니다.
주요 성과
- CLOVA X Skill System 개발 총괄 (2023)
- CLOVA Note AI 요약 기능 개발 및 적용 (MAU 16만+)
- 네이버 카페 Communication AD 모델 개발 (월 10억+ 매출)
- KoBERT, KoGPT2, KoBART 등 한국어 NLP 오픈소스 모델 개발
- AWS ML Hero 활동 중
오픈소스 활동
한국어 NLP 저자
- KoBERT: BERT 기반의 한국어 사전학습 모델
- KoGPT2: GPT-2 기반의 한국어 언어생성 모델
- KoBART: BART 기반의 한국어 시퀀스-투-시퀀스 모델
- PyKoSpacing: 한국어 띄어쓰기 교정 패키지
- KoNLP: R 기반 한국어 자연어처리 패키지
딥러닝 프레임워크 기여
- DMLC(XGBoost, GluonNLP) 개발 그룹 멤버
- PyTorch Lightning Contributor
- Pipeline parallelism 기반 멀티노드 학습 코드 기여
- GluonNLP Committer
- MXNet BERT 학습 코드 개발
저서 및 번역서
- 「구글 BERT의 정석」 (한빛미디어, 번역서)
- 「R로하는 데이터 시각화」(한빛미디어)
- 「실전 예제로 살펴보는 집단지성 프로그래밍」(인사이트, 번역서)
주요 발표 및 강연
- 서울대학교, 경찰청, KISA 등 딥러닝 NLP 강의
- Everyone’s Lab 딥러닝 NLP 강의
- 2018 뉴욕 Text Analytics Workshop 패널 초청 발표
- 2017 런던 Text Analytics Workshop 패널 초청 발표
학술 활동
- HyperCLOVA X Technical Report
- DSTC8 대화 시스템 챌린지 Track 2 2위 (2019)
- EMNLP2020 Findings 논문 채택
- “한글 검색 질의어 오타 패턴 분석과 사용자 로그를 이용한 오타 교정 시스템 구축” (2010 한글 및 한국어 정보처리 학술대회 우수 논문)
관심 분야
- Large Language Models (LLM)
- Natural Language Processing (NLP)
- Machine Learning Systems
- Open Source Development
경력
- NAVER CLOUD (2022-현재): HyperScale AI 리더
- NAVER CLOVA (2021-2022): AI 리더
- SK Telecom (2013-2021): Research Engineer
- NexR (2011-2013): Data Scientist
- Yahoo! (2007-2011): Software Engineer
Links
- GitHub: haven-jeon
- LinkedIn: gogamza
- AWS Hero Profile: heewon-jeon
언론 보도
- [AI타임즈] “SKT AI, 한국어 자연어처리 오픈소스 ‘KoBART’ 공개”
- [아주경제] KoBERT, KoGPT2 관련 다수 인터뷰
연락처
- Email: madjakarta@gmail.com
- 거주지: 과천