
안녕하세요, 고감자입니다. LLM + AI 제품 개발을 전문으로 하는 모델러이자 개발자입니다.
현실 문제를 정의하고 이것을 어떻게 하면 AI로 풀 수 있는지 디자인하고 구현하고 튜닝하는걸 주로 하고 있습니다. 리더 직무를 맡은 이후 모델 튜닝 경험이 줄어 손에 꼽지만 요즘 입으로 튜닝(프롬프트 튜닝)하는 게 대세가 된 걸 한 켠 다행이라 생각하고 있습니다.^^
AI가 앞으로 우리에게 어떠한 영향을 끼칠지에 대해서 관심이 많고 또한 아이를 키우는 입장에서 아이들의 세계에는 어떠한 영향을 줄지 항상 고민하고 예측하고 이런 이야기를 아이들과 하는 걸 좋아합니다.
현재
NAVER CLOUD(NAVER CLOVA)에서 HyperScale AI 팀의 리더로 일하며 CLOVA X의 Skill System을 총괄하고 있습니다. CLOVA Note의 AI 기능 개발을 담당하고 있으며, CLOVA Studio, CLOVA X 등 LLM 기반 제품/서비스 개발과 네이버 광고에서 쓰일 수 있는 AI 기능 개발을 이끌고 있습니다.
주요 성과
- CLOVA X Skill System 개발 총괄 (2023)
- CLOVA Note AI 요약 기능 개발 및 적용 (MAU 16만+)
- 네이버 카페 Communication AD 모델 개발 (월 10억+ 매출)
- KoBERT, KoGPT2, KoBART 등 한국어 NLP 오픈소스 모델 개발
- AWS ML Hero 활동

오픈소스 활동
한국어 NLP 저자
- KoBERT: BERT 기반의 한국어 사전학습 모델
- KoGPT2: GPT-2 기반의 한국어 언어생성 모델
- KoBART: BART 기반의 한국어 시퀀스-투-시퀀스 모델
- PyKoSpacing: 한국어 띄어쓰기 교정 패키지
- KoNLP: R 기반 한국어 자연어처리 패키지
딥러닝 프레임워크 기여
- DMLC(XGBoost, GluonNLP) 개발 그룹 멤버
- PyTorch Lightning Contributor
- Pipeline parallelism 기반 멀티노드 학습 코드 기여
- GluonNLP Committer
- MXNet BERT 학습 코드 개발
저서 및 번역서
- 「구글 BERT의 정석」 (한빛미디어, 번역서)
- 「R로하는 데이터 시각화」(한빛미디어)
- 「실전 예제로 살펴보는 집단지성 프로그래밍」(인사이트, 번역서)
주요 발표 및 강연
- 서울대학교, 경찰청, KISA 등 딥러닝 NLP 강의
- Everyone’s Lab 딥러닝 NLP 강의
- 2018 뉴욕 Text Analytics Workshop 패널 초청 발표
- 2017 런던 Text Analytics Workshop 패널 초청 발표
학술 활동
- HyperCLOVA X Technical Report
- DSTC8 대화 시스템 챌린지 Track 2 2위 (2019)
- EMNLP2020 Findings 논문 채택
- “한글 검색 질의어 오타 패턴 분석과 사용자 로그를 이용한 오타 교정 시스템 구축” (2010 한글 및 한국어 정보처리 학술대회 우수 논문)
관심 분야
- Large Language Models (LLM)
- Natural Language Processing (NLP)
- Machine Learning Systems
- Open Source Development
경력
- NAVER CLOUD (2022-현재): HyperScale AI 리더
- NAVER CLOVA (2021-2022): AI 리더
- SK Telecom (2013-2021): Research Engineer
- NexR (2011-2013): Data Scientist
- Yahoo! (2007-2011): Software Engineer
Links
- GitHub: haven-jeon
- LinkedIn: gogamza
- AWS Hero Profile: heewon-jeon
언론 보도
- [AI타임즈] “SKT AI, 한국어 자연어처리 오픈소스 ‘KoBART’ 공개”
- [아주경제] KoBERT, KoGPT2 관련 다수 인터뷰
연락처
- Email: madjakarta@gmail.com
- 거주지: 과천
[…] Gogamza Profile from __future__ import dream […]
번역본 독자 입니다. 책 잘보고 있습니다만 혼자 실험해 보려니 머리가 안따라와
많이 힘드네요.ㅠㅠ
(실전예제로 살펴보는 집단지성 프로그래밍)소스코드는 이클립스에서 돌아가는 거죠?
왜 전 안될까요? 처음 태그 클라우드 부터 막히기 시작하네요.
개발환경과 조언 부탁드려도 되는지요.
activeyyh@gmail:disqus .com 윤여황
소스코드가 일반적으로 인터넷에서 데이터를 가져와 분석하는 그런 코드들인데, 데이터 소스가 되는 서비스가 그동안 문을 닫거나 동작하지 않는 경우가 있습니다.
그냥 코드를 바로 돌리시는 것보다는 데이터 소스를 다시 한번 확인하시고 동작하는지 확인하시기 바랍니다.
저는 당시 윈도우 이클립스 환경에서 테스트 했습니다.
매번 블로그글 감사히 보고 있습니다
R을 공부하는 직장인 인데요 궁금한게 있어서
염치 없지만 질문글 남깁니다
http://abipictures.tistory.com/707
이 링크에 있는 어휘간 관계 그래프를 R을 이용해서 구현 할 수 있을까요..?
혹시 관련 패키지가 있을까요?
igraph 라는 패키지를 사용하시면 원하시는 그래프를 그려볼 수 있습니다.
하지만 단어들간의 관계를 정의하시기 위해서는 그리는것 이외에 여러 작업이 필요할듯 하네요.
답변 감사합니다!
혹시 단어들간의 관계를 정의하기 위한 패키지도 있을까요…?
서치엔진에 대해 공부를 해보려고 합니다.
어디서부터 시작하는게 좋을지 감이 안옵니다.
현재 The Anatomy of a Large-Scale Hypertextual Web Search Engine 이거 하나를 읽어보긴 했는데 무슨 말인지도 모르겠고 이곳 저곳 기웃 거리다가 블로그에 대해 접하게 되었습니다.
adison777@naver.com이 제 메일인데 많은 정보를 얻어 가고 싶습니다.
http://nlp.stanford.edu/IR-book/
일단 위 책을 충분히 내재화 될 때까지 보시기 바랍니다.
네 감사합니다. 읽고 궁금하거나 막히는 부분 틈틈히 질문하도록 하겠습니다.
안녕하세요. 저는 대학원에서 NLP를 공부하고 있는 학생입니다. 만드신 KoNLP 분석기를 너무나도 애용하고 있습니다. 한글 형태소 분석에 흥미가 많아 분석기를 만들고 싶은데 파이썬으로 만들수 있을까요? 만약 가능하다면 메뉴얼이 있는지 궁금합니다.
텍스트 분석 분야에 기여하신 부분 정말 감사드립니다.^^
Python으로는 KoNLPy라는게 있습니다.