Python으로 구현한 K-means 프로그램 공개

뭐 레포트도 넸겠다. 이래저래 가지고 있는것보다 공개하는게 나을거 같아서 공개함. 아래와 같은 숙제 Description이 나왔었고 Input : sample file, KM/LBG, Number of codeword Output : total distortion at each iteration Distortion measure : Euclidian distance Split : z × (1± 0.05) 8메가 정도되는 데이터 파일 이 아래 파일에 동봉되어 있으나 일단 설명하자면.. 한줄에 13개의 float형 […]

계속 읽기

우리나라 처음이자 마지막 한글 개발툴 창조는 건재하다.

전에 창조라는 개발툴을 아시나요?라는 포스팅을 쓴적이 있다. 창조 개발툴을 아주 재미있게 썼던 기억이 이따금씩 나서 창조유저그룹을 가끔 방문하곤한다. 헉~~스 그런데 남상기님이 오랜 공백 … 진짜 오랜 공백을 깨고 이게 몇년만인가??? 2000년도에인가 마지막 업데이트가 있었는데.. 그 후로 제작자이신 남상기님이 죽었는지 살았는지 몰랐다. 그런데.. 10월 31일날 창조 DB버전 베타2가 나왔더군.. ㅜㅜ 아직 베타버전이라서 인스톨본으로 배포는 안되었지만 압축만 […]

계속 읽기

IQ Test

점심시간에 잠시나마 머리를 식힐겸 conv2님 블로그에서 본 IQ테스트를 해봤다. 솔직히 IQ테스트보다는 이 IQ테스트가 어떤걸 의미하는지에 대해서 알수 있었고, 각 나라마다 그리고 방법마다 다른 결과가 나올수 있음을 알수 있었다. 내가 알기로는 상위 2%안에 드는 멘사레벨이 우리가 알고 있던 IQ 테스트로는 148이상인걸로 알고 있었는데 이곳 테스트에서는 130이상이였다. 물론 표준편차가 15이고, 평균이 100인 정규분포를 들어서 평가했다고 했다. 그리고 […]

계속 읽기

웰빙언어 Python

파이썬을 써보니, 편하더군.. 미병님의 포스팅에 발동이 걸려 또 Python관련글을 써본다. 사실 저번 K-means 클러스터링 알고리즘 숙제를 Python을 이용해서 했다. 도서관에서 알고리즘 분석하고 10메가의 데이터파일을 로딩하고 돌려보기까지 2시간정도밖에 안걸렸다. 그러니까 2시간만에 짜버린것이지. 물론 그당시 숙제의 description이 충분하게 자세히 나오지 않아 1주일 후에 다시 고치긴했지만 한달짜리 숙제제출기간이 잡힌걸 2시간만에 어느정도 해치워버린건 내가 생각해도 대단했다. 물론 이 수업이 […]

계속 읽기

DRM 보안모듈걸린 pdf도 프린트한다.

주로 pdf 변환툴로 CutePDF와 PrimoPDF를 쓴다는 포스팅을 전에 한적이 있다. 그런데 도서관에서 논문자료를 보는데 저장할수 없는 PDF였다, 그러니까 DRM 모듈을 통해서 보여지는 PDF라서 저장을 막아둔것이였다. 물론 Print는 가능하더라.. 하지만 학교에서 Print하기가 여간 힘든일이라 꼭 이걸 파일로 받아갈 생각을 했었다. 그래서 위에서 나온 툴을 이용한 파일로 프린트를 시도했는데 시간만 오래 걸리지 전혀 파일로 만들어 지지 않았다. […]

계속 읽기

경험상 군대내 의료체계는 원래부터 문제였다.

내가 군대에 있을때 소대원들이 충치가 있어 치과치료를 보네려고 하면 1달이 밀려있다고 했던게 생각난다. 그러니까 등록하고 한달이 지나야 치료를 받을수 있다는 이야기다. 항상 1달이상이였다. 그때 사단에 치과의사가 1명이라고 들었다. 거의 다 모든 병사들이 서서히 아파올 시점도 아니고 참기 힘들정도에 치료를 요청하는 상황인데. 1달동안 그럼 이빨잡고 계속 아파야 하는가? 그래서 줄곳 주말에 데리고 읍내에 나가서 치료를 받게 […]

계속 읽기

기다리는 번역본

Data Crunching: Solve Everyday Problems Using Java, Python, and More 살까 말까 수없이 고민하게 만든책이다. amazon 서평도 좋고 간단히 쓰고 버리는 텍스트 처리 코드들의 소개를 하는 책인거 같은데 아주 실용적일 내용이기 뻔할것이기 때문이다. 국내 Python의 인기와 Java의 인기를 생각해서는 반드시 번역본이 나와줘야되는 책중에 하나라고 생각한다. 아마 번역작업에 벌써 들어가지 않았을까 한다. 또하나는 Programming Ruby: The […]

계속 읽기

고려대학교 컴퓨터과학기술대학원 추계학술제 강연회

10월 12일 11월 12일날이 추계학술제날인데 그날 볼만한 강연회가 있어서 포스팅한다. 뭐 참가 자격은 관심있는 모든분들이고. 소정의 상품까지 있으니 1석2조겠네. 이런 강연은 일부러 찾아다니면서 듣자는 주의인데 누군가 가르쳐 주는것과 혼자서 배우는것과의 차이는 심하기 때문이다. 아직 보름넘게 남았지만 미리 올려본다.

계속 읽기

즉답형 검색엔진 lexxe.com 나왔다

구글처럼 또 하나의 검색엔진 대박기업이 나올지도 모르겠다. 빌게이츠 회장이 지난번 연설에서 말한 작은화면의 모바일 기기에서 사용가능한 검색질의 시스템이 벌써 나온건 아닌지 … 구글만큼 획기적인 서비스가 될 가능성이 다분하군… 그런데 ETRI연구원이 말한 “받침이 있는 한글 특성상 자연어 검색 엔진을 적용하기 어렵다는 것이다. “ 이말이 도대체 무슨뜻으로 한말인지…. 받침이 있어서 적용하기 어렵다는 말은 내가 책도 좀 보고 […]

계속 읽기

OpenOffice 2.0 에서 hwp파일이 보이는군,

개인용 놋북에 오픈소스 소프트웨어 들이 많다. 최근에 나온 OpenOffice 2.0를 깔아서 이래저래 쓰고 있는데 눈에 띄게 좋아진점이 몇개 있다. 거의(?) 완벽에 가까운 Microsoft 제품 제현률과 편집의 유사성 등등은 다들 아실테고.. 소문으로 듣던 Hwp 뷰잉기능이 있었다.(2.X 버전에 탑제될 기능이였다.) 물론 편집해서 hwp 포멧으로 저장은 불가능하다. 대신 그 문서를 다른 포멧으로 저장은 가능하다. 최근에 나온 2005포멧은 인식이 […]

계속 읽기