뭐 별 말씀은 없지만 검색엔진 개발자 그룹의 typos님이 만드신걸로 추정되는 국내 블로그 실시간 통계 사이트를 올려본다. (아니시라면 댓글달아 주세요.)

내가 이것을 만든 사람이 typos님이라 생각하는건 그 동안 나와 나눈 대화들 때문이다. 국내 블로그 통계정보를 다 가지고 계신다는 …
보다시피 네이버 블로그가 압도적으로 많다.
어떻게 이렇게 실시간으로 수집을 하는지 잠시 생각해 봤는데 블로그 서비스에서 지원하는 “새로운 블로거”를 리스팅 해주는 게시판 같은걸 크롤링하지 않을까 하는 생각을 해본다. 이런걸 만들어 보는것도 참 잼날거 같다는 생각이 든다. (웹로봇을 조금만 수정하면될거 같다는 막연한 생각.)
하여튼 블로거가 실시간으로 늘어나는게 신기해 보이기는 하지만 그 많은 블로거가 진정한 블로거로 성장하기까지는 참 많은 시간과 노력과 주변 블로거의 관심이 필요할거라는 생각을 해본다.
이중에 몇프로나 진정한(?) 블로거가 될까?
내 만든게 맞네^^
한달반치를 날리지만 않았으면 벌써 500만을 넘기는건데.. 블로그 아이디 찾는것도 꾸준한 인내가 필요한 것 같군.. 지금 이시간에도 새로운 아이디는 생성되는것이니..
역시 예상대로시네요. ㅋㅋ
blog id 찾는것만 해도 중복검사 모듈… 뭐 하면 상당한 인내와 고민이 필요할거 같습니다.
블로그 숫자 확인을 어떤방법으로 하셨는지 힌트좀 주시면 안되요 . .? 궁금해서 …예를 들어서 네이버 블로그 메인에서 시작해서 아이디 크롤링 으로 중복 제거하면서 계속 카운트 하시는건지요..? 가능한 방법인지도 모르겠습니다 – -;
편법으로는 서비스 메인 페이지의 “새로운 블로거” 이런 게시판을 크롤링 해서 블로그 ID를 추출하는 방법이 있겠구요.
그러면 이건 일단 서비스 종속적인 로봇이 되어 버리는거구요.
그렇게 된다면야. 많은 블로그를 수집할 수 있겠지만, 개인호스팅을 받는 양질의 블로그들은 찾기가 힘들죠.(대부분의 개인 호스팅을 받는 블로거는 파워블로거일 가능성이 있죠.)
이런 부분을 상쇄할 다른 방법이 있기는 한데 이 부분에 대한것은 로봇의 학습에 관련된 것이라 쪼금 어려운 개념이 될 수도 있겠습니다.
이 부분에 대한건 나중에 검개그 오프 모임에 오시면 알려드리겠습니다. ㅎㅎㅎㅎ