parallel_for와 Matrix 연산

TBB를 사용해서 Matrix연산 퍼포먼스를 측정해 봤다. Matrix Multiply를 해봤는데 그런대로 볼만한 성능향상이 있어서 그 내용에 대해서 올려본다.  Matrix 곱 연산은 N X N  두개의 행렬에 대해서 실행 했을때 O(n^3)이 나오는 복잡한 연산중에 하나이다. 게다가 매트릭스 곱은 행과 열의 관계에 대한 계산을 할때 빈번히 쓰여서 social network를 구현하기 위한 계산을 할때 자주쓰이는 재밋는 수식이다. 이 연산비교를 […]

계속 읽기

멀티코어 CPU에서 병렬 처리를 위한 몇몇 가지..

Exploiting Parallelism with Multi-core Technologies  위 강좌에서 잘 나온다. 3가지 멀티코어 병렬 처리를 위한 방법들.. 1. 새로운 언어를 사용한다. ex) Cilk, NESL, Haskel, Erlang, Fortress,…..2. 랭귀지 익스텐션을 사용한다. ex) OpenMP – 이해하기 쉽지만, 또 다른 컴파일러가 필요하다.3. 라이브러리 : POOMA, Hood ,…. – 사용하기 편하다. – 특정 도메인에만 적용 가능하다. 그래서 결론은 Intel Threading Building Blocks 이라는 말인인데, […]

계속 읽기