티스토리 뷰

Horovod 수행 환경 구성 정리

1. 환경 구성에 필요한 설치 패키지

  • CUDA
  • OpenMPI
  • Tensorflow GPU


2. 설치 기준

- CUDA 9.0
- OpenMPI 3.0
- Tensorflow GPU 1.5.0
    - prebuild Tensorflow GPU 1.5는 CUDA 9.0 지원
    - CUDA 9.1을 사용하기 위해서는 Tensorflow GPU를 따로 빌드할 것

2.1 OpenMPI 설치

NPROCS=`grep -c processor /proc/cpuinfo`;

wget https://www.open-mpi.org/software/ompi/v3.0/downloads/openmpi-3.0.
0.tar.gz
tar zxf openmpi-3.0.0.tar.gz

cd openmpi-3.0.0
./configure --enable-orterun-prefix-by-default

make -j $NPROCS all # for parallel compile
make install
ldconfig


2.2 Tensorflow GPU 설치

Tensorflow-GPU 설치시 필요 모듈
- 인터넷이 연결된 경우 자동으로 다운로드 및 설치 진행

enum34 (>=1.1.6)
backports.weakref (>=1.0rc1)
mock (>=2.0.0)
wheel
tensorflow-tensorboard (<1.6.0,>=1.5.0)
protobuf (>=3.4.0)
six (>=1.10.0)
numpy (>=1.12.1)
absl-py (>=0.1.6)
- 인터넷이 안되는 경우에는 해당 모듈을 다운로드후 별도 설치
    - python 패키지 다운로드       https://pypi.python.org/pypi


wget https://pypi.python.org/packages/0b/80/094c2f7b05acb1089333d
93c41323e93f3296eaa7a785d9848973e4e36bd/tensorflow_gpu-1.5.0-cp27-
cp27mu-manylinux1_x86_64.whl#md5=d519dd5669665acc286b7eb186e58f7a

pip install tensorflow_gpu-1.5.0-cp27-cp27mu-
manylinux1_x86_64.whl</code>


3. Horovod 설치

- CUDA Driver, OpenMPI가 설치되어있는 경우에만 설치 가능
- 설치시 openmpi의 binary가 존재하는 PATH를 지정

export PATH=/usr/local/bin:$PATH
pip install --no-cache-dir horovod

3.1 Horovod so 파일 위치 (python 2.7 기준)

- openmpi 라이브러리와 링크 되었는지 확인
ldd /usr/local/lib/python2.7/dist-
packages/horovod/tensorflow/mpi_lib.so | grep mpi
libmpi.so.40 => /usr/local/lib/libmpi.so.40 (0x00007f6fc001b000)</code>


공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
TAG
more
«   2024/04   »
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30
글 보관함