CUDA6.5/Ubuntu14.04
をテンプレートにして作成
[
トップ
] [
新規
|
一覧
|
単語検索
|
最終更新
]
開始行:
[[labs.beatcraft.com]] ~
[[CUDA]] ~
#contents
* CUDA6.5/Ubuntu14.04 [#n5b85c0a]
Tesla K20c を搭載した PC へ Ubuntu 14.04 をインストールし...
Ubuntu 14.04 に CUDA6.5 をインストールする手順を記述しま...
* Hardware Spec [#de8b31c5]
主な Hardware Spec は以下のとおりです。~
- CPU: Core i7 3770 (3.4GHz,4core/8thread)
- Memory: 32GB (DDR3-12800 8GBx4)
- HDD: 1TB (SATA,7200rpm)
- GPU: ETSK20-5GER (NVIDIA Tesla K20c, for CUDA)~
- GPU: GF-GT730-LE1GHD/D5 (NVIDIA Geforce GT730, for Vid...
~
GPGPU 専用の ETSK20-5GER にはディスプレイ出力端子(D-SUB,...
[[CUDA5/CentOS6.4]] の時は UEFI の設定で Primary Display ...
CUDA Toolkit インストール時に NVIDIA GPU ドライバーといっ...
NVIDIA 以外の GPU では GUI が正常に表示されなくなってしま...
今回は headless の Ubuntu Server でなく GUI のある Ubuntu...
NVIDIA Geforce GT730 を搭載した GF-GT730-LE1GHD/D5 を追加...
* Ubuntu 14.04 のインストール [#z1f9e64b]
以下のような設定で Ubuntu 14.04.01 LTS Desktop 64bit版を...
- 言語:US
- キーボード:日本語
- HDD パーティション:全領域使用、デフォルト設定
- ネットワーク:DHCP
後で邪魔になるので Ubuntu インストール DVD の起動オプショ...
オープンソースの NVIDIA GPU ドライバー Nouveau を使わずに...
* Ubuntu 14.04 インストール後設定 [#db8c96a0]
インストール完了後、以下の設定を行います。 ~
** Ubuntu 14.04 アップデート [#sf692f14]
最新の状態に更新します。
$ sudo apt-get update
$ sudo apt-get dist-upgrade
アップデート完了後再起動を実行し、アップデートした Kernel...
** Nouveau 無効化 [#f1bd954e]
NVIDIA 製 GPU ドライバーをインストール出来るようにしそち...
Nouveau ドライバーが読み込まれないようにします。~
以下の内容で /etc/modprobe.d/blacklist-nouveau.conf とい...
blacklist nouveau
options nouveau modeset=0
この設定が反映されるよう kernel initramfs を再生成します。
$ sudo update-initramfs -u
再起動し、Nouveau ドライバーが読み込まれていないことを確...
Nouveau が読み込まれていない場合は LightDM や Gnome が低...
また lsmod した video ドライバーに nouveau がないことを確...
** パッケージのインストール [#kf49d043]
Ubuntu 14.04 インストール直後の状態で CUDA のインストール...
管理運用を楽にするため以下のパッケージを追加します。
$ sudo apt-get install vim lv ssh naoutilus-open-termina...
* CUDA 6.5 のインストール [#h0c731ad]
CUDA 6.5 からは Ubuntu が正式にサポートディストリビューシ...
deb パッケージのリポジトリも用意されたのでインストールは...
~
Package Manager によるインストール~
http://docs.nvidia.com/cuda/cuda-getting-started-guide-fo...
の手順に従って CUDA 6.5 のインストールを行います。~
~
まず CUDA Downloads ページ~
https://developer.nvidia.com/cuda-downloads~
から Ubuntu 14.04 用の deb パッケージ cuda-repo-ubuntu140...
以下のようにインストールします。~
$ sudo dpkg -i cuda-repo-ubuntu1404_6.5-14_amd64.deb
この deb パッケージは apt sources list に NVIDIA のリポジ...
インストール後以下のように index を更新し CUDA をインスト...
$ sudo apt-get update
$ sudo apt-get install cuda
これで CUDA 6.5 のインストールは完了です。~
再起動すると Ubuntu Desktop の GUI は NVIDIA 製 GPU ドラ...
* CUDA 6.5 インストール後設定 [#acc5d5d4]
**環境変数設定 [#o5938b7b]
CUDA 6.5 が /usr/local/cuda-6.5/ の下に一式インストールさ...
ここにある実行ファイルやライブラリを利用出来るよう環境変...
~
.bashrc の末尾に以下の内容を追加します。
$ export PATH=/usr/local/cuda-6.5/bin:$PATH
$ export LD_LIBRARY_PATH=/usr/local/cuda-6.5/lib64:$LD_L...
これで新しく開いた Terminal から環境変数が反映されます。
**CUDA Samples コピー [#e02427b8]
/usr/local/cuda-6.5/samples/ の下に sample がインストール...
ここは root 権がないと書き込み出来ないので、~
以下のコマンドで書き込み権のあるディレクトリ(例えば自分...
$ cuda-install-samples-6.5.sh ~
/home/{user}/NVIDIA_CUDA-6.5_Samples/ に sample がコピー...
** Samples のビルドと実行 [#a3d4ec42]
以下のようにしてコピー出来た Samples をビルドします。
$ cd ~/NVIDIA_CUDA-6.5_Samples
$ make
これで NVIDIA_CUDA-6.5_Samples の下のサブディレクトリの各...
ビルドされた各 Sample の実行ファイルは ~/NVIDIA_CUDA-6.5_...
$ cd bin/x86_64/linux/release
beat@tesla:~/NVIDIA_CUDA-6.5_Samples/bin/x86_64/linux/re...
alignedTypes cudaDecodeGL matrixMu...
asyncAPI cudaOpenMP matrixMu...
bandwidthTest cuHook matrixMu...
batchCUBLAS dct8x8 matrixMu...
bicubicTexture deviceQuery matrixMu...
bilateralFilter deviceQueryDrv MC_Estim...
bindlessTexture dwtHaar1D MC_Estim...
binomialOptions dxtc MC_Estim...
BlackScholes eigenvalues MC_Estim...
boxFilter fastWalshTransform MC_Singl...
boxFilterNPP FDTD3d mergeSor...
cdpAdvancedQuicksort fluidsGL Mersenne...
cdpBezierTessellation freeImageInteropNPP MonteCar...
cdpLUDecomposition FunctionPointers nbody ...
cdpQuadtree grabcutNPP newdelet...
cdpSimplePrint histEqualizationNPP NV12ToAR...
cdpSimpleQuicksort histogram oceanFFT...
clock HSOpticalFlow p2pBandw...
concurrentKernels imageDenoising particle...
conjugateGradient imageSegmentationNPP postProc...
conjugateGradientPrecond inlinePTX ptxjit ...
conjugateGradientUM interval quasiran...
convolutionFFT2D jpegNPP radixSor...
convolutionSeparable libcuhook.so.1 randomFo...
convolutionTexture lineOfSight recursiv...
cppIntegration Mandelbrot reductio...
cppOverload marchingCubes scalarPr...
Running the Binaries~
http://docs.nvidia.com/cuda/cuda-getting-started-guide-fo...
に従って deviceQuery を実行してみると、以下のような結果に...
beat@tesla:~/NVIDIA_CUDA-6.5_Samples/bin/x86_64/linux/re...
./deviceQuery Starting...
CUDA Device Query (Runtime API) version (CUDART static ...
Detected 2 CUDA Capable device(s)
Device 0: "Tesla K20c"
CUDA Driver Version / Runtime Version 6.5 / 6.5
CUDA Capability Major/Minor version number: 3.5
Total amount of global memory: 4800 MB...
(13) Multiprocessors, (192) CUDA Cores/MP: 2496 CU...
GPU Clock rate: 706 MHz...
Memory Clock rate: 2600 Mhz
Memory Bus Width: 320-bit
L2 Cache Size: 1310720...
Maximum Texture Dimension Size (x,y,z) 1D=(655...
Maximum Layered 1D Texture Size, (num) layers 1D=(163...
Maximum Layered 2D Texture Size, (num) layers 2D=(163...
Total amount of constant memory: 65536 b...
Total amount of shared memory per block: 49152 b...
Total number of registers available per block: 65536
Warp size: 32
Maximum number of threads per multiprocessor: 2048
Maximum number of threads per block: 1024
Max dimension size of a thread block (x,y,z): (1024, 1...
Max dimension size of a grid size (x,y,z): (2147483...
Maximum memory pitch: 2147483...
Texture alignment: 512 bytes
Concurrent copy and kernel execution: Yes wit...
Run time limit on kernels: No
Integrated GPU sharing Host Memory: No
Support host page-locked memory mapping: Yes
Alignment requirement for Surfaces: Yes
Device has ECC support: Enabled
Device supports Unified Addressing (UVA): Yes
Device PCI Bus ID / PCI location ID: 1 / 0
Compute Mode:
< Default (multiple host threads can use ::cudaSetD...
Device 1: "GeForce GT 730"
CUDA Driver Version / Runtime Version 6.5 / 6.5
CUDA Capability Major/Minor version number: 3.5
Total amount of global memory: 1023 MB...
( 2) Multiprocessors, (192) CUDA Cores/MP: 384 CUD...
GPU Clock rate: 954 MHz...
Memory Clock rate: 2505 Mhz
Memory Bus Width: 64-bit
L2 Cache Size: 524288 ...
Maximum Texture Dimension Size (x,y,z) 1D=(655...
Maximum Layered 1D Texture Size, (num) layers 1D=(163...
Maximum Layered 2D Texture Size, (num) layers 2D=(163...
Total amount of constant memory: 65536 b...
Total amount of shared memory per block: 49152 b...
Total number of registers available per block: 65536
Warp size: 32
Maximum number of threads per multiprocessor: 2048
Maximum number of threads per block: 1024
Max dimension size of a thread block (x,y,z): (1024, 1...
Max dimension size of a grid size (x,y,z): (2147483...
Maximum memory pitch: 2147483...
Texture alignment: 512 bytes
Concurrent copy and kernel execution: Yes wit...
Run time limit on kernels: Yes
Integrated GPU sharing Host Memory: No
Support host page-locked memory mapping: Yes
Alignment requirement for Surfaces: Yes
Device has ECC support: Disabled
Device supports Unified Addressing (UVA): Yes
Device PCI Bus ID / PCI location ID: 2 / 0
Compute Mode:
< Default (multiple host threads can use ::cudaSetD...
> Peer access from Tesla K20c (GPU0) -> GeForce GT 730 (...
> Peer access from GeForce GT 730 (GPU1) -> Tesla K20c (...
deviceQuery, CUDA Driver = CUDART, CUDA Driver Version =...
Result = PASS
また、bandwidthTest を実行すると以下のような結果になりま...
beat@tesla:~/NVIDIA_CUDA-6.5_Samples/bin/x86_64/linux/re...
[CUDA Bandwidth Test] - Starting...
Running on...
Device 0: Tesla K20c
Quick Mode
Host to Device Bandwidth, 1 Device(s)
PINNED Memory Transfers
Transfer Size (Bytes) Bandwidth(MB/s)
33554432 6577.3
Device to Host Bandwidth, 1 Device(s)
PINNED Memory Transfers
Transfer Size (Bytes) Bandwidth(MB/s)
33554432 6545.8
Device to Device Bandwidth, 1 Device(s)
PINNED Memory Transfers
Transfer Size (Bytes) Bandwidth(MB/s)
33554432 147234.3
Result = PASS
* 更新履歴 [#cbed8220]
2015/01/27 初稿掲載 ~
RIGHT:Satoshi OTSUKA
終了行:
[[labs.beatcraft.com]] ~
[[CUDA]] ~
#contents
* CUDA6.5/Ubuntu14.04 [#n5b85c0a]
Tesla K20c を搭載した PC へ Ubuntu 14.04 をインストールし...
Ubuntu 14.04 に CUDA6.5 をインストールする手順を記述しま...
* Hardware Spec [#de8b31c5]
主な Hardware Spec は以下のとおりです。~
- CPU: Core i7 3770 (3.4GHz,4core/8thread)
- Memory: 32GB (DDR3-12800 8GBx4)
- HDD: 1TB (SATA,7200rpm)
- GPU: ETSK20-5GER (NVIDIA Tesla K20c, for CUDA)~
- GPU: GF-GT730-LE1GHD/D5 (NVIDIA Geforce GT730, for Vid...
~
GPGPU 専用の ETSK20-5GER にはディスプレイ出力端子(D-SUB,...
[[CUDA5/CentOS6.4]] の時は UEFI の設定で Primary Display ...
CUDA Toolkit インストール時に NVIDIA GPU ドライバーといっ...
NVIDIA 以外の GPU では GUI が正常に表示されなくなってしま...
今回は headless の Ubuntu Server でなく GUI のある Ubuntu...
NVIDIA Geforce GT730 を搭載した GF-GT730-LE1GHD/D5 を追加...
* Ubuntu 14.04 のインストール [#z1f9e64b]
以下のような設定で Ubuntu 14.04.01 LTS Desktop 64bit版を...
- 言語:US
- キーボード:日本語
- HDD パーティション:全領域使用、デフォルト設定
- ネットワーク:DHCP
後で邪魔になるので Ubuntu インストール DVD の起動オプショ...
オープンソースの NVIDIA GPU ドライバー Nouveau を使わずに...
* Ubuntu 14.04 インストール後設定 [#db8c96a0]
インストール完了後、以下の設定を行います。 ~
** Ubuntu 14.04 アップデート [#sf692f14]
最新の状態に更新します。
$ sudo apt-get update
$ sudo apt-get dist-upgrade
アップデート完了後再起動を実行し、アップデートした Kernel...
** Nouveau 無効化 [#f1bd954e]
NVIDIA 製 GPU ドライバーをインストール出来るようにしそち...
Nouveau ドライバーが読み込まれないようにします。~
以下の内容で /etc/modprobe.d/blacklist-nouveau.conf とい...
blacklist nouveau
options nouveau modeset=0
この設定が反映されるよう kernel initramfs を再生成します。
$ sudo update-initramfs -u
再起動し、Nouveau ドライバーが読み込まれていないことを確...
Nouveau が読み込まれていない場合は LightDM や Gnome が低...
また lsmod した video ドライバーに nouveau がないことを確...
** パッケージのインストール [#kf49d043]
Ubuntu 14.04 インストール直後の状態で CUDA のインストール...
管理運用を楽にするため以下のパッケージを追加します。
$ sudo apt-get install vim lv ssh naoutilus-open-termina...
* CUDA 6.5 のインストール [#h0c731ad]
CUDA 6.5 からは Ubuntu が正式にサポートディストリビューシ...
deb パッケージのリポジトリも用意されたのでインストールは...
~
Package Manager によるインストール~
http://docs.nvidia.com/cuda/cuda-getting-started-guide-fo...
の手順に従って CUDA 6.5 のインストールを行います。~
~
まず CUDA Downloads ページ~
https://developer.nvidia.com/cuda-downloads~
から Ubuntu 14.04 用の deb パッケージ cuda-repo-ubuntu140...
以下のようにインストールします。~
$ sudo dpkg -i cuda-repo-ubuntu1404_6.5-14_amd64.deb
この deb パッケージは apt sources list に NVIDIA のリポジ...
インストール後以下のように index を更新し CUDA をインスト...
$ sudo apt-get update
$ sudo apt-get install cuda
これで CUDA 6.5 のインストールは完了です。~
再起動すると Ubuntu Desktop の GUI は NVIDIA 製 GPU ドラ...
* CUDA 6.5 インストール後設定 [#acc5d5d4]
**環境変数設定 [#o5938b7b]
CUDA 6.5 が /usr/local/cuda-6.5/ の下に一式インストールさ...
ここにある実行ファイルやライブラリを利用出来るよう環境変...
~
.bashrc の末尾に以下の内容を追加します。
$ export PATH=/usr/local/cuda-6.5/bin:$PATH
$ export LD_LIBRARY_PATH=/usr/local/cuda-6.5/lib64:$LD_L...
これで新しく開いた Terminal から環境変数が反映されます。
**CUDA Samples コピー [#e02427b8]
/usr/local/cuda-6.5/samples/ の下に sample がインストール...
ここは root 権がないと書き込み出来ないので、~
以下のコマンドで書き込み権のあるディレクトリ(例えば自分...
$ cuda-install-samples-6.5.sh ~
/home/{user}/NVIDIA_CUDA-6.5_Samples/ に sample がコピー...
** Samples のビルドと実行 [#a3d4ec42]
以下のようにしてコピー出来た Samples をビルドします。
$ cd ~/NVIDIA_CUDA-6.5_Samples
$ make
これで NVIDIA_CUDA-6.5_Samples の下のサブディレクトリの各...
ビルドされた各 Sample の実行ファイルは ~/NVIDIA_CUDA-6.5_...
$ cd bin/x86_64/linux/release
beat@tesla:~/NVIDIA_CUDA-6.5_Samples/bin/x86_64/linux/re...
alignedTypes cudaDecodeGL matrixMu...
asyncAPI cudaOpenMP matrixMu...
bandwidthTest cuHook matrixMu...
batchCUBLAS dct8x8 matrixMu...
bicubicTexture deviceQuery matrixMu...
bilateralFilter deviceQueryDrv MC_Estim...
bindlessTexture dwtHaar1D MC_Estim...
binomialOptions dxtc MC_Estim...
BlackScholes eigenvalues MC_Estim...
boxFilter fastWalshTransform MC_Singl...
boxFilterNPP FDTD3d mergeSor...
cdpAdvancedQuicksort fluidsGL Mersenne...
cdpBezierTessellation freeImageInteropNPP MonteCar...
cdpLUDecomposition FunctionPointers nbody ...
cdpQuadtree grabcutNPP newdelet...
cdpSimplePrint histEqualizationNPP NV12ToAR...
cdpSimpleQuicksort histogram oceanFFT...
clock HSOpticalFlow p2pBandw...
concurrentKernels imageDenoising particle...
conjugateGradient imageSegmentationNPP postProc...
conjugateGradientPrecond inlinePTX ptxjit ...
conjugateGradientUM interval quasiran...
convolutionFFT2D jpegNPP radixSor...
convolutionSeparable libcuhook.so.1 randomFo...
convolutionTexture lineOfSight recursiv...
cppIntegration Mandelbrot reductio...
cppOverload marchingCubes scalarPr...
Running the Binaries~
http://docs.nvidia.com/cuda/cuda-getting-started-guide-fo...
に従って deviceQuery を実行してみると、以下のような結果に...
beat@tesla:~/NVIDIA_CUDA-6.5_Samples/bin/x86_64/linux/re...
./deviceQuery Starting...
CUDA Device Query (Runtime API) version (CUDART static ...
Detected 2 CUDA Capable device(s)
Device 0: "Tesla K20c"
CUDA Driver Version / Runtime Version 6.5 / 6.5
CUDA Capability Major/Minor version number: 3.5
Total amount of global memory: 4800 MB...
(13) Multiprocessors, (192) CUDA Cores/MP: 2496 CU...
GPU Clock rate: 706 MHz...
Memory Clock rate: 2600 Mhz
Memory Bus Width: 320-bit
L2 Cache Size: 1310720...
Maximum Texture Dimension Size (x,y,z) 1D=(655...
Maximum Layered 1D Texture Size, (num) layers 1D=(163...
Maximum Layered 2D Texture Size, (num) layers 2D=(163...
Total amount of constant memory: 65536 b...
Total amount of shared memory per block: 49152 b...
Total number of registers available per block: 65536
Warp size: 32
Maximum number of threads per multiprocessor: 2048
Maximum number of threads per block: 1024
Max dimension size of a thread block (x,y,z): (1024, 1...
Max dimension size of a grid size (x,y,z): (2147483...
Maximum memory pitch: 2147483...
Texture alignment: 512 bytes
Concurrent copy and kernel execution: Yes wit...
Run time limit on kernels: No
Integrated GPU sharing Host Memory: No
Support host page-locked memory mapping: Yes
Alignment requirement for Surfaces: Yes
Device has ECC support: Enabled
Device supports Unified Addressing (UVA): Yes
Device PCI Bus ID / PCI location ID: 1 / 0
Compute Mode:
< Default (multiple host threads can use ::cudaSetD...
Device 1: "GeForce GT 730"
CUDA Driver Version / Runtime Version 6.5 / 6.5
CUDA Capability Major/Minor version number: 3.5
Total amount of global memory: 1023 MB...
( 2) Multiprocessors, (192) CUDA Cores/MP: 384 CUD...
GPU Clock rate: 954 MHz...
Memory Clock rate: 2505 Mhz
Memory Bus Width: 64-bit
L2 Cache Size: 524288 ...
Maximum Texture Dimension Size (x,y,z) 1D=(655...
Maximum Layered 1D Texture Size, (num) layers 1D=(163...
Maximum Layered 2D Texture Size, (num) layers 2D=(163...
Total amount of constant memory: 65536 b...
Total amount of shared memory per block: 49152 b...
Total number of registers available per block: 65536
Warp size: 32
Maximum number of threads per multiprocessor: 2048
Maximum number of threads per block: 1024
Max dimension size of a thread block (x,y,z): (1024, 1...
Max dimension size of a grid size (x,y,z): (2147483...
Maximum memory pitch: 2147483...
Texture alignment: 512 bytes
Concurrent copy and kernel execution: Yes wit...
Run time limit on kernels: Yes
Integrated GPU sharing Host Memory: No
Support host page-locked memory mapping: Yes
Alignment requirement for Surfaces: Yes
Device has ECC support: Disabled
Device supports Unified Addressing (UVA): Yes
Device PCI Bus ID / PCI location ID: 2 / 0
Compute Mode:
< Default (multiple host threads can use ::cudaSetD...
> Peer access from Tesla K20c (GPU0) -> GeForce GT 730 (...
> Peer access from GeForce GT 730 (GPU1) -> Tesla K20c (...
deviceQuery, CUDA Driver = CUDART, CUDA Driver Version =...
Result = PASS
また、bandwidthTest を実行すると以下のような結果になりま...
beat@tesla:~/NVIDIA_CUDA-6.5_Samples/bin/x86_64/linux/re...
[CUDA Bandwidth Test] - Starting...
Running on...
Device 0: Tesla K20c
Quick Mode
Host to Device Bandwidth, 1 Device(s)
PINNED Memory Transfers
Transfer Size (Bytes) Bandwidth(MB/s)
33554432 6577.3
Device to Host Bandwidth, 1 Device(s)
PINNED Memory Transfers
Transfer Size (Bytes) Bandwidth(MB/s)
33554432 6545.8
Device to Device Bandwidth, 1 Device(s)
PINNED Memory Transfers
Transfer Size (Bytes) Bandwidth(MB/s)
33554432 147234.3
Result = PASS
* 更新履歴 [#cbed8220]
2015/01/27 初稿掲載 ~
RIGHT:Satoshi OTSUKA
ページ名:
BC::labsへの質問は、bc9-dev @ googlegroups.com までお願い致します。