CUDA5/CentOS6.4
をテンプレートにして作成
[
トップ
] [
新規
|
一覧
|
単語検索
|
最終更新
]
開始行:
[[labs.beatcraft.com]] ~
[[CUDA]] ~
#contents
* CUDA5/CentOS6.4 [#uc1c5ea8]
Tesla K20cを搭載したCentOS 6.4(64bit版)PCへCUDA5をインス...
~
#ref(CUDA_Tesla.jpg,,60%) ~
~
* Hardware Spec [#de8b31c5]
主なHardware Specは以下のとおりです。~
- CPU: Core i7 3770(3.4GHz,4core/8thread)
- Memory: 32GB(DDR3-12800 8GBx4)
- HDD: 1TB(SATA,7200rpm)
- GPU: ETSK20-5GER(nvidia Tesla K20c) ~
~
#ref(CUDA_PC.jpg,,60%) ~
~
ETSK20-5GERにはディスプレイ出力端子(D-SUB,DVI,HDMIなど)が...
UEFIの設定でPrimary DisplayをOn Boardに設定し、ディスプレ...
出力端子に接続しています。 ~
* CentOS 6.4(64bit版) のインストール [#z1f9e64b]
以下のような設定でCentOS 6.4(64bit版)インストールをしてい...
- 言語、キーボード: 日本語
- HDD パーティション: 全領域使用、デフォルト設定
- ネットワーク: DHCP
- パッケージ: Desktop
本稿では個別のパッケージのカスタマイズ設定は行っていませ...
またFirewall、SELinuxは共にDisableに設定しています。~
* CentOS インストール後設定 [#db8c96a0]
CentOS 6.4(64bit版)インストール後の設定について記載します...
** CentOSのアップデート [#sf692f14]
インストール直後のKernelバージョンは以下のとおりです。~
$ uname -a
Linux localhost.localdomain 2.6.32-358.el6.x86_64 #1 SMP...
yum コマンドでアップデートを実行します。 ~
# yum update
アップデート完了後再起動を実行しアップデートしたKernelで...
# reboot
再起動後のKernelバージョンは以下のとおりです。~
$ uname -a
Linux localhost.localdomain 2.6.32-358.6.2.el6.x86_64 #1...
beatユーザを作成し、sudoにbeatユーザを追加します。~
# useradd beat
# passwd beat
# /usr/sbin/visudo
...<略>
## user MACHINE=COMMANDS
##
## The COMMANDS section may have other options added to...
##
## Allow root to run any commands anywhere
root ALL=(ALL) ALL
beat ALL=(ALL) ALL
** パッケージ追加と設定 [#i1de06fb]
CUDAのインストールには直接関係はありませんが、作業をしや...
ntpdとopensshをインストールします。 ~
~
ntpdをインストールします。~
# yum install ntp
ntpサーバを追加します。 ~
# vi /etc/ntp/step-tickers
# List of servers used for initial synchronization.
ntp.nict.jp
ntp.jst.mfeed.ad.jp
ntp.ring.gr.jp
ntpdを起動します。~
# /etc/init.d/ntpd start
ntpdをサービスに追加します。 ~
# chkconfig --level 3 ntpd on
# chkconfig --level 5 ntpd on
opensshをインストールします。~
既にインストールされている場合はこの手順はとばしてくださ...
# yum install openssh
/etc/ssh/sshd_config内のPermitRootLoginと~
PermitEmptyPasswordsをnoに設定します。~
# vi /etc/ssh/sshd_config
... <略>
# Authentication:
#LoginGraceTime 2m
PermitRootLogin no
#StrictModes yes
#MaxAuthTries 6
#MaxSessions 10
... <略>
# To disable tunneled clear text passwords, change to ...
#PasswordAuthentication yes
PermitEmptyPasswords no
PasswordAuthentication yes
...
sshdを起動します。 ~
# /etc/init.d/sshd start
sshdをサービスに追加します。
# chkconfig --level 5 sshd on
# chkconfig --level 3 sshd on
* Tesla K20cドライバインストール [#n811fcbc]
Tesla K20cドライバインストールについて記載します。~
** Tesla K20cドライバインストール準備 [#k7d204e8]
Tesla K20cドライバインストールのためにパッケージの追加、...
開発用パッケージ、ライブラリ群(Development tools)をインス...
# yum groupinstall 'Development tools'
Tesla K20cのドライバ、CUDA5のインストール時にXが起動して...
エラーが起こるため、runlevel 3に変更し再起動を行います。 ~
# vi /etc/inittab
...<略>
# Default runlevel. The runlevels used are:
# 0 - halt (Do NOT set initdefault to this)
# 1 - Single user mode
# 2 - Multiuser, without NFS (The same as 3, if you ...
# 3 - Full multiuser mode
# 4 - unused
# 5 - X11
# 6 - reboot (Do NOT set initdefault to this)
#
id:3:initdefault:
# reboot
** Tesla K20cドライバのダウンロードとインストール [#w3abd...
再起動後、以下のURLよりNVIDIA-Linux-x86_64-319.23.runをダ...
http://www.nvidia.co.jp/object/linux-display-amd64-319.23...
~
NVIDIA-Linux-x86_64-319.23.runを実行し、ライセンスに同意...
インストール完了後/proc/driver/nvidia/にversionファイルが...
# chmod +x NVIDIA-Linux-x86_64-319.23.run
# ./NVIDIA-Linux-x86_64-319.23.run
# cat /proc/driver/nvidia/version
NVRM version: NVIDIA UNIX x86_64 Kernel Module 304.54 ...
GCC version: gcc version 4.4.7 20120313 (Red Hat 4.4.7-...
注1: kernelをupdateし再起動後は、再度ドライバをビルドする...
これは再起動後nvidia driverが読み込まれず、下記のCUDA5 Sa...
参考までに更新後のkernel versionと /proc/driver/nvidia/ve...
# uname -a
Linux tesla.beatcraft.com 2.6.32-358.18.1.el6.x86_64 #1 ...
# cat /proc/driver/nvidia/version
NVRM version: NVIDIA UNIX x86_64 Kernel Module 319.23 ...
GCC version: gcc version 4.4.7 20120313 (Red Hat 4.4.7-...
以下のURLに記載のあるように起動時ドライバを読み込むための...
runlevel3,5の起動時に実行するよう設定します。~
http://docs.nvidia.com/cuda/cuda-getting-started-guide-fo...
# vi /etc/init.d/nvidia
#!/bin/bash
/sbin/modprobe nvidia
if [ "$?" -eq 0 ]; then
# Count the number of NVIDIA controllers found.
NVDEVS=`lspci | grep -i NVIDIA`
N3D=`echo "$NVDEVS" | grep "3D controller" | wc -l`
NVGA=`echo "$NVDEVS" | grep "VGA compatible controlle...
N=`expr $N3D + $NVGA - 1`
for i in `seq 0 $N`; do
mknod -m 666 /dev/nvidia$i c 195 $i
done
mknod -m 666 /dev/nvidiactl c 195 255
else
exit 1
fi
# cd /etc/rc5.d/
# ln -s S99nvidia ../init.d/nvidia
# cd /etc/rc3.d/
# ln -s S99nvidia ../init.d/nvidia
* CUDA5のインストールとSampleの実行 [#gbfa8ff5]
CUDA5のインストールとCUDA5のSamplesについて記載します。~
** CUDA5のダウンロード [#ge140c64]
CentOS6 64bit版CUDA(cuda_5.0.35_linux_64_rhel6.x-1.run)を...
ダウンロードします。~
https://developer.nvidia.com/cuda-downloads ~
~
CUDA5のSampleインストール時にPATHが見つからずSampleがイン...
.bashrcに予めPATHを追加します。 ~
$ cd /home/beat
$ vi .bashrc
# .bashrc
# Source global definitions
if [ -f /etc/bashrc ]; then
. /etc/bashrc
fi
# User specific aliases and functions
export PATH=/usr/local/cuda-5.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-5.0/lib64:/usr/...
# source .bashrc
** パッケージのインストール [#md50346c]
Samplesのビルドで必要な以下のパッケージを予めインストール...
# yum install freeglut-devel.x86_64 libXi-devel.x86_64 m...
cuda_5.0.35_linux_64_rhel6.x-1.run を実行します。~
インストール先ディレクトリはデフォルトの/usr/local/cuda-5...
# chmod +x cuda_5.0.35_linux_64_rhel6.x-1.run
# ./cuda_5.0.35_linux_64_rhel6.x-1.run
Samplesはデフォルトで/usr/local/cuda-5.0/samplesと/root/N...
インストールされます。~
~
rootユーザでビルドできるようにld.so.conf.d/cuda.confを追...
# cat /etc/ld.so.conf.d/cuda.conf
/usr/local/cuda-5.0/lib
/usr/local/cuda-5.0/lib64
# ldconfig
** CUDA5 Samplesのビルドと実行 [#v02860fe]
NVIDIA_CUDA-5.0_Samplesをbeatユーザでビルド、実行できるよ...
/root/NVIDIA_CUDA-5.0_Samplesからコピーし、オーナーをbeat...
# cp -afr /root/NVIDIA_CUDA-5.0_Samples /home/beat/.
# cd /home/beat
# chown -R beat.beat NVIDIA_CUDA-5.0_Samples
$ cd ~/NVIDIA_CUDA-5.0_Samples
$ make
ビルド完了後 NVIDIA_CUDA-5.0_Samples/bin/linux/release/に...
NVIDIA CUDA Getting Started Guide for Linuxのページ内Runn...
記載されているdeviceQuery、bandwidthTestを実行します。 ~
deviceQuery、bandwidthTest共にTesla K20cを用いていること...
~
http://docs.nvidia.com/cuda/cuda-getting-started-guide-fo...
$ cd ~/NVIDIA_CUDA-5.0_Samples/bin/linux/release/
$ ./deviceQuery
./deviceQuery Starting...
CUDA Device Query (Runtime API) version (CUDART stati...
Detected 1 CUDA Capable device(s)
Device 0: "Tesla K20c"
CUDA Driver Version / Runtime Version 5.0 /...
CUDA Capability Major/Minor version number: 3.5
Total amount of global memory: 4800 ...
(13) Multiprocessors x (192) CUDA Cores/MP: 2496 ...
GPU Clock rate: 706 M...
Memory Clock rate: 2600 ...
Memory Bus Width: 320-bit
L2 Cache Size: 13107...
Max Texture Dimension Size (x,y,z) 1D=(6...
Max Layered Texture Size (dim) x layers 1D=(1...
Total amount of constant memory: 65536...
Total amount of shared memory per block: 49152...
Total number of registers available per block: 65536
Warp size: 32
Maximum number of threads per multiprocessor: 2048
Maximum number of threads per block: 1024
Maximum sizes of each dimension of a block: 1024 ...
Maximum sizes of each dimension of a grid: 21474...
Maximum memory pitch: 21474...
Texture alignment: 512 b...
Concurrent copy and kernel execution: Yes w...
Run time limit on kernels: No
Integrated GPU sharing Host Memory: No
Support host page-locked memory mapping: Yes
Alignment requirement for Surfaces: Yes
Device has ECC support: Enabled
Device supports Unified Addressing (UVA): Yes
Device PCI Bus ID / PCI location ID: 1 / 0
Compute Mode:
< Default (multiple host threads can use ::cudaSet...
deviceQuery, CUDA Driver = CUDART, CUDA Driver Version...
$ ./bandwidthTest
[CUDA Bandwidth Test] - Starting...
Running on...
Device 0: Tesla K20c
Quick Mode
Host to Device Bandwidth, 1 Device(s)
PINNED Memory Transfers
Transfer Size (Bytes) Bandwidth(MB/s)
33554432 6431.7
Device to Host Bandwidth, 1 Device(s)
PINNED Memory Transfers
Transfer Size (Bytes) Bandwidth(MB/s)
33554432 6396.1
Device to Device Bandwidth, 1 Device(s)
PINNED Memory Transfers
Transfer Size (Bytes) Bandwidth(MB/s)
33554432 143752.5
deviceQuery、bandwidthTest同様上記手順でビルド済みCUDA Sa...
simpleMultiCopyとcdpAdvancedQuicksortの実行結果を記載しま...
CUDA Samplesについては以下のURLを参照してください。~
http://docs.nvidia.com/cuda/cuda-samples/index.html ~
~
simpleMultiCopyはデバイスとホストシステム間のデータコピー...
実行時間を測定するCUDA Sampleです。 ~
cdpAdvancedQuicksortはCUDAのDynamic Parallelismを使用した...
またcdpAdvancedQuicksortはCapability 3.5以上のデバイスが...
~
CUDA Dynamic Parallelismについては以下のURLを参照してくだ...
http://www.nvidia.co.jp/object/how-tesla-k20-speeds-up-qu...
$ ./simpleMultiCopy
[simpleMultiCopy] - Starting...
> Using CUDA device [0]: Tesla K20c
[Tesla K20c] has 13 MP(s) x 192 (Cores/MP) = 2496 (Cores)
> Device name: Tesla K20c
> CUDA Capability 3.5 hardware with 13 multi-processors
> scale_factor = 1.00
> array_size = 4194304
Relevant properties of this CUDA device
(X) Can overlap one CPU<>GPU data transfer with GPU kern...
(X) Can overlap two CPU<>GPU data transfers with GPU ker...
(Compute Capability >= 2.0 AND (Tesla product OR Qua...
Measured timings (throughput):
Memcpy host to device : 2.510752 ms (6.682148 GB/s)
Memcpy device to host : 2.506624 ms (6.693152 GB/s)
Kernel : 0.502624 ms (333.792593 GB/s)
Theoretical limits for speedup gained from overlapped da...
No overlap at all (transfer-kernel-transfer): 5.520000 ms
Compute can overlap with one transfer: 5.017376 ms
Compute can overlap with both data transfers: 2.510752 ms
Average measured timings over 10 repetitions:
Avg. time when execution fully serialized : 5.54492...
Avg. time when overlapped using 4 streams : 2.97143...
Avg. speedup gained (serialized - overlapped) : 2.57349...
Measured throughput:
Fully serialized execution : 6.051377 GB/s
Overlapped using 4 streams : 11.292350 GB/s
$ ./cdpAdvancedQuicksort
Running on GPU 0 (Tesla K20c)
Running qsort on 5000 elements with seed 100, on Tesla K...
cdp_quicksort PASSED
Sorted 5000 elems in 0.988 ms (5.062 Melems/sec)
** 設定完了後のHDD使用容量 [#c97ef8c4]
設定完了後のHDDの使用容量は以下のとおりです。~
# df -h
Filesystem Size Used Avail Use% マウント位置
/dev/mapper/vg_beattesla-lv_root
50G 4.3G 45G 9% /
tmpfs 16G 0 16G 0% /dev/shm
/dev/sda1 485M 66M 394M 15% /boot
/dev/mapper/vg_beattesla-lv_home
852G 1.4G 808G 1% /home
* 更新履歴 [#cbed8220]
2013/05/31 初稿掲載 ~
2013/06/01 文言修正 ~
2013/06/07 [[CUDA5 Samplesのビルドと実行>http://labs.beat...
2013/09/26 項目タイトル「Tesla K20cドライバのダウンロード...
終了行:
[[labs.beatcraft.com]] ~
[[CUDA]] ~
#contents
* CUDA5/CentOS6.4 [#uc1c5ea8]
Tesla K20cを搭載したCentOS 6.4(64bit版)PCへCUDA5をインス...
~
#ref(CUDA_Tesla.jpg,,60%) ~
~
* Hardware Spec [#de8b31c5]
主なHardware Specは以下のとおりです。~
- CPU: Core i7 3770(3.4GHz,4core/8thread)
- Memory: 32GB(DDR3-12800 8GBx4)
- HDD: 1TB(SATA,7200rpm)
- GPU: ETSK20-5GER(nvidia Tesla K20c) ~
~
#ref(CUDA_PC.jpg,,60%) ~
~
ETSK20-5GERにはディスプレイ出力端子(D-SUB,DVI,HDMIなど)が...
UEFIの設定でPrimary DisplayをOn Boardに設定し、ディスプレ...
出力端子に接続しています。 ~
* CentOS 6.4(64bit版) のインストール [#z1f9e64b]
以下のような設定でCentOS 6.4(64bit版)インストールをしてい...
- 言語、キーボード: 日本語
- HDD パーティション: 全領域使用、デフォルト設定
- ネットワーク: DHCP
- パッケージ: Desktop
本稿では個別のパッケージのカスタマイズ設定は行っていませ...
またFirewall、SELinuxは共にDisableに設定しています。~
* CentOS インストール後設定 [#db8c96a0]
CentOS 6.4(64bit版)インストール後の設定について記載します...
** CentOSのアップデート [#sf692f14]
インストール直後のKernelバージョンは以下のとおりです。~
$ uname -a
Linux localhost.localdomain 2.6.32-358.el6.x86_64 #1 SMP...
yum コマンドでアップデートを実行します。 ~
# yum update
アップデート完了後再起動を実行しアップデートしたKernelで...
# reboot
再起動後のKernelバージョンは以下のとおりです。~
$ uname -a
Linux localhost.localdomain 2.6.32-358.6.2.el6.x86_64 #1...
beatユーザを作成し、sudoにbeatユーザを追加します。~
# useradd beat
# passwd beat
# /usr/sbin/visudo
...<略>
## user MACHINE=COMMANDS
##
## The COMMANDS section may have other options added to...
##
## Allow root to run any commands anywhere
root ALL=(ALL) ALL
beat ALL=(ALL) ALL
** パッケージ追加と設定 [#i1de06fb]
CUDAのインストールには直接関係はありませんが、作業をしや...
ntpdとopensshをインストールします。 ~
~
ntpdをインストールします。~
# yum install ntp
ntpサーバを追加します。 ~
# vi /etc/ntp/step-tickers
# List of servers used for initial synchronization.
ntp.nict.jp
ntp.jst.mfeed.ad.jp
ntp.ring.gr.jp
ntpdを起動します。~
# /etc/init.d/ntpd start
ntpdをサービスに追加します。 ~
# chkconfig --level 3 ntpd on
# chkconfig --level 5 ntpd on
opensshをインストールします。~
既にインストールされている場合はこの手順はとばしてくださ...
# yum install openssh
/etc/ssh/sshd_config内のPermitRootLoginと~
PermitEmptyPasswordsをnoに設定します。~
# vi /etc/ssh/sshd_config
... <略>
# Authentication:
#LoginGraceTime 2m
PermitRootLogin no
#StrictModes yes
#MaxAuthTries 6
#MaxSessions 10
... <略>
# To disable tunneled clear text passwords, change to ...
#PasswordAuthentication yes
PermitEmptyPasswords no
PasswordAuthentication yes
...
sshdを起動します。 ~
# /etc/init.d/sshd start
sshdをサービスに追加します。
# chkconfig --level 5 sshd on
# chkconfig --level 3 sshd on
* Tesla K20cドライバインストール [#n811fcbc]
Tesla K20cドライバインストールについて記載します。~
** Tesla K20cドライバインストール準備 [#k7d204e8]
Tesla K20cドライバインストールのためにパッケージの追加、...
開発用パッケージ、ライブラリ群(Development tools)をインス...
# yum groupinstall 'Development tools'
Tesla K20cのドライバ、CUDA5のインストール時にXが起動して...
エラーが起こるため、runlevel 3に変更し再起動を行います。 ~
# vi /etc/inittab
...<略>
# Default runlevel. The runlevels used are:
# 0 - halt (Do NOT set initdefault to this)
# 1 - Single user mode
# 2 - Multiuser, without NFS (The same as 3, if you ...
# 3 - Full multiuser mode
# 4 - unused
# 5 - X11
# 6 - reboot (Do NOT set initdefault to this)
#
id:3:initdefault:
# reboot
** Tesla K20cドライバのダウンロードとインストール [#w3abd...
再起動後、以下のURLよりNVIDIA-Linux-x86_64-319.23.runをダ...
http://www.nvidia.co.jp/object/linux-display-amd64-319.23...
~
NVIDIA-Linux-x86_64-319.23.runを実行し、ライセンスに同意...
インストール完了後/proc/driver/nvidia/にversionファイルが...
# chmod +x NVIDIA-Linux-x86_64-319.23.run
# ./NVIDIA-Linux-x86_64-319.23.run
# cat /proc/driver/nvidia/version
NVRM version: NVIDIA UNIX x86_64 Kernel Module 304.54 ...
GCC version: gcc version 4.4.7 20120313 (Red Hat 4.4.7-...
注1: kernelをupdateし再起動後は、再度ドライバをビルドする...
これは再起動後nvidia driverが読み込まれず、下記のCUDA5 Sa...
参考までに更新後のkernel versionと /proc/driver/nvidia/ve...
# uname -a
Linux tesla.beatcraft.com 2.6.32-358.18.1.el6.x86_64 #1 ...
# cat /proc/driver/nvidia/version
NVRM version: NVIDIA UNIX x86_64 Kernel Module 319.23 ...
GCC version: gcc version 4.4.7 20120313 (Red Hat 4.4.7-...
以下のURLに記載のあるように起動時ドライバを読み込むための...
runlevel3,5の起動時に実行するよう設定します。~
http://docs.nvidia.com/cuda/cuda-getting-started-guide-fo...
# vi /etc/init.d/nvidia
#!/bin/bash
/sbin/modprobe nvidia
if [ "$?" -eq 0 ]; then
# Count the number of NVIDIA controllers found.
NVDEVS=`lspci | grep -i NVIDIA`
N3D=`echo "$NVDEVS" | grep "3D controller" | wc -l`
NVGA=`echo "$NVDEVS" | grep "VGA compatible controlle...
N=`expr $N3D + $NVGA - 1`
for i in `seq 0 $N`; do
mknod -m 666 /dev/nvidia$i c 195 $i
done
mknod -m 666 /dev/nvidiactl c 195 255
else
exit 1
fi
# cd /etc/rc5.d/
# ln -s S99nvidia ../init.d/nvidia
# cd /etc/rc3.d/
# ln -s S99nvidia ../init.d/nvidia
* CUDA5のインストールとSampleの実行 [#gbfa8ff5]
CUDA5のインストールとCUDA5のSamplesについて記載します。~
** CUDA5のダウンロード [#ge140c64]
CentOS6 64bit版CUDA(cuda_5.0.35_linux_64_rhel6.x-1.run)を...
ダウンロードします。~
https://developer.nvidia.com/cuda-downloads ~
~
CUDA5のSampleインストール時にPATHが見つからずSampleがイン...
.bashrcに予めPATHを追加します。 ~
$ cd /home/beat
$ vi .bashrc
# .bashrc
# Source global definitions
if [ -f /etc/bashrc ]; then
. /etc/bashrc
fi
# User specific aliases and functions
export PATH=/usr/local/cuda-5.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-5.0/lib64:/usr/...
# source .bashrc
** パッケージのインストール [#md50346c]
Samplesのビルドで必要な以下のパッケージを予めインストール...
# yum install freeglut-devel.x86_64 libXi-devel.x86_64 m...
cuda_5.0.35_linux_64_rhel6.x-1.run を実行します。~
インストール先ディレクトリはデフォルトの/usr/local/cuda-5...
# chmod +x cuda_5.0.35_linux_64_rhel6.x-1.run
# ./cuda_5.0.35_linux_64_rhel6.x-1.run
Samplesはデフォルトで/usr/local/cuda-5.0/samplesと/root/N...
インストールされます。~
~
rootユーザでビルドできるようにld.so.conf.d/cuda.confを追...
# cat /etc/ld.so.conf.d/cuda.conf
/usr/local/cuda-5.0/lib
/usr/local/cuda-5.0/lib64
# ldconfig
** CUDA5 Samplesのビルドと実行 [#v02860fe]
NVIDIA_CUDA-5.0_Samplesをbeatユーザでビルド、実行できるよ...
/root/NVIDIA_CUDA-5.0_Samplesからコピーし、オーナーをbeat...
# cp -afr /root/NVIDIA_CUDA-5.0_Samples /home/beat/.
# cd /home/beat
# chown -R beat.beat NVIDIA_CUDA-5.0_Samples
$ cd ~/NVIDIA_CUDA-5.0_Samples
$ make
ビルド完了後 NVIDIA_CUDA-5.0_Samples/bin/linux/release/に...
NVIDIA CUDA Getting Started Guide for Linuxのページ内Runn...
記載されているdeviceQuery、bandwidthTestを実行します。 ~
deviceQuery、bandwidthTest共にTesla K20cを用いていること...
~
http://docs.nvidia.com/cuda/cuda-getting-started-guide-fo...
$ cd ~/NVIDIA_CUDA-5.0_Samples/bin/linux/release/
$ ./deviceQuery
./deviceQuery Starting...
CUDA Device Query (Runtime API) version (CUDART stati...
Detected 1 CUDA Capable device(s)
Device 0: "Tesla K20c"
CUDA Driver Version / Runtime Version 5.0 /...
CUDA Capability Major/Minor version number: 3.5
Total amount of global memory: 4800 ...
(13) Multiprocessors x (192) CUDA Cores/MP: 2496 ...
GPU Clock rate: 706 M...
Memory Clock rate: 2600 ...
Memory Bus Width: 320-bit
L2 Cache Size: 13107...
Max Texture Dimension Size (x,y,z) 1D=(6...
Max Layered Texture Size (dim) x layers 1D=(1...
Total amount of constant memory: 65536...
Total amount of shared memory per block: 49152...
Total number of registers available per block: 65536
Warp size: 32
Maximum number of threads per multiprocessor: 2048
Maximum number of threads per block: 1024
Maximum sizes of each dimension of a block: 1024 ...
Maximum sizes of each dimension of a grid: 21474...
Maximum memory pitch: 21474...
Texture alignment: 512 b...
Concurrent copy and kernel execution: Yes w...
Run time limit on kernels: No
Integrated GPU sharing Host Memory: No
Support host page-locked memory mapping: Yes
Alignment requirement for Surfaces: Yes
Device has ECC support: Enabled
Device supports Unified Addressing (UVA): Yes
Device PCI Bus ID / PCI location ID: 1 / 0
Compute Mode:
< Default (multiple host threads can use ::cudaSet...
deviceQuery, CUDA Driver = CUDART, CUDA Driver Version...
$ ./bandwidthTest
[CUDA Bandwidth Test] - Starting...
Running on...
Device 0: Tesla K20c
Quick Mode
Host to Device Bandwidth, 1 Device(s)
PINNED Memory Transfers
Transfer Size (Bytes) Bandwidth(MB/s)
33554432 6431.7
Device to Host Bandwidth, 1 Device(s)
PINNED Memory Transfers
Transfer Size (Bytes) Bandwidth(MB/s)
33554432 6396.1
Device to Device Bandwidth, 1 Device(s)
PINNED Memory Transfers
Transfer Size (Bytes) Bandwidth(MB/s)
33554432 143752.5
deviceQuery、bandwidthTest同様上記手順でビルド済みCUDA Sa...
simpleMultiCopyとcdpAdvancedQuicksortの実行結果を記載しま...
CUDA Samplesについては以下のURLを参照してください。~
http://docs.nvidia.com/cuda/cuda-samples/index.html ~
~
simpleMultiCopyはデバイスとホストシステム間のデータコピー...
実行時間を測定するCUDA Sampleです。 ~
cdpAdvancedQuicksortはCUDAのDynamic Parallelismを使用した...
またcdpAdvancedQuicksortはCapability 3.5以上のデバイスが...
~
CUDA Dynamic Parallelismについては以下のURLを参照してくだ...
http://www.nvidia.co.jp/object/how-tesla-k20-speeds-up-qu...
$ ./simpleMultiCopy
[simpleMultiCopy] - Starting...
> Using CUDA device [0]: Tesla K20c
[Tesla K20c] has 13 MP(s) x 192 (Cores/MP) = 2496 (Cores)
> Device name: Tesla K20c
> CUDA Capability 3.5 hardware with 13 multi-processors
> scale_factor = 1.00
> array_size = 4194304
Relevant properties of this CUDA device
(X) Can overlap one CPU<>GPU data transfer with GPU kern...
(X) Can overlap two CPU<>GPU data transfers with GPU ker...
(Compute Capability >= 2.0 AND (Tesla product OR Qua...
Measured timings (throughput):
Memcpy host to device : 2.510752 ms (6.682148 GB/s)
Memcpy device to host : 2.506624 ms (6.693152 GB/s)
Kernel : 0.502624 ms (333.792593 GB/s)
Theoretical limits for speedup gained from overlapped da...
No overlap at all (transfer-kernel-transfer): 5.520000 ms
Compute can overlap with one transfer: 5.017376 ms
Compute can overlap with both data transfers: 2.510752 ms
Average measured timings over 10 repetitions:
Avg. time when execution fully serialized : 5.54492...
Avg. time when overlapped using 4 streams : 2.97143...
Avg. speedup gained (serialized - overlapped) : 2.57349...
Measured throughput:
Fully serialized execution : 6.051377 GB/s
Overlapped using 4 streams : 11.292350 GB/s
$ ./cdpAdvancedQuicksort
Running on GPU 0 (Tesla K20c)
Running qsort on 5000 elements with seed 100, on Tesla K...
cdp_quicksort PASSED
Sorted 5000 elems in 0.988 ms (5.062 Melems/sec)
** 設定完了後のHDD使用容量 [#c97ef8c4]
設定完了後のHDDの使用容量は以下のとおりです。~
# df -h
Filesystem Size Used Avail Use% マウント位置
/dev/mapper/vg_beattesla-lv_root
50G 4.3G 45G 9% /
tmpfs 16G 0 16G 0% /dev/shm
/dev/sda1 485M 66M 394M 15% /boot
/dev/mapper/vg_beattesla-lv_home
852G 1.4G 808G 1% /home
* 更新履歴 [#cbed8220]
2013/05/31 初稿掲載 ~
2013/06/01 文言修正 ~
2013/06/07 [[CUDA5 Samplesのビルドと実行>http://labs.beat...
2013/09/26 項目タイトル「Tesla K20cドライバのダウンロード...
ページ名:
BC::labsへの質問は、bc9-dev @ googlegroups.com までお願い致します。