Taniwiki

TORQUEをダウンロード

★マスターノードの設定★
%wget http://www.clusterresources.com/downloads/torque/torque-2.5.5.tar.gz

  • ダウンロードした物を解凍する。
    %tar zxvf torque-2.5.5.tar.gz

%./configure --prefix=/usr/local/torque --with-default-server=mass00.~ --with-server-home=/var/spool/torque
注)--with-rcpオプションをつけるとrcpを使用するようになる(defaultではscpを使用)。

makeの準備ができたので
%make && make install

/etc/services に追記する(rorqueの使用するport)。

pbs             15001/tcp               # pbs server (pbs_server)
pbs_mom         15002/tcp               # mom to/from server
pbs_resmom      15003/tcp               # mom resource management requests
pbs_resmom      15003/udp               # mom resource management requests
pbs_sched       15004/tcp               # scheduler


torqueのデータベースを初期化する

/usr/local/torque/sbin/pbs_server -t create~


/var/spool/torque/server_priv/nodes

cls001.cs.ie.u-ryukyu.ac.jp np=2
cls002.cs.ie.u-ryukyu.ac.jp np=2
cls003.cs.ie.u-ryukyu.ac.jp np=2
cls004.cs.ie.u-ryukyu.ac.jp np=2
cls005.cs.ie.u-ryukyu.ac.jp np=2

の様に設定する。

/var/spool/torque/sched_priv/sched_configを次のように設定し直した

load_balancing: false ALL
↓変更
load_balancing: true ALL

sort_by: shortest_job_first ALL 
↓変更
sort_by: no_sort ALL



★ 計算ノードの設定★

cd torque-2.5.5
./configure --prefix=/usr/local/torque --with-server-home=/var/spool/torque
make
make install_mom install_clients



/usr/local/torqueと
/var/spool/torque中に設定ファイルなどがある

/var/spool/torque/mom_priv/configを

$logevent 0x1fff
$max_load 1.2
$ideal_load 1.0
$pbsserver マスターの名前
$restricted マスターの名前

のように設定する。 pbs_momを起動。
selinuxがEnforcingになっていると失敗してしまう。

確認

pbsnodes -a

cls001.cs.ie.u-ryukyu.ac.jp
    state = free
    np = 2
    ntype = cluster
    status = opsys=linux,uname=Linux cls001.cs.ie.u-ryukyu.ac.jp 2.6.23.1-42.fc8 #1 SMP Tue Oct 30
13:55:12 EDT 2007 i686,sessions=1392 4317 4279 5422 14032 14053 26888 26779
30846,nsessions=9,nusers=4,idletime=953,totmem=3131028kb,availmem=2961004kb,physmem=10
33884kb,ncpus=2,loadave=0.01,netload=281696549,state=free,jobs=? 0,rectime=1211966490

cls002.cs.ie.u-ryukyu.ac.jp
    state = free
    np = 2
    ntype = cluster
    status = opsys=linux,uname=Linux cls002.cs.ie.u-ryukyu.ac.jp 2.6.23.1-42.fc8 #1 SMP Tue Oct 30
13:55:12 EDT 2007 i686,sessions=13893 18162
30740,nsessions=3,nusers=3,idletime=605475,totmem=3131028kb,availmem=2887080kb,physme
m=1033884kb,ncpus=2,loadave=0.00,netload=3903101879,state=free,jobs=?
0,rectime=1211966502

のようにstateがfreeになっていれば良い。downなどの他の状態になっていたら設定がおかしいので見直し。

zshについて

zshはversionが3.*以上でなければ日本語が文字化けしてしまう。よってinstall方法を書いておく。

wget "http://downloads.sourceforge.net/zsh/zsh-4.3.9.tar.gz?modtime=1225708695&big_mirror=0"
tar zxvf zsh-4.3.9.tar.gz
cd zsh-4.3.9
./configure --enable-multibyte --enable-locale
 make install
 echo /usr/local/bin/zsh >> /etc/shells
 chsh -s /usr/local/bin/zsh


configureで失敗したらerrorを読んで直す。

gccは%yum install gcc gcc-c++ gcc-javaをインストールした。

参考サイト

http://www.clusterresources.com/torquedocs21/2.1jobsubmission.shtml


トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2012-03-10 (土) 18:37:41 (4420d)