ubuntu22 LTS の計算機クライアント設定(SSH,NFS,NIS,NVIDIA)
GPU計算機クライアント ubuntu22、 install後の設定
0.ネットワークにつながっていない状態でインストールしたから、ネットワークの設定をして色々アップデート。
一応、図のような構成を想定しています。計算機クライアントが1台ならNISなんて面倒くさいだけですが、実際は7~8台あるので、calc1~calc8とかにして設定してます。
1.rootのパスワード設定
$ sudo passwd root
で、「現在のユーザのパスワード」聞かれて、次に「rootの新しいパスワード」きめて、もう一度「rootの新しいパスワード」を打つ。
$ su
で、rootになる。以下はrootで設定する。
2.sshのインストール
基本、計算機なのでキーボードもマウスもディスプレイも、インストール時しか接続しないため、外部接続必須です。
# apt install ssh
必要なファイルを勝手にインストールしてくれた。
serverから接続しようとすると、すでに接続したことがあるホストを再インストールしているので、文句言われた。
$ ssh hoge@192.168.1.2 ←例です。ユーザhoge、ホスト192.168.1.2にsshでアクセスするときのコマンド
@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@
@ WARNING: REMOTE HOST IDENTIFICATION HAS CHANGED! @
@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@
IT IS POSSIBLE THAT SOMEONE IS DOING SOMETHING NASTY!
Someone could be eavesdropping on you right now (man-in-the-middle attack)!
It is also possible that a host key has just been changed.
The fingerprint for the ECDSA key sent by the remote host is
SHA256:********何か書いてあったけど、何の情報か知らないので一応消してます**********
Please contact your system administrator.
Add correct host key in /home/hoge/.ssh/known_hosts to get rid of this message.
Offending ECDSA key in /home/hoge/.ssh/known_hosts:8
remove with:
ssh-keygen -f "/home/hoge/.ssh/known_hosts" -R "192.168.1.2"
Host key for 192.168.1.2 has changed and you have requested strict checking.
Host key verification failed.
何をすればよいか教えてくれているので、その通りに
$ ssh-keygen -f "/home/hoge/.ssh/known_hosts" -R "192.168.1.2"
としてから、再度
$ ssh hoge@192.168.1.2
として、yesタイプしてパスワード打って普通にログインできました。
3.emacsのインストール
viとか良く分らんので、重いけどemacs使ってます。いろいろ便利なので、手放せない。
# apt install emacs
必要なファイルを勝手にインストールしてくれた。
4./etc/hostsの記述(serverの名前解決のため)
/etc/hostsを編集
127.0.0.1 localhost
192.168.1.1 server.testlab.net server
192.168.1.2 calc.testlab.net calc
これを書いておけば、sshも
$ ssh hoge@calc
でよい。
5.NFSクライアントの設定
# apt -y install nfs-common
- /etc/idmapd.confを編集
クライアントだからドメイン決まってるはずなので、
Domain = testlab.net - マウントポイントを作成
# mkdir /home1
# mkdir /home2
# mkdir /opt - /etc/fstabに追加(serverの名前解決が必要です。IPアドレスでもOK)
server:/home1 /home1 nfs auto 0 0
server:/home2 /home2 nfs auto 0 0
server:/opt /opt nfs auto 0 0
6.NISクライアントの設定
# apt -y install nis
- /etc/yp.confを編集
最終行に
domain testlab.net server server.testlab.net
を追加 - /etc/nsswitch.confを編集
passwd: files systemd nis
group: files systemd nis
shadow: files systemd nis
hosts: files mdns4_minimal [NOTFOUND=return] dns nis - /etc/defaultdomainファイルを以下の内容で作成
testlab.net - サービスの起動、システム起動時に開始の設定
# systemctl restart rpcbind nscd ypbind
# systemctl enable rpcbind nscd ypbind
7.NVIDIAドライバーのインストール
7-1.付いているGPUの確認
# lspci | grep -i nvidia
02:00.0 VGA compatible controller: NVIDIA Corporation TU102 [GeForce RTX 2080 Ti] (rev a1)
02:00.1 Audio device: NVIDIA Corporation TU102 High Definition Audio Controller (rev a1)
02:00.2 USB controller: NVIDIA Corporation TU102 USB 3.1 Host Controller (rev a1)
02:00.3 Serial bus controller: NVIDIA Corporation TU102 USB Type-C UCSI Controller (rev a1)
GeForce RTX 2080 Ti が付いてます。
7-2.Nouveauの無効化
まず、動いているか確認
# lsmod | grep nouveau
nouveau 2367488 0
drm_ttm_helper 16384 1 nouveau
ttm 98304 3 drm_ttm_helper,i915,nouveau
drm_display_helper 184320 2 i915,nouveau
drm_kms_helper 200704 3 drm_display_helper,i915,nouveau
i2c_algo_bit 16384 2 i915,nouveau
mxm_wmi 16384 1 nouveau
drm 581632 11 drm_kms_helper,drm_display_helper,drm_buddy,drm_ttm_helper,i915,ttm,nouveau
wmi 32768 5 asus_wmi,wmi_bmof,mfd_aaeon,mxm_wmi,nouveau
video 65536 3 asus_wmi,i915,nouveau
ちゃんと動いてます。
- /etc/modprobe.d/blacklist-nouveau.confファイルを、以下の内容で作成
blacklist nouveau
options nouveau modeset=0
これで、カネールモジュールがロードしないようになるそうです。
- initramfsイメージの更新
# update-initramfs -u - 再起動
# reboot
7-3.NVIDIAドライバーのインストール
- ドライバーの検出
# ubuntu-drivers devices
== /sys/devices/pci0000:00/0000:00:1b.4/0000:02:00.0 ==
modalias : pci:v000010DEd00001E04sv00001043sd00008675bc03sc00i00
vendor : NVIDIA Corporation
model : TU102 [GeForce RTX 2080 Ti]
driver : nvidia-driver-470-server - distro non-free
driver : nvidia-driver-525-open - distro non-free recommended
driver : nvidia-driver-470 - distro non-free
driver : nvidia-driver-510 - distro non-free
driver : nvidia-driver-450-server - distro non-free
driver : nvidia-driver-525 - distro non-free
driver : nvidia-driver-515 - distro non-free
driver : nvidia-driver-515-server - distro non-free
driver : nvidia-driver-525-server - distro non-free
driver : nvidia-driver-515-open - distro non-free
driver : nvidia-driver-418-server - distro non-free
driver : xserver-xorg-video-nouveau - distro free builtin
ここで、nvidia-driver-525-openがrecommendedされていますが、**-openはだめらしいです。普通にnvidia-driver-525をインストールします。
- ドライバーのインストール
# apt install nvidia-driver-525
かなりのファイルをダウンロードするので、回線によってはかなり時間かかるかも。 - 再起動
# reboot - 確認
# nvidia-smi
+--------------------------------------------------------------------------------------+
| NVIDIA-SMI 525.89.02 Driver Version: 525.89.02 CUDA Version: 12.0 |
|------------------------------------+----------------------+--------------------------+
| GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|=====================+==============+===============|
| 0 NVIDIA GeForce ... Off | 00000000:02:00.0 Off | N/A |
| 27% 28C P8 1W / 250W | 6MiB / 11264MiB | 0% Default |
| | | N/A |
+-----------------------------------+------------------------+------------------------+
+---------------------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=====================================================|
| 0 N/A N/A 1172 G /usr/lib/xorg/Xorg 4MiB |
+---------------------------------------------------------------------------------------+
認識されてました。完了です。