ubuntu22 LTS の計算機クライアント設定(SSH,NFS,NIS,NVIDIA)

GPU計算機クライアント ubuntu22、 install後の設定

0.ネットワークにつながっていない状態でインストールしたから、ネットワークの設定をして色々アップデート。

一応、図のような構成を想定しています。計算機クライアントが1台ならNISなんて面倒くさいだけですが、実際は7~8台あるので、calc1~calc8とかにして設定してます。



1.rootのパスワード設定
$ sudo passwd root
で、「現在のユーザのパスワード」聞かれて、次に「rootの新しいパスワード」きめて、もう一度「rootの新しいパスワード」を打つ。
$ su
で、rootになる。以下はrootで設定する。

 

2.sshのインストール
基本、計算機なのでキーボードもマウスもディスプレイも、インストール時しか接続しないため、外部接続必須です。
# apt install ssh
必要なファイルを勝手にインストールしてくれた。

serverから接続しようとすると、すでに接続したことがあるホストを再インストールしているので、文句言われた。
$ ssh hoge@192.168.1.2     ←例です。ユーザhoge、ホスト192.168.1.2にsshでアクセスするときのコマンド

@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@
@    WARNING: REMOTE HOST IDENTIFICATION HAS CHANGED!     @
@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@
IT IS POSSIBLE THAT SOMEONE IS DOING SOMETHING NASTY!
Someone could be eavesdropping on you right now (man-in-the-middle attack)!
It is also possible that a host key has just been changed.
The fingerprint for the ECDSA key sent by the remote host is
SHA256:********何か書いてあったけど、何の情報か知らないので一応消してます**********
Please contact your system administrator.
Add correct host key in /home/hoge/.ssh/known_hosts to get rid of this message.
Offending ECDSA key in /home/hoge/.ssh/known_hosts:8
  remove with:
  ssh-keygen -f "/home/hoge/.ssh/known_hosts" -R "192.168.1.2"
Host key for 192.168.1.2 has changed and you have requested strict checking.
Host key verification failed.

何をすればよいか教えてくれているので、その通りに
$ ssh-keygen -f "/home/hoge/.ssh/known_hosts" -R "192.168.1.2"
としてから、再度
$ ssh hoge@192.168.1.2
として、yesタイプしてパスワード打って普通にログインできました。

 

3.emacsのインストール
viとか良く分らんので、重いけどemacs使ってます。いろいろ便利なので、手放せない。
# apt install emacs
必要なファイルを勝手にインストールしてくれた。

 

4./etc/hostsの記述(serverの名前解決のため)
/etc/hostsを編集
127.0.0.1 localhost
192.168.1.1   server.testlab.net server
192.168.1.2   calc.testlab.net calc

これを書いておけば、ssh
$ ssh hoge@calc
でよい。

 

5.NFSクライアントの設定
# apt -y install nfs-common

  • /etc/idmapd.confを編集
    クライアントだからドメイン決まってるはずなので、
    Domain = testlab.net
  • マウントポイントを作成
    # mkdir /home1
    # mkdir /home2
    # mkdir /opt

  • /etc/fstabに追加(serverの名前解決が必要です。IPアドレスでもOK)
    server:/home1                     /home1          nfs     auto            0       0
    server:/home2                     /home2          nfs     auto            0       0
    server:/opt                        /opt    nfs     auto            0       0

6.NISクライアントの設定
# apt -y install nis

  • /etc/yp.confを編集
    最終行に
    domain testlab.net server server.testlab.net
    を追加

  • /etc/nsswitch.confを編集
    passwd:      files systemd nis
    group:        files systemd nis
    shadow:     files systemd nis
    hosts:         files mdns4_minimal [NOTFOUND=return] dns nis

  • /etc/defaultdomainファイルを以下の内容で作成
    testlab.net

  • サービスの起動、システム起動時に開始の設定
    # systemctl restart rpcbind nscd ypbind
    # systemctl enable rpcbind nscd ypbind


7.NVIDIAドライバーのインストール
7-1.付いているGPUの確認
# lspci | grep -i nvidia
02:00.0 VGA compatible controller: NVIDIA Corporation TU102 [GeForce RTX 2080 Ti] (rev a1)
02:00.1 Audio device: NVIDIA Corporation TU102 High Definition Audio Controller (rev a1)
02:00.2 USB controller: NVIDIA Corporation TU102 USB 3.1 Host Controller (rev a1)
02:00.3 Serial bus controller: NVIDIA Corporation TU102 USB Type-C UCSI Controller (rev a1)

GeForce RTX 2080 Ti が付いてます。

7-2.Nouveauの無効化
まず、動いているか確認
# lsmod | grep nouveau
nouveau                   2367488  0
drm_ttm_helper       16384  1 nouveau
ttm                           98304  3 drm_ttm_helper,i915,nouveau
drm_display_helper  184320  2 i915,nouveau
drm_kms_helper       200704  3 drm_display_helper,i915,nouveau
i2c_algo_bit              16384  2 i915,nouveau
mxm_wmi                 16384  1 nouveau
drm                           581632  11 drm_kms_helper,drm_display_helper,drm_buddy,drm_ttm_helper,i915,ttm,nouveau
wmi                           32768  5 asus_wmi,wmi_bmof,mfd_aaeon,mxm_wmi,nouveau
video                         65536  3 asus_wmi,i915,nouveau

ちゃんと動いてます。

  • /etc/modprobe.d/blacklist-nouveau.confファイルを、以下の内容で作成
    blacklist nouveau
    options nouveau modeset=0

    これで、カネールモジュールがロードしないようになるそうです。

  • initramfsイメージの更新
    # update-initramfs -u

  • 再起動
    # reboot

7-3.NVIDIAドライバーのインストール

  • ドライバーの検出
    # ubuntu-drivers devices
    == /sys/devices/pci0000:00/0000:00:1b.4/0000:02:00.0 ==
    modalias : pci:v000010DEd00001E04sv00001043sd00008675bc03sc00i00
    vendor   : NVIDIA Corporation
    model    : TU102 [GeForce RTX 2080 Ti]
    driver   : nvidia-driver-470-server - distro non-free
    driver   : nvidia-driver-525-open - distro non-free recommended
    driver   : nvidia-driver-470 - distro non-free
    driver   : nvidia-driver-510 - distro non-free
    driver   : nvidia-driver-450-server - distro non-free
    driver   : nvidia-driver-525 - distro non-free
    driver   : nvidia-driver-515 - distro non-free
    driver   : nvidia-driver-515-server - distro non-free
    driver   : nvidia-driver-525-server - distro non-free
    driver   : nvidia-driver-515-open - distro non-free
    driver   : nvidia-driver-418-server - distro non-free
    driver   : xserver-xorg-video-nouveau - distro free builtin

    ここで、nvidia-driver-525-openがrecommendedされていますが、**-openはだめらしいです。普通にnvidia-driver-525をインストールします。

 

  • ドライバーのインストール
    # apt install nvidia-driver-525
    かなりのファイルをダウンロードするので、回線によってはかなり時間かかるかも。

  • 再起動
    # reboot

  • 確認
    # nvidia-smi
    +--------------------------------------------------------------------------------------+
    | NVIDIA-SMI 525.89.02    Driver Version: 525.89.02    CUDA Version: 12.0            |
    |------------------------------------+----------------------+--------------------------+
    | GPU  Name        Persistence-M   | Bus-Id        Disp.A     | Volatile Uncorr. ECC      |
    | Fan  Temp  Perf  Pwr:Usage/Cap  |        Memory-Usage | GPU-Util  Compute M.  |
    |                                                      |                                  |                          MIG M. |
    |=====================+==============+===============|
    |   0  NVIDIA GeForce ...  Off          | 00000000:02:00.0 Off |                               N/A |
    | 27%   28C    P8     1W / 250W     |      6MiB / 11264MiB  |               0%      Default |
    |                                                     |                                    |                               N/A |
    +-----------------------------------+------------------------+------------------------+
    +---------------------------------------------------------------------------------------+
    | Processes:                                                                                                                |
    |  GPU   GI   CI        PID   Type   Process name                                     GPU Memory |
    |        ID   ID                                                                                                  Usage      |
    |=====================================================|
    |    0   N/A  N/A      1172      G   /usr/lib/xorg/Xorg                                            4MiB |
    +---------------------------------------------------------------------------------------+ 

    認識されてました。完了です。