Linux Ubuntu 機械学習

機械学習用サーバーのセットアップ備忘録

投稿日:

主として機械学習用を目的としたサーバーをセットアップした際の備忘録。

 

構成

主として開発機, 利用実機, およびその予備機の3台。
微妙に構成が異なるところもあるが構成は以下の通り。

  • OS: Ubuntu Server 20.04
  • CPU: AMD EPYC 7742 (64C128T) xN
  • Memory: 64GB x8 xN
  • GPU: NVIDIA A100 (HGX NVLink x4, PCIe)
  • N/W: 10GbE x2
  • Xilinx Alveo U50LV
  • Storage:
    • Samsung Pro 980 NVMe/PCIe SSD 1TB xN
    • WD-Red SA500 SATA SSD 4TB xN
    • NFS など

 

基本

 

ネットワーク

/etc/netplan/*.yaml
$ sudo netplan apply

 

NTP, タイムゾーン

/etc/systemd/timesyncd.conf
NTP=ntp.nict.jp
$ sudo systemctl restart systemd-timesyncd.service

$ timedatectl set-timezone Asia/Tokyo

 

apt

思いついたものを適当に。
$ sudo apt install emacs nfs-common cmake build-essential autofs gkrellm gkrelltop gkrellm-cpufreq
$ sudo apt install screen clang libhiredis-dev redis-server gv mosh net-tools source-highlight

 

~/.bashrc

less で強調表示(highlight)

  • LESS='-RN'
  • LESSOPEN='| /usr/share/source-highlight/src-hilite-lesspipe.sh %s'

 

ホスト名変更

  • /etc/hostname
  • /etc/hosts

 

アプリケーション

  • SmartGit
  • Visual Studio Code
    別途 Remote-SSH 拡張機能で接続しておく

 

その他

/etc/fstab

tmpfs, relatime など

 

~/.screenrc

 

proxy の使用 (必要に応じて)

 

NVIDIA driver

DKMS を活用する。

 

機械学習関連でガッツリGPUに負荷を掛けるとほぼ固まる問題対応

 

ZFS

 

ROOT

 

Nginx

後続の JupyterHub や Docker駆動の各種Webサービスへ、
サブディレクトリからアクセスさせるための reverse-proxy として動作させる。

 

Python/Conda

python/conda 環境は conda-forge で問題なさそうなので、Miniforge (link)を用いる。
Python v3.8系列の最終版をインストールした。
(PyROOT が v3.8系を参照するようにビルドしたため)

 

JupyterHub/Lab

JupyterHub/Lab のセットアップ

 

(Rootless-) Docker

Rootless Docker のインストール

 

GitLab の移設

[オンプレ] GitLab を移設, アップデートする [Docker]

 

PukiWiki

Pukiwiki を Docker で構築、移設する

 

Portainer

Portainer CE を Docker で構築する

 

RedisInsight

RedisInsight を Docker で構築する

 

phpVirtualBox

VirtualBox をブラウザから全て制御できるようにする → TBU

 

NVIDIA driver persistence

NVIDIA GPU の初期化が遅い問題の解決法

 

Xilinx Alveo U50LV

Xilinx Alveo U50LV のセットアップ

 

その他

スレッド数制限

XXX: OPENBLAS, OMP, MKL

 

Google Adsense

Google Adsense

-Linux, Ubuntu, 機械学習
-, ,

Copyright© HEPtech, 2024 All Rights Reserved.