Merge pull request #24 from nixified-ai/rocm-libdrm-patch-torch-bin

PyTorch: patch libdrm path for ROCm
2025-11-09 16:16:23 +01:00 · 2023-04-12 21:34:36 +01:00 · 2023-04-12 21:34:36 +01:00 · 422bf55033
parent 422f8f99be 0bc0ddf92f
commit 422bf55033
8 changed files with 32 additions and 26 deletions
--- a/modules/aipython3/overlays.nix
+++ b/modules/aipython3/overlays.nix
@ -95,6 +95,10 @@ pkgs: {
        url = "https://download.pytorch.org/whl/rocm5.1.1/torch-1.13.1%2Brocm5.1.1-cp310-cp310-linux_x86_64.whl";
        hash = "sha256-qUwAL3L9ODy9hjne8jZQRoG4BxvXXLT7cAy9RbM837A=";
      };
+      postFixup = (old.postFixup or "") + ''
+        ${pkgs.gnused}/bin/sed -i s,/opt/amdgpu/share/libdrm/amdgpu.ids,/tmp/nix-pytorch-rocm___/amdgpu.ids,g $out/${final.python.sitePackages}/torch/lib/libdrm_amdgpu.so
+      '';
+      rocmSupport = true;
    });
    torchvision-bin = prev.torchvision-bin.overrideAttrs (old: {
      src = pkgs.fetchurl {
--- a/projects/invokeai/default.nix
+++ b/projects/invokeai/default.nix
@ -29,7 +29,6 @@
    invokeai-amd = {
      imports = [
        config.flake.nixosModules.invokeai
-        ./nixos/amd.nix
        (packageModule "invokeai-amd")
      ];
    };
--- a/projects/invokeai/nixos/amd.nix
+++ b/projects/invokeai/nixos/amd.nix
@ -1,12 +0,0 @@
-{ pkgs, ... }:
-
-{
-  systemd = {
-    # Allow "unsupported" AMD GPUs
-    services.invokeai.environment.HSA_OVERRIDE_GFX_VERSION = "10.3.0";
-    # HACK: The PyTorch build we use on ROCm wants this to exist
-    tmpfiles.rules = [
-      "L+ /opt/amdgpu - - - - ${pkgs.libdrm}"
-    ];
-  };
-}
--- a/projects/invokeai/nixos/default.nix
+++ b/projects/invokeai/nixos/default.nix
@ -105,6 +105,7 @@ in
        User = cfg.user;
        Group = cfg.group;
        ExecStart = "${getExe cfg.package} ${escapeShellArgs cliArgs}";
+        PrivateTmp = true;
      };
    };
    systemd.tmpfiles.rules = [
--- a/projects/invokeai/package.nix
+++ b/projects/invokeai/package.nix
@ -2,6 +2,8 @@
 # misc
 , lib
 , src
+# extra deps
+, libdrm
 }:

 let
@ -70,6 +72,18 @@ aipython3.buildPythonPackage {
      fi
      '
    ''
+  ] ++ lib.optionals (aipython3.torch.rocmSupport or false) [
+    '' --run '
+      if [ ! -e /tmp/nix-pytorch-rocm___/amdgpu.ids ]
+      then
+          mkdir -p /tmp/nix-pytorch-rocm___
+          ln -s ${libdrm}/share/libdrm/amdgpu.ids /tmp/nix-pytorch-rocm___/amdgpu.ids
+      fi
+      '
+    ''
+    # See note about consumer GPUs:
+    # https://docs.amd.com/bundle/ROCm-Deep-Learning-Guide-v5.4.3/page/Troubleshooting.html
+    " --set-default HSA_OVERRIDE_GFX_VERSION 10.3.0"
  ];
  patchPhase = ''
    runHook prePatch
--- a/projects/koboldai/default.nix
+++ b/projects/koboldai/default.nix
@ -29,7 +29,6 @@
    koboldai-amd = {
      imports = [
        config.flake.nixosModules.koboldai
-        ./nixos/amd.nix
        (packageModule "koboldai-amd")
      ];
    };
--- a/projects/koboldai/nixos/amd.nix
+++ b/projects/koboldai/nixos/amd.nix
@ -1,12 +0,0 @@
-{ pkgs, ... }:
-
-{
-  systemd = {
-    # Allow "unsupported" AMD GPUs
-    services.koboldai.environment.HSA_OVERRIDE_GFX_VERSION = "10.3.0";
-    # HACK: The PyTorch build we use on ROCm wants this to exist
-    tmpfiles.rules = [
-      "L+ /opt/amdgpu - - - - ${pkgs.libdrm}"
-    ];
-  };
-}
--- a/projects/koboldai/package.nix
+++ b/projects/koboldai/package.nix
@ -7,6 +7,7 @@
 , runCommand
 , tmpDir ? "/tmp/nix-koboldai"
 , stateDir ? "$HOME/.koboldai/state"
+, libdrm
 }:
 let
  overrides = {
@ -87,6 +88,17 @@ let
    lupa
    memcached
  ]);
+
+  # See note about consumer GPUs:
+  # https://docs.amd.com/bundle/ROCm-Deep-Learning-Guide-v5.4.3/page/Troubleshooting.html
+  rocmInit = ''
+    if [ ! -e /tmp/nix-pytorch-rocm___/amdgpu.ids ]
+    then
+        mkdir -p /tmp/nix-pytorch-rocm___
+        ln -s ${libdrm}/share/libdrm/amdgpu.ids /tmp/nix-pytorch-rocm___/amdgpu.ids
+    fi
+    export HSA_OVERRIDE_GFX_VERSION=''${HSA_OVERRIDE_GFX_VERSION-'10.3.0'}
+  '';
 in
 (writeShellScriptBin "koboldai" ''
  if [ -d "/usr/lib/wsl/lib" ]
@ -102,6 +114,7 @@ in
  ln -s ${stateDir}/models/   ${tmpDir}/models
  ln -s ${stateDir}/settings/ ${tmpDir}/settings
  ln -s ${stateDir}/userscripts/ ${tmpDir}/userscripts
+  ${lib.optionalString (aipython3.torch.rocmSupport or false) rocmInit}
  ${koboldPython}/bin/python ${patchedSrc}/aiserver.py $@
 '').overrideAttrs
  (_: {