Boas práticas

Boas práticas ao usar um ambiente computacional compartilhado

Um ambiente computacional compartilhado demanda que todos adotem um comportamento diplomático, com o intuito de respeitar os processos dos seus colegas e não causar indisponibilidade de recursos. Portanto:

  • Priorize o uso do sbtach para submeter o seu job: utilizando o sbatch o nó alocado será liberado assim que a tarefa for concluída, para que fique livre para outros usuários.
  • Revise a alocação de recursos antes de submeter um job.
  • Configure o email para que o cluster te avise quando seu job terminar.
  • Seja consciente quando a alocação de recursos: procure solicitar somente aquilo que seu experimento for, de fato, utilizar. Exemplo: não aloque a partição gpu para jobs que utilizarão somente CPU, para isso existe a partição cpu.
  • Como definição de segurança, somente os administradores do C3HPC tem acesso direto aos nós, o usuário não conseguirá acessar os mesmos via ssh.
  • A máquina de login (denominada c3hpc) é destinada somente para a submissão de jobs para o SLURM e administração do ambiente conda do usuário. Esta possui limites rígidos e não deve ser usada para processamento.
  • Utilize o disco local montado em /scratch para copiar seus datasets.
  • Qualquer dúvida não coberta por este documento ou pela documentação das ferramentas SLURM e Anaconda, não hesite em mandar um email para o suporte do C3HPC (c3hpc@inf.ufpr.br).
Última modificação September 25, 2025: refactor: update docs to follow the standard (9a824b7)