Я запускаю (на CentOS 6) кластер, подключенный к головному узлу через медленную сеть. Каждое порожденное задание должно перетащить файл размером ~ 1 ГБ с головного узла на вычислительный узел, а затем обработать его локально. Файловая система головы обслуживается через NFS.
Разрешение каждому порожденному заданию (одновременно) cp
файла, который ему нужен, очевидно, замедляет работу сервера NFS.
Какой рекомендуемый способ ставит в очередь процессы копирования / передачи файлов в Linux?
NFS не обязательно присутствует. Если есть, например, ftp-сервер, который может принимать несколько запросов и обслуживать их по одному (или N) за раз, это было бы идеально. «Клиентский» компонент должен иметь возможность ждать долгое время без тайм-аута. Я использую диспетчер кластера SLURM; но вопрос общий.
РЕДАКТИРОВАТЬ
Это не вопрос синхронизации набора данных на всех узлах. Каждому нужны свои файлы.
Честно говоря, судя по всему, вам действительно следует использовать BitTorrent для синхронизации этих файлов. Таким образом, ни на одном компьютере не будет точки доступа.