Это для определенной встроенной системы? В целом изменение опций компиляции не будет иметь большое значение. Где производительность имеет значение, современное ядро обычно или автоматически выбирает наилучший вариант или иначе предлагает время выполнения tunables. Вы были бы более обеспеченной работой с теми или настройкой Вашей среды Java и Вашего кода.
Я бы сказал, что оба способа верны, но я немного склоняюсь к использованию memcached для каждого сервера. Пока у вас нет общих данных в memcached.
С общим memcached вы получаете:
При использовании memcached для каждого сервера вы получаете