Недавно авторы LLVM Clang закоммитили в ветку этой версии новые фичи для процессоров AMD Zen. Они добавили поддержку SQRTSS/SQRTPS-инструкций для более быстрого и точного вычисления квадратного корня.
Разработчики отмечают, что эти инструкции относительно быстрые (меньше 14 циклов процессора). Они работают на процессорах Zen 1 и новее, а также являются хорошей альтернативой для простых sqrt (X)-инструкций.
Предложение по их включению возникло в ходе большого обсуждения, где пользователи вместе с разработчиками LLVM Clang пытались понять, как улучшить -mtune для современных процессоров.
LLVM Clang уже получил поддержку подобных инструкций для процессоров Intel — TuningFastScalarFSQRT и TuningFastVectorFSQRT. А для процессоров AMD Zen обновление выпустят лишь в 2022-м.
Поддержка SQRTSS/SQRTPS-инструкций — это одно из единственных изменений для процессоров AMD Zen с сентября 2021 года. Пользователи всё ещё ждут поддержку Zen четвёртого поколения, пока Intel вовсю работает над патчами для Alder Lake и Sapphire Rapids.