anonymous
написал 14 марта 2004 года в 02:19 (838 просмотров)
Ведет себя
неопределенно; открыл 1814 темы в форуме, оставил 5575 комментариев на сайте.
Взял тут на сети прогу под названием flops.c http://xdroop.com/content/991659600.html — оценить мощность своей системы. Получилось, что мой 2.8 GHz Pentium 4 делает около 400 мегафлопов в секунду. Т.е., получается 7 циклов на флоп, что ли? Даже UNIVAC тратил только 2 цикла на флоп, а SPARC умудряется делать почти 1 цикл = 1 флоп.
Возмущению нет предела. Может я что не нак понял, кто-нибудь может прояснить, а то я еще успею свой лаптоп с мусорки забрать, пока машина не приезжала… :-)
Good Luck,
UT
Последние комментарии
- OlegL, 17 декабря 2023 года в 15:00 → Перекличка 21
- REDkiy, 8 июня 2023 года в 9:09 → Как «замокать» файл для юниттеста в Python? 2
- fhunter, 29 ноября 2022 года в 2:09 → Проблема с NO_PUBKEY: как получить GPG-ключ и добавить его в базу apt? 6
- Иванн, 9 апреля 2022 года в 8:31 → Ассоциация РАСПО провела первое учредительное собрание 1
- Kiri11.ADV1, 7 марта 2021 года в 12:01 → Логи catalina.out в TomCat 9 в формате JSON 1
DevOps as a Service from Palark
24/7 SRE & DevOps service to cover all your Kubernetes needs.
Эта прога оцениват скорсть выполнения арифметических операций. Что ИМХО не самый важный аспект, влияющий на произвоительность.
Нет, это лишь показывает несоответствие теста микроструктуре ядра P4. Или наоборот..
Длина конвейера P4, имнип, 17 (или 14) стадий, код, получающийся при компиляции вычислительных циклов — «сильносвязанный», т.е. результаты одной команды практически сразу требуются в другой… Это накладывает ограничение на загрузку команд в исполнительный конвейер.
FPU в P4 загружается раз в 2 такта (а вот ALU наоборот, работает с удвоенной частотой и может принимать данные раз в полтакта)…
Посему и получается, что откопать скрытого параллелизма в коде ярду P4 не удаётся для достижения его пиковой производительности.