С давних пор ARM и x86 шли разными путями, решения ARM использовался в основном в embedded решениях (терминалы, маршрутизаторы, КПК, телефоны), а x86 - в ПК и ноутбуках. ARM отличается энергоэффективностью, но ценой уменьшения производительности, а x86 - большей производительностью, но гораздо меньшей энергоэффективностью.
Но с недавних пор, компания Intel стала активнее интересоваться мобильным рынком и выпустила процессоры Atom, при проектировании которых во главу угла ставилась энергоэффективность, точек соприкосновения стало больше. В тоже время процессоры ARM становятся с каждым годом все производительнее. Сейчас ARM активно используется в смартфонах и планшетах (на различных "мобильных" операционных системах, как-то: iOS, Android, WinCE и т.д.), Atom - в нетбуках и планшетах (в основном на базе Windows 7, реже Android).
Вот почему мне стало интересно сравнить производительность современных ARM и Atom. Но как можно сравнить производительность различных архитектур? Можно было бы найти программы, работающие по одному и тому же алгоритму под обе платформы, в идеале код должен быть одинаковым, что усложняет задачу. Или написать такой тестовый набор самому, что я и решил сделать :).
Чтобы не писать совсем уж искусственные тесты, я решил использовать известные алгоритмы. Для начала мой выбор пал на алгоритм сжатия данных, для его осуществления выбрал известную кроссплатформенную библиотеку zlib. Эта библиотека часто используется разработчиками и написана на чистом Си, без специфических оптимизаций под какую-либо платформу.
Для тестирования использовал имеющиеся в наличии устройства.
ARM: Apple iPad 2, работающий на процессоре A5 (двухядерный Cortex A9) на частоте 1 ГГц, операционная система iOS.
Atom: домашний минисервер на базе материнской платы Intel D510MO c процессором D510 (два ядра + hyper-threading) на частоте 1.66 ГГц, операционная система Ubuntu 10.04.2 LTS 32-бит.
В основе программы - функция, использующая zlib:
Программа однопоточная, задействуется только одно ядро.
Время работы под iOS замерялось с помощью [NSDate timeIntervalSinceReferenceDate], а на Ubuntu - с помощью функции time.
На iOS применялся стандартный компилятор для XCode 4 - gcc 4.2 с опциями -O2 -mtune=cortex-a8 -march=armv7-a (но mtune и march особого влияния не оказали, настройки по умолчанию armv7 видимо достаточно), на Ubuntu - gcc 4.4 с -O2 -mtune=native -march=native.
Осуществлялась обработка 300Мб текстового файла, на выходе получился 70Мб файл.
Результаты:
Atom D510 ~290 сек
A5 ~440 сек
D510 быстрее A5 в 1,5 раза. Но учитывая что тактовая частота D510 больше в 1.66 раз, производительность же на единицу частоты у A5 получается несколько выше. Интересные результаты, не так ли? :]
Но с недавних пор, компания Intel стала активнее интересоваться мобильным рынком и выпустила процессоры Atom, при проектировании которых во главу угла ставилась энергоэффективность, точек соприкосновения стало больше. В тоже время процессоры ARM становятся с каждым годом все производительнее. Сейчас ARM активно используется в смартфонах и планшетах (на различных "мобильных" операционных системах, как-то: iOS, Android, WinCE и т.д.), Atom - в нетбуках и планшетах (в основном на базе Windows 7, реже Android).
Вот почему мне стало интересно сравнить производительность современных ARM и Atom. Но как можно сравнить производительность различных архитектур? Можно было бы найти программы, работающие по одному и тому же алгоритму под обе платформы, в идеале код должен быть одинаковым, что усложняет задачу. Или написать такой тестовый набор самому, что я и решил сделать :).
Чтобы не писать совсем уж искусственные тесты, я решил использовать известные алгоритмы. Для начала мой выбор пал на алгоритм сжатия данных, для его осуществления выбрал известную кроссплатформенную библиотеку zlib. Эта библиотека часто используется разработчиками и написана на чистом Си, без специфических оптимизаций под какую-либо платформу.
Для тестирования использовал имеющиеся в наличии устройства.
ARM: Apple iPad 2, работающий на процессоре A5 (двухядерный Cortex A9) на частоте 1 ГГц, операционная система iOS.
Atom: домашний минисервер на базе материнской платы Intel D510MO c процессором D510 (два ядра + hyper-threading) на частоте 1.66 ГГц, операционная система Ubuntu 10.04.2 LTS 32-бит.
В основе программы - функция, использующая zlib:
void compress_file(const char *fname_in, const char *fname_out)
{
FILE *f_in = fopen(fname_in, "rb");
gzFile fz_out = gzopen(fname_out, "wb9"); //используем максимальную степень сжатия - 9
char buf[8*1024];
size_t byte_read;
while ((byte_read = fread(buf, 1, sizeof(buf), f_in)) > 0)
{
gzwrite(fz_out, buf, byte_read);
}
fclose(f_in);
gzclose(fz_out);
}
Программа однопоточная, задействуется только одно ядро.
Время работы под iOS замерялось с помощью [NSDate timeIntervalSinceReferenceDate], а на Ubuntu - с помощью функции time.
На iOS применялся стандартный компилятор для XCode 4 - gcc 4.2 с опциями -O2 -mtune=cortex-a8 -march=armv7-a (но mtune и march особого влияния не оказали, настройки по умолчанию armv7 видимо достаточно), на Ubuntu - gcc 4.4 с -O2 -mtune=native -march=native.
Осуществлялась обработка 300Мб текстового файла, на выходе получился 70Мб файл.
Результаты:
Atom D510 ~290 сек
A5 ~440 сек
D510 быстрее A5 в 1,5 раза. Но учитывая что тактовая частота D510 больше в 1.66 раз, производительность же на единицу частоты у A5 получается несколько выше. Интересные результаты, не так ли? :]