Страница 2 из 2

Re: Python vs .....

Добавлено: 10 фев 2018, 21:57
borei
LeoV:
putanik:
AndreyA:Ну и вот на тему скорости - https://www.ibm.com/developerworks/comm ... on?lang=en


очень любительский пример. человек просто не понимает что делает.

а вообше-то, по хорошему, математику обычно прописывают на ассемблере.

одноразовую обработку результатов на ассемлере, и даже на С++ никто прописывать не будет

Ну об одноразовой обработке никто не говорит.
Цифирей сколько получили флопов я чегото не нашел, отсюда сложно сказать как хорошо или плохо реализованы алгоритмы.
Если действительно нужен результат - то это да ассемблер и в числодробильне нужен SIMD.
Я сейчас с этим и вожусь.

Re: Python vs .....

Добавлено: 10 фев 2018, 22:22
putanik
AndreyA:Вот этот человек не понимает - https://www.linkedin.com/in/jfpuget/ ?
Вы уверены что вы лучше этого человека понимаете? Я вот как то не очень в этом уверен.


да, я б такую чушь не написал.

Re: Python vs .....

Добавлено: 10 фев 2018, 22:47
AndreyA
Вы нам ваш Phd по математике покажите и опыт работа на архитектурных позициях в компании типа IBM, вот тогда и будем говорить. А еще лучше покажите нам ваши статьи и их цитирование в сообществе :) Будет хоть как вас с данным товарищем сравнить :)

Re: Python vs .....

Добавлено: 11 фев 2018, 10:29
putanik
у современных процессоров длинный pipeline, 4-8 parallel MAC units, multiple cores, very complicated memory access. Data must be properly aligned. You need to re-write your source algorithm to make sure the pipeline is fully load-able, the parallelism is exploited, etc. The gain may be 10..100x. To make full use of modern processors, you need assembly or IPP-like libs. Otherwise ... what you are comparing is not clear, скажем так.

что больше всего смешит в примере, это использование double. Double, Karl! есть очень мало задач в которых исходные данные поступают с такой точностью. для остальных использование double - маркер непрофессионализма. дальше использование тиме() вместо performance counter-ов, ни к селу ни к городу засунутые прагмы, итд и тп.

Вообще-то мой титул на последней работе был Senior Scienist (Intel), и занимался я непосредственно разработкой алгоритмов, а не руководством толпой. Но не в этом суть.

Re: Python vs .....

Добавлено: 11 фев 2018, 10:48
AndreyA
Здорово, теперь статьи?
Ну и что там с Python? Все на асме пишем?

Re: Python vs .....

Добавлено: 11 фев 2018, 15:39
putanik
AndreyA:Здорово, теперь статьи?
Ну и что там с Python? Все на асме пишем?


слишком много факторов вовлечено в сравнение питона и С. на такой general question я не возьмусь отвечать. но если есть специфичные ворпосы, тогда - с удовольствием.

Re: Python vs .....

Добавлено: 11 фев 2018, 17:15
borei
putanik:у современных процессоров длинный pipeline, 4-8 parallel MAC units, multiple cores, very complicated memory access. Data must be properly aligned. You need to re-write your source algorithm to make sure the pipeline is fully load-able, the parallelism is exploited, etc. The gain may be 10..100x. To make full use of modern processors, you need assembly or IPP-like libs. Otherwise ... what you are comparing is not clear, скажем так.

что больше всего смешит в примере, это использование double. Double, Karl! есть очень мало задач в которых исходные данные поступают с такой точностью. для остальных использование double - маркер непрофессионализма. дальше использование тиме() вместо performance counter-ов, ни к селу ни к городу засунутые прагмы, итд и тп.

Вообще-то мой титул на последней работе был Senior Scienist (Intel), и занимался я непосредственно разработкой алгоритмов, а не руководством толпой. Но не в этом суть.

Респектую!
У меня сейчас вопросов конкретных нету, но думаю подтянутся, если не против я бы потом поспрашал.
Что касается скорострельность и роста до x10-x100. Я в это не верил, но когда начал играться с оптимизацией в основном доступ к памяти и получил прирост x40 то немного офигел. Думаю что когда прикручу работу с упакованными числами то ещё раза в 4 подниму. Хорошо бы конечно поиметь доступ к avx2, там 256 разрядные регистры , но пока не знаю как сделать.
По текущему состоянию я имею пару гигафлопов на одном ядре, думаю получить в районе 30-40 когда задействую все ресурсы. Не лапак конечно но все равно не плохо.