Всем привет,
Сорри если это ужу здесь спрашивалось. Объясните не программисту как решаются вот такие задачи:
- дан большой массив целых чисел который не влезает в память. Как найти его медиану?
- как находить всех друзей друзей у произвольного количества пользователей соц. сетей - какие использовать алгоритмы
- дано 10000 петобайт данных - найти количество битов выставленных в "1".
Вопрос про медиану и алгоритмы
Правила форума
Пожалуйста, ознакомьтесь с правилами данного форума
Пожалуйста, ознакомьтесь с правилами данного форума
- Gaziz
- Житель
- Сообщения: 944
- Зарегистрирован: 17 фев 2003, 15:57
- Откуда: Almaty-Toronto-Vancouver-Seattle
- Marmot
- Графоман
- Сообщения: 39438
- Зарегистрирован: 17 фев 2003, 17:58
- Откуда: Caulfeild
- Контактная информация:
Re: Вопрос про медиану и алгоритмы
В каком виде дан? Насколько точное значение медианы нужно, каков диапазон значений чисел?Gaziz писал(а): - дан большой массив целых чисел который не влезает в память. Как найти его медиану?
эээ, а данные в каком виде?Gaziz писал(а): - как находить всех друзей друзей у произвольного количества пользователей соц. сетей - какие использовать алгоритмы
Тот же самый вопрос, в каком виде данные и где, и как они лежат.Gaziz писал(а): - дано 10000 петобайт данных - найти количество битов выставленных в "1".
Но сразу приходит в голову Hadoop... или вы не умеете битики в байтиках считать?
- Gaziz
- Житель
- Сообщения: 944
- Зарегистрирован: 17 фев 2003, 15:57
- Откуда: Almaty-Toronto-Vancouver-Seattle
Re: Вопрос про медиану и алгоритмы
>> - дан большой массив целых чисел который не влезает в память. Как найти его медиану?
>В каком виде дан? Насколько точное значение медианы нужно, каков диапазон значений чисел?
Например массив лежит на 2000 машинах. Нужно найти с погрешностью в 1%.
>В каком виде дан? Насколько точное значение медианы нужно, каков диапазон значений чисел?
Например массив лежит на 2000 машинах. Нужно найти с погрешностью в 1%.
- Marmot
- Графоман
- Сообщения: 39438
- Зарегистрирован: 17 фев 2003, 17:58
- Откуда: Caulfeild
- Контактная информация:
Re: Вопрос про медиану и алгоритмы
аааа, тогда, прикидываем диапазон значений, делим этот диапазон на разумное число кусочков , 10К, например, потом на каждой машине в массив из 10К считаем куда сколько попало.Gaziz писал(а):>> - дан большой массив целых чисел который не влезает в память. Как найти его медиану?
>В каком виде дан? Насколько точное значение медианы нужно, каков диапазон значений чисел?
Например массив лежит на 2000 машинах. Нужно найти с погрешностью в 1%.
Потом сливаем все эти гистограмы вместе, и находим медиану.
- Gaziz
- Житель
- Сообщения: 944
- Зарегистрирован: 17 фев 2003, 15:57
- Откуда: Almaty-Toronto-Vancouver-Seattle
Re: Вопрос про медиану и алгоритмы
> Потом сливаем все эти гистограмы вместе, и находим медиану.
Спасибо! А что находится в гистограмме? И как это относится к медиане?
Спасибо! А что находится в гистограмме? И как это относится к медиане?
- Marmot
- Графоман
- Сообщения: 39438
- Зарегистрирован: 17 фев 2003, 17:58
- Откуда: Caulfeild
- Контактная информация:
Re: Вопрос про медиану и алгоритмы
http://ru.wikipedia.org/wiki/%D0%9C%D0% ... %BA%D0%B0)Gaziz писал(а):> Потом сливаем все эти гистограмы вместе, и находим медиану.
Спасибо! А что находится в гистограмме? И как это относится к медиане?
- LeoV
- Графоман
- Сообщения: 14497
- Зарегистрирован: 02 июн 2012, 15:41
- Откуда: Графство O'Mан
- Контактная информация:
Re: Вопрос про медиану и алгоритмы
Искусство программирования (англ. The Art of Computer Programming) — фундаментальная монография известного американского математика и специалиста в области компьютерных наук Дональда Кнута, посвященная рассмотрению и анализу важнейших алгоритмов, используемых в информатике. В 1999 году книга была признана одной из двенадцати лучших физико-математических монографий столетия.
Любимая книга всех времен и народов
Любимая книга всех времен и народов
- Waterbyte
- Графоман
- Сообщения: 48042
- Зарегистрирован: 10 авг 2007, 13:43
Re: Вопрос про медиану и алгоритмы
как непрограммист, я бы сказал, что эта погрешность достижима уже на шестой-седьмой тысяче элементов случайной выборки. то есть выборки размером 10 тысяч элементов должно хватить за глаза. из каждой пятой машины вытянуть по 25 элементов массива, слить в один, и искать там медиану.Gaziz писал(а):Например массив лежит на 2000 машинах. Нужно найти с погрешностью в 1%.
насчёт друзей друзей в соцсетях не знаю. наверное, сначало как-то надо задачку формализовать, а потом уже алгоритмизировать.
-
putanik
- Житель
- Сообщения: 516
- Зарегистрирован: 12 мар 2012, 05:29
Re: Вопрос про медиану и алгоритмы
1. y(k+1)=y(k) + step_size(k) * sign(x(k)-y(k));
stochastic approximation step_size(k) = 1/k;

2. назовите любое разумое число объяснив его "алгоритмом" название которого состоит из любых двух заумных фамилий. медианных алгоритмов десятки, если не сотни. все равно никто всех их не знает.
3. запрограммировать алгоритм - лиха беда начало. отладить и оттестировать более-менее сложный алгоритм без знания теории - нереально.
stochastic approximation step_size(k) = 1/k;
2. назовите любое разумое число объяснив его "алгоритмом" название которого состоит из любых двух заумных фамилий. медианных алгоритмов десятки, если не сотни. все равно никто всех их не знает.
3. запрограммировать алгоритм - лиха беда начало. отладить и оттестировать более-менее сложный алгоритм без знания теории - нереально.
- Marmot
- Графоман
- Сообщения: 39438
- Зарегистрирован: 17 фев 2003, 17:58
- Откуда: Caulfeild
- Контактная информация:
Re: Вопрос про медиану и алгоритмы
Поэтому лучше всего использовать простые алгоритмыputanik писал(а):3. запрограммировать алгоритм - лиха беда начало. отладить и оттестировать более-менее сложный алгоритм без знания теории - нереально.
- Waterbyte
- Графоман
- Сообщения: 48042
- Зарегистрирован: 10 авг 2007, 13:43
Re: Вопрос про медиану и алгоритмы
мне кажется, примерно половина всех битов будет выставлена в 1. то есть около 10^4*10^15*8/2. если и ошибсо, то не думаю, что очень сильно.Gaziz писал(а): - дано 10000 петобайт данных - найти количество битов выставленных в "1".
- Gaziz
- Житель
- Сообщения: 944
- Зарегистрирован: 17 фев 2003, 15:57
- Откуда: Almaty-Toronto-Vancouver-Seattle
Re: Вопрос про медиану и алгоритмы
Есть интересная задача про 100 дверей. С наскока не смог ее решить и подсмотрел решение у интересного парня - Игоря Клейнера
http://www.youtube.com/watch?v=Z41uWyelHKE
http://www.youtube.com/watch?v=Z41uWyelHKE