Это не база - это копипаст статьи http://rnns.ru/2007/10/19/top-30-naibolee-chasto-ispolzuemykh.html. Неизвестный, но добрый человек владел базой на 140 тыс. записей и сделал вот такое исследование.
Как я мыслю себе список этих паролей - как вышеприведённый top30, только больше
Что касается различий для каждой базы записей - в случае достаточно большой базы записей списки наиболее употребляемых паролей будут очень похожи для больших баз.
Т.е. аналогия - это к примеру самые распространёные слова английского языка, которые учат в первую очередь. 5000 самых популярных слов в англ. языке позволяют понимать ~90% английского текста. Списки таких слов делаются анализом одной или группы книг по числу вхождений каждого слова в книгу. Так же и с паролями - нужно раздобыть базы записей с паролями, и потом посчитать число вхождений каждого пароля.
Где взять такие базы - есть же люди, кто владел\владеет сайтами с регистрацией, форумами и т.д. Есть люди кто ломает хэши - у них списки реальных паролей, есть люди кто делает SQL - инъекции и крадёт базы данных форумов - вот все эти люди могут нам помочь. В ветке Расшифровка Хэшей выкладывали подобные базы, но у меня там с форматом не заладилось, да и большинство обменивались через ПМ.
1234567890
rossia
hjccnz (Россия)
beckham
6six6 - так же с другими числами
19741974 - так же с другими годами
asd
zxcvbn
sh1ft - shist - SHIFT
cyfqgth (Снайпер)
654321
whitepower (аля фашизм) поймал штук 20 7-dig *монжно еще попробовать на skinhead
Вчера на "123456" - 13 лесенных 9-dig ( за 1 час), думайте сами........
Имхо когда чел преобретает 6-dig он уже ибо не лох и пасс генерирует на проге или же близко связаный с ним типо...
Зовут: Кирилл
Возраст: 11 лет
kup911 - 11kupull - и т.д.
тут уже нужно экспериментировать, а не как дурак идти за всеми.......