蓝剑千亿级别口令库依据人工智能的深度学习技术生成1400亿余条口令,口令字典采用专门的压缩算法,大幅度降低了数据传输量和磁盘占用空间,超大的口令字典和超强的设备性能相结合,必将在破译实战中转化为更高的破解成功率。
针对爆库样本数据去重,对假口令进行甄别、剔除,假口令包括:散列值、网页页面编码、人为产生的数据(量大且具有特征)等等。
利用上下文无关语言模型将样本数据分段并统计字符频率;对于常用字符组合进行频率统计。