关于NIST随机数测试软件报错问题的补充_nist测试报错error: log files could not be opened. max -程序员宅基地

技术标签: matlab  算法  NIST  测试数据与BUG  随机性测试  

NIST随机数测试算法相关测试软件的下载、安装、Cygwin环境配置等等已经有很多博客反复讲述过了,这里不再多说。

但是我发现在我的实际使用过程中遇到了很多意想不到的bug,我也留意到,在相关博客的评论区里,有很多朋友提到了相似的报错内容、相同的困惑。可问题在于CSDN甚至全网都无法找到详细的关于这个算法报错内容的解析。所以这里我尝试总结一下避免错误使用NIST测试软件的Tips,以及部分报错信息的解析。

待测试文件的格式与内容

关于文件格式

Cygwin运行sts-2.1.2算法包时 选择文件格式的提示语如下

Input File Format:
[0] ASCII - A sequence of ASCII 0’s and 1’s
[1]Binary - Each byte in data file contains 8 bits of data

这里主要谈论大家比较常用的[0]ASCII文件

  1. 一般来说,用python或matlab写的算法,导出txt文件是比较方便快捷的。
  2. UTF-8编码的txt文档兼容ASCII。
  3. “A sequence of ASCII 0’s and 1’s”指的不是二进制编码,这个描述指的是所有数据都是二进制数。
  4. 如果采用的是二进制编码文件,请选择第二个选项:Binary。

关于文件内容

  1. 二进制编码的数组可以保证超高精度,不需要担心十进制数值超过matlab/python的整数大小上限以后变为双精度数、导致精度降低。所以生成的随机数数值即使是超级大数也不会影响随机性的判定和测试。
  2. 特殊要求(1):所有二进制数要保证长度相同,如果位数不够,在前面用0补齐。
  3. 特殊要求(2):所有二进制数连续排列,中间不能有空格。
  4. 这里用matlab举例。假设已经生成了一个随机数数组,基于上述要求,导出时不能使用非常快捷的save函数,我们需要手动将数组中的每一个数转为二进制形式后连续写入txt文件。下面我放一段自己的代码,使用的时候请自行更改参数。
    fid = fopen('E:/Final1.txt','w'); 
    %E:/Final1.txt是待检测文件的绝对路径
    for i = 1:1000000
        fprintf(fid, '%s',dec2bin(X(i),32));
    end 
    %1000000是数组长度,32是这个数组中最大的二进制数的长度
    fclose(fid);
    
  5. 一个小建议:生成txt文件以后,可以先打开、缩小来看一看,如果你能看到明显的0、1规律,如下图,那证明你的数组随机性极差,这个算法包无法对你的数组进行测试,最后生成的Finalreport可能是空的0kb,也有可能参数全0。这也是不断报错“igamc underflow”的两大原因之一。
    这样可以目测随机性极差的文件就不需要浪费时间了,建议直接检查算法的正确性。
    二进制txt文件01规律性举例

运行算法时的参数

选择bit流大小和数量

  1. bit流的大小和数量,在很大程度上决定了最后Finalreport能否正常生成。
  2. ./assess 后数值小于1000000时可能无法产生finalreport(即0kb空txt),或是产生全0报告,如下图
    在这里插入图片描述
    其实我这里是有一部分数据的,并不是全0。可以看到明显的对比,下半部分的测试师通过了的。不过数据不够、全0的文件即为上半部分的样子。
  3. 如果数据量不够,./assess 输入较小数值,比如10000,则建议参照此博客的下个部分,采用分段部分测试的方式逐步完成15项检验。
  4. bit流的数量一般要求在10以上比较合理。
  5. 注意:单条bit流的长度 * bit流数量 不能超过你txt文件的数据量,否则同样会不断报错“igamc underflow”!(即第二大报错原因)

选择测试项

根据我个人的尝试,要想一次性完成全部十五项测试,至少需要数量为十万级的随机数,达到百万级更好。
但是部分算法(比如时间戳优化的LCG算法)运算速率很低,产生百万个随机数所需时间太长。那么假设我们只有不到十万个随机数,如果强行跑程序,反而会导致最后报告产生错误。
这里我们建议将15个测试分开为几组来进行测试。
输入文件绝对地址以后你会看到如下指示:

S T A T I S T I C A L T E S T S
_________________________________
[01] Frequency [02] Block Frequency
[03] Cumulative Sums [04] Runs
[05] Longest Run of Ones [06] Rank
[07] Discrete Fourier Transform [08] Nonperiodic Template Matchings
[09] Overlapping Template Matchings [10] Universal Statistical
[11] Approximate Entropy [12] Random Excursions
[13] Random Excursions Variant [14] Serial
[15] Linear Complexity
INSTRUCTIONS
Enter 0 if you DO NOT want to apply all of the
statistical tests to each sequence and 1 if you DO.
Enter Choice:

这里选择0,看到以下指示:

INSTRUCTIONS
Enter a 0 or 1 to indicate whether or not the numbered statistical
test should be applied to each sequence.
123456789111111
      012345

这里的两行数字表示的是1到15,后半段上面的1是十位,下面是个位。在下方对应输入1表示执行该测试,0则表示不执行。

最后,在以下的各个文件夹中查看各部分报告。总的finalreport是没有详细内容的。在这里插入图片描述
目前想到的就是这些,欢迎将漏洞和疑问补充在评论区。我会尝试完善这个回答。

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_46983031/article/details/115365328

智能推荐

SLAM ORB-SLAM2(15)单应矩阵的计算和评分-程序员宅基地

文章浏览阅读9.6k次,点赞20次,收藏21次。单应矩阵的概念、计算原理和重投影误差评分

GCC编译及GDB调试_编译gcc gdb-程序员宅基地

文章浏览阅读737次。目录前言一、GCC编译1.编译链接流程二、使用步骤1.引入库2.读入数据总结前言记录GCC和GDB的学习笔记一、GCC编译1.编译链接流程以File.c为例子File.i : 经过编译预处理的源代码;File.s : 汇编处理后的汇编代码;File.o : 编译后的目标文件,即含有最终编译出的机器码,但它里面所引用的其他文件中函数的内存位置尚未定义File.out:可执行文件C源程序头文件-->预编译处理(cpp)-->编译程序-->优化程序-->汇编程_编译gcc gdb

contest12 CF514div2 ooxxx oooox ooooo-程序员宅基地

文章浏览阅读1.3k次。未写转载于:https://www.cnblogs.com/ikihsiguoyr/p/10372635.html

决策表,决策树_决策表 决策树-程序员宅基地

文章浏览阅读293次。决策表决策表 - 百度百科决策表又称判断表,是一种呈表格状的图形工具,适用于描述处理判断条件较多,各条件又相互组合、有多种决策方案的情况。精确而简洁描述复杂逻辑的方式,将多个条件与这些条件满足后要执行动作相对应。但不同于传统程序语言中的控制语句,决策表能将多个独立的条件和多个动作直接的联系清晰的表示出来决策树决策树 - 百度百科决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运_决策表 决策树

【论文解读】语义分割&医学图像分割论文合集-程序员宅基地

文章浏览阅读4k次,点赞18次,收藏171次。description: 整理自己看过和待看的一些主要关于图像分割包括其他领域的论文,不定时更新…综述篇Deep learning for cardiac image segmentation: A review [2019]Deep Semantic Segmentation of Natural and Medical Images: A Review [2019]Understanding Deep Learning Techniques for Image Segmentation

随便推点

找不到引用microsoft.office.core_未安装 office using microsoft.office.core-程序员宅基地

文章浏览阅读4.9k次。在一个比较大的.net程序编译中,报告错误,找不到引用microsoft.office.core,从程序下的文件夹下找也找不到 microsoft.office.core.dll文件,在office的安装文件夹下也找不到,重装了office也不行,后来上网找了找,才知道了 解决办法。在控制面板中,选择“添加删除程序”,找到office ,选择“更改”,在对话框中选择“添加删除功能”,然后选_未安装 office using microsoft.office.core

就这样我成了一名程序员_flyfish365-程序员宅基地

文章浏览阅读1.6k次。 6月份,毕业了,炎炎夏日加上几只属苍蝇的知了,我知道这些并不是自己心里烦躁的理由,长吸一口气,我的未来在哪里?问题找到了,但答案在哪里? 宿舍的几位同僚,义无反顾的整理好皮箱奔向大城市去打天下,送走他们,告别已经分手的女朋友,拿着自己的三证和一堆宝贝技术书籍,决定先回家。 家里永远都是最温暖的,回家后第一次见到我刚出生几个月的外甥,这小子可爱极了,老乐呵_flyfish365

【u-boot-2015.10源码分析】board_r.c_config_board_early_init_r-程序员宅基地

文章浏览阅读1.7k次。文章链接:https://blog.csdn.net/q_z_r_s机器感知一个专注于SLAM、机器视觉、Linux 等相关技术文章分享的公众号/* 最终进入命令解析模式 */DECLARE_GLOBAL_DATA_PTR;ulong monitor_flash_len;static int run_main_loop(void){#ifdef CON..._config_board_early_init_r

python计算机毕设【附源码】毕业设计选题管理系统(django+mysql+论文)-程序员宅基地

文章浏览阅读280次,点赞4次,收藏3次。通过使用前端技术HTML+CSS+JavaScript+Vue,后端技术Java+SSM,数据库MySQL5.7,以及开发工具Eclipse或IntelliJ IDEA,Tomcat7.0,JDK1.8,Maven3.3.9,可以实现一个功能完善、操作简便的毕业设计选题管理系统。在数据库管理工具的选择上,使用了Navicat 11,这是一个用户友好且功能强大的数据库管理软件,它支持多种数据库系统,包括MySQL,并提供了图形化界面,使得数据库的管理和维护工作更加便捷。

图解通信原理与案例分析-17:2G GPRS通用分组无线业务详解_2g slot-程序员宅基地

文章浏览阅读4.7k次。先占个空,以后再详细拆解主要关注与GSM的区别,特别是GRPS是如何通过增加信道和分组交换系统支持数据传输,如何通过新的调制解调技术,增加数据传输的速率的!1. GSM是全球移动通讯系统(Global System for Mobile Communications)的简称2. GPRS是通用分组无线业务(General Packet Radio Service)的简称3. GPRS是在GSM系统基础上发展起来的分组数据承载和传输业务。4. GPRS与GSM......_2g slot

【图像拼接】论文精读:Natural Image Stitching Using Depth Maps-程序员宅基地

文章浏览阅读10w+次。图像拼接系列相关论文精读Seam Carving for Content-Aware Image ResizingAs-Rigid-As-Possible Shape ManipulationAdaptive As-Natural-As-Possible Image StitchingShape-Preserving Half-Projective Warps for Image StitchingSeam-Driven Image StitchingParallax-tolerant Ima_natural image stitching using depth maps

推荐文章

热门文章

相关标签