软件可靠性:软件产品在规定的条件下和规定的时间区间完成规定功能的能力
软件与硬件可靠性4个不同点:
1.软件可靠性的定量描述
规定时间:
有3种概念:自然时间,也就是日历时间,指人们日常计时用的年月周日等自然流逝的时间段;运行时间,指软件从启动开始到运行结束的时间;执行时间,指软件运行过程中,CPU执行程序指令所用的时间总和;使用执行时间来度量软件的可靠性最为准确,效果也最好。
失效概率:
从软件开始运行,到某一时刻t为止,出现失效概率可以看作是关于软件运行时间的一个随机函数,用F(t)表示,F(t)有如下特征
F(0)=0,即软件运行初始时刻失效概率为0
F(t)在时间域(0,+∞)上是单调递增的
F(+∞)=1,即失效概率在运行时间不断增长时趋向1
可靠度:
软件系统在规定的条件下、规定的时间内不发生失效的概率,公式为R(t)=1-(t);R(0)=1,R(+∞)=0。
失效强度:单位时间软件系统出现失效的概率
平均失效时间(MTTF)、平均恢复时间(MTTR)、平均故障时间(MTBF)

2.可靠性目标
失效严重程度类:对用户具有相同程度影响的失效集合
对失效严重程度的分级常见的分类:按对成本影响、对系统功能的影响
对成本的影响包括失效引起的额外运行成本、修复、恢复成本、现有或潜在的业务机会的损失等
对系统能力的影响包括为关键数据的损失、系统异常退出、系统崩溃、导致用户操作无效等
软件可靠性是指用户对所使用的软件的性能满意程度的期望,可以用可靠度、平均失效时间、故障强度等来描述
可靠性目标参考表

可靠性测试的意义
广义可靠性测试与狭义可靠性测试
广义:为最终评价软件系统的可靠性而运用建模、统计、试验、分析和评价等一系列手段对软件系统实施的一种测试
狭义:为了获取可靠性数据,按预先确定的测试用例,在软件的预期使用环境中,对软件实施的一种测试。
可靠性测试的目的:
软件可靠性模型:为预计或估算软件的可靠性所建立的可靠性框图和数学模型
影响软件可靠性的主要因素:缺陷的引入、发现和清除
缺陷的引入主要取决于软件产品的特性和软件的开发过程特性
缺陷的发现依靠用户对软件的操作方式、运行环境等
缺陷的清除依赖失效的发现和修复活动及可靠性方面的投入
从技术角度影响软件可靠性的主要因素:
软件可靠性的建模方法
组成:
3个共同假设:
软件可靠性模型的分类(10类)
种子法模型
失效率类模型
曲线拟合类模型
可靠性增长模型
程序结构分析模型
输入域分类模型
执行路径分析方法模型
非齐次泊松过程模型
马尔可夫过程模型
贝叶斯分析模型
容错设计技术
检错技术:在软件出现故障后能及时发现并报警,提醒维护人员进行处理。
检错技术着重考虑几个要素:检测对象、检测延时、实现方式、处理方式
检测对象:包括两个层次的含义,即检测点和检测内容
检测延时:从软件发生故障到被自检出来是有一定延时的,这段延时的长短对故障的处理是非常重要的。
实现方式:最直接方式是判断返回结果,结果超出正常范围,则进行异常处理;计算运行时间也是常用的技术
处理方式:采用查出故障——停止软件系统运行——报警的处理方式,也有采用不停止或部分停止软件系统运行的情况,一般由故障是否需要实时处理来决定
降低复杂度设计:在保证实现软件功能的基础上,简化软件结构,缩短程序代码长度,优化软件数据流向,降低软件复杂度,从而提高软件可靠性
系统配置技术
双机热备技术:一种软硬件结合的较高容错应用方案,由两台服务器系统和一个外接共享磁盘阵列柜和相应的双机热备份软件组成。分3种不同的工作模式
服务器集群技术:一组相互独立的服务器在网络中组成单一的系统工作,并以单一系统模式加以管理。集群内各结点服务器通过内部局域网相互通信,当某结点服务器发生故障时,这台服务器上所运行的应用程序将在另一结点服务器上被自动接管
软件可靠性测试由可靠性目标确定、运行剖面开发、测试用例的设计、测试实施、测试结果的分析等主要活动组成。
定义软件运行剖面:为软件的使用行为建模,开发使用模型,明确需测试内容
可靠性测试用例设计:测试用例要能够反应实际的使用情况,优先测试最重要的和最频繁使用的功能
典型的测试用例包括以下内容:
可靠性测试实施
软件可靠性数据分4类:
失效时间数据:记录发生一次失效所累积经历的时间
失效间隔时间数据:记录本次失效与上一次失效间的间隔时间
分组时间内的失效数:记录某个时间区间内发生了多少次失效
分组时间的累积失效数:记录到某个区间的累积失效数
评估和预测软件可靠性过程包含3个方面
如何选择可靠性模型
可以从以下几方面进行比较和选择
可靠性数据收集
关于数据的收集工作,存在以下问题
针对以上问题解决办法如下
软件可靠性的评估和预测
目的:评估软件系统的可靠性状况和预测将来一段时间的可靠性水平
需要软件可靠性评价进行解答的问题:
软件可靠性数据分析方法:失效数据的图形分析法、试探性数据分析技术