软件项目的规模是影响软件项目成本和工作量的主要因素。在基于代码行(LOC,Line Of Code)和功能点(Function Point)的估算方法中,利用代码行和功能点来表示软件系统的规模,并通过对软件项目规模的估算进而来估算软件项目的成本和工作量。
显然,一个软件项目的代码行数目越多,它的规模也就越大。软件代码行的数目易于度量,许多软件开发组织和项目组都保留有以往软件项目代码行数目的记录,这有助于在以往类似软件项目代码行记录的基础上对当前软件项目的规模进行估算。
用代码行的数目来表示软件项目的规模简单易行,自然、直观且易于度量。但是其缺点也非常明显。在软件开发初期很难估算出最终软件系统的代码行数;软件项目代码行的数目通常依赖于程序设计语言的功能和表达能力;采用代码行的估算方法会对那些设计精巧的软件项目产生不利的影响;该方法只适合于过程式程序设计语言,不适合于非过程式程序设计语言(如函数式或者逻辑语言)。
针对上述问题,人们提出用软件系统的功能数目来表示软件系统的规模。1979年IBM的Albrecht提出了计算功能点的方法。该方法需要对软件系统的二个方面进行评估,即评估软件系统所需的内部基本功能和外部基本功能,然后根据技术复杂度因子对这二个方面的评估结果进行加权量化,产生软件系统功能点数目的具体计算值。具体的,以下是软件系统功能点的计算公式。
FP = CT× (0.65 + 0.01×SFi) (i=1..14)
其中,CT是5个信息量的“加权和”,Fi是14个因素的“复杂性调节值”(i =1..14),0.65和0.01是经验常数。
CT的计算方法如表 3所示,CT =(简单用户输入数×3 +一般用户输入数×4+复杂用户输入数×6)+(简单用户输出数×4+一般用户输出数×5+复杂用户输出数×7)+(简单用户查询数×3+一般用户查询数×4+复杂用户查询数×6)+(简单文件数×7+一般文件数×10+复杂文件数×15)+(简单外部界面数×5+一般外部界面数×7+复杂外部界面数×10)。其中,用户输入数是指由用户提供的、用来输入的应用数据项的数目;用户输出数是指软件系统为用户提供的、向用户输出的应用数据项的数目;用户查询数是指要求回答的交互式输入的项;文件数是指系统中主文件的数目;外部界面数是指机器可读的文件数目(如磁盘或者磁带中的数据文件)。
表 3. CT值的加权计算
Fi(i=1..14)14个因素的“复杂性调节值”取值见表 4。
表 4. Fi的取值表
例如,假设项目组要开发一个软件项目A。根据用户的需求描述,该软件项目的CT取值如表 5所示。进一步的,假设该软件项目的14个复杂性调节值全部取平均程度。那么根据表 5可知,该软件项目的CT=341,14个复杂性调节因素的累加值SFi=42,因而根据公式FP = CT× (0.65 + 0.01×SFi) (i=1..14)可知,该软件项目的功能点FP=341× (0.65 + 0.01×42) = 364.87,即该项目的功能点数目大致为364。
表 5. 软件项目A的CT值
用功能点来表示软件项目规模的好处是:软件系统的功能与实现该软件系统的语言和技术无关,而且在软件开发的早期阶段(如需求分析)就可通过对用户需求的理解获得软件系统的功能点数目,因而该方法可以较好地克服基于代码行软件项目规模表示方法的不足。其不足主要体现在:该方法没有直接涉及算法的复杂度,不适合算法比较复杂的软件系统;功能点计算主要靠经验公式,主观因素比较多;此外计算功能点所需的数据不好采集。
大量的实践表明:针对特定的程序设计语言,软件系统的功能点和代码行二者之间存在某种对应关系(如表 6所示)。根据该表的数据,一个功能点如果用汇编语言来实现大约需要320行代码,如果用C语言来实现大约需要150行代码,如果用SMALLTALK语言来实现大约需要21行代码。从另一个角度上看,该表反映了不同程序设计语言的描述能力是不一样的。
表 6. 功能点和代码行之间的转换表
假设用L表示软件系统的规模(或者用LOC表示,或者用FP来表示)。针对一个具体的软件项目,可以采用自顶向下或者自底向上等多种方式来估算出软件项目规模的乐观值a、悲观值b和一般值m,然后根据以下公式估算出软件项目规模的期望值e:
e = (a + 4 m + b)/6
根据软件项目规模的期望值e以及下列公式,就可以估算出软件项目的成本和工作量。
生产率
PM = L / E
其中,L表示软件项目的规模(单位:LOC或者FP),E表示软件工作量(单位:人月),PM表示单个人月能够生产的功能点或者代码行数。
平均成本
CKL = S / L
其中,S为软件项目总开销,L表示软件项目的规模(单位:LOC或者FP), CKL表示每行代码或者每个功能点的平均成本。
对于一个特定的软件开发组织或者项目组而言,其软件生产率和平均成本在不同的软件项目实施中可能是比较稳定的。如果有以往软件项目的历史信息,可以很容易地获得关于软件开发组织或者项目组的PM和CKL值。因此,一旦估算出了软件项目的规模,获得了软件开发组织或者项目组的PM和CKL的值,就可根据公式CKL = S / L计算出软件项目的成本S = CKL L,也可根据公式PM = L / E计算出软件项目的工作量E= L / PM。
例如,假设项目组要开发一个软件项目A,经过估算该项目的规模是364个功能点。进一步的,根据以往的历史数据,该项目组软件开发的生产率是8FP/人月,每个功能点的平均成本为12000元人民币,那么该软件项目的开发成本S = 6800元人民币 364 = 247,5200元人民币,工作量为E= 364/ 8 = 45.5人月。
基于经验模型的估算
基于经验模型的估算根据以往软件项目实施的经验数据(如成本、工作量和进度等)建立相应的估算模型,并以此为基础对软件项目开发的有关属性进行估算。构造性成本模型CoCoMo(Constructive Cost Model)是目前应用最为广泛的经验模型之一。
在二十世纪七十年代后期,Boehm对多达63个软件项目的经验数据进行了分析和研究,在此基础上于1981年提出了CoCoMo模型用于对软件项目的规模、成本、进度等方面进行估算。Boehm把CoCoMo模型分为基本、中间和详细三个层次,分别支持软件开发的三个不同阶段。基本CoCoMo模型用于估算整个软件系统开发所需的工作量和开发时间,适合于软件系统开发的初期。中间层次的CoCoMo模型用于估算各个子系统的工作量和开发时间,适合在获得各个子系统信息之后对软件项目的估算。详细层次的CoCoMo模型用于估算独立的软构件,适合在获得各个软构件信息之后对软件项目的估算。由于篇幅限制,本书仅介绍基本CoCoMo模型,其模型形式描述如下。
E = a * (kLOC)b 。其中E是软件系统的工作量(单位:人月) ,a和b是经验常数,其取值见表 7,kLOC是软件系统的规模(单位:千行代码)。该公式描述了软件系统的规模与工作量之间的关系。
D = c * Ed。其中D是开发时间(单位:月),c和d是经验常数,其取值见表 7。该公式描述了软件系统的开发时间与工作量之间的关系。
表 7. 基本CoCoMo模型参数的取值
CoCoMo模型是一个综合经验模型,它考虑了诸多因素,因而是一个比较全面的估算模型。CoCoMo模型有许多参数,其取值来至于经验值。该估算模型比较实用、易于操作,在欧盟国家应用较为广泛。
例如,针对