高效计算——RenderScript
RenderScript是安卓平台上很受谷歌推荐的一个高效计算平台,它能够自动把计算任务分配到各个可用的计算核心上,包括CPU,GPU以及DSP等,提供十分高效的并行计算能力。可能是由于应用开发时的需求不够,关于RenderScript的相关文章很少,刚好我在工作中应用到此平台,做了一些笔记,因此决定整理成博文分享给大家。内容主要来源于官方文档、StackOverflow以及自己的理解,如有错误,请大家指正。本篇主要介绍RenderScript的基本概念。
1 RenderScript简介
RenderScript是安卓提供的一个高效计算平台。它显著的特点在于:
- 能够自动利用各种核心,包括CPU,GPU以及DSP等,来进行并行计算,能大大提高在图片处理、数学模型等领域提供高效的计算能力;
- 不需要针对不同的核心平台而编写不同的代码,因为RenderScript是在设备上进行运行时编译的。
使用了RenderScript的应用与一般的安卓应用在代码编写上与并没有太大区别。使用了RenderScript的应用依然像传统应用一样运行在VM中,但是你需要给你的应用编写你所需要的RenderScript代码,且这部分代码运行在native层。
RenderScript采用从属控制架构:底层RenderScript被运行在虚拟机中的上层安卓系统所控制。安卓VM负责所有内存管理并把它分配给RenderScript的内存绑定到RenderScript运行时,所以RenderScript代码能够访问这些内存。安卓框架对RenderScript进行异步调用,每个调用都放在消息队列中,并且会被尽快处理。
RenderScript工作流程需要经历三层:
- RenderScript运行时API:提供进行运算的API
- 反射层:相当于NDK中的JNI胶水代码,它是一些由安卓编译工具自动生成的类,对你写的RenderScript代码进行包装,使得安卓层能够和RenderScript进行交互
- 安卓框架:通过调用反射层来访问RenderScript运行时
RenderScript的主要优点:
- 可移植性:对于不同架构,不同的处理器都不需要考虑代码的差异化,因为都是运行时在设备上进行编译的;
- 高性能:提供充分利用所有核心的无缝的并行化计算
- 易用性:简化编码,不需要像JNI一样写胶水代码
缺点:
- 开发复杂:需要去学习新的api
- 调试可见性:因为RenderScript可能运行在除了主cpu之外的处理器上,所以调试困难
2 使用RenderScript
使用RenderScript需要对编译或者开发环境进行一定的配置。
使用RenderScript主要分为两个步骤:编写.rs文件以及在Android framework中使用RenderScript,下面分别介绍。
2.1 环境配置
- RenderScript的API可以有两种来源方式:
对于Android 3.0 (API level 11)及以上的可以在android.renderscript包中获取
通过android.support.v8.renderscript包获取,可以支持API level 8及以上的平台,官方强烈建议使用此支持包的方式来获取API
Android SDK Tools revision 需要22.2及以上
Android SDK Build-tools revision 需要18.1.0及以上
- 在project.properties文件中写入如下属性:
renderscript.target=18
renderscript.support.mode=true
或者在AS中的build.gradle的defaultConfig中添加
renderscriptTargetApi 18
renderscriptSupportModeEnabled true
注意:target的值应该为11及以上,但推荐使用18.如果在Manifest中配置的minSDK的值与target的值不相同,那么在编译的时候,将使用target的值替代Mainfest中的minSDK值。
2.2 编写RenderScript文件
RenderScript代码放在.rs或者.rsh文件中,在RenderScript代码中包含计算逻辑以及声明所有必须的变量和指针,通常一个.rs文件包含如下几个部分:
- 编译声明:#pragma rs java_package_name(package.name),比如#pragma rs java_package_name (com.willhua.RenderScript),用来声明本rs所在的java包。注意:.rs文件只能在应用程序包中,而不能在library项目中。
- 编译声明:#pragma version(1).声明RenderScript版本,现在都是1
- 主工作函数root().它会被RenderScript层的reForEach函数调用,实现多处理器对root工作的并行处理。Root函数必须返回void以及接受如下参数
1.分配给RenderScript的输入输出地址的指针。在Android3.2以及更低版本中,输入输出的指针都需要,在Android4.0及以后的版本中,给出其中一个或者两个都可以
- 2.下面两个参数是可选的,但是只要用了其中一个就必须两个都提供
a) 指向用户数据的指针。该数据会在RenderScript的计算中用到。该数据可以指向原始类型或者复杂结构类型
b) 用户数据的大小
从官方文档来看,老版本的文档中有介绍root,而新版本的则用kernel替代。官方在弱化root函数的概念,而是推荐使用kernel概念。本质上来说,root仅仅是一个写法形式上特殊的kernel而已。
- 可选init()函数。可以用来做任何初始化工作,比如初始化变量。它将会在每次RenderScript启动的时候,在其他任何代码之前执行一次
- 一些invokable函数。这些函数都是单线程函数(kernel函数的工作则是并行工作的),你可以给这些函数传递任意数量的参数。这些函数将会在反射层中生成对应的版本,可以从Android framework中调用。这些函数一般用来做一些初始化工作或者当做计算任务中的一个串行计算单元任务。注意:invokable函数不能是static的。
- 一些计算内核(compute kernel)。计算内核是并行执行的,它将并行处理输入Allocation中的每一个Element。一个简单的compute kernel如下:
uchar4 __attribute__((kernel)) invert(uchar4 in, uint32_t x, uint32_t y) {
uchar4 out = in;
out.r = 255 - in.r;
out.g = 255 - in.