【转帖】彩色转灰度算法彻底学习

/ 0评 / 1

一、基础

对于彩色转灰度,有一个很著名的心理学公式:

Gray = R*0.299 + G*0.587 + B*0.114

二、整数算法

而实际应用时,希望避免低速的浮点运算,所以需要整数算法。

注意到系数都是3位精度的没有,我们可以将它们缩放1000倍来实现整数运算算法:

Gray = (R*299 + G*587 + B*114 + 500) / 1000

RGB一般是8位精度,现在缩放1000倍,所以上面的运算是32位整型的运算。注意后面那个除法是整数除法,所以需要加上500来实现四舍五入。

就是由于该算法需要32位运算,所以该公式的另一个变种很流行:

Gray = (R*30 + G*59 + B*11 + 50) / 100

但是,虽说上一个公式是32位整数运算,但是根据80x86体系的整数乘除指令的特点,是可以用16位整数乘除指令来运算的。而且现在32位早普及了(AMD64都出来了),所以推荐使用上一个公式。

三、整数移位算法

上面的整数算法已经很快了,但是有一点仍制约速度,就是最后的那个除法。移位比除法快多了,所以可以将系数缩放成 2的整数幂。

习惯上使用16位精度,2的16次幂是65536,所以这样计算系数:

0.299 * 65536 = 19595.264 ≈ 19595

0.587 * 65536 + (0.264) = 38469.632 + 0.264 = 38469.896 ≈ 38469

0.114 * 65536 + (0.896) = 7471.104 + 0.896 = 7472

可能很多人看见了,我所使用的舍入方式不是四舍五入。四舍五入会有较大的误差,应该将以前的计算结果的误差一起计算进去,舍入方式是去尾法:

写成表达式是:

Gray = (R*19595 + G*38469 + B*7472) >> 16

2至20位精度的系数:

Gray = (R*1 + G*2 + B*1) >> 2

Gray = (R*2 + G*5 + B*1) >> 3

Gray = (R*4 + G*10 + B*2) >> 4

Gray = (R*9 + G*19 + B*4) >> 5

Gray = (R*19 + G*37 + B*8) >> 6

Gray = (R*38 + G*75 + B*15) >> 7

Gray = (R*76 + G*150 + B*30) >> 8

Gray = (R*153 + G*300 + B*59) >> 9

Gray = (R*306 + G*601 + B*117) >> 10

Gray = (R*612 + G*1202 + B*234) >> 11

Gray = (R*1224 + G*2405 + B*467) >> 12

Gray = (R*2449 + G*4809 + B*934) >> 13

Gray = (R*4898 + G*9618 + B*1868) >> 14

Gray = (R*9797 + G*19235 + B*3736) >> 15

Gray = (R*19595 + G*38469 + B*7472) >> 16

Gray = (R*39190 + G*76939 + B*14943) >> 17

Gray = (R*78381 + G*153878 + B*29885) >> 18

Gray = (R*156762 + G*307757 + B*59769) >> 19

Gray = (R*313524 + G*615514 + B*119538) >> 20

仔细观察上面的表格,这些精度实际上是一样的:3与4、7与8、10与11、13与14、19与20

所以16位运算下最好的计算公式是使用7位精度,比先前那个系数缩放100倍的精度高,而且速度快:

Gray = (R*38 + G*75 + B*15) >> 7

其实最有意思的还是那个2位精度的,完全可以移位优化:

Gray = (R + (WORD)G<<1 + B) >> 2

由于误差很大,所以做图像处理绝不用该公式(最常用的是16位精度)。但对于游戏编程,场景经常变化,用户一般不可能观察到颜色的细微差别,所以最常用的是2位精度。
c#代码

 /// <summary>

        /// 彩色图片转换成灰度图片代码

        /// </summary>

        /// <param name="img">源图片</param>

        /// <returns></returns>

        public Bitmap BitmapConvetGray(Bitmap img)

        {

            int h = img.Height;

            int w = img.Width;

            int gray = 0;    //灰度值

            Bitmap bmpOut = new Bitmap(w, h, PixelFormat. Format24bppRgb);    //每像素3字节

            BitmapData dataIn = img.LockBits(new Rectangle(0, 0, w, h), ImageLockMode.ReadOnly, PixelFormat.Format24bppRgb);

            BitmapData dataOut = bmpOut.LockBits(new Rectangle(0, 0, w, h), ImageLockMode.ReadWrite, PixelFormat.Format24bppRgb);

            unsafe

            {

                byte* pIn = (byte*)(dataIn.Scan0.ToPointer());       //指向源文件首地址

                byte* pOut = (byte*)(dataOut.Scan0.ToPointer());   //指向目标文件首地址

                for (int y = 0; y < dataIn.Height; y++) //列扫描

                {

                    for (int x = 0; x < dataIn.Width; x++)   //行扫描

                    {

                        gray = (pIn[0] * 19595 + pIn[1] * 38469 + pIn[2] * 7472) >> 16; //灰度计算公式

                        pOut[0] = (byte)gray;     //R分量

                        pOut[1] = (byte)gray;     //G分量

                        pOut[2] = (byte)gray;     //B分量

                        pIn += 3; pOut += 3;      //指针后移3个分量位置

                    }

                    pIn += dataIn.Stride - dataIn.Width * 3;

                    pOut += dataOut.Stride - dataOut.Width * 3;

                }

            }

            bmpOut.UnlockBits(dataOut);

            img.UnlockBits(dataIn);

            return bmpOut;

        }

注:

理解Stride:假设有一张图片宽度为6,因为是Format24bppRgb格式(每像素3字节。否则Bitmap默认24位RGB)的,显然,每一行需要6*3=18个字节存储。对于Bitmap就是如此。但对于C# BitmapData,虽然BitmapData.Width还是等于Bitmap.Width,但大概是出于显示性能的考虑,每行的实际的字节数将变成大于等于它的那个离它最近的4的整倍数,此时的实际字节数就是Stride.就此例而言,18不是4的整倍数,而比18大的离18最近的4的倍数是20,所以这个BitmapData.Stride = 20.显然,当宽度本身就是4的倍数时,BitmapData.Stride = Bitmap.Width * 3.画个图可能更好理解。R、G、B 分别代表3个原色分量字节,BGR就表示一个像素。为了看起来方便在每个像素之间插了个空格,实际上是没有的。X表示补足4的倍数而自动插入的字节。为了符合人类的阅读习惯分行了,其实在计算机内存中应该看成连续的一大段。

该代码在VS2008中编译通过,当使用unsafe关键字时,项目的属性-->生成-->勾选"允许使用不安全代码"

发表评论

邮箱地址不会被公开。 必填项已用*标注