2024最新版JavaScript逆向爬虫教程-------基础篇之JavaScript混淆原理

目录

  • 一、常量的混淆原理
    • 1.1 对象属性的两种访问方式
    • 1.2 十六进制字符串
    • 1.3 Unicode字符串
    • 1.4 字符串的ASCII码混淆
    • 1.5 字符串常量加密
    • 1.6 数值常量加密
  • 二、增加 JS 逆向者的工作量
    • 2.1 数组混淆
    • 2.2 数组乱序
    • 2.3 花指令
    • 2.4 jsfuck
  • 三、代码执行流程的防护原理
    • 3.1 流程平坦化
    • 3.2 逗号表达式混淆
  • 四、其他代码防护方案
    • 4.1 eval加密
    • 4.2 内存爆破
    • 4.3 检测代码是否格式化

一、常量的混淆原理

示例代码:

Date.prototype.format = function (formatStr) {
    let str = formatStr;
    let Week = ['日', '一', '二', '三', '四', '五', '六'];
    str = str.replace(/yyyy|YYYY/, this.getFullYear());
    // console.log(str);
    str = str.replace(/MM/, (this.getMonth() + 1) > 9 ? (this.getMonth() + 1)
        .toString() : '0' + (this.getMonth() + 1));
    // console.log(str);
    str = str.replace(/dd|DD/, this.getDate() > 9 ? this.getDate().toString() : '0' + this.getDate());
    // console.log(str);
    return str;
}
// console.log(new Date());  // 2022-04-25T05:25:36.856Z
console.log(new Date().format('yyyy-MM-dd')); //2024-05-01
console.log(new Date().getFullYear()) //2024
console.log(new Date().getMonth()) //4 当前月份为结果+1
//输出结果 2022-04-25

上面的代码用于格式化时间,这段代码整体上来讲逻辑简单清晰,即在 Date 的原型对象上,增加了一个 format 方法,当实例化一个 Date 对象后,就可以直接调用从 Date 原型对象上继承过来的 format 方法。上面代码没有经过任何处理,任何查看脚本的开发者 (js0基础的不算,嘿嘿) 都可以清楚地理解本段代码内容,假如这是某网站开发人员编写的一段关键代码,那么在代码发布后,很容易被第三方破解利用,从而引发安全问题,因此学习 JS 代码的防护技术就显得格外重要了。

ps:学习 JavaScript 混淆原理是非常有必要的,原因:

  1. 学好 AST 混淆和还原 JavaScript 代码的基础
  2. 招聘要求,越来越多的招聘要求爬虫人员懂 JavaScript 防护技术(逆向是越来越卷了)

1.1 对象属性的两种访问方式

示例代码:

let person = {
    'name': 'amo',
    'age': 18,
    'address': '重庆市红鼎国际',
    eat: function () {
        console.log(this.name + '~eating')
    }
}

// ①: person.name,name是一个标识符,必须明确出现在代码中,不能进行加密与拼接
console.log(person.name)
person.eat()
// ②: person['name'],该种方式name是一个字符串,既然是字符串,访问的时候就可以进行加密与拼接
// 在js混淆中一般会选择用这种方式来访问属性,操作空间更大
console.log(person['name'])
person['eat']()

访问对象的方法也可以通过 [] 的方式,因为对象的方法可以看作特殊的属性,它是一种值为函数的属性。将 一、常量的混淆原理 中的示例代码可以转换为如下形式:

let window = globalThis;

// Date.prototype.format = function (formatStr) {
Date['prototype']['format'] = function (formatStr) {
    let str = formatStr;
    let Week = ['日', '一', '二', '三', '四', '五', '六'];
    // str = str.replace(/yyyy|YYYY/, this.getFullYear());
    str = str['replace'](/yyyy|YYYY/, this['getFullYear']());
    // console.log(str);

    // str = str.replace(/MM/, (this.getMonth() + 1) > 9 ? (this.getMonth() + 1)
    //     .toString() : '0' + (this.getMonth() + 1));
    str = str['replace'](/MM/, (this['getMonth']() + 1) > 9 ? (this['getMonth']() + 1)
        ['toString']() : '0' + (this['getMonth']() + 1));

    // console.log(str);
    // str = str.replace(/dd|DD/, this.getDate() > 9 ? this.getDate().toString() : '0' + this.getDate());
    str = str['replace'](/dd|DD/, this['getDate']() > 9 ? this['getDate']()['toString']() : '0'
        + this['getDate']());
    // console.log(str);
    return str;
}
// console.log(new Date());  // 2022-04-25T05:25:36.856Z
console.log(new window['Date']()['format']('yyyy-MM-dd')); //2024-05-01
console.log(new window['Date']()['getFullYear']()) //2024
console.log(new window['Date']()['getMonth']()) //4 当前月份为结果+1
//输出结果 2022-04-25

Date 是 JS 的内置对象,在 JS 中,很多内置对象都是 window 的属性 (上面的代码由于笔者是在 node.js 中运行的,故将 window 指向了 globalThis), 所以 JS 中的内置对象和客户端 JS 中的 DOM 对于 JS 的防护与逆向极为重要。在真实浏览器环境中,代码中定义的全局变量 (var) 都是全局对象 window 的属性,定义的全局函数都是全局对象 window 的方法,全局对象的属性或者方法在调用时,可以省略全局对象名,例如:window.btoa('a') 等同于 btoa('a'),如果要把 btoa 变为字符串,前面就必须加 window,如上面的示例代码:new window['Date']()

1.2 十六进制字符串

改变对象属性的访问方式后,代码的阅读性仍然较高,要继续进行复杂化处理。因为 JS 中的字符串支持以十六进制形式表示,所以可以用十六进制形式代替原有的字符串。如:amo,可以表示成 '\x61\x6d\x6f',其中字符 a 转换为字节,再用十六进制表示就是 61(字符 a 的 Hex 形式的 ASCII 码 )。ps:在 JavaScript 中,使用 \x十六进制 来定义一个十六进制的字符串字面量。 可以使用以下代码,完成十六进制字符串的转换。

function charToHex(characters) {
    let hexString = ''
    for (let i = 0; i < characters.length; i++) {
        // ①: charCodeAt()方法用来取出字符串中对应索引字符的ASCII码
        // ②: toString(16)转换为十六进制
        const hexCode = characters[i].charCodeAt(0).toString(16);
        // ③与\x进行拼接
        hexString += `\\x${hexCode}`
    }
    return hexString;
}

// 示例代码
const codes = 'amoGood';
const hexString = charToHex(codes);
console.log(hexString)

1.1 对象属性的两种访问方式 中的代码转换为如下形式:

let window = globalThis;

// Date.prototype.format = function (formatStr) {
// Date['prototype']['format'] = function (formatStr) {
Date['\x70\x72\x6f\x74\x6f\x74\x79\x70\x65']['\x66\x6f\x72\x6d\x61\x74'] = function (formatStr) {
    let str = formatStr;
    let Week = ['日', '一', '二', '三', '四', '五', '六'];
    // str = str.replace(/yyyy|YYYY/, this.getFullYear());
    // str = str['replace'](/yyyy|YYYY/, this['getFullYear']());
    str = str['\x72\x65\x70\x6c\x61\x63\x65'](/yyyy|YYYY/,
        this['\x67\x65\x74\x46\x75\x6c\x6c\x59\x65\x61\x72']());
    // console.log(str);

    // str = str.replace(/MM/, (this.getMonth() + 1) > 9 ? (this.getMonth() + 1)
    //     .toString() : '0' + (this.getMonth() + 1));
    // str = str['replace'](/MM/, (this['getMonth']() + 1) > 9 ? (this['getMonth']() + 1)
    //     ['toString']() : '0' + (this['getMonth']() + 1));

    str = str['\x72\x65\x70\x6c\x61\x63\x65'](/MM/,
        (this['\x67\x65\x74\x4d\x6f\x6e\x74\x68']() + 1) > 9 ?
            (this['\x67\x65\x74\x4d\x6f\x6e\x74\x68']() + 1)
                ['\x67\x65\x74\x4d\x6f\x6e\x74\x68']() : '0' +
            (this['\x67\x65\x74\x4d\x6f\x6e\x74\x68']() + 1));

    // console.log(str);
    // str = str.replace(/dd|DD/, this.getDate() > 9 ? this.getDate().toString() : '0' + this.getDate());
    // str = str['replace'](/dd|DD/, this['getDate']() > 9 ? this['getDate']()['toString']() : '0'
    //     + this['getDate']());

    str = str['\x72\x65\x70\x6c\x61\x63\x65'](/dd|DD/,
        this['\x67\x65\x74\x44\x61\x74\x65']() > 9 ?
            this['\x67\x65\x74\x44\x61\x74\x65']()['\x74\x6f\x53\x74\x72\x69\x6e\x67']() : '0'
            + this['\x67\x65\x74\x44\x61\x74\x65']());
    return str;
}
// console.log(new Date());  // 2022-04-25T05:25:36.856Z
console.log(new window['\x44\x61\x74\x65']()['\x66\x6f\x72\x6d\x61\x74']('yyyy-MM-dd')); //2024-05-01
console.log(new window['\x44\x61\x74\x65']()['\x67\x65\x74\x46\x75\x6c\x6c\x59\x65\x61\x72']()) //2024
console.log(new window['\x44\x61\x74\x65']()['\x67\x65\x74\x4d\x6f\x6e\x74\x68']()) //4 当前月份为结果+1
//输出结果 2022-04-25

这种混淆方式很容易被还原,不会大量应用,只用在无法加密的字符串上。十六进制字符串的还原方法很简单,把字符串放到控制台中输出即可。

1.3 Unicode字符串

在 JavaScript 中,可以使用 Unicode 编码来定义字符串。Unicode 编码通常以 \u 开头,后跟四位十六进制数,不足四位的补0。例如,表示字母 "A" 的 Unicode 编码是 \u0041。以下是使用 Unicode 编码定义字符串的示例:

let unicodeString1 = '\u0061\u006d\u006f'; // 定义一个包含"amo"的字符串
console.log(unicodeString1); // 输出: amo

let unicodeString2 = '\u91cd\u5e86\u5e02\u7ea2\u9f0e\u56fd\u9645'; //定义一个包含"重庆市红鼎国际"的字符串
console.log(unicodeString2); // 输出: 重庆市红鼎国际

可以使用以下代码完成 Unicode 转换:

function charToUnicode(characters) {
    let unicodeString = ''
    for (let i = 0; i < characters.length; i++) {
        // ①: charCodeAt()方法用来取出字符串中对应索引字符的ASCII码
        // ②: toString(16)转换为十六进制
        const hexCode = characters[i].charCodeAt(0).toString(16);
        // ③与\x进行拼接
        unicodeString += hexCode.length < 4 ? `\\u00${hexCode}` : `\\u${hexCode}`
    }
    return unicodeString;
}

JS 中的标识符也支持 Unicode 形式表示,因此之前代码中的 format、Week、str、formatStr、window 等都支持以 Unicode 形式表示,将 将 1.2 十六进制字符串 中的代码转换为如下形式 (只处理部分代码)

let window = globalThis;

Date['\u0070\u0072\u006f\u0074\u006f\u0074\u0079\u0070\u0065']
    ['\x66\x6f\x72\x6d\x61\x74'] = function (formatStr) {
    let \u0073\u0074\u0072 = \u0066\u006f\u0072\u006d\u0061\u0074\u0053\u0074\u0072;
    let \u0057\u0065\u0065\u006b = ['\u65e5', '\u4e00', '\u4e8c', '\u4e09',
        '\u56db', '\u4e94', '\u516d'];
    \u0057\u0065\u0065\u006b = \u0073\u0074\u0072['\x72\x65\x70\x6c\x61\x63\x65'](/yyyy|YYYY/,
        this['\x67\x65\x74\x46\x75\x6c\x6c\x59\x65\x61\x72']());

    \u0057\u0065\u0065\u006b = \u0057\u0065\u0065\u006b['\x72\x65\x70\x6c\x61\x63\x65'](/MM/,
        (this['\x67\x65\x74\x4d\x6f\x6e\x74\x68']() + 1) > 9 ?
            (this['\x67\x65\x74\x4d\x6f\x6e\x74\x68']() + 1)
                ['\x67\x65\x74\x4d\x6f\x6e\x74\x68']() : '0' +
            (this['\x67\x65\x74\x4d\x6f\x6e\x74\x68']() + 1));

    \u0057\u0065\u0065\u006b = \u0057\u0065\u0065\u006b['\x72\x65\x70\x6c\x61\x63\x65'](/dd|DD/,
        this['\x67\x65\x74\x44\x61\x74\x65']() > 9 ?
            this['\x67\x65\x74\x44\x61\x74\x65']()['\x74\x6f\x53\x74\x72\x69\x6e\x67']() : '0'
            + this['\x67\x65\x74\x44\x61\x74\x65']());
    return \u0057\u0065\u0065\u006b;
}
// console.log(new Date());  // 2022-04-25T05:25:36.856Z
console.log(new \u0077\u0069\u006e\u0064\u006f\u0077
    ['\x44\x61\x74\x65']()['\x66\x6f\x72\x6d\x61\x74']('yyyy-MM-dd')); //2024-05-01
console.log(new window['\x44\x61\x74\x65']()['\x67\x65\x74\x46\x75\x6c\x6c\x59\x65\x61\x72']()) //2024
console.log(new window['\x44\x61\x74\x65']()['\x67\x65\x74\x4d\x6f\x6e\x74\x68']()) //4 当前月份为结果+1
//输出结果 2022-04-25

在使用 \u0073\u0074\u0072 定义变量后,依然能够使用对应的 str 来引用变量。在实际 JS 混淆应用中,标识符一般不会替换成 Unicode 形式,因为要还原它十分容易。通常的混淆方式是替换成没有语义,但看上去又很相似的名字,如:_0x278843,_0x278844_0x257799,或是由大写字母 O、小写字母 o、以及数字 0 组成的名字,Oo00Oo0、Oo00O0o 和 oO000Oo,注意标识符不允许以数字开头,与十六进制字符串一样,把字符串放到控制台中输出即可还原。

1.4 字符串的ASCII码混淆

使用以下代码将一个字符串转换为字节数组:

function stringToBytes(str) {
    const encoder = new TextEncoder(); // 创建TextEncoder实例
    return encoder.encode(str); // 将字符串转换为字节
}

// 使用例子
const str = "amo";
const bytes = stringToBytes(str);
console.log(bytes)

'yyyy-MM-dd' 字符串转换为字节数组是 [121,121,121,121,45,77,77,45,100,100],因此代码中的 'yyyy-MM-dd',可以表示为:

//String.fromCharCode()方法将Unicode值转换为字符 接受的是可变长度的数值类型的参数
//String.fromCharCode()方法接收的参数类型并非数组,如果想要传递数组,可以使用String.fromCharCode.apply
String.fromCharCode.apply(null,[121, 121, 121, 121, 45, 77, 77, 45, 100, 100]))

ASCII 码混淆不仅用来做字符串混淆,还可以用来做代码混淆。以下面这段代码为例:

Date.prototype.format = function (formatStr) {
    let str = formatStr;
    let Week = ['日', '一', '二', '三', '四', '五', '六'];
    // str = str.replace(/yyyy|YYYY/, this.getFullYear());
    // 字符串的ASCII码混淆 等同于上面的代码 str = str.replace(/yyyy|YYYY/, this.getFullYear());
    eval(String.fromCharCode.apply(null, [
            115, 116, 114, 32, 61, 32, 115, 116, 114, 46,
            114, 101, 112, 108, 97, 99, 101, 40, 47, 121,
            121, 121, 121, 124, 89, 89, 89, 89, 47, 44,
            32, 116, 104, 105, 115, 46, 103, 101, 116, 70,
            117, 108, 108, 89, 101, 97, 114, 40, 41, 41,
            59
        ]
    )) // 由于str = str.replace(/yyyy|YYYY/, this.getFullYear());变成了字符串,故执行需要依赖于eval函数
    str = str.replace(/MM/, (this.getMonth() + 1) > 9 ? (this.getMonth() + 1)
        .toString() : '0' + (this.getMonth() + 1));
    // console.log(str);
    str = str.replace(/dd|DD/, this.getDate() > 9 ? this.getDate().toString() : '0' + this.getDate());
    // console.log(str);
    return str;
}
// console.log(new Date());  // 2022-04-25T05:25:36.856Z
console.log(new Date().format('yyyy-MM-dd')); //2024-05-01
console.log(new Date().getFullYear()) //2024
console.log(new Date().getMonth()) //4 当前月份为结果+1

1.5 字符串常量加密

字符串常量加密的核心思想是,先把字符串加密得到密文,然后在使用前调用对应的解密去解密得到明文,代码中仅出现解密函数和密文,当然也可以使用不同的加密方法去加密字符串,再调用不同的解密函数去解密。示例代码:

Date.prototype.format = function (formatStr) {
    let str = formatStr;
    str = str['replace'](/yyyy|YYYY/, this['getFullYear']());
    console.log(str)
}
new Date().format('yyyy'); //2024

将上述代码中的所有字符串进行加密,此处仅为了演示,故采用最简单的 Base64 编码,如下:

console.log(btoa('replace')) // cmVwbGFjZQ==
console.log(btoa('getFullYear')) // Z2V0RnVsbFllYXI=
console.log(btoa('yyyy')) // eXl5eQ==

处理后的代码为:

Date.prototype.format = function (formatStr) {
    let str = formatStr;
    // 字符串加密后,需要把对应的解密函数也放入代码中,才能正常运行
    // btoa: 用来编码,atob: 用来解码 这里使用的是node.js中自带的,在实际的混淆应用中,还是自己实现比较好
    str = str[atob('cmVwbGFjZQ==')](/yyyy|YYYY/, this[atob('Z2V0RnVsbFllYXI=')]());
    console.log(str)
}
new Date().format(atob('eXl5eQ==')); //2024

在实际混淆应用中,标识符必须处理成没有语义的,不然很容易就定位到关键代码。此外,建议减少使用系统自带的函数,自己去实现相应的函数,因为不管如何混淆,最终执行过程中,系统函数的名字是固定的,通过 Hook 技术极易定位到关键代码。根据写法的不同,代码中有一些字符串常量没法加密和拼接,如以下代码:

let person = {
    // 'name': 'amo', //正确写法
    // '\x6e\x61\x6d\x65': 'amo', //正确写法
    // '\x6e\x61\x6d\x65': 'amo', //正确写法
    '\u006e\u0061\u006d\u0065': 'amo', //正确写法
    // atob('bmFtZQ=='): 'amo', //直接报错
    'age': 18,
    'address': '重庆市红鼎国际',
    eat: function () {
        console.log(this.name + '~eating')
    }
}
console.log(person.name)
console.log(btoa('name'))
let person2 = {}
let str = 'na'
person2[str + 'me'] = 'Amo'
console.log(person2.name) // 用这种方式给对象增加属性,属性名可以加密和拼接

1.6 数值常量加密

算法加密过程中,会使用一些固定的数值常量,如 MD5 中的常量 0x67452301、0xefcdab89、0x98badcfe 和 0x10325476,以及 sha1 中的常量 0x67452301、0xefcdab89、0x98badcfe、0x10325476 和 0xc3d2e1f0。因此,在标准算法逆向中,会通过搜索这些数值常量,来定位代码关键位置,或者确定使用的是哪个算法。当然,在代码中不一定会写十六进制形式,如 0x67452301,在代码中可能会写成十进制的 1732584193。为了安全起见,可以把这些数值常量也进行简单加密。可以利用位异或的特性来加密。例如,如果 a^b=c,那么 c^b=a。以 sha1 算法中的 0xc3d2e1f0 常量为例,0xc3d2e1f0^0x12345678=0xd1e6b788,那么在代码中可以用 0xd1e6b788^0x12345678 来代替 0xc3d2e1f0,其中 0x12345678 可以理解成密钥,它可以随机生成。上述方法中两个数字进行位异或,实际上就是一个二项式。

小结:混淆方案不一定是单一使用,各种方案之间可以结合使用。

二、增加 JS 逆向者的工作量

一、常量的混淆原理 中介绍了一部分的混淆手段,现在我们应该对 JS 混淆有了一定的认识,但实际上只是处理了一些常量,防护力度并不高。混淆的目的是为了增加破解的难度和时间,因此本小节从这方面入手,继续介绍更加深入的内容。

2.1 数组混淆

之前的示例代码中,在改变对象属性的访问方式后,产生了很多原本没有的字符串。虽然在前面的介绍中,已经对它们做了一系列的处理,但是遇到有混淆逆向经验的逆向开发者,破解这里的混淆十分容易,本小节的方案是将所有的字符串都提取到一个数组中,然后在需要引用字符串的地方,全部都以数组下标的方式访问数组成员。例如:

let bigArr = ['Date', 'getTime', 'log'];
console[bigArr[2]](new window[bigArr[0]]()[bigArr[1]]());
console.log(new window.Date().getTime()) // 1714585619000

这里展示的代码,阅读难度已经大大增加。当代码为上千行,数组提取的字符串也有上千个。在代码中要引用字符串时,全都以 bigArr[1001]bigArr[1002] 访问,就会大大增加理解难度,不容易建立对应关系。在其他静态编程语言中,同一个数组只能存放同一种类型。但是 JavaScript 语法灵活,同一个数组中,可以同时存放各种类型,如布尔值、字符串、数值、数组、对象和函数等。例如:

let bigArr = [
    false,
    'Amo',
    1314520,
    [13, 14, 520],
    {'name': 'amo', 'age': 18},
    function () {
        console.log('hello')
    }
]
console.log(bigArr[0])
console.log(bigArr[1])
console.log(bigArr[2])
console.log(bigArr[3])
console.log(bigArr[4])
bigArr[5]()

因此,可以把代码中的一部分函数以及字符串提取到大数组中。为了安全,通常会对提取到数组中的字符串进行加密处理,把代码处理成字符串就可以进行加密了。对于之前格式化日期的函数,改写为以下形式:

let window = globalThis;
let bigArr = ['\u65e5', '\u4e00', '\u4e8c', '\u4e09',
    '\u56db', '\u4e94', '\u516d', 'cmVwbGFjZQ==', 'Z2V0TW9udGg=', 'dG9TdHJpbmc=',
    'Z2V0RGF0ZQ==', 'RGF0ZQ==', ''['constructor']['fromCharCode']];

Date.\u0070\u0072\u006f\u0074\u006f\u0074\u0079\u0070\u0065['\x66\x6f\x72\x6d\x61\x74'] =
    function (formatStr) {
        let \u0073\u0074\u0072 = \u0066\u006f\u0072\u006d\u0061\u0074\u0053\u0074\u0072;
        let Week = [bigArr[0], bigArr[1], bigArr[2], bigArr[3], bigArr[4], bigArr[5], bigArr[6]];
        eval(bigArr[12][atob('YXBwbHk=')](null, [
                115, 116, 114, 32, 61, 32, 115, 116, 114, 46,
                114, 101, 112, 108, 97, 99, 101, 40, 47, 121,
                121, 121, 121, 124, 89, 89, 89, 89, 47, 44,
                32, 116, 104, 105, 115, 46, 103, 101, 116, 70,
                117, 108, 108, 89, 101, 97, 114, 40, 41, 41,
                59
            ]
        ))
        str = str[atob(bigArr[7])](/MM/, (this[atob(bigArr[8])]() + 1) > 9 ?
            (this[atob(bigArr[8])]() + 1)
                [atob(bigArr[9])]() : '0' + (this[atob(bigArr[8])]() + 1));
        str = str[atob(bigArr[7])](/dd|DD/, this[atob(bigArr[10])]() > 9 ?
            this[atob(bigArr[10])]()[atob(bigArr[9])]() : '0'
            + this[atob(bigArr[10])]());
        return str;
    }
console.log(new \u0077\u0069\u006e\u0064\u006f\u0077[atob(bigArr[11])]()['\x66\x6f\x72\x6d\x61\x74']
('\u0079\u0079\u0079\u0079\u002d\u004d\u004d\u002d\u0064\u0064')); //2024-05-02
console.log(new \u0077\u0069\u006e\u0064\u006f\u0077[atob(bigArr[11])]()
    ['\x67\x65\x74\x46\x75\x6c\x6c\x59\x65\x61\x72']()) //2024
console.log(new \u0077\u0069\u006e\u0064\u006f\u0077[atob(bigArr[11])]()
    ['\x67\x65\x74\x4d\x6f\x6e\x74\x68']() + 1) //5 当前月份为结果+1

这段代码在不使用动态调试,也不使用 AST 的情况下,可读性非常差,但是 JS 代码混淆仍可继续。

2.2 数组乱序

观察 2.1 数组混淆 小节中处理后的代码,数组成员与被引用的地方是一一对应的。如引用 bigArr[12] 的地方,需要的是 String.fromCharCode 函数,而该数组中下标为 12 的成员,也是这个函数。将数组顺序打乱可以解决这个问题,不过在数组顺序混乱后,本身的代码也引用不到正确的数组成员。此处的解决方案是,在代码中内置一段还原顺序的代码。可以使用以下代码打乱数组顺序:

let bigArr = ['\u65e5', '\u4e00', '\u4e8c', '\u4e09',
    '\u56db', '\u4e94', '\u516d', 'cmVwbGFjZQ==', 'Z2V0TW9udGg=', 'dG9TdHJpbmc=',
    'Z2V0RGF0ZQ==', 'RGF0ZQ==', ''['constructor']['fromCharCode']];
(function (arr, num) {
    let foo = function (nums) {
        while (--nums) {
            // 弹出数组的最后一个元素并将其追加到数组的首位
            arr.unshift(arr.pop());
        }
    }
    foo(++num);
})(bigArr, 0x20);
console.log(bigArr)

在这段代码中,有一个自执行的匿名函数,实参部分传入的是数组和一个任意数值,在这个函数内部通过对数组进行弹出和压入操作来打乱顺序,除此之外,只要控制台输出,Unicode 处理后的字符串就变成原来的中文,这就是之前说的十六进制字符串和 Unicode 都很容易被还原。String.fromCharCode 函数被移动到了下标为 5 的地方,但代码处引用的仍是 bigArr[12],所以需要把还原数组顺序的函数放入代码中,还原数组顺序的代码逆向编写即可,如下所示:

(function (arr, num) {
    let foo = function (nums) {
        while (--nums) {
            // 移除数组的第一个元素并将其追加到数组的尾部
            arr.push(arr.shift());
        }
    }
    foo(++num);
})(bigArr, 0x20);

console.log(bigArr)

ps:还原数组顺序中的函数用到的字符串,不能再提取到 bigArr 中。

2.3 花指令

添加一些没有意义却可以混淆视听的代码,是花指令的核心。这里介绍一种比较简单的花指令实现方式,举个例子:

str = str.replace(/MM/, (this.getMonth() + 1) > 9 ? (this.getMonth() + 1)
        .toString() : '0' + (this.getMonth() + 1));

this.getMonth() + 1 这个二项式改为如下形式:

function _0x20ab1fxe1(a, b) {
    return a + b;
}
// _0x20ab1fxe1(this.getMonth(), 1)
 str = str.replace(/MM/, _0x20ab1fxe1(this.getMonth(), 1) > 9 ? _0x20ab1fxe1(this.getMonth(), 1)
        .toString() : '0' + _0x20ab1fxe1(this.getMonth(), 1));

本质是把二项式拆开成三部分:二项式的左边、二项式的右边和运算符。二项式的左边和右边作为另外一个函数的两个参数,二项式的运算符作为该函数的运行逻辑。这个函救本身是没有意义的,但它能瞬间增加代码量,从而增加 JavaScript 逆向者的工作量。二项式转变为函数时,进行多级嵌套,代码如下:

function _0x20ab1fxe1(a, b) {
    return a + b;
}

function _0x20ab1fxe2(a, b) {
    return _0x20ab1fxe1(a, b);
}
// _0x20ab1fxe2(this.getMonth(), 1)
str = str.replace(/MM/, _0x20ab1fxe2(this.getMonth(), 1) > 9 ? _0x20ab1fxe2(this.getMonth(), 1)
        .toString() : '0' + _0x20ab1fxe2(this.getMonth(), 1));

这个案例较为简单,但是在实际混淆中,代码可能有几千行,函数定义部分与调用部分往往相差甚远。另外具有相同运算符的二项式,并不是一定要调用相同的函数,如把 '0'+(this.getMonth()+1) 这个二项式改为如下所示代码:

function _0x20ab1fxe1(a, b) {
    return a + b;
}

function _0x20ab1fxe2(a, b) {
    return _0x20ab1fxe1(a, b);
}

function _0x20ab1fxe3(a, b) {
    return a + b;
}

function _0x20ab1fxe4(a, b) {
    return _0x20ab1fxe3(a, b);
}

str = str.replace(/MM/, _0x20ab1fxe2(this.getMonth(), 1) > 9 ? _0x20ab1fxe2(this.getMonth(), 1)
        .toString() : _0x20ab1fxe4('0', _0x20ab1fxe1(this.getMonth(), 1)));

上面介绍的是二项式转变为函数的花指令,其实函数调用表达式也可以处理成类似的花指令。代码如下:

function _0x20ab1fxe7(a, b, c) {
    return a.apply(b, c);
}

str = _0x20ab1fxe7(str.replace, str, [
        /MM/,
        (this.getMonth() + 1) > 9 ? (this.getMonth() + 1)
            .toString() : '0' + (this.getMonth() + 1)]);

花指令的生成方案,并不是只有这些。文章后续还会演示另外一种插入花指令的方式。

2.4 jsfuck

样例参考:https://jsfuck.com/
jsfuck 也可以算是一种编码,它能把 JS 代码转化成只用 6 个字符就可以表示的代码并可以正常执行,这 6 个字符分别是 (、+、!、[、]、)。转换后的 JS 代码难以阅读,可作为简单的保密措施,如数值常量 8 转成 jsfuck 后为:

[][(![]+[])[+[]]+(![]+[])[!+[]+!+[]]+(![]+[])[+!+[]]+(!![]+[])[+[]]][([][(![]+[])[+[]]+(![]+[])[!+[]+!+[]]+(![]+[])[+!+[]]+(!![]+[])[+[]]]+[])[!+[]+!+[]+!+[]]+(!![]+[][(![]+[])[+[]]+(![]+[])[!+[]+!+[]]+(![]+[])[+!+[]]+(!![]+[])[+[]]])[+!+[]+[+[]]]+([][[]]+[])[+!+[]]+(![]+[])[!+[]+!+[]+!+[]]+(!![]+[])[+[]]+(!![]+[])[+!+[]]+([][[]]+[])[+[]]+([][(![]+[])[+[]]+(![]+[])[!+[]+!+[]]+(![]+[])[+!+[]]+(!![]+[])[+[]]]+[])[!+[]+!+[]+!+[]]+(!![]+[])[+[]]+(!![]+[][(![]+[])[+[]]+(![]+[])[!+[]+!+[]]+(![]+[])[+!+[]]+(!![]+[])[+[]]])[+!+[]+[+[]]]+(!![]+[])[+!+[]]]((!![]+[])[+!+[]]+(!![]+[])[!+[]+!+[]+!+[]]+(!![]+[])[+[]]+([][[]]+[])[+[]]+(!![]+[])[+!+[]]+([][[]]+[])[+!+[]]+(+[![]]+[][(![]+[])[+[]]+(![]+[])[!+[]+!+[]]+(![]+[])[+!+[]]+(!![]+[])[+[]]])[+!+[]+[+!+[]]]+(!![]+[])[!+[]+!+[]+!+[]]+(+(!+[]+!+[]+!+[]+[+!+[]]))[(!![]+[])[+[]]+(!![]+[][(![]+[])[+[]]+(![]+[])[!+[]+!+[]]+(![]+[])[+!+[]]+(!![]+[])[+[]]])[+!+[]+[+[]]]+([]+[])[([][(![]+[])[+[]]+(![]+[])[!+[]+!+[]]+(![]+[])[+!+[]]+(!![]+[])[+[]]]+[])[!+[]+!+[]+!+[]]+(!![]+[][(![]+[])[+[]]+(![]+[])[!+[]+!+[]]+(![]+[])[+!+[]]+(!![]+[])[+[]]])[+!+[]+[+[]]]+([][[]]+[])[+!+[]]+(![]+[])[!+[]+!+[]+!+[]]+(!![]+[])[+[]]+(!![]+[])[+!+[]]+([][[]]+[])[+[]]+([][(![]+[])[+[]]+(![]+[])[!+[]+!+[]]+(![]+[])[+!+[]]+(!![]+[])[+[]]]+[])[!+[]+!+[]+!+[]]+(!![]+[])[+[]]+(!![]+[][(![]+[])[+[]]+(![]+[])[!+[]+!+[]]+(![]+[])[+!+[]]+(!![]+[])[+[]]])[+!+[]+[+[]]]+(!![]+[])[+!+[]]][([][[]]+[])[+!+[]]+(![]+[])[+!+[]]+((+[])[([][(![]+[])[+[]]+(![]+[])[!+[]+!+[]]+(![]+[])[+!+[]]+(!![]+[])[+[]]]+[])[!+[]+!+[]+!+[]]+(!![]+[][(![]+[])[+[]]+(![]+[])[!+[]+!+[]]+(![]+[])[+!+[]]+(!![]+[])[+[]]])[+!+[]+[+[]]]+([][[]]+[])[+!+[]]+(![]+[])[!+[]+!+[]+!+[]]+(!![]+[])[+[]]+(!![]+[])[+!+[]]+([][[]]+[])[+[]]+([][(![]+[])[+[]]+(![]+[])[!+[]+!+[]]+(![]+[])[+!+[]]+(!![]+[])[+[]]]+[])[!+[]+!+[]+!+[]]+(!![]+[])[+[]]+(!![]+[][(![]+[])[+[]]+(![]+[])[!+[]+!+[]]+(![]+[])[+!+[]]+(!![]+[])[+[]]])[+!+[]+[+[]]]+(!![]+[])[+!+[]]]+[])[+!+[]+[+!+[]]]+(!![]+[])[!+[]+!+[]+!+[]]]](!+[]+!+[]+!+[]+[!+[]+!+[]])+(![]+[])[+!+[]]+(![]+[])[!+[]+!+[]])()([!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]]+[])

接下来介绍 jsfuck 的基本原理,+ 是 JS 中的一个算术运算符,当它作为一元运算符使用时代表强转为数值类型,[] 在 JS 中表示空数组,因此 +[] 等于0,!+[] 等同于 !0,JS 是一种弱类型的语言,弱类型并不是代表没有类型,是指 JS 引擎会在适当的时候,自动完成类型的隐式转换。! 是 JS 中的取反,这时需要一个布尔值,在 JS 中,七种值为假值,其余均为真值,这七种值分别是 false,undefined,null,0,-0,NaN,""。因此,0 转换为布尔值为 false,再取反就是 true,也就是 !+[] === true。又如 !![],数组转换成布尔值为 true,然后两次取反,依旧等于 true。JS 中的 + 作为二元运算符时,假如有一边是字符串,就代表着拼接;两边都没有字符串,就代表着数值相加,true 转换为数值等于1,剩余的部分原理相同,不再赘述。在实际开发中,jsfuck 的应用有限,只会应用于 JS 文件中的一部分代码,主要原因是它的代码量非常庞大且还原它较为容易,例如,把上述代码直接输入控制台运行,就会输出 8。一些网站之所以用它进行加密,是因为个别情况下,把整段 jsfuck 代码输入控制台运行会报错,尤其是当它跟别的代码混杂时。

ps,半淘汰加壳器系列: AAEncode、JJEncode、jsfuck,关于 AAEncode、JJEncode、jsfuck 具体的还原方式,笔者会在后续实战的文章中进行详细演示,这里就不再进行赘述。

三、代码执行流程的防护原理

经过 一、常量的混淆原理二、增加 JS 逆向者的工作量 两节的处理,虽然代码已经被混淆得 面目全非 了,但是执行流程还是跟原先一样。因此,本节从代码的执行流程入手,介绍更深入的代码防护方案。

3.1 流程平坦化

在一般的代码开发中,会有很多的流程控制相关代码,即代码中有很多分支,这些分支会具有一定的层级关系,在流程平坦化混淆中,会用到 switch 语句,因为 switch 语句中的 case 块是平级的,而且调换 case 块的前后顺序并不影响代码原先的执行逻辑。为了方便理解,这里举一个简单的例子,代码如下:

function test1() {
    var a = 1000;
    var b = a + 2000;
    var c = b + 3000;
    var d = c + 4000;
    var e = d + 5000;
    var f = e + 6000;
    return f;
}

console.log(test1());

混淆 test1 函数中的代码,代码如下:

function test3() {
    // ①:构造一个分发器,里面记录了代码执行的真实顺序。并把字符串通过split分割成一个数组
    var arr = 'z|t|y|u|a|d|7|c'.split('|');
    var index = 0;
    // ② 因为switch语句一次只能计算一次,故需要一个循环
    while (!![]) {
        //  ③ index作为计数器,每次递增,按顺序引用数组中的每一个成员
        // switch中把表达式的值与每个case的值进行对比(这里是===的匹配,不进行类型转换)
        switch (arr[index++]) {
            case 'a':
                var e = d + 5000;
                break;
            case 't':
                var b = a + 2000;
                break;
            case 'y':
                var c = b + 3000;
                break;
            case 'd':
                var f = e + 6000;
                break;
            case 7:
                var g = 100000;
                g = g + a + b + c + d;
                break;
            case 'c':
                return f;
            case 'z':
                var a = 1000;
                break;
            case 'u':
                var d = c + 4000;
                break;
        }
    }
}

console.log(test3());

在了解了简单的案例后,对 2.1 数组混淆 一节中的代码做进一步混淆,处理后的代码如下:

let window = globalThis;
let bigArr = ['\u65e5', '\u4e00', '\u4e8c', '\u4e09',
    '\u56db', '\u4e94', '\u516d', 'cmVwbGFjZQ==', 'Z2V0TW9udGg=', 'dG9TdHJpbmc=',
    'Z2V0RGF0ZQ==', 'RGF0ZQ==', ''['constructor']['fromCharCode']];

Date.\u0070\u0072\u006f\u0074\u006f\u0074\u0079\u0070\u0065['\x66\x6f\x72\x6d\x61\x74'] =
    function (formatStr) {
        // 定义分发器
        let arr = 'z|t|y|u|a|d|7|c'.split('|');
        let index = 0;
        let str = ''
        while (!![]) { //需要多次计算,故使用循环
            switch (arr[index++]) { // 依次引用数组中的每一个成员
                case 'a':
                    str = str[atob(bigArr[7])](/dd|DD/, this[atob(bigArr[10])]() > 9 ?
                        this[atob(bigArr[10])]()[atob(bigArr[9])]() : '0'
                        + this[atob(bigArr[10])]());
                    break;
                case 't':
                    let Week = [bigArr[0], bigArr[1], bigArr[2], bigArr[3], bigArr[4],
                        bigArr[5], bigArr[6]];
                    break;
                case 'y':
                    eval(bigArr[12][atob('YXBwbHk=')](null, [
                            115, 116, 114, 32, 61, 32, 115, 116, 114, 46,
                            114, 101, 112, 108, 97, 99, 101, 40, 47, 121,
                            121, 121, 121, 124, 89, 89, 89, 89, 47, 44,
                            32, 116, 104, 105, 115, 46, 103, 101, 116, 70,
                            117, 108, 108, 89, 101, 97, 114, 40, 41, 41,
                            59
                        ]
                    ))
                    break;
                case 'd':
                    console.log('~amo')
                    break;
                // case '7':
                case 7:
                    console.log('~jerry')
                    break;
                case 'c':
                    return str;
                case 'z':
                    str = \u0066\u006f\u0072\u006d\u0061\u0074\u0053\u0074\u0072;
                    break;
                case 'u':
                    str = str[atob(bigArr[7])](/MM/, (this[atob(bigArr[8])]() + 1) > 9 ?
                        (this[atob(bigArr[8])]() + 1)
                            [atob(bigArr[9])]() : '0' + (this[atob(bigArr[8])]() + 1));
                    break;
            }
        }
    }
console.log(new \u0077\u0069\u006e\u0064\u006f\u0077[atob(bigArr[11])]()['\x66\x6f\x72\x6d\x61\x74']
('\u0079\u0079\u0079\u0079\u002d\u004d\u004d\u002d\u0064\u0064')); //2024-05-02
console.log(new \u0077\u0069\u006e\u0064\u006f\u0077[atob(bigArr[11])]()
    ['\x67\x65\x74\x46\x75\x6c\x6c\x59\x65\x61\x72']()) //2024
console.log(new \u0077\u0069\u006e\u0064\u006f\u0077[atob(bigArr[11])]()
    ['\x67\x65\x74\x4d\x6f\x6e\x74\x68']() + 1) //5 当前月份为结果+1

JS 语法比较灵活,case 后面跟的值可以是字符/字符串,也可以是数值还可以是对象或者数组。

3.2 逗号表达式混淆

逗号运算符的主要作用是把多个表达式或语句连接成一个复合语句。3.1 流程平坦化 中的 test1() 函数等价于:

function test1() {
    let a, b, c, d, e, f;
    return a = 1000, b = a + 2000, c = b + 3000, d = c + 4000, e = d + 5000, f = e + 6000, f;
}

console.log(test1())

return 语句后通常只能跟一个表达式,它会返回这个表达式计算后的结果,但是逗号运算符可以把多个表达式连接成一个复合语句,因此上述代码中,return 语句的使用也是没有问题的,它会返回最后一个表达式计算后的结果,但是前面的表达式依然会执行。上述案例只是单纯的连接语句,没有混淆力度。下面再介绍一个案例,代码如下:

var a = (a = 1000, a += 2000); // 使用let会报错
console.log(a)

第一行代码中,括号代表这是一个整体,也就是把 (a=1000,a+=2000) 整体赋值给 a 变量,这个整体返回的结果和 return 语句是一样的,会先执行 a=1000,然后执行 a+=2000,再把结果赋值给 a 变量,最终 a 变量的值为 3000。明白了上述原理后,再介绍逗号运算符的混淆,以本节中的 test1 函数为例,处理思路如下:

// ① 执行 a=1000,再执行 a+2000,代码可以改为 (a=1000,a+2000)
// ② 接着赋值给b,代码可以改为 b=(a=1000,a+2000)
// ③ 执行 b+3000,代码可以改为 (b=(a=1000,a+2000),b+3000)
// ④ 接着赋值给 c,代码可以改为 c=(b=(a=1000,a+2000),b+3000)
// ⑤ 执行 c+4000,代码可以改为 (c=(b=(a=1000,a+2000),b+3000),c+4000)
// 以此类推....

处理后的代码为:

function test2() {
	let a, b, c, d, e, f;
	return f = (e = (d = (c = (b = (a = 1000, a += 2000), b += 3000), c += 4000), d + 5000), e + 6000)
}

console.log(test2())

这段代码有一个声明一系列变量的语句,这个语句很多余,可以放到参数列表上,这样就不需要 let 声明了。另外,既然逗号运算符连接多个表达式,只会返回最后一个表达式计算后的结果,那么可以在最后一个表达式之前插入不影响结果的花指令。最终处理后的代码如下:

function test2(a, b, c, d, e, f) {
    //
    return f = (e = (d = (c = (b = (a = 1000, a + 50, b + 60, c + 70, a += 2000), d + 80,
        b += 3000), e + 90, c += 4000), f + 100, d + 5000), e + 6000)
}

console.log(test2())

a + 50, b + 60, c + 70,d + 80,e + 90,f + 100 这些花指令并无实际意义,不影响原先的代码逻辑,test2() 虽有 6 个参数,但是不传参也可以调用,只不过各参数的初始值为 undefined。逗号表达式混淆不仅能处理赋值表达式,还能处理调用表达式、成员表达式等。考虑下面这个案例:

let obj = {
    'name': 'amo',
    add: function (a, b) {
        return a + b;
    }
}

function sub(a, b) {
    return a - b;
}

function test() {
    let a = 1000;
    let b = sub(a, 3000) + 1; 
    let c = b + obj.add(b, 2000);
    return c + obj.name
}

console.log(test());

上述案例中的代码,可以处理成如下形式:

let obj = {
    'name': 'amo',
    add: function (a, b) {
        return a + b;
    }
}

function sub(a, b) {
    return a - b;
}

function test(a, b, c) {
    return c = (b = (a = 1000, sub)(a, 3000) + 1, b + (0, obj).add(b, 2000)), c + (0,obj).name;
}

console.log(test());

首先提升变量声明到函数参数中,b = (a = 1000, sub)(a,3000) + 1 中的 (a = 1000,sub) 可以整体返回 sub 函数,然后直接调用,计算的结果加 1 后赋值给 b(等号的运算符优先级很低)。同理,如果 sub 函数改为 obj.add 的话,可以处理成 (a=1000,obj.add)(a,3000) 或者 (a=1000,obj).add(a,3000),第2种方法是调用表达式在等号右边的情况,例如 test 函数中的第3条语里面的 b+obj.add(b,2000),可以对 obj.add 进行包装,处理成 b+(0,obj.add)(b,2000) 或者 b+(0,obj).add(b,2000),括号中的0可以是其他花指令。

最后介绍逗号表达式混淆的还原技巧,在逗号表达式混淆中,通常需要使用括号来分组,定位到最里面的那个括号,一般就是第一条语句,然后从里到外,一层层地根据括号对应关系,还原语句顺序,如果用 AST 还原逗号表达式混淆,就不用这么麻烦地找对应关系:几行代码就可以解决问题,在后续的文章中笔者会对 AST 进行详细地介绍。

四、其他代码防护方案

4.1 eval加密

加密的代码格式化后如下所示:

eval(function (p, a, c, k, e, r) {
    e = function (c) {
        return c.toString(36)
    };
    if ('0'.replace(0, e) == 0) {
        while (c--)
            r[e(c)] = k[c];
        k = [function (e) {
            return r[e] || e
        }
        ];
        e = function () {
            return '[2-8a-f]'
        };
        c = 1
    }
    ;
    while (c--)
        if (k[c])
            p = p.replace(new RegExp('\\b' + e(c) + '\\b', 'g'), k[c]);
    return p
}('7.prototype.8=function(a){b 2=a;b Week=[\'日\',\'一\',\'二\',\'三\',\'四\',\'五\',\'六\'];' +
    '2=2.4(/c|YYYY/' + ',3.getFullYear());2=2.4(/d/,(3.5()+1)>9?(3.5()+1).e():\'0\'+(3.5()+1));' +
    '2=2.4(/f|DD/,3.6()>9?'
    + '3.6().e():\'0\'+3.6());return 2};console.log(new 7().8(\'c-d-f\'));',
    [], 16, '||str|this|replace|getMonth|getDate|Date|format||formatStr|var|yyyy|MM|toString|dd'
        .split('|'), 0, {}));

这段代码的一个 eval() 函数,它用来把一段字符串当作 JS 代码来执行,也就是说,传给 eval() 的参数是一段字符串。但在上述代码中,传给 eval() 函数的参数是一个自执行的匿名函数,这说明,这个匿名函数执行后会返回一段字符串,并且用 eval() 执行这段字符串,执行效果与 eval 加密前的代码效果等同,那就可以把这个匿名函数理解成是一个解密函数了,由此可见,eval 加密其实和 eval 关系不大,eval 只是用来执行解密出来的代码。

再来观察传给这个匿名函数的实参部分,观察第1个实参p和第4个实参k,可以看出处理方式很简单,提取原始代码中的一部分标识符,然后用它自己的符号占位,最后再对应替换回去就解密了,最后介绍 eval 解密,这个比较容易,既然这个自执行的匿名函数就是解密函数,把上述代码中的 eval 删去,剩余代码在控制台中执行,就得到原始代码。

4.2 内存爆破

内存爆破是在代码中加入死代码,正常情况下这段代码不执行,当检测到函数被格式化或者函数被 Hook,就跳转到这段代码并执行,直到内存溢出,浏览器会提示 Out of Memory 程序崩溃。内存爆破的代码如下所示:

let d = [0x1, 0x1, 0x1]

function b() {
    for (let i = 0x0, c = d.length; i < c; i++) {
        d.push(Math.round(Math.random()));
        c = d.length;
    }
}

这段代码中的 for 循环是一个死循环,但它的形式不像 while(true) 这样明显,尤其是代码混淆以后,更具有迷惑性,这段代码其实是从以下这段代码简化而来:

const _0x447a = ['push', 'length'];
const _0x3774 = function (_0x447aa4, _0x377412) {
    _0x447aa4 = _0x447aa4 - 0x0;
    let _0x2a002f = _0x447a[_0x447aa4];
    return _0x2a002f;
};
let d = [0x1, 0x1, 0x1];

function b() {
    for (let _0x514f9d = 0x0, _0x1c3f88 = d[_0x3774('0x1')];
         _0x514f9d < _0x1c3f88; _0x514f9d++) {
        d[_0x3774('0x0')](Math['round'](Math['random']()));
        _0x1c3f88 = d['length'];
    }
}

for 循环的结束条件是 _0x514f9d < _0x1c3f88,其中 _0x1c3f88 的初始化值是数组的长度,看着像是一个遍历数组的操作,但是在循环中,又往数组中 push 了成员,接着又重新给 _0x1c3f88 赋值为数组的长度,这时这段代码就永远不会结束了,直到内存溢出。

4.3 检测代码是否格式化

检测的思路很简单,在 JS 中,函数是可以转为字符串的,因此可以选择一个函数转为字符串,然后跟内置的字符串对比或者用正则匹配,函数转为字符串很简单,代码如下:

function add(a, b) {
    return a + b;
}

console.log(add + '');
console.log(add.toString()) // 未格式化:function add(a, b) {return a + b;}
// 格式化:
// function add(a, b) {
//     return a + b;   
// } 

在 Chrome 开发者工具中,把代码格式化后,会产生一个后缀为 :formatted 的文件,之后在这个文件中设置断点,触发断点后,会停在这个文件中,但是,这时把某个函数转为字符串,取到的依然是格式化之前的代码。上述检测方法检测不到这种情况,那么,上述检测方法的应用场景是什么?在算法逆向中,分析完算法,为了得到想要的结果,就需要实现这个算法,简单的算法一般可以直接调用现成的加密库,复杂的算法就会选择直接修改原文件,然后运行得到结果,把格式化后的代码保存成一个本地文件,这时某个函数转为字符串,取到的就是格式化后的结果了,是否触发格式化检测,关键是看原文件中是否有格式化,接着把 4.2 内存爆破 小节中的内存爆破代码加入其中,检测到格式化就跳转到内存爆破代码中执行,程序会崩溃。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/589451.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

pyqt 按钮常用格式Qss设置

pyqt 按钮常用格式Qss设置 QSS介绍按钮常用的QSS设置效果代码 QSS介绍 Qt Style Sheets (QSS) 是 Qt 框架中用于定制应用程序界面样式的一种语言。它类似于网页开发中的 CSS&#xff08;Cascading Style Sheets&#xff09;&#xff0c;但专门为 Qt 应用程序设计。使用 QSS&am…

数据分析--客户价值分析RFM(分箱法/标准化)

原数据 原数据如果有异常或者缺失等情况&#xff0c;要先对数据进行处理 &#xff0c;再进行下面的操作&#xff0c;要不然会影响结果的正确性 一、根据RFM计算客户价值并对客户进行细分 1. 数据预处理 1.1 创建视图存储 R、F、M的最大最小值 创建视图存储R 、F、M 的最大最小…

力扣练习题(2024/5/2)

1填充每个节点的下一个右侧节点指针 给定一个 完美二叉树 &#xff0c;其所有叶子节点都在同一层&#xff0c;每个父节点都有两个子节点。二叉树定义如下&#xff1a; struct Node {int val;Node *left;Node *right;Node *next; } 填充它的每个 next 指针&#xff0c;让这个…

C#知识|Dictionary泛型集合的使用总结

哈喽,你好,我是雷工! 以下是C#Dictionary泛型集合的学习笔记。 01 Dictionary泛型集合 1.1、Dictionary<K,V>通常称为字典, 1.2、其中<K,V>是自定义的,用来约束集合中元素类型。 1.3、在编译时检查类型约束, 1.4、无需装箱拆箱操作, 1.5、操作与哈希表(Ha…

C++ string类

目录 0.前言 1.为什么学习string类 1.1 C语言字符串的局限性 1.2 C string类的优势 2.标准库中的string类 2.1 字符串作为字符序列的类 2.2 接口与标准容器类似 2.3 基于模板的设计 2.4 编码和字符处理 3.string类的常用接口说明 3.1构造函数 3.1.1默认构造函数 3…

前端Web开发基础知识

HTML定义 超文本标记语言&#xff08;英语&#xff1a;HyperText Markup Language&#xff0c;简称&#xff1a;HTML&#xff09;是一种用于创建网页的标准标记语言。 什么是 HTML? HTML 是用来描述网页的一种语言。 HTML 指的是超文本标记语言: HyperText Markup LanguageH…

ELK Stack 8 接入ElasticFlow

介绍 Netflow v5 / v9 / v10&#xff08;IPFIX&#xff09;&#xff0c;支持大部分网络厂商及VMware的分布式交换机。 NetFlow是一种数据交换方式。Netflow提供网络流量的会话级视图&#xff0c;记录下每个TCP/IP事务的信息。当汇集起来时&#xff0c;它更加易于管理和易读。…

EasyExcel 处理 Excel

序言 本文介绍在日常的开发中&#xff0c;如何使用 EasyExcel 高效处理 Excel。 一、EasyExcel 是什么 EasyExcel 是阿里巴巴开源的一个 Java Excel 操作类库&#xff0c;它基于 Apache POI 封装了简单易用的 API&#xff0c;使得我们能够方便地读取、写入 Excel 文件。Easy…

常用AI工具分享 + IDEA内使用通义灵码

引言 随着人工智能技术的飞速发展&#xff0c;AI工具已经渗透到我们日常生活和工作的各个领域&#xff0c;带来了前所未有的便利。现在我将分享一下常用的AI工具&#xff0c;以及介绍如何在IDEA中使用通义灵码。 常用AI工具 1. 通义灵码 (TONGYI Lingma) - 由阿里云开发的智能…

Neo4j v5 中 Cypher 的变化

How Cypher changed in Neo4j v5 Neo4j v5 中 Cypher 的变化 几周前&#xff0c;Neo4j 5 发布了。如果你像我一样&#xff0c;在 Neo4j 4 的后期版本中忽略了所有的弃用警告&#xff0c;你可能需要更新你的 Cypher 查询以适应最新版本的 Neo4j。幸运的是&#xff0c;新的 Cyp…

【翻译】REST API

自动伸缩 API 创建或更新自动伸缩策略 API 此特性设计用于 Elasticsearch Service、Elastic Cloud Enterprise 和 Kubernetes 上的 Elastic Cloud 的间接使用。不支持直接用户使用。 创建或更新一个自动伸缩策略。 请求 PUT /_autoscaling/policy/<name> {"rol…

什么是UDP反射放大攻击,有什么安全措施可以防护UDP攻击

随着互联网的飞速发展和业务复杂性的提升&#xff0c;网络安全问题日益凸显&#xff0c;其中分布式拒绝服务&#xff08;DDoS&#xff09;攻击成为危害最为严重的一类网络威胁之一。 近些年&#xff0c;网络攻击越来越频繁&#xff0c;常见的网络攻击类型包括&#xff1a;蠕虫…

AI图书推荐:用ChatGPT快速创建在线课程

您是否是您领域的专家&#xff0c;拥有丰富的知识和技能可以分享&#xff1f;您是否曾想过创建一个在线课程&#xff0c;但被这个过程吓倒了&#xff1f;那么&#xff0c;是时候把这些担忧放在一边&#xff0c;迈出这一步了&#xff01;有了这本指南和ChatGPT的帮助&#xff0c…

ssh远程访问windows系统下的jupyterlab

网上配置这一堆那一堆&#xff0c;特别乱&#xff0c;找了好久整理后发在这里 由于既想打游戏又想做深度学习&#xff0c;不舍得显卡性能白白消耗&#xff0c;这里尝试使用笔记本连接主机 OpenSSH 最初是为 Linux 系统开发的&#xff0c;现在也支持包括 Windows 和 macOS 在内…

[1673]jsp在线考试管理系统Myeclipse开发mysql数据库web结构java编程计算机网页项目

一、源码特点 JSP 在线考试管理系统是一套完善的java web信息管理系统&#xff0c;对理解JSP java编程开发语言有帮助&#xff0c;系统具有完整的源代码和数据库&#xff0c;系统主要采用B/S模式开发。开发环境为TOMCAT7.0,Myeclipse8.5开发&#xff0c;数据库为Mysql5.0&…

R语言学习—4—数据矩阵及R表示

1、创建向量、矩阵 在R中&#xff0c;c()函数用于创建向量或组合数据对象。它在某些情况下可能会被省略&#xff0c;因为R有一些隐式的向量创建规则。例如&#xff0c;当你使用:操作符创建一个数字序列时&#xff0c;R会自动创建一个向量&#xff0c;所以你不需要显式地调用c()…

《QT实用小工具·五十二》文本或窗口炫酷有趣的滚动条——果冻条

1、概述 源码放在文章末尾 该项目实现了文本或窗口纤细的滚动条——果冻条 一个可以像弓弦一样拉出来&#xff0c;并且来回弹动的普通滚动条。 思路为此&#xff0c;但发现实际效果更像条状果冻&#xff0c;并且略有谐音&#xff0c; 故&#xff0c;称之为——“果冻条”&am…

条件依赖性的方法示例

5个条件判断一件事情是否发生&#xff0c;每个条件可能性只有2种&#xff08;发生或者不发生&#xff09;&#xff0c;计算每个条件对这件事情发生的影响力&#xff0c;条件之间有很强的依赖关系。 例一 如果条件之间有很强的依赖关系&#xff0c;那么简单地计算每个条件独立的…

初探 Google 云原生的CICD - CloudBuild

大纲 Google Cloud Build 简介 Google Cloud Build&#xff08;谷歌云构建&#xff09;是谷歌云平台&#xff08;Google Cloud Platform&#xff0c;GCP&#xff09;提供的一项服务&#xff0c;可帮助开发人员以一致和自动化的方式构建、测试和部署应用程序或构件。它为构建和…

B树:原理、操作及应用

B树&#xff1a;原理、操作及应用 一、引言二、B树概述1. 定义与性质2. B树与磁盘I/O 三、B树的基本操作1. 搜索&#xff08;B-TREE-SEARCH&#xff09;2. 插入&#xff08;B-TREE-INSERT&#xff09;3. 删除&#xff08;B-TREE-DELETE&#xff09; 四、B树的C代码实现示例五、…
最新文章