Posted 2024-02-20Updated 2024-03-0710 minutes read (About 1541 words)0 visits

记一次JA3指纹识别的经历

最近在写一个小工具，但是遇到一个问题而引发的研究。

在开发Python工具的过程中遇到这样一个问题：开发的程序放在docker中运行，使用requests模块请求一个https服务，但是总是能触发目标服务的验证机制，会要求我输入图片验证码进行验证。

可以看出，目标服务器能检测出请求客户端是一个bot，而我并不想让目标服务检测出来，每次请求都要输入验证码，在我看来是一件很麻烦的事。

接着，我就开始研究是哪个环节被服务器检测出来有问题。

环境如下：

A: 平常使用的Mbp笔记本
B: 装了docker的Linux主机
C: 运行python工具的docker环境

对于上述的三个环境，确保它们处在同一个内网中，这样外网的服务器没法通过IP地址来进行区分。

然后进行以下测试：

在A环境中使用浏览器访问目标，并不会触发验证码。说明目标服务器并没有把测试环境中的外网IP地址放入黑名单中。
在A环境中启动Burp Suite，在C环境中加上环境变量HTTP_PROXY/HTTPS_PROXY确保C环境中运行程序产生的流量能被代理到Burp中。在Burp中查看流量发现，不会触发验证码机制。
在C环境中运行脚本时加上环境变量SSLKEYLOGFILE，然后在网关使用tcpdump抓包，会触发验证码机制。随后在本地使用wireshark对解密出的HTTPS流量进行分析。
把A和C环境中的程序放到B环境中运行，不会触发验证码机制。

针对2，3，4步骤的结果进行分析：

只有在docker环境中运行程序才会触发验证码机制。
目标服务器并没有对HTTP数据包进行检测，并不是HTTP数据包中多了或者少了某段数据导致被目标服务器检测出来的。
因为A, B, C环境中的python版本不一样，所以有可能是docker环境中的python或者其相关库(比如requests)在流量中多了某些数据导致被检测出来。

把C环境中的requests/urllib3库的版本和B环境中的版本一致，在C环境中运行程序仍然会触发验证码。
在C环境中把程序中使用requests发送的流量提取出来，使用curl想目标服务发送数据包，不会触发验证码。

测试到这，发现只有在C环境中使用python的requests发送流量才会被目标服务器检测出来，这个时候因为知识的缺失，只能猜测可能在SSL握手环节进行了检测，但是却不知是如何检测的。

随后在协会的大哥帮助下知道了JA3指纹[1]。

简单的说就是对SSL握手的Client Hello流量包的一些不随机的字段进行hash签名，然后可以做一个JA3指纹库，这样在一定程度上可以通过JA3指纹得知客户端的UA。

一般情况下，Web服务器想要知道客户端的什么设备，都是通过HTTP头的User-Agent字段，但是众所周知，对该字段进行伪造是轻而易举的事。所以出现了JA3指纹，默认情况下，如果不对SSL的参数进行特殊设置，那么JA3指纹就是固定的。

比如使用Python的requests请求一个HTTPS服务，正常情况下开发人员只会对HTTP请求进行操作，并不会修改ssl的参数，最多设置一个verify=False。这样requests发送的Client Hello包中的非随机字段都是固定的，从而计算出的JA3指纹都是固定的。

可以使用下面的代码获取到requests的JA3指纹：

import requests
url2 = "https://tools.scrapfly.io/api/fp/ja3"
res = requests.get(url2, headers={"origin": "https://scrapfly.io"})
print(res.json()["ja3_digest"])

可以使用下面的代码获取到curl的JA3指纹：

1
2
3

$ curl 'https://tools.scrapfly.io/api/fp/ja3' -H 'origin: https://scrapfly.io'
$ curl --ciphers ECDHE-RSA-AES128-GCM-SHA256  'https://tools.scrapfly.io/api/fp/ja3' -H 'origin: https://scrapfly.io'
# 通过上面两个请求的结果可以发现，我们能很容易的让JA3指纹的结果产生变化。

在浏览器上可以访问https://scrapfly.io/web-scraping-tools/ja3-fingerprint获取到浏览器的JA3指纹。

经过研究发现，Chrome的JA3指纹是随机变化的，但是使用Chrome访问目标服务器却不会触发验证码。从这可以猜测，目标服务器采用的是JA3黑名单。

而黑名单是最好绕过的，想把客户端的JA3指纹设置成指定值是有难度的，但是让客户端的JA3指纹不等于某个值是非常容易的。只要对ssl的ciphers参数进行任何变动，都会导致JA3指纹发现变化。

有以下两个简单的绕过方案：

docker换一个python版本，比如原本使用的是FROM python:3.10-slim-buster，现在换成FROM python:3.11-slim-buster。
修改requests.packages.urllib3.util.ssl_.DEFAULT_CIPHERS的值。

不过经过一天的测试发现，第一个方案并不靠谱，目标服务器还有其他的检测方案，过了一天3.11的指纹也进入到黑名单中。所以考虑写一个函数，让DEFAULT_CIPHERS的值每次请求都发现变化，就像Chrome一样，每次JA3值都不一样。

总结

通过以上研究可以发现，黑名单机制并不靠谱。

参考链接

https://github.com/yolossn/JA3-Fingerprint-Introduction

记一次JA3指纹识别的经历

https://nobb.site/2024/02/20/0x87/

Author

Hcamael

Posted on

2024-02-20

Updated on

2024-03-07

Licensed under

#record

记一次JA3指纹识别的经历

总结

参考链接

Author

Posted on

Updated on

Licensed under

Like this article? Support the author with

Recents

Tags

Links