服务器之家:专注于VPS、云服务器配置技术及软件下载分享
分类导航

PHP教程|ASP.NET教程|Java教程|ASP教程|编程技术|正则表达式|C/C++|IOS|C#|Swift|Android|VB|R语言|JavaScript|易语言|vb.net|

服务器之家 - 编程语言 - C# - c# Selenium爬取数据时防止webdriver封爬虫的方法

c# Selenium爬取数据时防止webdriver封爬虫的方法

2022-10-28 12:11UP技术控 C#

这篇文章主要介绍了c# Selenium爬取数据时防止webdriver封爬虫的方法,帮助大家更好的理解和使用c#,感兴趣的朋友可以了解下

背景

大家在使用Selenium + Chromedriver爬取网站信息的时候,以为这样就能做到不被网站的反爬虫机制发现。但是实际上很多参数和实际浏览器还是不一样的,只要网站进行判断处理,就能轻轻松松识别你是否使用了Selenium + Chromedriver模拟浏览器。其中

window.navigator.webdriver

就是很重要的一个。

问题窥探

正常浏览器打开是这样的

c# Selenium爬取数据时防止webdriver封爬虫的方法

 模拟器打开是这样的 

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
ChromeOptions options = null;
      IWebDriver driver = null;
      try
      {
        options = new ChromeOptions();
        options.AddArguments("--ignore-certificate-errors");
        options.AddArguments("--ignore-ssl-errors");
 
        // options.AddExcludedArgument("enable-automation");
        // options.AddAdditionalCapability("useAutomationExtension", false);
 
        var listCookie = CookieHelp.GetCookie();
        if (listCookie != null)
        {
          // options.AddArgument("headless");
        }
 
        // string ss = @"{ ""source"": ""Object.defineProperty(navigator, 'webdriver', { get: () => undefined})""}";
        //  options.AddUserProfilePreference("Page.addScriptToEvaluateOnNewDocument", new ssss() { source = " Object.defineProperty(navigator, 'webdriver', {  get: () => undefined }) " });
 
        ChromeDriverService service = ChromeDriverService.CreateDefaultService(System.Environment.CurrentDirectory);
        service.HideCommandPromptWindow = true;
        driver = new ChromeDriver(service, options, TimeSpan.FromSeconds(120));
 
        ////session.Page.AddScriptToEvaluateOnNewDocument(new OpenQA.Selenium.DevTools.Page.AddScriptToEvaluateOnNewDocumentCommandSettings()
        ////{
        ////  Source = @"Object.defineProperty(navigator, 'webdriver', { get: () => undefined })"
        ////}
        //// );

c# Selenium爬取数据时防止webdriver封爬虫的方法

所以,如果网站通过js代码获取这个参数,返回值为undefined说明是正常的浏览器,返回true说明用的是Selenium模拟浏览器。

解决办法

那么对于这种情况,在爬虫开发的过程中如何防止这个参数告诉网站你在模拟浏览器呢?执行对应的js,改掉它的值。

?
1
2
IJavaScriptExecutor js = (IJavaScriptExecutor)driver;
string returnjs = (string)js.ExecuteScript("Object.defineProperties(navigator, {webdriver:{get:()=>undefined}});");

运行效果

c# Selenium爬取数据时防止webdriver封爬虫的方法

 完美,达到预期效果。

以上就是c# Selenium爬取数据时防止webdriver封爬虫的方法的详细内容,更多关于c# 防止webdriver封爬虫的资料请关注服务器之家其它相关文章!

原文链接:https://www.cnblogs.com/lyl6796910/p/14275770.html

延伸 · 阅读

精彩推荐
  • C#在C#使用字典存储事件示例及实现自定义事件访问器

    在C#使用字典存储事件示例及实现自定义事件访问器

    这篇文章主要介绍了在C#使用字典存储事件示例及实现自定义事件访问器的方法,是C#事件编程中的基础知识,需要的朋友可以参考下...

    C#教程网5932021-11-11
  • C#基于C#的socket编程的TCP异步的实现代码

    基于C#的socket编程的TCP异步的实现代码

    本篇文章主要介绍了基于C#的socket编程的TCP异步的实现代码,详解的讲诉了TCP通信异步的实现,有兴趣的可以了解一下。...

    sunev9062021-12-09
  • C#unity实现贪吃蛇游戏

    unity实现贪吃蛇游戏

    这篇文章主要为大家详细介绍了unity实现贪吃蛇游戏,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下...

    行者疾风3622022-09-02
  • C#C#中List和SortedList的简介

    C#中List和SortedList的简介

    今天小编就为大家分享一篇关于C#中List和SortedList的简介,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看...

    Czhenya6952022-03-03
  • C#c#中值类型和引用类型的基础教程

    c#中值类型和引用类型的基础教程

    这篇文章主要给大家介绍了关于c#中值类型和引用类型的基础教程,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,...

    老胡写代码10262022-09-09
  • C#Unity实现3D贪吃蛇的移动代码

    Unity实现3D贪吃蛇的移动代码

    这篇文章主要为大家详细介绍了Unity实现3D贪吃蛇的移动代码,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下...

    永远的小白虾11002022-09-02
  • C#详解C#中一维数组的插入

    详解C#中一维数组的插入

    本文内容给大家分享了在C#中进行一维数组的插入的详细实例代码,大家可以测试下。...

    彬菌6012022-02-21
  • C#NancyFx框架检测任务管理器详解

    NancyFx框架检测任务管理器详解

    这篇文章主要为大家详细介绍了NancyFx框架检测任务管理器的相关资料,具有一定的参考价值,感兴趣的小伙伴们可以参考一下...

    Lexan5082022-01-25