[总结] 浅谈渐进式优化LinuxPcap抓包历程(部分附代码)

文章目录

  • 前言
  • 历程
    • 使用阻塞式pcap_loop
    • 使用非阻塞式pcap_dispatch
    • 优化1多网卡名创建一个pcap实例
    • 优化2使用select异步监听fd
  • 总结

前言

最近一直在做pcap抓包,需求很简单就是指定一个或多个bpf语句抓计算机上所有网卡。
不考虑性能开销和资源开销的话,实现方式很多。

历程

使用阻塞式pcap_loop

不考虑性能开销和资源开销的话的实现方式很多。

浅谈最简单的一种:

  • 使用单线程阻塞式的pcap_loop,一个线程抓一个网卡和一种bpf语句。
    • 优点:实现简单。
    • 缺点:资源开销大,线程数 = bpf数量 * 网卡数。

大致实现:


那么如何减少线程数量呢?
那就不得不提pcap_dispatch方法

使用非阻塞式pcap_dispatch

pcap_dispatch函数是非阻塞的,即可以使用循环的方式轮询查找是否捕获到数据包。

思路:

  • 根据bpf和网卡创建pcap实例
  • 所有pcap都放在一个线程使用轮询方式查找
  • 抓包成功会自动调用回调
    • 优化:线程数量大幅度减少,
    • 缺点:1.线程数 = bpf数量 2.需要创建大量网卡数量的pcap实例

优化1多网卡名创建一个pcap实例

利用pcap创建时device_name=“any”,使之多个网卡对应一个pcap实例
思路:

  • 根据bpf和网卡创建pcap实例
  • pcap都放在一个线程使用轮询方式查找
  • 抓包成功会自动调用回调
    • 优化:多个网卡对应一个pcap实例,减少了pcap实例数量
    • 缺点:
    1. 线程数 = bpf数量,pcap实例数=bpf数量,
    2. pcap_callback回调函数需要特殊解析数据包,使用any设备名,数据包结构会发生变化,需要特殊调整和特别解析。
    3. 多实例放在一个循环中可能会造成超时,影响后一个pcap实例的延迟处理

优化2使用select异步监听fd

利用pcap_get_select_fd获取socket fd,再使用select函数监听处理
思路:

  • 根据不同的bpf和多个网卡创建pcap实例
  • bpf数量的pcap都放在一个线程使用轮询方式查找
  • 抓包成功会自动调用回调
    • 优化:
      1. 线程数只有1,pcap实例数=bpf数量
      2. select去除了非响应的pcap实例,减少了pcap实例的超时造成的延迟影响
      3. 如果使用多个网卡创建多个pcap的方法影响也几乎没有影响 并且callback不需要特殊解析数据包
    • 缺点:几乎没有
#include <mutex>
#include <algorithm>
#include <map>
#include <unordered_map>
#include <list>
#include <queue>
#include <string>
#include <sstream>
#include <chrono>

#include <sys/time.h>
#include <sys/ioctl.h>
#include <net/if.h>
#include <unistd.h>
#include <netinet/in.h>
#include <netinet/ip6.h>
#include <netinet/ip.h>
#include <string.h>
#include <dirent.h>

#include <netinet/tcp.h>
#include <netinet/ip_icmp.h>
#include <netinet/ether.h>

#include <pcap.h>

void PcapCallback(u_char* argument, const struct pcap_pkthdr* packet_header, const u_char* packet_content) {
	// to do something
}

pcap_t * create_pcap(const char * dev, const std::string &str_filter_exp,  std::mutex *mutex){
    
    char errbuf[PCAP_ERRBUF_SIZE]; // 存储错误信息的缓冲区
    int snaplen = 65535; // 捕获数据包的长度
    int promisc = 0; // 混杂模式
    int to_ms = 1000; // 等待捕获的超时时间

    // 打开捕获设备
    pcap_t* handle = pcap_create(dev, errbuf);
    if (handle == nullptr) {
        printf("Could not create pcap handle: %s\n", errbuf);
        return nullptr;
    }

    struct bpf_program filter;
    pcap_set_snaplen(handle, snaplen);
    pcap_set_promisc(handle, promisc);
    pcap_set_timeout(handle, to_ms);
    pcap_compile(handle, &filter, str_filter_exp.c_str(), 1, 0);
    pcap_setfilter(handle, &filter);
    pcap_set_buffer_size(handle, 20 * 1024 * 1024);
    // pcap_set_immediate_mode(handle, 1);      // 开启immediate模式
    if (pcap_activate(handle) != 0) {
        printf("Could not activate pcap handle: %s\n", pcap_geterr(handle));
        pcap_close(handle);
        return nullptr;
    }

    return handle;
}

int main() {
    char errbuf[PCAP_ERRBUF_SIZE];
    pcap_if_t* alldevs;
    pcap_if_t* device;

    // 获取系统上的所有网络设备
    if (pcap_findalldevs(&alldevs, errbuf) == -1) {
        printf("Error finding devices: %s", errbuf);
        return 1;
    }
    
    std::vector<int> fds;
    std::vector<pcap *> pds;
    for (device = alldevs; device != nullptr; device = device->next) {
        for(pcap_addr_t *a=device->addresses; a!=NULL; a=a->next) {
            if(a->addr->sa_family == AF_INET){
                char* sz_ip_addr = inet_ntoa(((struct sockaddr_in*)a->addr)->sin_addr);
                std::string str_bpf_str = "tcp";
                pcap_t* pcap = create_pcap(device->name, str_filter_exp, nullptr);

                int fd = pcap_get_selectable_fd(pcap);
                fds.push_back(fd);
                pds.push_back(pcap);
            }
        }
    }
    // 释放设备列表
    pcap_freealldevs(alldevs);

    while (true)
    {
        fd_set read_fds;
        FD_ZERO(&read_fds);
        int max_fd = 0;
        for (auto &one : fds)
        {
            if (one > max_fd)
            {
                max_fd = one;
            }
            FD_SET(one, &read_fds);
        }

        struct timeval timeout;
        timeout.tv_sec = 5;
        timeout.tv_usec = 0;

        int result = select(max_fd + 1, &read_fds, NULL, NULL, &timeout);

        if (result == -1)
        {
            printf("error: select");
            break;
        }
        else if (result > 0)
        {
            std::vector<std::size_t> pds_indexs;

            for (std::size_t i = 0; i < fds.size(); i++)
            {
                if (FD_ISSET(fds[i], &read_fds))
                {
                    pds_indexs.emplace_back(i);
                }
            }

            for (std::size_t id = 0; id < pds_indexs.size(); id++)
            {
                std::size_t i = pds_indexs[id];

                //set_ns(containers[i].pid);
                int status =
                    pcap_dispatch(pds[i], -1, PcapCallback, nullptr);
                if (status < 0)
                    break;
            }
        }
        else
        {
            printf("Timeout!\n");
        }
    }

    for (auto &one : pds)
    {
        pcap_close(one);
    }
    return 0;
}

总结

优化过程很长,主要考虑是线程数量的优化,以及使用非阻塞函数pcap_dispatch过程中产生pcap实例延迟问题。

记下此文希望大家都能掌握这些技巧。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/403765.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

期货量化001:获取玉米主连的数据到execel表中

用efinance库&#xff1a; import efinance as ef import pandas as pd# 获取期货基本信息 futures_info ef.futures.get_futures_base_info()# 根据名称找到玉米主力的行情ID corn_quote_id futures_info[futures_info[期货名称] 玉米主连][行情ID].values[0]# 获取玉米的…

【这个词(Sequence-to-Sequence)在深度学习中怎么解释,有什么作用?】

&#x1f680; 作者 &#xff1a;“码上有前” &#x1f680; 文章简介 &#xff1a;深度学习笔记 &#x1f680; 欢迎小伙伴们 点赞&#x1f44d;、收藏⭐、留言&#x1f4ac; Sequence-to-Sequence&#xff08;Seq2Seq&#xff09; Sequence-to-Sequence&#xff08;Seq2Seq…

【机器学习】数据清洗——基于Pandas库的方法删除重复点

&#x1f388;个人主页&#xff1a;豌豆射手^ &#x1f389;欢迎 &#x1f44d;点赞✍评论⭐收藏 &#x1f917;收录专栏&#xff1a;机器学习 &#x1f91d;希望本文对您有所裨益&#xff0c;如有不足之处&#xff0c;欢迎在评论区提出指正&#xff0c;让我们共同学习、交流进…

华为OD机试真题C卷-篇4

200分值题 可以处理的最大任务员工派遣快递员的烦恼符号运算伐木工反射计数分披萨推荐多样性贪心的歌手螺旋数组矩阵(100) 可以处理的最大任务 有一个tasks任务列表&#xff0c;需要处理其中的任务&#xff1b;tasks[i] [si, ei]&#xff0c;该任务可以在si<day<ei之间…

网络安全-nc(Netcat)工具详解

经常在反弹shell的时候使用nc命令&#xff0c;但是从来没有了解过&#xff0c;今天翻书看到了&#xff0c;准备记录一下。 nc全称Netcat&#xff0c;是TCP/IP连接的瑞士军刀。哈哈我最喜欢瑞士军刀了。 有一个比较偏的知识点&#xff0c;nc还可以探测目标的端口是否开放&…

Flink中的双流Join

1. Flink中双流Join介绍 Flink版本Join支持类型Join API1.4innerTable/SQL1.5inner,left,right,fullTable/SQL1.6inner,left,right,fullTable/SQL/DataStream Join大体分为两种&#xff1a;Window Join 和 Interval Join 两种。 Window Join又可以根据Window的类型细分为3种…

【王道数据结构】【chapter6图】【P234t5】

假设图用邻接表表示&#xff0c;设计一个算法&#xff0c;输出从顶点vi到顶点vj的所有简单路径 #include <iostream>] #include <string.h> #define maxsize 10 typedef struct node{int data;struct node *next; }node ,*pnode;pnode buynode(int x) {pnode tmp(p…

【Linux取经路】文件系统之缓冲区

文章目录 一、先看现象二、用户缓冲区的引入三、用户缓冲区的刷新策略四、为什么要有用户缓冲区五、现象解释六、结语 一、先看现象 #include <stdio.h> #include <string.h> #include <unistd.h>int main() {const char* fstr "Hello fwrite\n"…

电路设计(26)——速度表的multisim仿真

1.设计要求 设计一款电路&#xff0c;能够实时显示当前速度。 用输入信号模拟行驶的汽车&#xff0c;信号频率的1hz代表汽车速度的1m/s。最后速度显示&#xff0c;以km/h为单位。 2.电路设计 当输入信号频率为40HZ时&#xff0c;显示的速度应该为144KM/h&#xff0c;仿真结果为…

petalinux_zynq7 驱动DAC以及ADC模块之一:建立IP

0. 环境 - ubuntu18 - vivado 2018.3 - mizar z7010 ada106模块 1. vivado 1.1 创建vivado工程 运行vivado source /tools/Xilinx/Vivado/2018.3/settings64.sh vivado& 创建vivado工程 Vivado -> Create Project -> Next -> -> Project name: …

OpenCV中图像的HSV色彩空间

在HSV 色彩空间中H, S, V 这三个通道分别代表着色相(Hue)&#xff0c;饱和度(Saturation)和明度(Value)&#xff0c; 原本输出的HSV 的取值范围分别是0-360, 0-1, 0-1; 但是为了匹配目标数据类型OpenCV 将每个通道的取值范围都做了修改,于是就变成了0-180, 0-255, 0-255 impo…

人机交互新研究:MIT开发了结合脑电和眼电的新式眼镜,与机器狗交互

还记得之前的AI读心术吗&#xff1f;最近&#xff0c;「心想事成」的能力再次进化&#xff0c; ——人类可以通过自己的想法直接控制机器人了&#xff01; 来自麻省理工的研究人员发表了Ddog项目&#xff0c;通过自己开发的脑机接口&#xff08;BCI&#xff09;设备&#xff…

设置墙、楼板每层的厚度和材质——群问题整理003

你好&#xff0c;这里是BIM的乐趣&#xff0c;我是九哥~ 今天分享的是设置墙、楼板等每层的厚度和材质。 我们都知道&#xff0c;Revit中墙、板这类系统族&#xff0c;厚度设置和普通族是不太一样的&#xff0c;他的厚度参数可读&#xff0c;但是并不可设置&#xff0c;因为我…

flannel网络拓扑

测试环境创建 在k8s中部署flannel网络插件 https://blog.csdn.net/weixin_64124795/article/details/128894411 参考文章部署k8s集群和flannel网络插件 我的k8s集群物理环境 我的集群中只有两个节点master和node1节点 [rootmaster sjs]# kubectl get node NAME STATU…

MySQL 索引原理以及 SQL 优化

索引 索引&#xff1a;一种有序的存储结构&#xff0c;按照单个或者多个列的值进行排序。索引的目的&#xff1a;提升搜索效率。索引分类&#xff1a; 数据结构 B 树索引&#xff08;映射的是磁盘数据&#xff09;hash 索引&#xff08;快速锁定内存数据&#xff09;全文索引 …

华为OD机试真题-查找接口成功率最优时间段-2023年OD统一考试(C卷)--Python3--开源

题目&#xff1a; 考察内容&#xff1a; for 时间窗口list(append, sum, sort) join 代码&#xff1a; """ 题目分析&#xff1a;最长时间段 且平均值小于等于minLost同时存在多个时间段&#xff0c;则输出多个&#xff0c;从大到小排序未找到返回 NULL 输入…

PostgreSQL 的实体化视图介绍

PostgreSQL 实体化视图提供一个强大的机制&#xff0c;通过预先计算并将查询结果集存储为物理表来提高查询性能。本教程将使用 DVD Rental Database 数据库作为演示例子&#xff0c;指导你在 PostgreSQL中创建实体化视图。 了解实体化视图 实体化视图是查询结果集的快照&…

T-Dongle-S3开发笔记——分区表

参考&#xff1a; ESP32之 ESP-IDF 教学&#xff08;十三&#xff09;—— 分区表_esp32分区表-CSDN博客 分区表 - ESP32 - — ESP-IDF 编程指南 latest 文档 (espressif.com) 分区表是 ESP32 划分内部 flash 闪存的清单&#xff0c;它将 flash 划分为多个不同功能的区域用于…

【前端素材】推荐优质后台管理系统inspina平台模板(附源码)

一、需求分析 后台管理系统是一个集成了多种功能模块的系统&#xff0c;通过这些模块的协同工作&#xff0c;实现对网站、应用程序或系统的全面管理和控制。管理员通过后台管理系统可以高效地管理用户、内容、数据、权限等方面的工作&#xff0c;确保系统的正常运行和安全性。…
最新文章