论文 辅助笔记:t2vec train.py

1 train

1.1 加载training和validation数据

def train(args):
    logging.basicConfig(filename=os.path.join(args.data, "training.log"), level=logging.INFO)
    '''
    设置了日志的基本配置。
    将日志信息保存到名为 "training.log" 的文件中
    日志的级别被设置为 INFO,这意味着所有级别为 INFO 及以上的日志消息都会被记录。
    '''

    trainsrc = os.path.join(args.data, "train.src")
    traintrg = os.path.join(args.data, "train.trg")
    trainmta = os.path.join(args.data, "train.mta")
    trainData = DataLoader(trainsrc, traintrg, trainmta, args.batch, args.bucketsize)
    #使用自定义的Dataloader 加载训练数据

    print("Reading training data...")

    trainData.load(args.max_num_line)
    #从指定的源文件、目标文件和元数据文件中加载数据,并按照桶大小进行组织
    print("Allocation: {}".format(trainData.allocation))
    print("Percent: {}".format(trainData.p))

    valsrc = os.path.join(args.data, "val.src")
    valtrg = os.path.join(args.data, "val.trg")
    valmta = os.path.join(args.data, "val.mta")
    #使用自定义的Dataloader 加载测试数据


    if os.path.isfile(valsrc) and os.path.isfile(valtrg):
        valData = DataLoader(valsrc, valtrg, valmta, args.batch, args.bucketsize, True)
        print("Reading validation data...")
        valData.load()
        assert valData.size > 0, "Validation data size must be greater than 0"
        print("Loaded validation data size {}".format(valData.size))
    else:
        print("No validation data found, training without validating...")
    '''
    首先检查验证数据的文件是否存在。
    如果存在,则加载验证数据;
    否则,输出一个消息表示没有找到验证数据,并且将在没有验证的情况下进行训练
    '''

1.2 创建优化器、loss function等

## create criterion, model, optimizer
    if args.criterion_name == "NLL":
        #检查args.criterion_name是否为"NLL"

        criterion = NLLcriterion(args.vocab_size)
        lossF = lambda o, t: criterion(o, t)
        如果是,使用NLLcriterion创建一个损失函数。
    else:
        assert os.path.isfile(args.knearestvocabs),\
            "{} does not exist".format(args.knearestvocabs)
        '''
        首先,确保args.knearestvocabs指向一个存在的文件。
        如果不是,则触发断言错误。
        '''
        print("Loading vocab distance file {}...".format(args.knearestvocabs))

        with h5py.File(args.knearestvocabs, "r") as f:
            V, D = f["V"][...], f["D"][...]
            V, D = torch.LongTensor(V), torch.FloatTensor(D)
        '''
        加载args.knearestvocabs指向的文件内容
        
        V矩阵存储每个词汇的k个最近词汇的索引,而D矩阵存储与这些词汇的相应距离
        '''

        D = dist2weight(D, args.dist_decay_speed)
        #将距离矩阵逐行softmax

        if args.cuda and torch.cuda.is_available():
            V, D = V.cuda(), D.cuda()

        criterion = KLDIVcriterion(args.vocab_size)
        lossF = lambda o, t: KLDIVloss(o, t, criterion, V, D)
        '''
        使用KLDIVcriterion创建一个损失函数,并定义另一个损失函数lossF
        '''

    triplet_loss = nn.TripletMarginLoss(margin=1.0, p=2)
    '''
    定义一个Triplet loss
    测量一个锚点与一个正面样本之间的距离相对于一个负面样本的距离
    '''

1.3 创建模型

    m0 = EncoderDecoder(args.vocab_size,
                        args.embedding_size,
                        args.hidden_size,
                        args.num_layers,
                        args.dropout,
                        args.bidirectional)
    #创建EncoderDecoder

    m1 = nn.Sequential(nn.Linear(args.hidden_size, args.vocab_size),
                       nn.LogSoftmax(dim=1))
    #线性层,输入维度是args.hidden_size,输出维度是args.vocab_size
    #接着,这个线性层的输出被送入一个LogSoftmax层,用于归一化输出并取对数

    if args.cuda and torch.cuda.is_available():
        print("=> training with GPU")
        m0.cuda()
        m1.cuda()
        criterion.cuda()
        #m0 = nn.DataParallel(m0, dim=1)
    else:
        print("=> training with CPU")
    #是否放在GPU上训练

 1.4 定义优化过程

    m0_optimizer = torch.optim.Adam(m0.parameters(), lr=args.learning_rate)
    m1_optimizer = torch.optim.Adam(m1.parameters(), lr=args.learning_rate)
    #为前面定义的两个模块m0和m1各自创建了一个优化器

    ## load model state and optmizer state
    if os.path.isfile(args.checkpoint):
        print("=> loading checkpoint '{}'".format(args.checkpoint))
        logging.info("Restore training @ {}".format(time.ctime()))
        checkpoint = torch.load(args.checkpoint)
        args.start_iteration = checkpoint["iteration"]
        best_prec_loss = checkpoint["best_prec_loss"]
        m0.load_state_dict(checkpoint["m0"])
        m1.load_state_dict(checkpoint["m1"])
        m0_optimizer.load_state_dict(checkpoint["m0_optimizer"])
        m1_optimizer.load_state_dict(checkpoint["m1_optimizer"])
    else:
        print("=> no checkpoint found at '{}'".format(args.checkpoint))
        logging.info("Start training @ {}".format(time.ctime()))
        best_prec_loss = float('inf')

    '''
    首先检查args.checkpoint指定的路径是否存在检查点文件:

        如果存在,它会加载检查点,然后从中恢复模型m0、m1以及它们的优化器的状态。这对于中断后继续训练非常有用。
        
        如果不存在检查点,代码将记录开始训练的时间,并设置best_prec_loss为无穷大,表示还没有最好的损失值。
        
    '''

1.5 训练过程

    num_iteration = 67000*128 // args.batch
    print("Iteration starts at {} "
          "and will end at {}".format(args.start_iteration, num_iteration-1))
    #设定总迭代次数

    ## training
    for iteration in range(args.start_iteration, num_iteration):
        try:
            m0_optimizer.zero_grad()
            m1_optimizer.zero_grad()
            #在每次迭代开始时,都会清零之前计算的梯度。(pytorch训练三部曲1)

            ## generative loss
            gendata = trainData.getbatch_generative()
            #获取一个桶中一个batch的train、target数据
            #分别将train和val数据pad成相同的长度

            genloss = genLoss(gendata, m0, m1, lossF, args)
            '''
            对于选择的这一个batch的src、target数据
            计算经过encoder-decoder之后的输出,和ground-truth单元格 最近的 k个单元格的加权距离和
            '''

            ## discriminative loss
            disloss_cross, disloss_inner = 0, 0
            if args.use_discriminative and iteration % 10 == 0:
                a, p, n = trainData.getbatch_discriminative_cross()
                '''
                获取三个batch的数据,a、p和n[锚点(anchor)、正例(positive)和负例(negative)]
                '''
                disloss_cross = disLoss(a, p, n, m0, triplet_loss, args)
                #锚点(anchor)、正例(positive)和负例(negative)经过encoder之后的hidden state的三元组距离

                a, p, n = trainData.getbatch_discriminative_inner()
                '''
                从同一个初始数据的不同部分产生a(锚点)、p(正例)、和n(负例)
                '''
                disloss_inner = disLoss(a, p, n, m0, triplet_loss, args)
                #锚点(anchor)、正例(positive)和负例(negative)经过encoder之后的hidden state的三元组距离

            loss = genloss + args.discriminative_w * (disloss_cross + disloss_inner)
            #总的loss

            ## compute the gradients
            loss.backward()
            #梯度反向传播

            ## clip the gradients
            clip_grad_norm_(m0.parameters(), args.max_grad_norm)
            clip_grad_norm_(m1.parameters(), args.max_grad_norm)
            #并对模型的梯度进行裁剪,以防止梯度爆炸

            ## one step optimization
            m0_optimizer.step()
            m1_optimizer.step()
            #使用前面计算的梯度更新模型的参数


            ## average loss for one word
            avg_genloss = genloss.item() / gendata.trg.size(0)
            if iteration % args.print_freq == 0:
                print("Iteration: {0:}\tGenerative Loss: {1:.3f}\t"\
                      "Discriminative Cross Loss: {2:.3f}\tDiscriminative Inner Loss: {3:.3f}"\
                      .format(iteration, avg_genloss, disloss_cross, disloss_inner))
            #打印信息

            if iteration % args.save_freq == 0 and iteration > 0:
                prec_loss = validate(valData, (m0, m1), lossF, args)
                if prec_loss < best_prec_loss:
                    best_prec_loss = prec_loss
                    logging.info("Best model with loss {} at iteration {} @ {}"\
                                 .format(best_prec_loss, iteration, time.ctime()))
                    is_best = True
                else:
                    is_best = False
                print("Saving the model at iteration {} validation loss {}"\
                      .format(iteration, prec_loss))
                savecheckpoint({
                    "iteration": iteration,
                    "best_prec_loss": best_prec_loss,
                    "m0": m0.state_dict(),
                    "m1": m1.state_dict(),
                    "m0_optimizer": m0_optimizer.state_dict(),
                    "m1_optimizer": m1_optimizer.state_dict()
                }, is_best, args)    
            #保存最好的model
        except KeyboardInterrupt:
            break

 t2vec 辅助笔记:data_utils-CSDN博客

2  NLLcriterion

'''
构造负对数似然损失函数(Negative Log Likelihood, y NLL)
'''
def NLLcriterion(vocab_size):

    weight = torch.ones(vocab_size)
    #建一个大小为vocab_size的全1张量,用于为每个词汇项赋权重。

    weight[constants.PAD] = 0
    '''
    constants.PAD是指示填充(Padding)标记的索引,这行代码将其权重设置为0
    这意味着在计算损失时会忽略填充标记。
    '''

    
    criterion = nn.NLLLoss(weight, reduction='sum')
    '''
     创建NLL损失函数。
    其中reduction='sum'表示损失是所有元素的总和
    '''
    return criterion

注:确保传入NLL损失的输入已经经过了log_softmax,因为NLLLoss期望的输入是对数概率。

2.1 举例

假设词汇表由以下词汇组成

词汇表: ["<PAD>", "你好", "再见", "是", "吗"]

其中,"<PAD>"是用于填充序列的特殊标记。

因此,vocab_size是5,constants.PAD的索引是0。

现在,假设有以下批量预测输出(batch=2),每一行表示这个样本的预测结果(经过了log和softmax之后)

log_probs = [[-0.2, -1.5, -2.3, -3.1, -1.8],
             [-0.5, -1.2, -0.9, -2.5, -3.0],
            ]

同时目标标签是[1, 2](表示第一个示例的标签是“你好”,第二个是“再见”)

所以

# 创建损失函数
criterion = NLLcriterion(5)

# 示例数据
log_probs = torch.tensor([
    [-0.2, -1.5, -2.3, -3.1, -1.8],
    [-0.5, -1.2, -0.9, -2.5, -3.0],
])
targets = torch.tensor([1, 2])

# 计算损失
loss = criterion(log_probs, targets)
print(loss)
#2.4
#损失 = -(-1.5) - (-0.9) = 1.5 + 0.9 = 2.4

3 dist2weight

'''
将给定的距离矩阵转换为一个权重矩阵
'''
def dist2weight(D, dist_decay_speed=0.8):
    D = D.div(100)
    D = torch.exp(-D * dist_decay_speed)
    '''
    使用指数衰减————让距离较小的元素(距离更近的)获得更大的权重,并且让距离较大的元素获得更小的权重
    '''
    s = D.sum(dim=1, keepdim=True)
    D = D / s
    '''
    逐行手动softmax
    '''

    ## The PAD should not contribute to the decoding loss
    D[constants.PAD, :] = 0.0
    return D

4 KLDIVcriterion

'''
创建KLloss
'''
def KLDIVcriterion(vocab_size):

    criterion = nn.KLDivLoss(reduction='sum')
    
    return criterion

 5 KLDIVloss

'''
计算 KL 散度损失,但它与通常的直接比较输出和目标之间的损失有所不同。

它基于目标索引的 k-最近邻来计算损失
'''
def KLDIVloss(output, target, criterion, V, D):
    """
    output (batch, vocab_size)
    target (batch,)
    criterion (nn.KLDIVLoss)
    V (vocab_size, k) 最近的K个词汇的ID
    D (vocab_size, k) 最近的K个词汇的距离
    """

    ## (batch, k) index in vocab_size dimension
    ## k-nearest neighbors for target
    indices = torch.index_select(V, 0, target)
    '''
    target的维度也即(seq_len*generator_batch)
    也就是generator_batch个sequence 每个元素的ground-truth 单元格
    index_select就把这些单元格作为索引id给提取了出来,得到了一个 (batch, k)

    generator_batch个sequence 每个元素的最近k个邻居单元格
    '''


    ## (batch, k) gather along vocab_size dimension
    outputk = torch.gather(output, 1, indices)
    '''
    output的维度是 (batch, vocab_size)也即(seq_len*generator_batch, vocab_size)
    
    generator_batch个sequence 每个元素在vocab_size个单元格的概率

    这里只考虑最近的k个邻居单元格的概率,所以使用index_select

    得到的(seq_len*generator_batch, k)

    generator_batch个sequence 每个元素的最近k个邻居单元格的概率
    '''

    ## (batch, k) index in vocab_size dimension
    targetk = torch.index_select(D, 0, target)
    '''
    generator_batch个sequence 每个元素的最近k个邻居单元格的距离
    '''
    return criterion(outputk, targetk)

 pytorch 笔记:KLDivLoss-CSDN博客

6 genLoss

def genLoss(gendata, m0, m1, lossF, args):
    """
    One batch loss

    Input:
    gendata: a named tuple contains
        gendata.src (seq_len1, batch): input tensor
        gendata.lengths (1, batch): lengths of source sequences
        gendata.trg (seq_len2, batch): target tensor.
    m0: map input to output.
    m1: map the output of EncoderDecoder into the vocabulary space and do
        log transform.
    lossF: loss function.
    ---
    Output:
    loss
    """
    input, lengths, target = gendata.src, gendata.lengths, gendata.trg
    if args.cuda and torch.cuda.is_available():
        input, lengths, target = input.cuda(), lengths.cuda(), target.cuda()
    #从gendata中提取数据,并根据是否使用GPU进行调整
    
    ## (seq_len2, batch, hidden_size)
    output = m0(input, lengths, target)
    '''
    m0是一个encoder-decoder
    encoder输入input
    
    decoder将encoder的hidden state和target 作为输入,得到和target通常的一个输出
    '''

    batch = output.size(1)
    loss = 0

    ## we want to decode target in range [BOS+1:EOS]
    target = target[1:]

    for o, t in zip(output.split(args.generator_batch),
                    target.split(args.generator_batch)):
        '''
        !!!这里我存疑,output的维度是 (seq_len2, batch, hidden_size),target的维度是(seq_len2, batch)
        那么进行split的时候,是否需要设置dim=1?
        '''
        
        ## (seq_len2, generator_batch, hidden_size) =>
        ## (seq_len2*generator_batch, hidden_size)
        o = o.view(-1, o.size(2))
        #根据论文作者给的注释,如果第二个维度是generator_batch,那上面的split就应该有dim=1

        o = m1(o)
        # (seq_len2*generator_batch, vocab_size)

        ## (seq_len*generator_batch,)
        t = t.view(-1)

        loss += lossF(o, t)

    return loss.div(batch)
    '''
    seq_len2* generator_batch 每个元素到他最近的k个单元格的距离*在这个单元格的概率  ,这个概率距离的和
    '''

genData的格式如下 

 7 disLoss

'''
计算三元组损失
'''
def disLoss(a, p, n, m0, triplet_loss, args):
    """
    a (named tuple): anchor data
    p (named tuple): positive data
    n (named tuple): negative data
    """
    a_src, a_lengths, a_invp = a.src, a.lengths, a.invp
    p_src, p_lengths, p_invp = p.src, p.lengths, p.invp
    n_src, n_lengths, n_invp = n.src, n.lengths, n.invp
    #从命名元组中解包数据

    if args.cuda and torch.cuda.is_available():
        a_src, a_lengths, a_invp = a_src.cuda(), a_lengths.cuda(), a_invp.cuda()
        p_src, p_lengths, p_invp = p_src.cuda(), p_lengths.cuda(), p_invp.cuda()
        n_src, n_lengths, n_invp = n_src.cuda(), n_lengths.cuda(), n_invp.cuda()


    ## (num_layers * num_directions, batch, hidden_size)
    a_h, _ = m0.encoder(a_src, a_lengths)
    p_h, _ = m0.encoder(p_src, p_lengths)
    n_h, _ = m0.encoder(n_src, n_lengths)
    #从命名元组中解包数据

    ## (num_layers, batch, hidden_size * num_directions)
    a_h = m0.encoder_hn2decoder_h0(a_h)
    p_h = m0.encoder_hn2decoder_h0(p_h)
    n_h = m0.encoder_hn2decoder_h0(n_h)
    #使用函数 encoder_hn2decoder_h0 来调整每个隐藏状态的形状

    ## take the last layer as representations (batch, hidden_size * num_directions)
    a_h, p_h, n_h = a_h[-1], p_h[-1], n_h[-1]
    #使用编码器的最后一个层的输出作为数据的表示

    return triplet_loss(a_h[a_invp], p_h[p_invp], n_h[n_invp])
    #使用 triplet_loss 函数计算锚点、正样本和负样本之间的三元组损失

8 validate

def validate(valData, model, lossF, args):
    """
    valData (DataLoader)
    """
    m0, m1 = model
    ## switch to evaluation mode
    m0.eval()
    m1.eval()    
    #在评估之前将模型设置为评估模式,这样可以关闭dropout

    num_iteration = valData.size // args.batch
    if valData.size % args.batch > 0: num_iteration += 1
    #根据验证数据集的大小和批量大小计算需要的迭代次数。

    total_genloss = 0
    for iteration in range(num_iteration):
        gendata = valData.getbatch_generative()
        #获取一个batch的train、target数据
        #分别将train和val数据pad成相同的长度
        
        with torch.no_grad():
            genloss = genLoss(gendata, m0, m1, lossF, args)
            '''
            对于选择的这一个batch的src、target数据
            计算经过encoder-decoder之后的输出,和ground-truth单元格 最近的 k个单元格的加权距离和
            '''
            total_genloss += genloss.item() * gendata.trg.size(1)
    ## switch back to training mode
    m0.train()
    m1.train()
    return total_genloss / valData.size

9 保存模型

def savecheckpoint(state, is_best, args):
    torch.save(state, args.checkpoint)
    if is_best:
        shutil.copyfile(args.checkpoint, os.path.join(args.data, 'best_model.pt'))
    '''
    如果is_best为True,意味着当前的模型是最好的模型,那么它会使用shutil.copyfile函数把args.checkpoint文件复制到一个新的路径
    这个路径由args.data文件夹和文件名'best_model.pt'组成。
    这样做的目的是为了保留一个单独的最好模型的副本
    '''

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/113522.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Run, Don‘t Walk: Chasing Higher FLOPS for Faster Neural Networks(CVPR2023)

文章目录 AbstractIntroduction过去工作存在的不足我们的工作主要贡献&#xff08;待参考&#xff09; Related workCNNViT, MLP, and variants Design of PConv and FasterNetPreliminaryPartial convolution as a basic operatorPConv followed by PWConvFasterNet as a gene…

整理笔记——0欧电阻、电感、磁珠

设计电路时&#xff0c;经常用到0欧电阻、电感、磁珠&#xff0c;这三个基础电子原件万用表量都是“短路”&#xff0c;这三者之间有什么区别&#xff1f;什么情况下用什么原件&#xff1f; 一、0欧电阻 0欧电阻&#xff0c;并不是指元件的电阻值为0&#xff0c;而是电阻值很小…

主机ping、ssh连接不通本地虚拟机

一、问题描述 在使用vscode remote ssh时&#xff0c;连接timeout&#xff0c;而且主机无论如何也ping不通虚拟机&#xff0c;但是虚拟机可以ping通主机。通过vagrant也可以连接虚拟机。 二、解决方案 试了网上包括设置remote ssh在内的许多方法都不行。重新查看主机和虚拟机…

IMX6ULL——GPIO

本章目的&#xff1a;使用GPIO点亮一个LED灯 1.LED原理 &#xff08;1&#xff09;LED类型&#xff1a;插脚LED&#xff1b;贴片LED。 &#xff08;2&#xff09;LED点亮电路 法一&#xff1a; 法二&#xff1a; 我们本章使用法二&#xff0c;使用IMX6ULL的GPIO引脚输出高低电…

8+双疾病+WGCNA+多机器学习筛选疾病的共同靶点并验证表达

今天给同学们分享一篇双疾病WGCNA多机器学习的生信文章“Shared diagnostic genes and potential mechanism between PCOS and recurrent implantation failure revealed by integrated transcriptomic analysis and machine learning”&#xff0c;这篇文章于2023年5月16日发表…

Python 正则表达式(RegEx)指南

正则表达式&#xff08;RegEx&#xff09;是一系列字符&#xff0c;形成了一个搜索模式。RegEx 可用于检查字符串是否包含指定的搜索模式。 RegEx 模块 Python 中有一个内置的包叫做 re&#xff0c;它可以用于处理正则表达式。导入 re 模块&#xff1a; import rePython 中的…

C语言 Number 1 基本数据类型

数据类型的定义 c语言的数据分类基本类型整型浮点型float和double的精度和范围范围精度 枚举类型空类型派生类型派生的一般表达形式 注 c语言的数据分类 首先是针对C语言的数据类型做个整理 大致分为四个大类型 基本类型枚举类型空类型派生类型 那么根据以上四个大类型 我们…

三门问题 最通俗解释+拓展

三门问题是概率论比较经典的一个问题&#xff0c;答案有点反直觉&#xff0c;所以值得学习&#xff0c;理性第一&#xff01;但是&#xff0c;很多网上解释都让人云里雾里&#xff0c;或者干脆解释就是错了&#xff0c;或一上来就贝叶斯公式开始搞数学&#xff0c;其实很简单可…

OpenFeign的简单介绍和功能实操

前言 本文主要做一下OpenFeign的简单介绍和功能实操&#xff0c;实操主要是OpenFeign的超时和重试&#xff0c;在阅读本文章前&#xff0c;请完成《Nacos 注册中心介绍与实操》内的Nacos多模块生产消费者项目 什么是OpenFeign OpenFeign全名Spring Cloud OpenFeign&#xff…

企业服务总线ESB有什么作用?和微服务有什么区别?会如何发展?

企业服务总线ESB是什么 下面这张图&#xff0c;稍微了解些IT集成的朋友应该不陌生。 随着信息化发展不断深入&#xff0c;企业在不同的阶段引入了不同的应用、系统和软件。这些原始的应用系统互不连通&#xff0c;如同一根根独立的烟囱。 但是企业业务是流程化的&#xff0c;…

AI:46-基于深度学习的垃圾邮件识别

🚀 本文选自专栏:AI领域专栏 从基础到实践,深入了解算法、案例和最新趋势。无论你是初学者还是经验丰富的数据科学家,通过案例和项目实践,掌握核心概念和实用技能。每篇案例都包含代码实例,详细讲解供大家学习。 📌📌📌本专栏包含以下学习方向: 机器学习、深度学…

蓝桥白皮书16.0版——1、STEMA 考试综述

目 录 ​​​​​​​STEMA 考试综述 STEMA 考试组别 STEMA 试题数量与计分点 STEMA 考试时长 STEMA 考试成绩计算与发布 STEMA 考试成绩计算 STEMA 考试分数区间 STEMA 考试成绩百分比 STEMA 考试命题原则 STEMA 考试范围 科技素养组考试范围 推荐初级考生阅读 &#xff1…

✔ ★【备战实习(面经+项目+算法)】 11.2学习

✔ ★【备战实习&#xff08;面经项目算法&#xff09;】 坚持完成每天必做如何找到好工作1. 科学的学习方法&#xff08;专注&#xff01;效率&#xff01;记忆&#xff01;心流&#xff01;&#xff09;2. 每天认真完成必做项&#xff0c;踏实学习技术 认真完成每天必做&…

【实验五】题解

T1&#xff1a;缺失的数字 题目描述; 我是敦立坤的爹&#xff01;&#xff01;&#xff01; 一个整数集合中含有n个数字&#xff0c;每个数字都在0n之间。假设0n的n1个数字中有且仅有一个数字不在该集合中&#xff0c;请找出这个数字。 分析&#xff1a; 这里引用一个桶的思…

做测试,写了一周的测试用例,感觉自己像个文员?

“需求不明确&#xff0c;测试用例改来改去&#xff0c;像个文员” 深有感触&#xff0c;瞬间回想起自己在测试行业混迹10年摸爬滚打的曲折路程。为了彻底解决“需求不明确&#xff0c;测试人员应该怎么做”这个问题&#xff0c;我从下面两个方面分享我个人的解决经验&#xff…

68 内网安全-域横向PTHPTKPTT哈希票据传递

目录 演示案例:域横向移动PTH传递-Mimikatz域横向移动PTK传递-Mimikatz域横向移动PTT传递-MS14068&kekeo&local国产Ladon内网杀器测试验收-信息收集,连接等 涉及资源: PTH(pass the hash) #利用lm或ntlm的值进行的渗透测试 PTT(pass the ticket) #利用的票据凭证TGT进行…

NLP 快速入门

文章目录 前言NLP 历史回顾NLP任务语料的标注AI语料标注师岗位职责 TransformersHugging Face模型中文文本分类使用 NLTK 进行文本分类 参考链接开源NLP 前言 学习NLP&#xff0c;解决两个问题&#xff1a; 如何使用别人训练好的模型&#xff1f;如何基于别人的模型&#xff…

力扣 搜索旋转排序数组 二分

&#x1f468;‍&#x1f3eb; 33. 搜索旋转排序数组 class Solution {public int search(int[] nums, int target){int l 0;int r nums.length - 1;while (l < r){int m l r >> 1;//else大法&#xff0c;把无序段抛给else&#xff0c;if只处理有序段 // 需要特…

串口通信(6)应用定时器中断+串口中断实现接收一串数据

本文为博主 日月同辉&#xff0c;与我共生&#xff0c;csdn原创首发。希望看完后能对你有所帮助&#xff0c;不足之处请指正&#xff01;一起交流学习&#xff0c;共同进步&#xff01; > 发布人&#xff1a;日月同辉,与我共生_单片机-CSDN博客 > 欢迎你为独创博主日月同…

第一章 Python基础知识

文章目录 python介绍优点应用领域web框架学习小技巧 python安装linux运行第一个程序Windows 基础数据类型算术运算符变量与赋值操作符变量赋值操作符转义符 获取用户输入与注释获取用户注释 案例&#xff1a;简单计算器实现在这里插入图片描述 总结 python介绍 python是一种面…
最新文章