面经总结系列(二): 面壁智能大模型算法工程师

在这里插入图片描述

👨‍💻作者简介: CSDN、阿里云人工智能领域博客专家,新星计划计算机视觉导师,百度飞桨PPDE,专注大数据与AI知识分享。✨公众号:GoAI的学习小屋 ,免费分享书籍、简历、导图等,更有交流群分享宝藏资料,关注公众号回复“加群”或➡️点击链接 加群。

🎉AI学习星球推荐: GoAI的学习社区 知识星球是一个致力于提供《机器学习 | 深度学习 | CV | NLP | 大模型 | 多模态 | AIGC 》各个最新AI方向综述、论文等成体系的学习资料,配有全面而有深度的专栏内容,包括不限于 前沿论文解读、资料共享、行业最新动态以、实践教程、求职相关(简历撰写技巧、面经资料与心得)多方面综合学习平台,强烈推荐AI小白及AI爱好者学习,性价比非常高!加入星球➡️点击链接

💚AI面经专栏总结: 本专栏主要为总结各小中大厂的面经系列总结,内容涵盖了多个热门技术领域,包括但不限于算法、机器学习、CV、NLP、大模型、测开、大数据、数分等,内容包括问题及详细答案,此外金邀请了行业内经验丰富的技术专家和面试官,分享面试经验和技巧,帮助求职者顺利通关各类技术面试。

算法工程师面经系列

面壁智能 大模型算法工程师 base北京

  1. 首先是自我介绍+实习项目介绍
    因为我没有实际的大模型经验,所以问我的偏基础。

  2. Adam优化器
    自适应优化算法,可以根据历史梯度信息来调整学习率,对参数的更新进行了归一化处理,使得每个参数的更新都有一个相似的量级,从而提高训练效果。
    Adam在动量SGD的基础上增加了二阶动量,通过其来自适应控制步长,当梯度较小时,整体的学习率就会增加,反之会缩小。

  3. 各种激活函数及其优缺点
    一文读懂常见激活函数 - 知乎

  4. Transformer的结构,其中解码器和编码器的attention有什么不同
    其应用方式和关注的对象有所不同:
    编码器的自注意力:
    编码器的自注意力用于处理输入序列的元素,每个编码器层的自注意力机制关注输入序列中的不同位置,以学习各元素之间的关系。编码器的自注意力有助于将输入序列的信息编码为一种上下文感知的表示,以供解码器使用。

解码器的自注意力:
解码器的自注意力用于处理已生成的目标序列的部分或全部元素,以预测下一个目标元素。
在解码器中,为了避免信息泄露,自注意力机制通常会掩盖(Mask)当前时刻之后的信息,以确保在生成目标序列时不会使用未来信息。解码器的自注意力有助于将上下文信息与已生成的部分目标序列关联起来,以支持逐步生成目标语言的词语。

编码器-解码器注意力(Encoder-Decoder Attention):
在解码器中,除了自注意力,还使用编码器-解码器注意力来获取与源语言序列相关的信息。
编码器-解码器注意力关注源语言序列的各个元素,以帮助解码器理解输入序列与当前解码时刻的关系。

这种注意力机制用于将源语言的上下文信息引入到解码器中,以支持翻译或序列生成任务。
编码器和解码器中的自注意力和编码器-解码器注意力的作用分别是编码输入信息和生成输出信息,并在不同的上下文中使用。编码器的自注意力用于处理源语言序列,而解码器的自注意力用于处理目标语言序列。编码器-解码器注意力用于建立源语言和目标语言序列之间的关联,以便在翻译或序列生成任务中生成有意义的输出。

  1. LN和BN的不同,为什么transformer用LN
    LN和BN主要是作用的维度不同,LN是在特征这个维度,BN是在batch这个维度。
    LN 在处理自注意力模型中更适合,因为它更能满足序列数据的特性,减小梯度问题,同时保持了输入特征的独立性。
    用norm的目的是为了数值稳定 防止梯度出现异常 你将什么东西看作一个整体 就对这个整体进行norm 不同整体之间是分别进行norm的,一个句子里的token的意义和句子本身有关 而不是和不同句子有关 所以用LN。

  2. distribute和non-distribute有什么区别?
    distribute指分布式训练, 是在多个计算节点上并行训练模型的方法。通常,每个节点都包含一个或多个GPU,每个GPU都用于处理一部分数据,分布式训练通常用于处理大规模数据集或复杂的深度学习模型,以加快训练速度和提高性能。
    Non-distributed 指非分布式训练,是在单个计算节点上训练模型的方法。在这种情况下,训练数据和模型参数都位于单个计算节点上。非分布式训练通常用于较小的数据集或简单的深度学习模型,或者是为了快速原型开发。在非分布式训练中,通常使用单个GPU或CPU来执行训练。

  3. 简述目前各种cv模型的发展趋势和方向

  4. Codeing题目
    现在有一个整数数组 ,请找出一个正整数满足以下两个条件:1)不在数组中;2)最小。
    输入:array = [1,3,0]
    输出:2
    输入:array = [2,4,-1,1]
    输出:3
    输入:array = [4,8,9,11,12]
    输出:1

思路:
哈希+二分

代码:

def func(nums):
    n = len(nums)
    d = {}
    nums = sorted(list(set(nums)))
    for i in range(n):
        d[nums[i]] = i
    if 1 not in d:
        return 1
    if d[nums[-1]] - d[1] == nums[-1] - 1:
        return nums[-1] + 1
    l, r = 1, nums[-1]
    res = 0
    while l <= r:
        mid = (l + r) >> 1
        if mid not in d:
            res = mid
            r = mid - 1
        else:
            if d[mid] - d[1] == mid - 1:
                l = mid + 1
            else:
                r = mid - 1
                res = r
    return res

nums1 = [1,3,0]
print(func(nums1))

nums2 = [2,4,-1,1]
print(func(nums2))

nums3 = [4,8,9,11,12]
print(func(nums3))

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/592302.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

设计模式之数据访问对象模式

在Java编程的浩瀚星海中&#xff0c;有一个模式低调却强大&#xff0c;它像是一位默默无闻的超级英雄&#xff0c;支撑起无数应用的数据脊梁——那就是数据访问对象&#xff08;DAO, Data Access Object&#xff09;模式&#xff01;想象一下&#xff0c;如果你能像操纵魔法一样…

网络基础(全)

协议 ”协议“就是一种约定。那么协议需要需要管理吗&#xff1f;答案是当然需要管理呀。 操作系统要进行协议管理——先描述&#xff0c;在组织协议本质就是软件&#xff0c;软件是可以进分层的协议在设计的时候&#xff0c;就是被层状的划分的为什么要划分为层状结呢&#…

综合能源系统:Modbus转IEC104网关解决方案

Modbus转IEC104网关BE102 方案概述 Modbus和IEC104是两种通信协议&#xff0c;各自适用于不同行业和场景&#xff0c;其中Modbus常见于工业自动化&#xff0c;而IEC104则主导电力行业。在某些项目中&#xff0c;需要将Modbus设备的数据传至IEC104电力平台&#xff0c;但两者协…

[嵌入式系统-65]:RT-Thread-组件:FinSH控制台, 用户与RT Thread OS实时命令行交互工具

目录 FinSH 控制台 1. FinSH 简介 2. FinSH 内置命令 - 内核代码自身提供的命令 显示线程状态 显示信号量状态 显示事件状态 显示互斥量状态 显示邮箱状态 显示消息队列状态 显示内存池状态 显示定时器状态 显示设备状态 显示动态内存状态 3. 自定义 FinSH 命令 …

【5/01-5/03】 Arxiv安全类文章速览

知识星球 首先推荐一下我们的知识星球&#xff0c;以AI与安全结合作为主题&#xff0c;包括AI在安全上的应用和AI本身的安全&#xff1b; 加入星球你将获得&#xff1a; 【Ai4sec】&#xff1a;以数据驱动增强安全水位&#xff0c;涵盖内容包括&#xff1a;恶意软件分析&…

MATLAB中功率谱密度计算pwelch函数使用详解

MATLAB中功率谱密度计算pwelch函数使用详解 目录 前言 一、pwelch函数简介 二、pwelch函数参数说明 三、pxx pwelch(x)示例 四、[pxx,f]pwelch(x,window,noverlap,nfft,fs)示例 四、[pxx,f] pwelch(x,window,noverlap,nfft,fs,freqrange,spectrumtype)示例 五、多通道功…

# cmd 报错 “npm 不是内部或外部命令,也不是可运行的程序 或批处理文件”

cmd 报错 “npm 不是内部或外部命令,也不是可运行的程序 或批处理文件” 1、报错原因分析&#xff1a; Node.js 没有安装或安装不正确。 npm 的路径没有添加到系统环境变量中。 安装 Node.js 时选择了不包含 npm 的安装选项。 2、解决方法&#xff1a; 1&#xff09;在 cm…

【房屋】租房攻略,萌新第一次租房需要考虑的要素(通勤、地段、房源)

【房屋】租房攻略&#xff0c;萌新第一次租房需要考虑的要素&#xff08;通勤、地段、房源&#xff09; 文章目录 1、位置要好&#xff08;通勤近 vs 地段好&#xff09;2、户型要好&#xff08;朝向/楼层&#xff0c;独卫/家具&#xff0c;水电费&#xff09;3、价格要便宜4、…

Github 2024-05-03 Java开源项目日报 Top9

根据Github Trendings的统计,今日(2024-05-03统计)共有9个项目上榜。根据开发语言中项目的数量,汇总情况如下: 开发语言项目数量Java项目9Kotlin项目1C++项目1libGDX: 跨平台Java游戏开发框架 创建周期:4284 天开发语言:Java, C++协议类型:Apache License 2.0Star数量:2…

DDD:根据maven的脚手架archetype生成ddd多模块项目目录结构

随着领域驱动的兴起&#xff0c;很多人都想学习如何进行ddd的项目开发&#xff0c;那ddd的项目结构是怎么样的&#xff1f;又是如何结合SpringBoot呢&#xff1f;那么针对这个问题&#xff0c;笔者使用maven的archetype封装一个相对通用的ddd的项目目录&#xff0c;方便一键生成…

函数模板 template

函数模板的定义和调用 注意&#xff1a; 在调用函数模板时&#xff0c;编译器会根据调用的函数的参数类型自动推导出T的类型。 优先选择普通函数 强制调用函数模板 函数模板不能对函数的参数自动强制类型转换 myPrintAll(10,b)//普通函数&#xff0c;因为普通函数将b强制转换成…

安装vscode基础配置,es6基础语法,

https://code.visualstudio.com/ es6 定义变量 const声明常量&#xff08;只读变量&#xff09; // 1、声明之后不允许改变 const PI “3.1415926” PI 3 // TypeError: Assignment to constant variable. // 2、一但声明必须初始化&#xff0c;否则会报错 const MY_AGE /…

极简单行阅读器:上班族的摸鱼神器

在忙碌的工作日中&#xff0c;我们经常需要寻找一些方式来放松自己&#xff0c;而阅读无疑是一种既能够放松心情&#xff0c;又能增长知识的方式。今天&#xff0c;我要向大家介绍一个名为“极简单行阅读器”的神器&#xff0c;它不仅能够满足你的阅读需求&#xff0c;还能让你…

时也命也!反派失败于错估了主角的实力——早读(逆天打工人爬取热门微信文章解读)

此子断不可留 引言Python 代码第一篇 洞见 人到中年最大的清醒&#xff1a;时也&#xff0c;运也&#xff0c;命也第二篇 人民日报要闻社会政策 结尾 自知之明是最难得的知识 真正的智慧来自于对自己能力和局限的深刻理解 引言 最近在看仙葫 然后昨天晚上刷了一下这个诛仙 发现…

Qt之信号与槽

槽的本质&#xff1a;对信号响应的函数。 信号函数和槽函数通常位于某个类中&#xff0c;和普通的成员函数相⽐&#xff0c;它们的特别之处在于&#xff1a; 信号函数⽤ signals 关键字修饰&#xff0c;槽函数⽤ public slots、protected slots 或者 private slots 修饰。sign…

前端基础学习html-->表单标签

目录 表单标签&#xff1a; 表单域&#xff1a; 表单控件(表单元素)&#xff1a; 提示信息: 表单标签&#xff1a; 表单标签顾名思义就是一种表格&#xff0c;用于收集用户信息 在html&#xff0c;一个完整的表单域是由表单域&#xff0c;表单控件(表单元素)和提示信息组…

揭秘Fabric交易流程:一文带你深入了解

随着区块链技术的日益普及&#xff0c;Hyperledger Fabric作为一种联盟链解决方案&#xff0c;受到了广泛关注。那么&#xff0c;Fabric的交易流程究竟是怎样的呢&#xff1f;本文将为您一一揭晓。 1. Fabric交易的参与方 客户端&#xff1a;交易流程的发起方&#xff0c;发起…

Java web第五次作业

1.在idea中配置好数据源 2、视频案例中只给出了查询所有结果的示例&#xff0c;请自己完成添加、删除、修改操作的代码。以下供参 考。 Delete("delete from emp where id#{id}") public void delete(Integer id); 测试代码 Test public void testDelete(){ empMa…

springboot 整合 knife4j-openapi3

适用于&#xff1a;项目已使用shiro安全认证框架&#xff0c;整合knife4j-openapi3 1.引入依赖 <!-- knife4j-openapi3 --> <dependency><groupId>com.github.xiaoymin</groupId><artifactId>knife4j-openapi3-spring-boot-starter</artifa…

SpringBoot+Vue项目在线视频教育平台

一、前言介绍 本系统采用的数据库是Mysql&#xff0c;使用SpringBoot框架开发&#xff0c;运行环境使用Tomcat服务器&#xff0c;idea是本系统的开发平台。在设计过程中&#xff0c;充分保证了系统代码的良好可读性、实用性、易扩展性、通用性、便于后期维护、操作方便以及页面…