当前位置: 首页 > news >正文

腾讯大模型算法实习生面试题,大家秋招上岸

本人情况

关于博主: 博主是过年某985研二,过完年打算找大厂实习offer,本次主要记录了本小菜研找实习的坎坷历程,

欢迎大佬们给建议!!!

应聘岗位: 腾讯大模型算法实习生
面试轮数: 第一轮 整体面试感觉:偏难

在这里插入图片描述

技术问题

  1. 分布式训练框架都了解哪些,能不能简单介绍一下?
  2. 你了解 deepspeed,那介绍zero1,2,3分别是什么,分析训练时候显存占用? 参考:【图解分布式训练(八)】
  3. 说-下 Transformer 的架构和其内部细节?【必考题】建议
    把【Transformer常见面试篇】Transformer常见面试篇)里面的题目都刷一遍!!!
  4. 介绍大模型推理过程中,可以通过调节哪些参数提高性能?参考:【大模型(LLMs)推理面】
  5. 你既然做过 RAG,能不能介绍一下 RAG,大模型在里面主要是起到什么作用?
  6. 大模型训练的三种并行是什么?通讯开销比?
  7. 手撕代码。给一个md维度的矩阵,m代表样本数量,d是样本的维度。请使用不超过mm复杂度的代码求解其亮亮的欧式距离?
  8. llama2中使用的注意力机制是什么?手写实现下分组注意力。
  9. 了解langchain吗?讲讲其结构。
  10. 对位置编码熟悉吗?讲讲几种位置编码的异同RLHF的具体工程是什么?包含了哪几个模型?
  11. 分别讲讲encoder-only、decoder-only、encoder-decoder 几种大模型的代表作。
  12. 具体讲讲 p-tuning、lora等微调方法,并指出它们与传统fine-tuning微调有何不同。
  13. 显存不够一般怎么解决的?
  14. 几种主流大模型的 loss 了解过吗?
  15. 有哪些异同?了解半精度训练吗?
  16. 展开讲讲。deepspeed 用过吗?展开讲讲。
《字节大模型算法实习生面试题》已经整理上传CSDN,还有完整版的大模型 AI 学习资料,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

PDF书籍: 完整版本链接获取

👉[CSDN大礼包🎁:《字节大模型算法实习生面试题》免费分享(安全链接,放心点击)]👈


在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

《字节大模型算法实习生面试题》已经整理上传CSDN,还有完整版的大模型 AI 学习资料,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

PDF书籍: 完整版本链接获取

👉[CSDN大礼包🎁:《字节大模型算法实习生面试题》免费分享(安全链接,放心点击)]👈

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 【VUE3.0】动手做一套像素风的前端UI组件库---Button
  • SQL编程题复习(24/9/20)
  • 【随手笔记】使用J-LINK读写芯片内存数据
  • Java:List<String> 转换List<BigDecimal> 并求和
  • 【系统架构设计师】专业英语90题(附答案详解)
  • 手写Spring
  • 0基础跟德姆(dom)一起学AI 数据处理和统计分析04-Panda入门
  • ArrayList和Array有什么区别?
  • 【RabbitMQ 项目】项目概述
  • 9.20-使用k8s部署wordpress项目
  • ELF文件结构
  • Git入门学习(1)
  • 基于协同过滤算法+PHP的新闻推荐系统
  • 详解Linux中cat命令
  • linux-安全管理-防火墙与网络安全
  • 【每日笔记】【Go学习笔记】2019-01-10 codis proxy处理流程
  • 【译】React性能工程(下) -- 深入研究React性能调试
  • 11111111
  • 2017-09-12 前端日报
  • Angularjs之国际化
  • C++类的相互关联
  • Linux下的乱码问题
  • MQ框架的比较
  • PHP那些事儿
  • vue-loader 源码解析系列之 selector
  • 聊聊hikari连接池的leakDetectionThreshold
  • 浏览器缓存机制分析
  • 推荐一款sublime text 3 支持JSX和es201x 代码格式化的插件
  • 微信小程序填坑清单
  • 06-01 点餐小程序前台界面搭建
  • postgresql行列转换函数
  • ​猴子吃桃问题:每天都吃了前一天剩下的一半多一个。
  • #java学习笔记(面向对象)----(未完结)
  • #NOIP 2014# day.1 T3 飞扬的小鸟 bird
  • (19)夹钳(用于送货)
  • (2)关于RabbitMq 的 Topic Exchange 主题交换机
  • (7)STL算法之交换赋值
  • (C#)if (this == null)?你在逗我,this 怎么可能为 null!用 IL 编译和反编译看穿一切
  • (Redis使用系列) SpringBoot中Redis的RedisConfig 二
  • (阿里云万网)-域名注册购买实名流程
  • (编译到47%失败)to be deleted
  • (附源码)计算机毕业设计SSM基于健身房管理系统
  • (贪心 + 双指针) LeetCode 455. 分发饼干
  • (贪心) LeetCode 45. 跳跃游戏 II
  • (原創) 如何優化ThinkPad X61開機速度? (NB) (ThinkPad) (X61) (OS) (Windows)
  • .DFS.
  • .NET 8.0 中有哪些新的变化?
  • .NET Core 2.1路线图
  • .NET Core中的时区转换问题
  • .net framwork4.6操作MySQL报错Character set ‘utf8mb3‘ is not supported 解决方法
  • .NET 使用 ILMerge 合并多个程序集,避免引入额外的依赖
  • .net(C#)中String.Format如何使用
  • [ 蓝桥杯Web真题 ]-Markdown 文档解析
  • []FET-430SIM508 研究日志 11.3.31
  • [8] CUDA之向量点乘和矩阵乘法