当前位置: 首页 > news >正文

【数据挖掘】2022年2023届秋招知能科技公司机器学习算法工程师 笔试题

岗位:高级机器学习算法工程师
笔试时间:2022-9-28

1 简答题

1、神经网络中防止过拟合的方法

(1)降低模型复杂度

(2)正则化 ,正则化正是通过在损失函数上添加额外的参数稀疏性惩罚项(正则项),来限制网络的稀疏性,以此约束网络的实际容量,从而防止模型出现过拟合。L1正则化是将权值的绝对值之和加入损失函数,使得权值中0值比重增大,因此得到的权值较为稀疏。L2正则化是将权重的平方之和加入损失函数,使得权值分布更加平均,所以权值较为平滑。

(3)Dropout舍弃,在深度学习网络的训练过程中,对于神经网络单元,按照一定的概率将其暂时从网络中丢弃,使得每次训练的网络结构多样。

2、为什么使用relu激活函数

(1)可以使网络训练更快。

相比于sigmoid、tanh,导数更加好求,反向传播就是不断的更新参数的过程,因为其导数不复杂形式简单。

(2)增加网络的非线性。
本身为非线性函数,加入到神经网络中可以是网格拟合非线性映射。

(3)防止梯度消失。
当数值过大或者过小,sigmoid,tanh的导数接近于0,relu为非饱和激活函数不存在这种现象。

(4)使网格具有稀疏性。
由于小于0部分为0,大于0部分才有值,所以可以减少过拟合。

3、 x 1 , x 2 ∈ { 0 , 1 } , y ∈ { 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 , 10 } x1,x2 \in \{0,1\},y \in \{1,2,3,4,5,6,7,8,9,10\} x1,x2{0,1},y{1,2,3,4,5,6,7,8,9,10},已知 p ( Y = y ) = y 10 , P ( x 1 = 1 ∣ Y = y ) = y 10 , ¶ ( x 2 = 1 ∣ Y = y ) = y 540 p(Y=y) = \frac{y}{10},P(x_1=1|Y=y) = \frac{y}{10},\P(x_2=1|Y=y)=\frac{y}{540} p(Y=y)=10y,P(x1=1∣Y=y)=10y,(x2=1∣Y=y)=540y,求 P ( y ∣ x 1 = 0 , x 2 = 1 ) P(y|x_1=0,x_2=1) P(yx1=0,x2=1) ?

在这里插入图片描述

2 编程题

来自题目:Testing Round #16 (Unrated) C. Skier

1、题意: 给一个字符串,N,S,W,E,分别代表上下左右。当走过一个没有走过的边时,花费5秒,如果走过这个边,则花费1秒。(注意:判断的是两点之间的距离,不是单纯的点).给你他的行动轨迹,求消耗的时间。

例子1

NNN
15

例子2

NS
6

例子3

WWEN
16

例子4

WWEE
12

例子5

NWNWS
25

https://blog.csdn.net/moasad/article/details/105991386
(2)解析
将每条路径的两个端点坐标存储起来,使用元组来存储两个坐标,注意一条线段的两个坐标是有两个方向。

direction = {
    'N':(0,1),
    'S':(0,-1),
    'E':(-1,0),
    'W':(1,0)

}
x,y= 0,0
ans = 0
path = 'WWEN' # 输出16
# path ='NWNWS' # 输出25
# x1,y1线段的当前坐标,x,y表示线段的另一个坐标。
visit = set([(0,0,0,0)])
for p in path:
    dx,dy = direction[p]
    x1,y1 = x+dx,y+dy

    if (x1,y1,x,y) in visit or (x,y,x1,y1) in visit:
        ans +=1
    else:
        ans+=5
    # 存储线段,线段的两个坐标,两个方向都要存储
    visit.add((x1,y1,x,y))
    visit.add((x,y,x1,y1))
    x,y =x1,y1 
print(ans)

2、路径长度为l,有 a i a_i ai个路径点,两辆车分别从路径的两端开始,以1个单位的速度相向而行,每当一辆车经过路径点,它的速度提高一个单位每秒,求两辆车会多少秒后相遇?

相关文章:

  • 基于Python的视频中的人脸识别系统设计与实现
  • MySQL主从复制详解
  • 【深度学习入门】- 用电路思想解释感知机
  • 文字生成图片
  • HTTPS的原理浅析与本地开发实践(下)
  • java-多态
  • 一、CSS文本样式[文本基础、文本样式、段落控制]
  • Nginx网络服务的配置
  • m基于随机接入代价的异构网络速率分配算法matlab仿真(包括matlab仿真录像)
  • 【VUE的Form表单】使用v-if切换控件时,表单校验不生效
  • EnumWindowsProc
  • SSL安全证书:免费的SSL证书申请渠道有哪些?
  • SQL语言---数据的查询
  • 建模杂谈系列162 APIFunc: 可靠的复杂函数开发3
  • nslookup命令的常见用法
  • [译]Python中的类属性与实例属性的区别
  • 【跃迁之路】【669天】程序员高效学习方法论探索系列(实验阶段426-2018.12.13)...
  • js
  • js对象的深浅拷贝
  • Laravel核心解读--Facades
  • python学习笔记-类对象的信息
  • 百度地图API标注+时间轴组件
  • 分布式任务队列Celery
  • 复杂数据处理
  • 强力优化Rancher k8s中国区的使用体验
  • 删除表内多余的重复数据
  • 使用Maven插件构建SpringBoot项目,生成Docker镜像push到DockerHub上
  • 算法之不定期更新(一)(2018-04-12)
  • 通信类
  • 物联网链路协议
  • 2017年360最后一道编程题
  • AI又要和人类“对打”,Deepmind宣布《星战Ⅱ》即将开始 ...
  • ​ 轻量应用服务器:亚马逊云科技打造全球领先的云计算解决方案
  • ###C语言程序设计-----C语言学习(6)#
  • #[Composer学习笔记]Part1:安装composer并通过composer创建一个项目
  • #我与Java虚拟机的故事#连载10: 如何在阿里、腾讯、百度、及字节跳动等公司面试中脱颖而出...
  • #我与虚拟机的故事#连载20:周志明虚拟机第 3 版:到底值不值得买?
  • (1)STL算法之遍历容器
  • (9)STL算法之逆转旋转
  • (Oracle)SQL优化技巧(一):分页查询
  • (附源码)计算机毕业设计SSM疫情居家隔离服务系统
  • (剑指Offer)面试题41:和为s的连续正数序列
  • (免费领源码)Java#Springboot#mysql农产品销售管理系统47627-计算机毕业设计项目选题推荐
  • (三)uboot源码分析
  • (四)鸿鹄云架构一服务注册中心
  • (一)搭建springboot+vue前后端分离项目--前端vue搭建
  • (转载)OpenStack Hacker养成指南
  • .NET : 在VS2008中计算代码度量值
  • .NET 的程序集加载上下文
  • .NET 中 GetProcess 相关方法的性能
  • .Net程序猿乐Android发展---(10)框架布局FrameLayout
  • .net下简单快捷的数值高低位切换
  • /boot 内存空间不够
  • @Query中countQuery的介绍
  • [20170713] 无法访问SQL Server