当前位置: 首页 > news >正文

kaggle竞赛宝典 | 量化竞赛第一名的网络模型

本文来源公众号“kaggle竞赛宝典”,仅用于学术分享,侵权删,干货满满。

原文链接:量化竞赛第一名的网络模型

1 简介

今天我们重温Jane Street 大赛第一名的网络模型。该次赛事数据集包含了一组匿名的特征,feature_{0...129},代表真实的股市数据。数据集中的每一行代表一个交易机会,你需要预测一个动作值:1表示进行交易,0表示放弃。每笔交易都有一个相关的权重和响应,它们一起代表交易的回报。日期列是一个整数,表示交易的日期,而ts_id表示时间顺序。

该赛事的第一名选手采用的是AutoEncoder+MLP的网络模型。一起回顾学习一下。

2 模型

2.1 模型结构

模型主要由三个模块组成:

  1. 加入高斯噪音的Autoencoder模块;

  2. Decoder之后数据的原始Loss;

  3. 原始数据+Encoder数据的原始问题的Loss;

2.2 相关细节

  1. 使用自编码器创建新特征,并与原始特征连接,作为下游MLP模型的输入

  2. 在每个交叉验证分割中一起训练自编码器和MLP,以防止数据泄漏

  3. 向自编码器添加目标信息(监督学习),迫使其生成更相关的特征,并为梯度的反向传播创建捷径

  4. 在编码器前添加高斯噪声层,以进行数据增强并防止过拟合

  5. 使用Swish激活函数代替ReLU,以防止“死亡神经元”并平滑梯度

  6. MLP使用批归一化和Dropout

  7. 使用3个不同的随机种子训练模型,并取平均值以减少预测方差

  8. 仅使用在最后两个交叉验证分割中训练的模型(具有不同种子),因为它们已经看到更多的数据

  9. 仅监控MLP的二元交叉熵损失,而不是整体损失,以便早停

  10. 使用Hyperopt找到最佳超参数集

3 核心代码

def create_ae_mlp(num_columns, num_labels, hidden_units, dropout_rates, ls = 1e-2, lr = 1e-3):inp = tf.keras.layers.Input(shape = (num_columns, ))x0 = tf.keras.layers.BatchNormalization()(inp)encoder = tf.keras.layers.GaussianNoise(dropout_rates[0])(x0)encoder = tf.keras.layers.Dense(hidden_units[0])(encoder)encoder = tf.keras.layers.BatchNormalization()(encoder)encoder = tf.keras.layers.Activation('swish')(encoder)decoder = tf.keras.layers.Dropout(dropout_rates[1])(encoder)decoder = tf.keras.layers.Dense(num_columns, name = 'decoder')(decoder)x_ae = tf.keras.layers.Dense(hidden_units[1])(decoder)x_ae = tf.keras.layers.BatchNormalization()(x_ae)x_ae = tf.keras.layers.Activation('swish')(x_ae)x_ae = tf.keras.layers.Dropout(dropout_rates[2])(x_ae)out_ae = tf.keras.layers.Dense(num_labels, activation = 'sigmoid', name = 'ae_action')(x_ae)x = tf.keras.layers.Concatenate()([x0, encoder])x = tf.keras.layers.BatchNormalization()(x)x = tf.keras.layers.Dropout(dropout_rates[3])(x)for i in range(2, len(hidden_units)):x = tf.keras.layers.Dense(hidden_units[i])(x)x = tf.keras.layers.BatchNormalization()(x)x = tf.keras.layers.Activation('swish')(x)x = tf.keras.layers.Dropout(dropout_rates[i + 2])(x)out = tf.keras.layers.Dense(num_labels, activation = 'sigmoid', name = 'action')(x)model = tf.keras.models.Model(inputs = inp, outputs = [decoder, out_ae, out])model.compile(optimizer = tf.keras.optimizers.Adam(learning_rate = lr),loss = {'decoder': tf.keras.losses.MeanSquaredError(), 'ae_action': tf.keras.losses.BinaryCrossentropy(label_smoothing = ls),'action': tf.keras.losses.BinaryCrossentropy(label_smoothing = ls), },metrics = {'decoder': tf.keras.metrics.MeanAbsoluteError(name = 'MAE'), 'ae_action': tf.keras.metrics.AUC(name = 'AUC'), 'action': tf.keras.metrics.AUC(name = 'AUC'), }, )return model

4 参考文献

  1. https://www.kaggle.com/competitions/jane-street-market-prediction/discussion/224348

  2. https://www.kaggle.com/code/gogo827jz/jane-street-supervised-autoencoder-mlp

THE END !

文章结束,感谢阅读。您的点赞,收藏,评论是我继续更新的动力。大家有推荐的公众号可以评论区留言,共同学习,一起进步。

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 【系统架构设计师】论文:论软件开发平台的选择与应用
  • NPJ系列|放射组学与多组学数据整合:推进精准肿瘤学的新模式|文献速递·24-08-25
  • 虚幻5|制作一个木桩,含血量及伤害数字
  • python代码错误集合
  • Linux自旋锁和读写锁
  • Runnable
  • Flutter-->Widget上屏之路
  • git cherry-pick 合并单个提交
  • 【OSCP系列】OSCP靶机-Dawn1(原创)
  • ESP32 出现 failed to load RF 报错
  • 高级java每日一道面试题-2024年8月25日-框架篇[Spring篇]-Spring框架中请举例解释@Required注解?
  • 从头到尾快速学习一遍Linux,高级工程师多年实践实战经验精华总结和实例示例,第四章:高阶使用
  • 云计算实训30——自动化运维(ansible)
  • Javascript——JSDoc 风格的注释语法 为参数添加说明
  • <数据集>斯坦福狗狗识别数据集<目标检测>
  • [译]如何构建服务器端web组件,为何要构建?
  • 《用数据讲故事》作者Cole N. Knaflic:消除一切无效的图表
  • 【每日笔记】【Go学习笔记】2019-01-10 codis proxy处理流程
  • CSS3 聊天气泡框以及 inherit、currentColor 关键字
  • electron原来这么简单----打包你的react、VUE桌面应用程序
  • JDK9: 集成 Jshell 和 Maven 项目.
  • Spring Cloud Alibaba迁移指南(一):一行代码从 Hystrix 迁移到 Sentinel
  • Vim 折腾记
  • 表单中readonly的input等标签,禁止光标进入(focus)的几种方式
  • 前嗅ForeSpider教程:创建模板
  • # 消息中间件 RocketMQ 高级功能和源码分析(七)
  • #pragma multi_compile #pragma shader_feature
  • $jQuery 重写Alert样式方法
  • (2022 CVPR) Unbiased Teacher v2
  • (3)(3.2) MAVLink2数据包签名(安全)
  • (6)STL算法之转换
  • (C语言)输入自定义个数的整数,打印出最大值和最小值
  • (第二周)效能测试
  • (动手学习深度学习)第13章 计算机视觉---图像增广与微调
  • (分类)KNN算法- 参数调优
  • (附源码)spring boot校园健康监测管理系统 毕业设计 151047
  • (十)T检验-第一部分
  • (已解决)Bootstrap精美弹出框模态框modal,实现js向modal传递数据
  • (转)es进行聚合操作时提示Fielddata is disabled on text fields by default
  • .cn根服务器被攻击之后
  • .MSSQLSERVER 导入导出 命令集--堪称经典,值得借鉴!
  • .net core 管理用户机密
  • .NET delegate 委托 、 Event 事件,接口回调
  • .NET 表达式计算:Expression Evaluator
  • .NET面试题解析(11)-SQL语言基础及数据库基本原理
  • .Net转Java自学之路—基础巩固篇十三(集合)
  • @configuration注解_2w字长文给你讲透了配置类为什么要添加 @Configuration注解
  • @SentinelResource详解
  • [2018/11/18] Java数据结构(2) 简单排序 冒泡排序 选择排序 插入排序
  • [Android] 240204批量生成联系人,短信,通话记录的APK
  • [C#]winform部署yolov5-onnx模型
  • [C++]——带你学习类和对象
  • [codeforces]Levko and Permutation
  • [English]英语积累本
  • [Git 1]基本操作与协同开发