当前位置：首页 > news >正文

2024年第十七届“认证杯”数学中国数学建模网络挑战赛D题思路（第二阶段）

news 来源：原创 2024/9/28 23:27:42

第二阶段问题：

我们可以利用 MJ 软件来生成大量的 AI 设计图来作为识别 AI 设计的样本数据集，如果这种思路可行，你认为需要构建一个多大的数据集才能保证识别率超过 80%？
如果在今后的设计比赛中，使用 AI 进行设计辅助已经是不可避免，那么人的参与频次、参与深度、人与 AI 的信息交互内容等指标将成为打分的关键依据，请你结合第一阶段的模型，构建一个打分系统，通过一定的问卷调研数据来对设计作品进行评价。

思路与求解

问题1：AI 设计图的数据集大小

要建立一个能够在识别 AI 生成的设计图时具有超过 80% 识别率的数据集，关键是数据集的质量和多样性。MJ 软件生成的图像应覆盖设计的各个方面，包括不同的风格、主题和复杂性级别。以下是几个关键步骤和考虑因素：

数据多样性：确保数据集中包含各种风格和类型的设计图，以覆盖可能的设计范围。
数据量：理论上，更大的数据集能提供更多的信息，有助于提高模型的泛化能力。然而，数据集的大小也受到训练资源和时间的限制。
平衡数据集：数据集中 AI 设计图与非 AI 设计图的比例应该大致相等，避免模型偏向于某一类。
数据标注：每张设计图需要准确的标注，指明是否由 AI 生成。

一般而言，如果是用于复杂任务的深度学习模型，数据集大小通常需要达到数万到数十万级别。具体到 80% 的识别率，可以从一个小数据集（例如 10

相关文章：

解锁Nginx跨域谜题：3步打造安全高效的CORS策略

【Centos7+JDK1.8】Jenkins安装手册

MySql：多表设计-关联查询

slam14讲（第8讲、前端里程计）LK光流、直接法

【pyspark速成专家】3_Spark之RDD编程1

【数据结构】第七节：堆

鸿蒙开发配置官方地图

Python语法学习之 - 生成器表达式（Generator Expression）

【文末附gpt升级方案】UC伯克利的CV三巨头推出的纯视觉大模型在下游任务中的表现分析

爬虫基本原理及requests库用法

从“图形可视化”到“图生代码”，低代码平台的新挑战

AI模型发展之路：开源还是闭源？

YashanDB与慧点科技完成兼容互认证

我把PostgreSQL最核心的插件撸干净了！！！

搜索引擎的设计与实现（四）

java 多线程基础, 我觉得还是有必要看看的

java中的hashCode

laravel with 查询列表限制条数

oschina

pdf文件如何在线转换为jpg图片

php ci框架整合银盛支付

React Native移动开发实战-3-实现页面间的数据传递

react-native 安卓真机环境搭建

Vim Clutch | 面向脚踏板编程……

Vue2 SSR 的优化之旅

Web标准制定过程

坑！为什么View.startAnimation不起作用？

理清楚Vue的结构

漂亮刷新控件-iOS

软件开发学习的5大技巧，你知道吗？

数组的操作

用jQuery怎么做到前后端分离

用quicker-worker.js轻松跑一个大数据遍历

FaaS 的简单实践

阿里云ACE认证学习知识点梳理

#{} 和 ${}区别

#162 (Div. 2)

（4）logging（日志模块）

(function(){})()的分步解析

（补）B+树一些思想

（二）PySpark3：SparkSQL编程

（附源码）springboot 个人网页的网站毕业设计031623

（六）激光线扫描-三维重建

(全注解开发)学习Spring-MVC的第三天

（十）【Jmeter】线程（Threads(Users)）之jp@gc - Stepping Thread Group (deprecated)

（一）Kafka 安全之使用 SASL 进行身份验证 —— JAAS 配置、SASL 配置

（一）Mocha源码阅读: 项目结构及命令行启动

(转) Android中ViewStub组件使用

(转)ABI是什么

（转）Android学习笔记 --- android任务栈和启动模式

（转）shell调试方法

..thread“main“ com.fasterxml.jackson.databind.JsonMappingException: Jackson version is too old 2.3.1

.aanva

.net core 6 集成 elasticsearch 并使用分词器

.net core webapi 部署iis_一键部署VS插件：让.NET开发者更幸福