当前位置: 首页 > news >正文

【毕设进行时-工业大数据,数据挖掘】用C++对数据进行整改,修缮一下!

正文之前

因为数据差距实在太大,从10-10000都有,要是全搞决策树我估计我是啥都不用搞了,看着电脑卡死就ok!所以特地将连续的数据转化为连续的数据!看看是不是会生成新的、更好地决策树!

正文

废话不多说!直接丢代码!不然真是难受的一批!写了好一会儿才搞定的!

#include<iostream>
#include<string>
#include<fstream>
using namespace std;

int main()
{
    int count=0;
    float attr[34];
    ifstream in("/Users/zhangzhaobo/Documents/Graduation-Design/Mydata.txt");
    ofstream out("/Users/zhangzhaobo/Documents/Graduation-Design/Data/New_Data.txt");
    string line[34];
    for (int i = 0; i < 34; ++i)
    {
        in>>line[i];
    }
    out<<"Diff_X"<<"\t"<<"Diff_Y"<<"\t";
    for (int i = 4; i < 8; ++i)
    {
        out<<line[i]<<"\t";
    }
    out<<"Diff_Luminosity\t";
    out<<line[10]<<"\t";
    out<<"TypeouOfSteel\t";
    for (int i = 13; i < 27; ++i)
    {
        out<<line[i]<<"\t";
    }
    out<<"Fault";
    out<<endl;
    float maxX,MaxY,MaxL;
    while(count<1941)
    {
        for (int i = 0; i < 34; ++i)
        {
            in>>attr[i];
        }
        float X_dis=attr[1]-attr[0];
        float Y_dis=attr[3]-attr[2];
        float Luminosity_dis=attr[9]-attr[8];
        float TypeOfSteel=attr[11];
        out<<X_dis<<"\t"<<Y_dis<<"\t";
        for (int i = 4; i < 8; ++i)
        {
            out<<attr[i]<<"\t";
        }
        out<<Luminosity_dis<<"\t";
        out<<attr[10]<<"\t";
        out<<TypeOfSteel<<"\t";
        for (int i = 13; i < 27; ++i)
        {
            out<<attr[i]<<"\t";
        }
        int Fault=0;
        for (int i = 0; i < 7; ++i)
        {
            Fault=(Fault+attr[i+27])*2;
        }
        out<<Fault<<endl;
        count++;
    }
    in.close();
    return 0;
}
复制代码

正文

改善之后的属性为:

Diff_X	Diff_Y	Pixels_Areas	X_Perimeter	Y_Perimeter	Sum_of_Luminosity	Diff_Luminosity	Length_of_Conveyer	TypeouOfSteel	Steel_Plate_Thickness	Edges_Index	Empty_Index	Square_Index	Outside_X_Index	Edges_X_Index	Edges_Y_Index	Outside_Global_Index	LogOfAreas	Log_X_Index	Log_Y_Index	Orientation_Index	Luminosity_Index	SigmoidOfAreas	Fault
8	44	267	17	44	24220	32	1687	1	80	0.0498	0.2415	0.1818	0.0047	0.4706	1	1	2.4265	0.9031	1.6435	0.8182	-0.2913	0.5822	128
6	29	108	10	30	11397	39	1687	1	80	0.7647	0.3793	0.2069	0.0036	0.6	0.9667	1	2.0334	0.7782	1.4624	0.7931	-0.1756	0.2984	128
复制代码

为此还特地写了个C++的程序来观察!

#include<iostream>
#include<string>
#include<fstream>
using namespace std;

int main()
{
    string line[72];
    int count=0;
    for (int i = 0; i < 72; ++i)
    {
        cin>>line[i];
    }
    for (int i = 0; i < 24; ++i)
    {
        cout<<"[->"<<i<<": "<<line[i]<<" --> "<<line[i+24]<<" --> "<<line[i+48]<<endl;
        /* code */
    }
}
复制代码

最后整出来还蛮好看!?

[->0: Diff_X --> 8 --> 6
[->1: Diff_Y --> 44 --> 29
[->2: Pixels_Areas --> 267 --> 108
[->3: X_Perimeter --> 17 --> 10
[->4: Y_Perimeter --> 44 --> 30
[->5: Sum_of_Luminosity --> 24220 --> 11397
[->6: Diff_Luminosity --> 32 --> 39
[->7: Length_of_Conveyer --> 1687 --> 1687
[->8: TypeouOfSteel --> 1 --> 1
[->9: Steel_Plate_Thickness --> 80 --> 80
[->10: Edges_Index --> 0.0498 --> 0.7647
[->11: Empty_Index --> 0.2415 --> 0.3793
[->12: Square_Index --> 0.1818 --> 0.2069
[->13: Outside_X_Index --> 0.0047 --> 0.0036
[->14: Edges_X_Index --> 0.4706 --> 0.6
[->15: Edges_Y_Index --> 1 --> 0.9667
[->16: Outside_Global_Index --> 1 --> 1
[->17: LogOfAreas --> 2.4265 --> 2.0334
[->18: Log_X_Index --> 0.9031 --> 0.7782
[->19: Log_Y_Index --> 1.6435 --> 1.4624
[->20: Orientation_Index --> 0.8182 --> 0.7931
[->21: Luminosity_Index --> -0.2913 --> -0.1756
[->22: SigmoidOfAreas --> 0.5822 --> 0.2984
[->23: Fault --> 128 --> 128
复制代码

相关文章:

  • JDBC
  • 动画演示 Delphi 2007 IDE 功能[4] - 自定义界面
  • ASCSDK-------通用包接入文档(UNITY篇)
  • 内存管理[3]
  • Graphics 单元下的公用函数目录
  • 入口文件开始,分析Vue源码实现
  • hive可以drop所有表的bug fix
  • 标准化 归一化
  • MongoDB命令
  • 【转】nGrinder 简易使用教程
  • (备忘)Java Map 遍历
  • Linux vmstat命令实战详解
  • LintCode 31. partitionArray 数组划分
  • ASP.NET-FineUI开发实践-6(二)
  • 十大经典排序算法(动图演示)(转载)
  • (ckeditor+ckfinder用法)Jquery,js获取ckeditor值
  • 【翻译】Mashape是如何管理15000个API和微服务的(三)
  • 2017前端实习生面试总结
  • 4月23日世界读书日 网络营销论坛推荐《正在爆发的营销革命》
  • bearychat的java client
  • es6
  • ES6语法详解(一)
  • github指令
  • Gradle 5.0 正式版发布
  • If…else
  • JS专题之继承
  • Node.js 新计划:使用 V8 snapshot 将启动速度提升 8 倍
  • Redash本地开发环境搭建
  • spring-boot List转Page
  • Spring-boot 启动时碰到的错误
  • 成为一名优秀的Developer的书单
  • 多线程 start 和 run 方法到底有什么区别?
  • 前端面试之闭包
  • 测评:对于写作的人来说,Markdown是你最好的朋友 ...
  • ​ 无限可能性的探索:Amazon Lightsail轻量应用服务器引领数字化时代创新发展
  • # Java NIO(一)FileChannel
  • #鸿蒙生态创新中心#揭幕仪式在深圳湾科技生态园举行
  • (12)Linux 常见的三种进程状态
  • (AtCoder Beginner Contest 340) -- F - S = 1 -- 题解
  • (LeetCode) T14. Longest Common Prefix
  • (四)库存超卖案例实战——优化redis分布式锁
  • (一)Neo4j下载安装以及初次使用
  • (一)使用Mybatis实现在student数据库中插入一个学生信息
  • (转载)深入super,看Python如何解决钻石继承难题
  • *Algs4-1.5.25随机网格的倍率测试-(未读懂题)
  • .babyk勒索病毒解析:恶意更新如何威胁您的数据安全
  • .NET/C# 使用 SpanT 为字符串处理提升性能
  • .netcore如何运行环境安装到Linux服务器
  • .net中应用SQL缓存(实例使用)
  • .php结尾的域名,【php】php正则截取url中域名后的内容
  • [C++]C++入门--引用
  • [C++]unordered系列关联式容器
  • [corCTF 2022] CoRJail: From Null Byte Overflow To Docker Escape
  • [CSS] - 修正IE6不支持position:fixed的bug
  • [Django开源学习 1]django-vue-admin