当前位置: 首页 > news >正文

整理样本标签

%%%整理样本标签:
%%%1. 手动删除坏样本; 2.将训练样本和测试样本分开;
%%%3. 增加训练样本和对应标签(筛选标签,然后得到对应类别的文件名,从文件夹中挑选样本,并重命名);

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%读取原标签表格
[N, T] = xlsread('F:\kaggle_data_zip\train_zip\trainLabels.csv\trainLabels.xls');
%%读取所有标签,N是数字,T是文本

T=T(2:35111);%%只留下文件名对应的文本

for i=1:35110
    train(i).image=T{i};
    train(i).level=N(i);
end
%%%存入train 和 test 结构体中
test=train(length(train)-1000+1:length(train));
train=train(1:length(train)-1000);
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

%%将训练和测试标签分别保存,先将结构体转化成cell,然后再将cell写入excel文件
testcell=cell(1000,2);
for i=1:length(test)
    testcell{i,1}=test(i).image;
    testcell{i,2}=test(i).level;
end
xlswrite('F:\kaggle_data_zip\train_zip\test.xls',testcell,'sheet1');

traincell=cell(34110,2);
for i=1:length(train)
    traincell{i,1}=train(i).image;
    traincell{i,2}=train(i).level;
end
xlswrite('F:\kaggle_data_zip\train_zip\train.xls',traincell,'sheet1');

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%不同类别标签筛选,不用排序
H=cell(length(train),1);
for i=1:length(train)
    if (train(i).level==0)
        H{i}=train(i).image;
    end
end
xlswrite('F:\kaggle_data_zip\train_zip\A.xls',H,'sheet1');%% 在excel表格中删除空行
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

clear all
im={};
[p, pp] = xlsread('F:\kaggle_data_zip\train_zip\B.xls');%% 读出新的表格
for i=1:length(pp)     %% 将cell再换成结构体
    dis(i).image=strcat(pp{i},'.jpeg');
    path=strcat('F:\AAAAA\角度\角度180\',dis(i).image);
    im{i}=imread(path);
    imwrite(im{i},strcat('F:\DR\train\B+\','30a',dis(i).image),'jpeg');% 将不同的类别的图像,分别写入到不同的文件夹下面
    im{i}=1;
end


%%%从不同类别的样本数据中,打乱后,随机挑选一定数量的样本
clear all
dis3=dir('F:\DR\train\E+\*jpeg');%%%所有样本
dis2=dis3(randperm(length(dis3)));%%%随机打乱
dis=dis2(1:int16(length(dis3)));%%%挑选一定数量

%%读取不同种类的数据并为他们加上标签,并输出位excel表格;当要将cell转换成表格时,维数过大也不行,第0类就不行。
%%我们在第0类只选取一部分数据,所以,不会出现这个问题。
im={};
for i=1:length(dis)
    path=strcat('F:\DR\train\E+\',dis(i).name);
    im{i}=imread(path);%%将挑选的样本添加到相应的 A/B/C/D ++ 文件夹中
    imwrite(im{i},strcat('F:\DR\train\E++\',dis(i).name),'jpeg');
    im{i}=1;
    dis1(i).image=dis(i).name;
    dis1(i).level=4;
    label0{i,1}=dis1(i).image;
    label0{i,2}=dis1(i).level;
end
xlswrite('F:\DR\train\4.xls',label0,'sheet1'); %%注意,E+ 文件夹中的数据处理,是100%

%%%给没后缀的名字加后缀! 也可以用txt文档中的替换功能;
%%% 直接写出文件夹中样本标签EXCEL。
clear all
dis=dir('F:\DR\train\A\*jpeg');%%%A所有样本
im={};
for i=1:length(dis)
    dis1(i).image=dis(i).name;
    dis1(i).level=0;
    label0{i,1}=dis1(i).image;
    label0{i,2}=dis1(i).level;
end
xlswrite('F:\DR\train\A1.xls',label0,'sheet1');

 

相关文章:

  • OpenSSL命令---s_client
  • Wireshark设置interface 时提示“There are no interfaces on which a capture can be done ”
  • MooseFS维护技巧集锦
  • linux 文件管理
  • Java安全——提供者相关的体系架构
  • 服务器TIME_WAIT和CLOSE_WAIT详解和解决办法
  • vijos 1426
  • 百度地图获取应用SHA1
  • Android Design Support Library使用详解——Snackbar
  • linux安全之iptables防火墙详解1
  • Python学习总结13:os模块
  • 如何打造100亿SDK累计覆盖量的大数据系统
  • 虚拟机的封装
  • dplyr 数据操作 数据排序 (arrange)
  • jquery分页滑动插件(鼠标可控制上下滑动)
  • Java精华积累:初学者都应该搞懂的问题
  • mysql 数据库四种事务隔离级别
  • Mysql优化
  • Python进阶细节
  • Spring核心 Bean的高级装配
  • 翻译--Thinking in React
  • 后端_ThinkPHP5
  • 前端临床手札——文件上传
  • 提醒我喝水chrome插件开发指南
  • 问题之ssh中Host key verification failed的解决
  • 我感觉这是史上最牛的防sql注入方法类
  • 小程序button引导用户授权
  • 【云吞铺子】性能抖动剖析(二)
  • 400多位云计算专家和开发者,加入了同一个组织 ...
  • LIGO、Virgo第三轮探测告捷,同时探测到一对黑洞合并产生的引力波事件 ...
  • 阿里云IoT边缘计算助力企业零改造实现远程运维 ...
  • 摩拜创始人胡玮炜也彻底离开了,共享单车行业还有未来吗? ...
  • (007)XHTML文档之标题——h1~h6
  • (1)Nginx简介和安装教程
  • (附源码)springboot学生选课系统 毕业设计 612555
  • (入门自用)--C++--抽象类--多态原理--虚表--1020
  • (三)centos7案例实战—vmware虚拟机硬盘挂载与卸载
  • .java 9 找不到符号_java找不到符号
  • .mkp勒索病毒解密方法|勒索病毒解决|勒索病毒恢复|数据库修复
  • .Net CoreRabbitMQ消息存储可靠机制
  • .Net FrameWork总结
  • .net 使用$.ajax实现从前台调用后台方法(包含静态方法和非静态方法调用)
  • .NET/C# 使用 #if 和 Conditional 特性来按条件编译代码的不同原理和适用场景
  • .NET成年了,然后呢?
  • .Net的C#语言取月份数值对应的MonthName值
  • .net解析传过来的xml_DOM4J解析XML文件
  • .php文件都打不开,打不开php文件怎么办
  • @GetMapping和@RequestMapping的区别
  • @private @protected @public
  • [04]Web前端进阶—JS伪数组
  • [android] 请求码和结果码的作用
  • [Android]使用Git将项目提交到GitHub
  • [APIO2012] 派遣 dispatching
  • [C#]手把手教你打造Socket的TCP通讯连接(一)
  • [C++]Leetcode17电话号码的字母组合