当前位置: 首页 > news >正文

【译Py】2018年8月,GitHub上的Python数据科学明星项目:自动化机器学习、自然语言处理、可视化、机器学习工作流...

原文作者:Matthew Mayo
原文地址:GitHub Python Data Science Spotlight: AutoML, NLP, Visualization, ML Workflows

img_c335e712aa5f2496a92adfb666192919.jpe
Python数据分析

本文是“五个不容忽视的机器学习项目”一文的续篇。和上篇文章相比,这次选出的项目涉及更多数据科学领域,并且都是GitHub上的开源项目,我们为每个项目都附上了Repo、文档和入门指南的链接,并对每个项目进行了简单介绍。
下面一起来了解一下这些新兴的热门Python库吧,希望本文对你的工作能有所帮助:

  1. Auto-Keras自动机器学习库
    项目链接:https://github.com/jhfjhfj1/autokeras
    文档:http://autokeras.com
    入门指南:https://autokeras.com/#example
    Auto-Keras是用于自动机器学习(AutoML)的开源软件库。自动机器学习的最终目标是让仅拥有一定数据科学知识或机器学习背景的行业专家可以轻松地应用深度学习模型。Auto-Keras提供了很多用于自动研究深度学习模型架构与超参数的函数。
  2. Finetune Scikit-Learn风格的自然语言处理模型微调器
    项目链接:https://github.com/IndicoDataSolutions/finetune
    文档:https://finetune.indico.io
    入门指南:https://finetune.indico.io
    Finetune提供了“通过生成式预训练改进对语言的理解”的预训练语言模型,并扩充了OpenAI/finetune-language-model库。
  3. GluonNLP - 让自然语言处理变得更简单
    项目链接:https://github.com/dmlc/gluon-nlp
    文档:http://gluon-nlp.mxnet.io
    入门指南: https://github.com/dmlc/gluon-nlp#quick-start-guide
    GluonNLP可以使文本处理、数据加载及构建神经模型变得更容易,加快自然语言处理研究的速度。
  4. animatplot - 基于Matplotlib的Python动图库
    项目链接:https://github.com/t-makaro/animatplot
    文档:https://animatplot.readthedocs.io/en/latest
    入门指南: https://animatplot.readthedocs.io/en/latest/tutorial/getting_started.html
    请注意,本库文档里的例子比较简单,本文引用的是该库在GitHub上列出的功能更全、形式更酷的示例图。
    img_37ebbad1a368b88b3cfcaf9afa3bcc5a.gif
    animatplot
  5. MLflow - 机器学习生命周期的开源平台
    项目链接:https://github.com/mlflow/mlflow
    文档:https://mlflow.org/docs/latest/index.html
    入门指南:https://mlflow.org/docs/latest/quickstart.html
    MLflow是用来管理机器学习整体生命周期的开源平台,这个平台提供了以下主要三个功能:
  • MLflow Tracking:跟踪实验,以用来记录和比较机器学习的参数。
  • MLflow Projects:以可复用、可再现的形式,将机器学习的代码进行打包,以便分享给其他数据科学家或传递给生产环境。
  • MLflow Models:管理各类机器学习库中的模型,并部署到不同的模型服务及应用平台。
    MLflow通过访问REST API和CLI实现其功能,所以它不依赖于某个库,并且支持多种机器学习库与编程语言,为了使用方便,它还内置了Python API。

相关文章:

  • ElasticSearch(九):springboot项目集成消息中间件activeMQ
  • BZOJ2157旅游——树链剖分+线段树
  • linux中快速清空文件内容的几种方法
  • JS中的继承
  • MyBatis拦截器原理探究
  • 关于电脑使用习惯的若干看法
  • Docker与Tomcat:去掉项目名称进行访问
  • ab压力测试工具的简单使用
  • 一个开发两年的程序员面试总结
  • sigmoid函数求导
  • rhel7 IP地址配置,DNS配置,NetworkManager查看
  • Nosql介绍
  • UESTC - 1999 也许这是唯一能阻止乐爷AK的方法( Just for Fun )(回文树)
  • 语音和面部识别技术能帮助AI在情商上超越人类吗
  • 5分钟即可掌握的前端高效利器:JavaScript 策略模式
  • codis proxy处理流程
  • CSS进阶篇--用CSS开启硬件加速来提高网站性能
  • CSS选择器——伪元素选择器之处理父元素高度及外边距溢出
  • Js基础知识(四) - js运行原理与机制
  • Laravel 中的一个后期静态绑定
  • MyEclipse 8.0 GA 搭建 Struts2 + Spring2 + Hibernate3 (测试)
  • Objective-C 中关联引用的概念
  • Promise面试题2实现异步串行执行
  • 从伪并行的 Python 多线程说起
  • 基于遗传算法的优化问题求解
  • 老板让我十分钟上手nx-admin
  • 七牛云 DV OV EV SSL 证书上线,限时折扣低至 6.75 折!
  • 区块链技术特点之去中心化特性
  • 听说你叫Java(二)–Servlet请求
  • 我建了一个叫Hello World的项目
  • 终端用户监控:真实用户监控还是模拟监控?
  • 走向全栈之MongoDB的使用
  • ### Cause: com.mysql.jdbc.exceptions.jdbc4.MySQLTr
  • #FPGA(基础知识)
  • #NOIP 2014#day.2 T1 无限网络发射器选址
  • #Z0458. 树的中心2
  • (11)工业界推荐系统-小红书推荐场景及内部实践【粗排三塔模型】
  • (13)Hive调优——动态分区导致的小文件问题
  • (C#)Windows Shell 外壳编程系列9 - QueryInfo 扩展提示
  • (day 12)JavaScript学习笔记(数组3)
  • (NO.00004)iOS实现打砖块游戏(九):游戏中小球与反弹棒的碰撞
  • (pytorch进阶之路)CLIP模型 实现图像多模态检索任务
  • (第二周)效能测试
  • (附源码)springboot美食分享系统 毕业设计 612231
  • (九)信息融合方式简介
  • (力扣)循环队列的实现与详解(C语言)
  • .NET 6 Mysql Canal (CDC 增量同步,捕获变更数据) 案例版
  • .NET CF命令行调试器MDbg入门(四) Attaching to Processes
  • .NET delegate 委托 、 Event 事件,接口回调
  • .net 获取url的方法
  • .NET4.0并行计算技术基础(1)
  • .Net环境下的缓存技术介绍
  • .NET企业级应用架构设计系列之开场白
  • @RequestMapping 的作用是什么?
  • @SuppressWarnings(unchecked)代码的作用