当前位置：首页 > news >正文

TensorRT(GIE)

news 来源：原创 2024/5/2 17:45:36

TensorRT是可以在NVIDIA各种GPU硬件平台下运行的一个C++推理框架。是一个高性能的深度学习推理（Inference）优化器，可以为深度学习应用提供低延迟、高吞吐率的部署推理

我们利用Pytorch、TF或者其他框架训练好的模型，可以转化为TensorRT的格式，然后利用TensorRT推理引擎去运行我们这个模型，从而提升这个模型在英伟达GPU上运行的速度。速度提升的比例是比较可观的

TensorRT项目立项的时候名字叫做GPU Inference Engine（简称GIE）

相关文章：

tensor与PIL.Image转换

numpy array与PIL.Image的转换

PyTorch Lightning (pl)

torch.jit (Python JIT) (Just-In-Time 即时编译器) (动态图转为静态图)

TorchScript (将动态图转为静态图)(模型部署)(jit)(torch.jit.trace)

linux grub菜单

linux lsblk 列出所有可用盘块/查看系统的磁盘

ssh连接对方机器环境改变

Python处理mat数据集

Python HDF5

Python定时执行程序(schedule)

linux 批量kill进程

为什么Pytorch多卡训练容易导致GPU显存不释放

IPMI 服务器远程管理方法

linux dmesg诊断设备/硬件故障

【RocksDB】TransactionDB源码分析

2017 年终总结 —— 在路上

2017前端实习生面试总结

Android Volley源码解析

android百种动画侧滑库、步骤视图、TextView效果、社交、搜房、K线图等源码

axios请求、和返回数据拦截，统一请求报错提示_012

CAP 一致性协议及应用解析

CSS魔法堂：Absolute Positioning就这个样

DataBase in Android

iBatis和MyBatis在使用ResultMap对应关系时的区别

javascript从右向左截取指定位数字符的3种方法

JS变量作用域

mongo索引构建

Otto开发初探——微服务依赖管理新利器

PermissionScope Swift4 兼容问题

Webpack 4 学习01（基础配置）

持续集成与持续部署宝典Part 2：创建持续集成流水线

初识 webpack

纯 javascript 半自动式下滑一定高度，导航栏固定

动态魔术使用DBMS_SQL

服务器之间，相同帐号，实现免密钥登录

干货 | 以太坊Mist负责人教你建立无服务器应用

给Prometheus造假数据的方法

什么软件可以提取视频中的音频制作成手机铃声

原生js练习题---第五课

这几个编码小技巧将令你 PHP 代码更加简洁

［地铁译］使用SSD缓存应用数据——Moneta项目: 低成本优化的下一代EVCache ...

Kaggle X光肺炎检测比赛第二名方案解析 | CVPR 2020 Workshop

直流电和交流电有什么区别为什么这个时候又要变成直流电呢？交流转换到直流（整流器）直流变交流（逆变器）

#Js篇：单线程模式同步任务异步任务任务队列事件循环setTimeout() setInterval()

#调用传感器数据_Flink使用函数之监控传感器温度上升提醒

(1)Map集合 (2)异常机制 (3)File类 (4)I/O流

（十二）python网络爬虫（理论+实战）——实战：使用BeautfulSoup解析baidu热搜新闻数据

（四）Linux Shell编程——输入输出重定向

(一)为什么要选择C++

(转)shell中括号的特殊用法 linux if多条件判断

(转)Sql Server 保留几位小数的两种做法

.NET CF命令行调试器MDbg入门（二）设备模拟器

.net core 客户端缓存、服务器端响应缓存、服务器内存缓存

.NET 将多个程序集合并成单一程序集的 4+3 种方法