当前位置: 首页 > news >正文

OrangePi AIpro 开箱初体验及语音识别样例

OrangePi AIpro 开箱初体验及语音识别样例

一、 前言

首先非常感谢官方大大给予这次机会,让我有幸参加此次活动。

 

OrangePi AIpro联合华为精心打造,采用昇腾AI技术路线,具体为4核64位处理器+AI处理器,集成图形处理器,支持8TOPS AI算力,拥有8GB/16GB LPDDR4X,可以外接32GB/64GB/128GB/256GB eMMC模块,支持双4K高清输出。并且OrangePi AIpro引用了相当丰富的接口,包括两个HDMI输出、GPIO接口、Type-C电源接口、支持SATA/NVMe SSD 2280的M.2插槽、TF插槽、千兆网口、两个USB3.0、一个USB Type-C 3.0、一个Micro USB(串口打印调试功能)、两个MIPI摄像头、一个MIPI屏等,预留电池接口,可广泛适用于AI边缘计算、深度视觉学习及视频流AI分析、视频图像分析、自然语言处理、智能小车、机械臂、人工智能、无人机、云计算、AR/VR、智能安防、智能家居等领域,覆盖 AIoT各个行业。 Orange Pi AIpro支持Ubuntu、openEuler操作系统,满足大多数AI算法原型验证、推理应用开发的需求,总之是非常的nice。

二、 开发板介绍

1、 接口详情

 

如图所见,我们看到它的功能是十分丰富的,并且还支持接入其他外设接口,扩展非常的方便。

2、 烧录镜像

2.1、事先准备

首先我们需要准备:OrangePi AIpro(包括主板和电源)、SD卡(用于装载镜像运行开发板)、读卡器(这里配置选择USB)、PC(笔记本或台式机)、显示器、双头HDMI线、键盘(可以外接USB)、鼠标(可以外接USB)。

2.2、烧写镜像到SD卡

(1)下载资料

我们打开官方网站,点击下载按钮,下载资料。

 

官方工具和ubuntu镜像都在百度网盘,分别根据页面提示提取文件,并在以下目录中获取文件后,保存在PC机上,烧录工具使用的是balenaEtcher。

 

ubuntu镜像:opiaipro_ubuntu22.04_desktop_aarch64_*.img.xz

 

注:ubuntu镜像我们尽量使用旧版本的,旧版本更稳定,在本人的实际安装中,使用版本为3xx会烧录失败,但在使用旧版本,在本人的亲测下,旧版本的基本不会出现烧录失败的情况,所以下面我所使用的是2xx的。

(2)烧录

将SD卡插入读卡器,再将读卡器插入PC机。

 

然后启动烧录工具balenaEtcher,根据提示,依次“从文件烧录”-》“选择目标磁盘”-》“开始烧录!”,因为之前烧录了,所以我这里就不点了,烧录需要耐心等待下。

 

烧录完成之后需要验证,验证也是自动完成的,我们耐心等待,完成之后显示烧录成功。

 

2.3、启动OrangePi AIpro系统

我们将烧录好的SD卡插入开发板的SD插槽,然后将开发板的电源线接上、两个USB接键盘与鼠标、使用双头HDMI线接显示器,如下图。

 

插入上电完成之后,等待一会,显示器就会显示登录界面了。

 

输入HwHiAiUser用户名登录密码(默认为Mind@123)登录开发板,进入主界面如下图所示,登录后请修改默认密码,并妥善保管新密码。

 

三、运行案例:语音识别

1、准备工作

首先为了操作方便,我们可以进入系统然后连接WIFI,打开终端,输入ifconfig 查看IP地址。

 

 

 

在个人PC 这里打开 FinalShell 工具,使用SSH 连接,填写好名称,主机(这就是IP地址),用户名与密码等参数,点击确定,完成连接。

 

3、 播放音频与录音

2.1、播放音频

准备好3.5mm口的耳机,将耳机插入开发板的3.5mm耳机接口中。

 

然后接下来进入到音频测试程序所在的目录中,打开FinalShell 工具,敲指令。

sudo-i # 切换管理员权限,输入密码进入
cd /opt/opi_test/audio

输入ls 查看目录下的文件,当然 FinalShell 也会已树形文件结构实时同步文件信息。

 

使用下的命令就可以播放测试音频到耳机了。

./sample_audio play 2 qzgy_48k_16_mono_30s.pcm

2.2、效果演示

由于3.5mm耳机外放声音有点小,所以这里就使用音响的方式记录下来。

https://www.bilibili.com/video/BV1nr421L7q9

2.3、录音播放

首先将带MIC功能的耳机插入开发板的3.5mm耳机接口中。

然后进入音频测试程序所在的目录中,执行下面的指令。

sudo -icd /opt/opi_test/audio

然后可以使用下面的命令录制一段5秒钟的音频。

./sample_audio capture test05.pcm

录音完成后会在当前目录下生成一个test05.pcm的录音文件,然后使用下面的命令可以将录制的音频文件播放到耳机。

./sample_audio play 2 test05.pcm

 

2.4、演示视频

https://www.bilibili.com/video/BV12J4m1378V

https://www.bilibili.com/video/BV137421Z711

四、 运行语音识别

在镜像中预装了JupyterLab软件。Jupyter Lab软件是一个基于web的交互式开发环境,集成了代码编辑器、终端、文件管理器等功能,使得开发者可以在一个界面中完成各种任务。并且我们在镜像中也预置了一些可以在JupyterLab软件中运行的AI应用样例。这些样例都是使用Python编写的,并调用了Python版本的AscendCL编程接口。本章节介绍如何登录jupyterlab并在jupyterlab中运行 这些预置的AI应用样例。

1、 启动JupyterLab

首先登录Linux系统桌面,然后打开终端,再切换到保存AI应用样例的目录下。

cd /home/HwHiAiUser/samples/notebooks

然后执行start_notebook.sh脚本启动 Jupyter Lab。

./start_notebook.sh

 

在执行该脚本后,终端会出现如下打印信息,在打印信息中会有登录Jupyter Lab的网址链接。

 

登录Jupyter Lab后的界面如下所示,左侧文件管理器中是9个AI应用样例和 Jupyter Lab 启动脚本。

 

2、启动智能语音识别

首先在Jupyter Lab界面双击“09-speech-recognition”,进入到该目录下,在该目录下有运行该示例的所有资源,其中mian.ipynb是在JupyterLab中运行该样例的文件,双击打开main.ipynb,在右侧窗口中会显示main.ipynb文件中的内容,单击按钮运行样例,在弹出的对话框中单击“Restart”按钮,此时该样例开始运行。

 

若干秒后,在窗口中出现了如下内容。我们可以看到模型对测试语音进行推理, 识别出了语音中的文本信息为“智能语音作为智能时代人机交互的关键接口各行业 爆发式的场景需求驱动行业发展进入黄金期”。

 

测试语音的保存路径如下所示

/home/HwHiAiUser/samples/notebooks/09-speech-recognition/sample.wav

我们可以自己修改音频文件,然后实现语音转文字效果。

至此,演示案例就完成了,在开发板上可以外接一个小型的显示器,当我们需要录音时,自动连接蓝牙点击按钮进行录音,然后将文件保存下来,自动执行转文字效果,实现实时翻译器或在线文字转换功能。

五、 总结

综上所述,我们可以看出OrangePi AIpro是一款非常优秀AI开发板,不仅演示的案例,它的内部还有许多非常实用的功能,例如目标检测、卡通图像生成、人像分割与背景替换等,功能使用是真的强大。

体验下来,开发板真的很不错,无论对于刚毕业的小白新手还是别的某一领域的大牛想学习,都很友好,容易上手,官方的手册也是十分的详细;并且随着未来科技的不断发展,我相信越来越多的领域都会开始向AI靠拢,从制造业到人们的出行,OrangePi AIpro展现出未来带来巨大价值。

剧透一下:后续会把上述的实时翻译器给做出来,以及智能家居联合使用,敬请期待。

相关文章:

  • 41-2 DDOS基础
  • 守护景区安全:探讨景区视频监控方案的搭建及必要性
  • R语言lavaan结构方程模型(SEM)
  • element+ 引入图标报错 Failed to resolve import “@element-plus/icons-vue“ from “
  • C++-指针
  • 【TCP协议中104解析】wireshark抓取流量包工具,群殴协议解析基础
  • 基于vuestic-ui实战教程 - 页面篇
  • Flutter中图片是怎么在flutter上呈现出来的?
  • 【OCPP】ocpp1.6协议第3.13章节SmartCharging介绍及翻译
  • Unity 实现心电图波形播放(需波形图图片)
  • 搜维尔科技:使用Haption Virtuose 6D 力反馈通过机器人和虚拟现实完成远程操作项目
  • Android 动效整理
  • 蓝牙模块选型之蓝牙功能
  • mysql实战——mysql主从复制管理
  • huawei 华为 交换机 配置 Dot1q 终结子接口实现跨设备 VLAN 间通信示例
  • [ JavaScript ] 数据结构与算法 —— 链表
  • 【comparator, comparable】小总结
  • 【跃迁之路】【585天】程序员高效学习方法论探索系列(实验阶段342-2018.09.13)...
  • es6要点
  • FastReport在线报表设计器工作原理
  • JavaScript服务器推送技术之 WebSocket
  • nginx 负载服务器优化
  • Spring Cloud Feign的两种使用姿势
  • yii2权限控制rbac之rule详细讲解
  • 经典排序算法及其 Java 实现
  • 前端技术周刊 2018-12-10:前端自动化测试
  • 算法系列——算法入门之递归分而治之思想的实现
  • 小程序01:wepy框架整合iview webapp UI
  • 异常机制详解
  • 原生Ajax
  • 源码之下无秘密 ── 做最好的 Netty 源码分析教程
  • ​14:00面试,14:06就出来了,问的问题有点变态。。。
  • # Swust 12th acm 邀请赛# [ K ] 三角形判定 [题解]
  • # 利刃出鞘_Tomcat 核心原理解析(二)
  • $(function(){})与(function($){....})(jQuery)的区别
  • $.type 怎么精确判断对象类型的 --(源码学习2)
  • (003)SlickEdit Unity的补全
  • (16)UiBot:智能化软件机器人(以头歌抓取课程数据为例)
  • (计算机网络)物理层
  • (免费领源码)python+django+mysql线上兼职平台系统83320-计算机毕业设计项目选题推荐
  • (十八)用JAVA编写MP3解码器——迷你播放器
  • (十二)springboot实战——SSE服务推送事件案例实现
  • (十三)MipMap
  • (四)Android布局类型(线性布局LinearLayout)
  • (一)spring cloud微服务分布式云架构 - Spring Cloud简介
  • (原創) 如何刪除Windows Live Writer留在本機的文章? (Web) (Windows Live Writer)
  • (转)chrome浏览器收藏夹(书签)的导出与导入
  • (转)Linux下编译安装log4cxx
  • (转)linux下的时间函数使用
  • (转)用.Net的File控件上传文件的解决方案
  • (轉貼)《OOD启思录》:61条面向对象设计的经验原则 (OO)
  • **PHP分步表单提交思路(分页表单提交)
  • .NET CF命令行调试器MDbg入门(二) 设备模拟器
  • .NET I/O 学习笔记:对文件和目录进行解压缩操作
  • .NET 命令行参数包含应用程序路径吗?