当前位置：首页 > news >正文

OrangePi AIpro 开箱初体验及语音识别样例

news 来源：原创 2024/9/30 16:20:13

OrangePi AIpro 开箱初体验及语音识别样例

一、前言

首先非常感谢官方大大给予这次机会，让我有幸参加此次活动。

OrangePi AIpro联合华为精心打造，采用昇腾AI技术路线，具体为4核64位处理器+AI处理器，集成图形处理器，支持8TOPS AI算力，拥有8GB/16GB LPDDR4X，可以外接32GB/64GB/128GB/256GB eMMC模块，支持双4K高清输出。并且OrangePi AIpro引用了相当丰富的接口，包括两个HDMI输出、GPIO接口、Type-C电源接口、支持SATA/NVMe SSD 2280的M.2插槽、TF插槽、千兆网口、两个USB3.0、一个USB Type-C 3.0、一个Micro USB（串口打印调试功能）、两个MIPI摄像头、一个MIPI屏等，预留电池接口，可广泛适用于AI边缘计算、深度视觉学习及视频流AI分析、视频图像分析、自然语言处理、智能小车、机械臂、人工智能、无人机、云计算、AR/VR、智能安防、智能家居等领域，覆盖 AIoT各个行业。 Orange Pi AIpro支持Ubuntu、openEuler操作系统，满足大多数AI算法原型验证、推理应用开发的需求，总之是非常的nice。

二、开发板介绍

1、接口详情

如图所见，我们看到它的功能是十分丰富的，并且还支持接入其他外设接口，扩展非常的方便。

2、烧录镜像

2.1、事先准备

首先我们需要准备：OrangePi AIpro（包括主板和电源）、SD卡（用于装载镜像运行开发板）、读卡器（这里配置选择USB）、PC（笔记本或台式机）、显示器、双头HDMI线、键盘（可以外接USB）、鼠标（可以外接USB）。

2.2、烧写镜像到SD卡

（1）下载资料

我们打开官方网站，点击下载按钮，下载资料。

官方工具和ubuntu镜像都在百度网盘，分别根据页面提示提取文件，并在以下目录中获取文件后，保存在PC机上，烧录工具使用的是balenaEtcher。

ubuntu镜像：opiaipro_ubuntu22.04_desktop_aarch64_*.img.xz

注：ubuntu镜像我们尽量使用旧版本的，旧版本更稳定，在本人的实际安装中，使用版本为3xx会烧录失败，但在使用旧版本，在本人的亲测下，旧版本的基本不会出现烧录失败的情况，所以下面我所使用的是2xx的。

（2）烧录

将SD卡插入读卡器，再将读卡器插入PC机。

然后启动烧录工具balenaEtcher，根据提示，依次“从文件烧录”-》“选择目标磁盘”-》“开始烧录！”，因为之前烧录了，所以我这里就不点了，烧录需要耐心等待下。

烧录完成之后需要验证，验证也是自动完成的，我们耐心等待，完成之后显示烧录成功。

2.3、启动OrangePi AIpro系统

我们将烧录好的SD卡插入开发板的SD插槽，然后将开发板的电源线接上、两个USB接键盘与鼠标、使用双头HDMI线接显示器，如下图。

插入上电完成之后，等待一会，显示器就会显示登录界面了。

输入HwHiAiUser用户名登录密码（默认为Mind@123）登录开发板，进入主界面如下图所示，登录后请修改默认密码，并妥善保管新密码。

三、运行案例：语音识别

1、准备工作

首先为了操作方便，我们可以进入系统然后连接WIFI，打开终端，输入ifconfig 查看IP地址。

在个人PC 这里打开 FinalShell 工具，使用SSH 连接，填写好名称，主机（这就是IP地址），用户名与密码等参数，点击确定，完成连接。

3、播放音频与录音

2.1、播放音频

准备好3.5mm口的耳机，将耳机插入开发板的3.5mm耳机接口中。

然后接下来进入到音频测试程序所在的目录中，打开FinalShell 工具，敲指令。

sudo-i # 切换管理员权限，输入密码进入
cd /opt/opi_test/audio

输入ls 查看目录下的文件，当然 FinalShell 也会已树形文件结构实时同步文件信息。

使用下的命令就可以播放测试音频到耳机了。

./sample_audio play 2 qzgy_48k_16_mono_30s.pcm

2.2、效果演示

由于3.5mm耳机外放声音有点小，所以这里就使用音响的方式记录下来。

https://www.bilibili.com/video/BV1nr421L7q9

2.3、录音播放

首先将带MIC功能的耳机插入开发板的3.5mm耳机接口中。

然后进入音频测试程序所在的目录中，执行下面的指令。

sudo -icd /opt/opi_test/audio

然后可以使用下面的命令录制一段5秒钟的音频。

./sample_audio capture test05.pcm

录音完成后会在当前目录下生成一个test05.pcm的录音文件，然后使用下面的命令可以将录制的音频文件播放到耳机。

./sample_audio play 2 test05.pcm

2.4、演示视频

https://www.bilibili.com/video/BV12J4m1378V

https://www.bilibili.com/video/BV137421Z711

四、运行语音识别

在镜像中预装了JupyterLab软件。Jupyter Lab软件是一个基于web的交互式开发环境，集成了代码编辑器、终端、文件管理器等功能，使得开发者可以在一个界面中完成各种任务。并且我们在镜像中也预置了一些可以在JupyterLab软件中运行的AI应用样例。这些样例都是使用Python编写的，并调用了Python版本的AscendCL编程接口。本章节介绍如何登录jupyterlab并在jupyterlab中运行这些预置的AI应用样例。

1、启动JupyterLab

首先登录Linux系统桌面，然后打开终端，再切换到保存AI应用样例的目录下。

cd /home/HwHiAiUser/samples/notebooks

然后执行start_notebook.sh脚本启动 Jupyter Lab。

./start_notebook.sh

在执行该脚本后，终端会出现如下打印信息，在打印信息中会有登录Jupyter Lab的网址链接。

登录Jupyter Lab后的界面如下所示，左侧文件管理器中是9个AI应用样例和 Jupyter Lab 启动脚本。

2、启动智能语音识别

首先在Jupyter Lab界面双击“09-speech-recognition”，进入到该目录下，在该目录下有运行该示例的所有资源，其中mian.ipynb是在JupyterLab中运行该样例的文件，双击打开main.ipynb，在右侧窗口中会显示main.ipynb文件中的内容，单击按钮运行样例，在弹出的对话框中单击“Restart”按钮，此时该样例开始运行。

若干秒后，在窗口中出现了如下内容。我们可以看到模型对测试语音进行推理，识别出了语音中的文本信息为“智能语音作为智能时代人机交互的关键接口各行业爆发式的场景需求驱动行业发展进入黄金期”。

测试语音的保存路径如下所示

/home/HwHiAiUser/samples/notebooks/09-speech-recognition/sample.wav

我们可以自己修改音频文件，然后实现语音转文字效果。

至此，演示案例就完成了，在开发板上可以外接一个小型的显示器，当我们需要录音时，自动连接蓝牙点击按钮进行录音，然后将文件保存下来，自动执行转文字效果，实现实时翻译器或在线文字转换功能。

五、总结

综上所述，我们可以看出OrangePi AIpro是一款非常优秀AI开发板，不仅演示的案例，它的内部还有许多非常实用的功能，例如目标检测、卡通图像生成、人像分割与背景替换等，功能使用是真的强大。

体验下来，开发板真的很不错，无论对于刚毕业的小白新手还是别的某一领域的大牛想学习，都很友好，容易上手，官方的手册也是十分的详细；并且随着未来科技的不断发展，我相信越来越多的领域都会开始向AI靠拢，从制造业到人们的出行，OrangePi AIpro展现出未来带来巨大价值。

剧透一下：后续会把上述的实时翻译器给做出来，以及智能家居联合使用，敬请期待。

41-2 DDOS基础

守护景区安全：探讨景区视频监控方案的搭建及必要性

R语言lavaan结构方程模型（SEM）

element+ 引入图标报错 Failed to resolve import “@element-plus/icons-vue“ from “

C++-指针

【TCP协议中104解析】wireshark抓取流量包工具,群殴协议解析基础

基于vuestic-ui实战教程 - 页面篇

Flutter中图片是怎么在flutter上呈现出来的？

【OCPP】ocpp1.6协议第3.13章节SmartCharging介绍及翻译

Unity 实现心电图波形播放（需波形图图片）

搜维尔科技：使用Haption Virtuose 6D 力反馈通过机器人和虚拟现实完成远程操作项目

Android 动效整理

蓝牙模块选型之蓝牙功能

mysql实战——mysql主从复制管理

huawei 华为交换机配置 Dot1q 终结子接口实现跨设备 VLAN 间通信示例

[ JavaScript ] 数据结构与算法 —— 链表

【comparator, comparable】小总结

【跃迁之路】【585天】程序员高效学习方法论探索系列（实验阶段342-2018.09.13）...

es6要点

FastReport在线报表设计器工作原理

JavaScript服务器推送技术之 WebSocket

nginx 负载服务器优化

Spring Cloud Feign的两种使用姿势

yii2权限控制rbac之rule详细讲解

经典排序算法及其 Java 实现

前端技术周刊 2018-12-10：前端自动化测试

算法系列——算法入门之递归分而治之思想的实现

小程序01:wepy框架整合iview webapp UI

异常机制详解

原生Ajax

源码之下无秘密 ── 做最好的 Netty 源码分析教程

14：00面试，14：06就出来了，问的问题有点变态。。。

# Swust 12th acm 邀请赛# [ K ] 三角形判定 [题解]

# 利刃出鞘_Tomcat 核心原理解析（二）

$(function(){})与(function($){....})(jQuery)的区别

$.type 怎么精确判断对象类型的 --（源码学习2）

（003）SlickEdit Unity的补全

(16)UiBot：智能化软件机器人（以头歌抓取课程数据为例）

(计算机网络)物理层

（免费领源码）python+django+mysql线上兼职平台系统83320-计算机毕业设计项目选题推荐

（十八）用JAVA编写MP3解码器——迷你播放器

（十二）springboot实战——SSE服务推送事件案例实现

(十三)MipMap

（四）Android布局类型（线性布局LinearLayout）

（一）spring cloud微服务分布式云架构 - Spring Cloud简介

(原創) 如何刪除Windows Live Writer留在本機的文章? (Web) (Windows Live Writer)

(转)chrome浏览器收藏夹（书签）的导出与导入

(转)Linux下编译安装log4cxx

（转）linux下的时间函数使用

(转)用.Net的File控件上传文件的解决方案

(轉貼)《OOD启思录》：61条面向对象设计的经验原则 (OO)

**PHP分步表单提交思路（分页表单提交）

.NET CF命令行调试器MDbg入门（二）设备模拟器

.NET I/O 学习笔记：对文件和目录进行解压缩操作

.NET 命令行参数包含应用程序路径吗？