温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

Python3.7 + Yolo3怎么实现识别语音播报功能

发布时间:2021-12-27 09:20:03 来源:亿速云 阅读:219 作者:柒染 栏目:开发技术

这篇文章将为大家详细讲解有关Python3.7 + Yolo3怎么实现识别语音播报功能,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。

一、利用Python调用系统win10的文字转语音

首先下载需要用到的库:pip install pyttsx3 -i https://mirrors.aliyun.com/pypi/simple/

接下来直接上代码:

import win32com.client as win

# SpVoice类是支持语音合成(TTS)的核心类。通过SpVoice对象调用TTS引擎,从而实现朗读功能
speak = win.Dispatch("SAPI.SpVoice")
# 完成将文本信息转换为语音并按照指定的参数进行朗读。
# 该方法有Text和Flags两个参数,分别指定要朗读的文本和朗读方式(同步或异步等)。
speak.Speak("come on")
speak.Speak("你好")

最后运行代码,就会听到系统传出来的声音,读出了 come on 和 你好。

二、开始使用Yolo识别,利用语音播报返回出来

开始之前我们先得解析出来Yolo3的代码,从而获取到被识别出来的物体标签。

首先我们找到一个coco_classes.txt,发现里面有很多的英文单词,这些就是准备识别匹配的标签了。

Python3.7 + Yolo3怎么实现识别语音播报功能

然后我们在找到yolo.py,发现的我们的coco_classes.txt被传入进来了

Python3.7 + Yolo3怎么实现识别语音播报功能

关键的来了,我们通过Ctrl + F 搜索一下classes_path这个Key,发现这几行代码

Python3.7 + Yolo3怎么实现识别语音播报功能

这里就是读取了存放标签的那个文本,进行了处理,并且返回了名字。

最后找到这一行代码,此处代码就是一开始进行识别的时候,我们的控制台打印出来的代码。

Python3.7 + Yolo3怎么实现识别语音播报功能

运行代码的时候发现,打印的这个label,就是识别出的物体的标签了。

这个时候我们就可以将我们的语音播报的代码添加进行,把label传入进去,就会发现识别出来的物体就会通过语音返回。

Python3.7 + Yolo3怎么实现识别语音播报功能

关于Python3.7 + Yolo3怎么实现识别语音播报功能就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI