明经CAD社区

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
楼主: vitalgg

【视频】字正腔圆,从此无话不说。朗读文本、语音反馈,全方位交互。附粤语版木兰辞

  [复制链接]
 楼主| 发表于 2022-9-19 10:39:28 | 显示全部楼层
mikewolf2k 发表于 2022-9-19 08:54
这个功能吧,纯炫技,毫无实际作用,浪费面板控件。

对稿,多人分发内容。以及更多的交互场景
人不只有眼睛,还有耳朵。
人与电脑的交互也不只是使用手和眼睛。
自然语言交互是未来。

如有不同意见,你是对的。
发表于 2022-9-19 11:11:53 | 显示全部楼层
牛蛙牛蛙
看起来很厉害,朗读声有点太僵硬了,好像微软有自然一些的人声。
发表于 2022-9-19 11:49:24 | 显示全部楼层
vitalgg 发表于 2022-9-19 10:39
对稿,多人分发内容。以及更多的交互场景
人不只有眼睛,还有耳朵。
人与电脑的交互也不只是使用手和眼 ...

图纸中的文字,基本没有逻辑性,加上机器朗读语速语调变化,对照着字幕固然能听懂,离开字幕光听的话,反正我是听不明白的。比如现在的小说可以实现机器阅读,问问那些追小说的,是看文字版还是听机器朗读版。
办公环境要求静音,如果每台机器都读的话,相互干扰也听不清,很久以前就有人弄过语音输入,没见过有实用的。
语音的信息接受效率远远低于文字,当时没听到就没了,而且语音是线性的,必须按时间顺序依次收听,想提前推后都不行。
文字阅读是主动,用户必须用心去看才能看到;语音收听是被动的,用户不需要用心也一样能播放声音,这样的差异造成同样信息的阅读和收听,必定是阅读能够接受到的信息比语音深刻得多。
以上个人建议供参考。决定权是你的。
回复 支持 1 反对 0

使用道具 举报

发表于 2022-9-19 13:20:26 | 显示全部楼层
mikewolf2k 发表于 2022-9-19 11:49
图纸中的文字,基本没有逻辑性,加上机器朗读语速语调变化,对照着字幕固然能听懂,离开字幕光听的话,反 ...

深刻,哈哈。
感觉说的都有道理
发表于 2022-9-19 14:04:37 | 显示全部楼层
朗读语言有几种?
 楼主| 发表于 2022-9-19 14:10:57 | 显示全部楼层
emk 发表于 2022-9-19 14:04
朗读语言有几种?

调用的是系统的TTS
一般系统里只有 简体和繁体,英文。默认是普通话,如果是粤语、四川方言,河南方言什么的,还需要继续开发。

其它的系统有人家的语言。像法语,德语。意大利语等。
发表于 2022-9-19 14:47:17 | 显示全部楼层
使用场景在哪?   
 楼主| 发表于 2022-9-19 15:00:07 | 显示全部楼层

这需要一个过程,比如 VR眼镜最早的使用场景是 高端自娱行业。
现在VR体验馆已经有很多了。
发表于 2022-9-19 15:33:14 | 显示全部楼层
高端操作,了解下
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|CAD论坛|CAD教程|CAD下载|联系我们|关于明经|明经通道 ( 粤ICP备05003914号 )  
©2000-2023 明经通道 版权所有 本站代码,在未取得本站及作者授权的情况下,不得用于商业用途

GMT+8, 2024-12-23 17:29 , Processed in 0.178767 second(s), 17 queries , Gzip On.

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表