百度推AI应用SwiftScribe:单次能接受的最长语音材料为一小时 环球热资讯


【资料图】

3月14日消息,今天百度硅谷研究院公布了一款网页式语音转录应用SwiftScribe,据悉其借助了DeepSpeech语音识别核心技术,可利用其AI神经网络帮助用户将声音文件转变为文字。

SwiftScribe的使用方法很简单,用户可以在其网页中上传.wav或.mp3音频文件,这个文件内容一般是记录人物的讲话,上传完成后,语音识别AI就会即刻开始听写用户刚刚上传的材料。其速度很快,整个识别时间大约为音频文件时长的1/3。SwiftScribe单次能接受的最长语音材料为一小时,算下来处理时间需要20分钟。

目前SwiftScribe仍然处于测试阶段,并不能做到听写100%准确,他们计划邀请数十名专职做转录的行业人士参与公开测试,协助改进SwiftScribe。接下来这个转录AI还要面对视频转录和添加字母、适配更多文件格式,以及自动标点等挑战。目前SwiftScribe是免费的,但百度打算在其成熟之后开发收费点。

目前百度开放了30-50个测试名额,具体可参看http://swiftscribe.ai/或发邮件到swiftscribe@baidu.com了解。

推荐DIY文章
Win10命令提示符已被系统管理员停用如何解决 为什么会出现这种情况
如何用一键ghost安装win7 如果你还对装系统有疑问 可以看看本教程
【新要闻】win10所有word文档都打不开怎么办 建议重新选择word程序
怎么升级Win10创意者更新?感兴趣的用户可以一起来体验看看|快看
热门看点:C盘空间不够用怎么扩容 分区助手专业版软件可以帮您解决问题
win10打开网页慢是什么原因?如何根据不同故障来修复问题
精彩新闻

超前放送