【资料图】
3月14日消息,今天百度硅谷研究院公布了一款网页式语音转录应用SwiftScribe,据悉其借助了DeepSpeech语音识别核心技术,可利用其AI神经网络帮助用户将声音文件转变为文字。
SwiftScribe的使用方法很简单,用户可以在其网页中上传.wav或.mp3音频文件,这个文件内容一般是记录人物的讲话,上传完成后,语音识别AI就会即刻开始听写用户刚刚上传的材料。其速度很快,整个识别时间大约为音频文件时长的1/3。SwiftScribe单次能接受的最长语音材料为一小时,算下来处理时间需要20分钟。
目前SwiftScribe仍然处于测试阶段,并不能做到听写100%准确,他们计划邀请数十名专职做转录的行业人士参与公开测试,协助改进SwiftScribe。接下来这个转录AI还要面对视频转录和添加字母、适配更多文件格式,以及自动标点等挑战。目前SwiftScribe是免费的,但百度打算在其成熟之后开发收费点。
目前百度开放了30-50个测试名额,具体可参看http://swiftscribe.ai/或发邮件到swiftscribe@baidu.com了解。