基于Azure云构建 赋能口语学习的教与学 微软上线语音评测功能 (基于azure ad的sso)

文章编号:37974 资讯动态 2024-11-30 口语学习微软语音评测

近年来,随着人工智能技术的不断成熟,企业数字化转型步伐的加快,AI的触角逐渐深入到各个场景,使人类的生产生活变得更加智慧化。在听觉方面,智能语音技术成为各大科技公司们攻坚的重要领域。

一家老牌科技巨头微软,在语音合成技术、语音识别技术上深耕多年,面向全球合作伙伴开放和落地其技术能力,提供多种智能语音解决方案。

5月中旬,在2020微软Build开发者大会上,微软上线了语音评测功能,该功能基于Azure语音服务Speech-to-Text(语音转文本)构建。用户可以上传跟读文本和音频对发音人的语音从准确度,流利度和完整度进行评测。在教育领域,尤其是口语学习方面,因具有高识别准确率、拟专家打分的高一致性,可以让口语学习的教和学更加高效方便。

近日,微软亚太研发集团智能语音团队接受了雷锋网等媒体的线上采访,对微软智能语音评测技术的优势和应用场景等内容进行了详细介绍。

微软亚太研发集团云计算与人工智能事业部产品总监丁秉公、微软亚太研发集团云计算与人工智能事业部资深产品经理马莉莎参与了本次采访。

语音评测的四个维度

微软亚太研发集团云计算与人工智能事业部资深产品经理马莉莎表示,目前语音评测市场需求的考量方向主要有四个维度:

对于专业性,微软语音评测的每个语言从10万小时以上的母语大数据中学习当地语言纯正口音发音,针对各年龄段多维度精准打分,从文章——句子——词——音素四个环节,层层评估,拟专家团打分一致性高。

微软上线语音评测功能:基于Azure云构建,赋能口语学习的教与学

马莉莎提到,语音评测的专业性考量对比的是和母语专家评测的一致性。 业内通用皮尔森相关系数来反映两个序列线性相关程度的统计量。范围在-1到1之间,1表示完全相关,-1表示完全相反,0表示乱序无关,数值越大表示相关度越高。微软语音评测在一致性上达到了0.75,与母语专家水平接近。

对于实时性,微软语音评测支持音频上传流式处理,也就是边朗读边处理,读完立即反馈评估结果。

对于稳定性,微软语音评测基于NLP模型构建模糊匹配文本,针对垂直领域的特定场景的容错率有良好的包容性,漏读、错读、重复读不影响打分有效性与准确性。

对于可定制性,ASR基础模型与微软在语音领域的全面技术能力,可以实现个性化评分标准,可适配口音、适配噪音环境以及适配年龄层等。

据了解,微软语音评测除了支持英语评测外,还可扩展支持全球 40 多个国家和地区的语言评测,广泛适用于教育领域解决方案的合作伙伴、APP开发者以及语言学校、培训中心、教育机构、考试中心的各种语言学习、口语练习和考试等场景的开发。

最大的技术难点在于多点平衡

语音评测能力,在教育领域主要的受众人群包括老师、学生,通常被广泛应用于教师评估、作业练习和语言学习场景中。那么, 对于口语学习,教育用户的痛点是什么?语音评测最大的技术难点又是什么?

对此,马莉莎表示,对于学生来说,他们的痛点在于非母语口语学习。学生们在学习新语言的过程中,如何及时准确地给学生的发音进行反馈,让学生随时随地更方便地联系对于提升口语学习的有效性至关重要。

对于学校和教育机构来说,他们的痛点在于老师的资源有限,如何把现有的优质教师资源拓展到一个稳定的教学系统里。因此,老师需要这样一个能力,不仅能模拟母语专家打分,还能够学习到老师们的评测方法,让老师们可以使用评测高效地一对多给学生提供在线和线下的指导和帮助。

教育用户的这些痛点,对语音评测技术提出了更高的要求。马莉莎认为, 语音评测最大的技术难点在于语音识别技术本身,首先是多语言的理解和识别,不同的打分场景,包括噪声环境、不同年龄段学生的发音情况等都要进一步优化。

其次就是要达到包容性和鲁棒性(注:robust,技术术语,此处可理解为稳健性或抗变性)的平衡。 既要模型做得好、识别好,还要能够动态、实时构建,对大模型达到高实时地调用,而这些需求加起来就是难上加难了。

据悉,积极探索数字化转型和新教育模式的好未来,也是微软语音评测功能的客户之一。好未来AI科学家胡翔宇表示:

基于Azure云构建的一种能力:算法、数据、算力

微软亚太研发集团云计算与人工智能事业部产品总监丁秉公介绍, 一般来说,我们看AI技术主要看三个方面:算法、数据、算力。 从这三个方面来说,微软的语音评测功能有自己独特的优势。

实际上,微软语音评测不是一个具体的产品,而是基于Azure云构建的一种能力。即以微软Azure为平台,将微软在人工智能领域30年的研究成果,开放API给合作伙伴、独立软件开发商、系统集成商,为他们提供认知服务之上的能力,从而进一步做出适合各自领域的方案。

微软上线语音评测功能:基于Azure云构建,赋能口语学习的教与学

“可以打一个比方,如果微软云是平台的话,认知服务就是这个平台上提供给用户智能的部分。就好像一个人有眼睛、耳朵、头脑,认知服务就是赋予想要在微软Azure云上获取这些能力的用户,给他们提供扩展能力”,丁秉公说道。

据了解,目前,微软语音评测的API有丰富的接口和参数,支持高实时率多并发调用。如果第三方想调用API,在前期评测环节是免费的,而进入集成开发阶段,会根据标准的Speech-To-Text(语音转文本)服务的价格,按照评测音频的时长来计费。

另外,丁秉公还提到,微软Azure内部有独立的Microsoft Education团队,专门针对教育领域提供不同的解决方案。除了语音评测外,Azure云在教育领域还有很多已落地的应用。

马莉莎认为,当前全球的教育行业都在进行数字化转型,疫情的到来加速了教育行业的数字化和线上化。通过让AI和云计算进一步赋能教育行业,可以为学生提供多元化个性化的服务,打造一个更加智能的生态环境。

微软在智能语音技术方面深耕多年,曾推出过多款耳熟能详的语音产品,如微软小娜(Cortana)、微软小冰、Skype等,此次上线语音评测功能也是“顺水推舟”之举。语音评测市场,BAT和科大讯飞等科技巨头争相布局,微软这匹“黑马”的加入,势必会让语音评测战场的厮杀更为激烈。

原创文章,未经授权禁止转载。详情见 转载须知 。

全局中部横幅
神州租车

神州租车,亚洲租车大品牌,全国千家网点,100+车型任选,无限里程,100%保障,还免预授权免违章押金;智能取还,随需而用,7*24小时客户服务。TEL:400-616-6666

星鑫防爆电器有限公司

星鑫防爆电器有限公司主要从事厂用防爆电器、防爆灯具、防爆管件等20多个系列,500多种规格的防爆产品的开发与制造。

山东专升本网

山东专升本网(山东省专升本考试网)为山东专升本考生提供最新的2024年山东(自考、成考、留学、统招)专升本政策资讯、专升本报名条件、专升本报名时间、专升本报名流程、专升本招生院校及专业、专升本考试科目、专升本考试时间、专升本考试大纲以及专升本成绩查询、专升本录取分数线、专升本报名系统入口等信息。并为专升本考生提供山东专升本培训、专升本辅导等专升本服务。

中投网

中投网国内知名的投资资讯网站,为股权投资,创业投资,风险投资,私募股权,创业者提供TMT,IT服务,互联网,清洁技术,医疗健康,消费连锁等行业投资融资,上市IPO,收购重组,基金募集等资讯信息的股权投资权,风险投资专业门户。

成都糖酒会

成都糖酒会_2025年成都糖酒会_2025成都糖酒会有着中国食品行业“晴雨表”之称的全国糖酒商品交易会,始于1955年,是中国历史最为悠久的大型专业展会之一。全国糖酒商品交易会由中国糖业酒类集团有限公司主办,一年两届,分春、秋两季举行。

ZBZ
ZBZ

ZBZ-瓦房店中北轴承制造有限公司主营类目:轧机轴承/深沟球轴承/滚动轴承/推力轴承/圆锥滚子轴承/微型轴承。瓦房店中北轴承制造有限公司前身为瓦房店市金属材料冷拔厂,为瓦轴集团(ZWZ)下属单位,始建于1990.10.01日,主要为瓦轴集团生产加工轴承配套产品,企业改制后改名为瓦房店中北轴承制造有限公司。

小暖表情包网

表情包是以图片为介质,在社交软件或社交网站兴起后形成的一种流行文化,通常以时下流行的名人、语录、漫画、影视截图等素材,配上传达主旨或解释图片的文字,用以表达特定的情感或观点。

168五金网

168五金网,集找产品、找商家、公司网站、电子画册、进销存管理、客户管理、财务管理、销售推广等功能于一体,为五金企业打造一站式销售推广移动办公管理平台,让管理推广更轻松。

【上海写字楼出租

上海写字楼网,提供上海写字楼租赁,上海办公楼出租,上海商务楼招租,上海写字楼出租,免费发布求租求购信息,提供上海房产信息、家居装修资讯上海房产楼盘详情、上海租房二手房商业地产信息.

欧仕达助听器官网,隐形助听器,助听器品牌,耳道式助听器,儿童助听器,老年人助听器

欧仕达听力科技(厦门)有限公司获得了SGS(瑞士通用公证集团)的ISO13485、CE、美国FDA等认证,在美国、欧洲、亚洲、美洲等市场拥有超过500家代理商,在中国,拥有近3000家助听器经销商,在全球市场取得优秀的业绩。ASThearing(欧仕达听力科技)在全球各地设立分部,AST(中国),AST(土耳其)、AST(新加坡)、AST(香港)……,为世界听障人士提供着全心全意的服务和尽善尽美的产品。

十二星座运势

神巴巴星座网是一个星座网站,提供全面的星座信息。包含星座今日运势、今年运势、星座排名、星座爱情配对、星座婚恋爱情、性格特点分析等栏目。

全局底部横幅