议程出炉!地表最强之 倒计时16天 智适应教育峰会 全球AI (什么是地议权制度)
2017年开始,AI浪潮开始席卷教育行业,AI技术已然渗透了教育的各个场景和环节,图像识别与OCR技术可以帮助纸质教育材料实现数字化、拍照搜题、作业自动批改;语音识别技术可以帮助指出和纠正错误发音,让每个人都有一对一的语言老师;自然语言处理可以用于英语作文批改,中文分级阅读等;人脸识别可以刷脸进入校园,考场,提升校园安全和教务管理效率...。
竹间智能翁嘉颀 人机交互技术探索 (竹间智能ceo)
雷锋网AI科技评论按,随着语音识别ASR的进步,对话机器人从简单的指令式的语音助手,进化到关键词交互方式,人们能够使用较为完整的句子来表达意图,机器人从中截取关键词判断用户意图,现阶段利用NLP、NLU技术,以及机器学习方式,慢慢脱离关键词的束缚,可以更聪明的去理解用户意图以做出正确的回应,再下一步是否能脱离一问一答的回应方式,是否机...。
详解人工同传与机器同传优劣势 百度发布AI同传 (人工同步化的方法)
上个月,由于科大讯飞,AI同传造假,事件,AI同传被推上舆论的风口浪尖,不过,这件事显然并没有影响到AI同传技术的发展,今天,百度正式公布自家的AI同传,在10月19日的百度大脑行业创新论坛上,雷锋网编辑在现场就发现了百度的AI同传,百度AI技术生态部总经理喻友平在演讲时,左右两边的屏幕上实时呈现了中英文字幕,从现场效果来看,语音识别...。
AI金融 交互应用 的窘境与进击的独角兽 (ai金融服务)
AI对金融核心业务流程的改造,似乎始终,雷声大雨点小,但在用户的,交互方式,上,AI早就不声不响地,攻下数城,通过生物识别,AI不仅成功地取代银行卡这一物理介质,还替代了密码输入等核对流程,让金融的交易与身份识别更加,无感,;通过语音识别&,NLP,AI直接让客服这一工作,从,人人,交互转变为,人机,交互,随着图像和语料数据...。
可无限生成小程序码 苹果正开发 苹果神经引擎 AI 处理器;小程序又升级 (可无限生成小说的软件)
苹果正开发,苹果神经引擎,AI处理器据彭博社MarkGurman报道,从知情人士处了解到,苹果正在开发一种专用处理器,可以用于处理人工智能相关的任务,比如在产品中实现面部和语音识别,报道称该芯片在苹果内部被称作,苹果神经引擎,AppleNeuralEngine,苹果计划与标准处理器和图形芯片一同使用这款处理器,以此为其产品增加更先...。
有趣的融合 Google首席科学家Vincent 机器人和深度学习正在发生一些 Vanhoucke (有趣的融合课作文)
VincentVanhoucke是Google的首席科学家,斯坦福大学电子工程学博士,目前在GoogleBrain主导机器人相关的项目,Vanhoucke主要的研究领域是语音识别、计算机视觉和机器人等领域,他还即将主持机器人领域的盛会CoRL2017,ConferenceonRobotLearning,Vanhoucke认为,机器智...。
李飞飞 我把今天AI所处的发展阶段称为 in AI vivo
雷锋网按,在谷歌I,O2017的最后一日,主场馆海岸线圆形剧场迎来了本届I,O最具重量级的机器学习讲座,由四位分属不同领域的AI女性大牛展开巅峰对话,漫谈AI的过去、现在与将来,四位嘉宾分别是语音识别、计算机视觉、数据可视化和生物计算领域的顶级AI学者与工程师,而本场对话无关技术,纯是几位杰出科学家对各自领域深度学习发展历程的反思,以...。
亚马逊Alexa的庞大 破局 与尴尬 (亚马逊alexa人工智能)
无论是苹果、谷歌、亚马逊的新品发布会,还是百度、阿里、华为当下追逐的智能产品或生态,始终不缺智能语音的身影,可见,智能语音很热,而且不是一般的热,然而,智能语音在多数应用中,仍难逃鸡肋二字,仍是现实,尽管在语音识别能力方面,各一线,甚至二、三线厂商,已经能够达到95%及以上的精准度,但是,就应用来看,仍以泛娱乐为主,难以切中行业应用的...。
到通用汽车 张文德为何被称为自动驾驶圈的 扫地僧 CMU 从 (通用汽车张清伟)
通用汽车在1965年就脑洞大开地预示了汽车未来的两大发展方向——自动驾驶和语音识别技术,这家车企如今在自动驾驶领域的步调非常迅速,在将创业公司CruiseAutomation收入囊中之后,接连取得突破性进展,今年9月份,这家车企推出了首款可大规模量产的高级别自动驾驶汽车,这款车型基于第三代雪佛兰BoltEV开发,已经进行了小批量生产,...。
或因自动驾驶领域布局 英伟达联手投资AI语音助手SoundHound 三星 (因自动驾驶牺牲媒体人)
继谷歌、苹果、亚马逊之后,AI语音助手领域又闯入一名实力玩家,雷锋网消息,日前,致力于语音识别与搜索的科技公司SoundHound宣布获得一笔高达7500万美元的投资,该笔资金由英伟达领投,三星催化剂基金,SamsungCatalystFund,参与跟投,媒体认为,SoundHound很可能成为对标GoogleAssistan、Sir...。
Schmidhuber访谈 LSTM之父 畅想人类和AI共处的世界 Jürgen (schmidt)
雷锋网AI科技评论按,2019年8月29日,世界人工智能大会WAIC2019在上海世博中心举行,瑞士USI和SUPSI教授,NNAISENSE联合创始人兼首席科学家,,LSTM网络之父,JürgenSchmidhuber也受邀出席大会,8月30日,雷锋网AI科技评论和多家社会媒体一同对Schmidhuber教授,图中右侧,进行了采访,...。
思必驰俞凯 端到端与半监督语音识别的技术进展 (思必驰俞凯个人简介)
雷锋网按,如何低成本高效率地利用少量带标注的数据,挖掘大量语音数据中的有效信息,半监督学习正成为当下研究趋势之一,在这种趋势背景下,端到端的训练方法也正尝试结合预训练或先验知识,投入在语音识别网络的探索中,在8月8日的CCF,GAIR2020全球人工智能与机器人大会·前沿语音技术专场上,俞凯教授分享了端到端和半监督学习技术在语音识别问...。
2016 认知计算需要解决这些问题 思必驰首席科学家俞凯 大数据和深度学习不是万能的 CAIIC (认知策略百科)
如果横向对比语音和视觉两种技术,大多数人可能会直观地认为视觉是比语音更复杂的一种技术,但事实真是如此吗,在17日举办的中国人工智能产业大会上,思必驰首席科学家、,思必驰,上海交大智能人机交互联合实验室,主任、上海交通大学计算机教授俞凯博士在接受雷锋网采访时表示,,语音和视觉是两种不同的模态,前者是一维信号,后者是二维信号,视觉的帧率比...。
2018WAIC 高光 时刻系列回顾 人工智能与传统产业融合是大势所趋 (2018网剧)
如今,人工智能早已不再是停留在实验室里的研究,而是渐渐渗透到生活的各方面,普通市民也可感知到人工智能技术带来的改变,无论是机场、火车站的刷脸进站,还是语音识别输入文字,亦或是医疗行业中的AI辅助诊断,都获得了资本的青睐,目前,我国部署人工智能发展的政策重点正向着人工智能商业化发展转移,2017年7月8日,国务院印发了,新一代人工智能发...。
蓄势待发 乐视的人工智能路 (蓄势待发前面那句)
除了BAT外,乐视是国内人工智能领域布局范围较广的企业,其实也不难理解,乐视自身拥有两大先天优势,乐视生态下的产品可产生大量用户行为数据,为人工智能的发展打好了基础,此外,乐视的硬件终端设备也可为人工智能的落地提供更大的发挥空间,目前乐视还处于人工智能初级阶段,主要发力于语音识别、计算机视觉、VR,AR、无人驾驶等方向,去年是乐视的生...。
LeCun 年阿斯图里亚斯公主技术和科学研究奖! 与 Demis Hinton 2022 Hassabis一同获得 Bengio
当地时间6月15日,阿斯图里亚斯公主基金会官宣,2022年阿斯图里亚斯公主技术和科学研究奖,以表彰他们对人工智能的进步及其在社会中的全面融合所做出的贡献!他们在深度学习领域的贡献带来了语音识别、自然语言处理、对象感知、机器翻译、策略优化、蛋白质结构分析、医学诊断和许多其他技术的重大进步,这些技术在目前和未来对社会进步的影响非同寻常,阿...。
这家企业走在了前面 预训练大模型产业落地的爆发前夜 (这家企业走在人生路上)
2021年是大规模预训练模型的爆发之年,掀起了人工智能又一波热潮,并迅速成为AI领域的技术新高地,助推人工智能从1.0的感知智能向2.0的认知智能转变,自从2012年深度学习的应用元年以来,人脸识别、语音识别等技术通过机器学习实现了大量应用场景突破,不仅提升了社会工作效率,同时改变了人们的生活出行模式,建立了人类对人工智能技术的基础认...。
依图科技入局语音赛道AI独角兽为何高调换轨 (依图科技规模)
眼下,行业巨头都在打造自己的智能语音生态系统,国外有IBM、微软、Google等,国内则有百度、阿里、科大讯飞、搜狗和云知声,但这一次,四大AI独角兽之一的依图科技也正式拿到入场券了,雷锋网12月11日消息,依图科技今日公布了其在中文语音识别技术上的最新突破,宣称在全球最大的中文开源数据库AISHELL,2中,依图短语音听写的字错率,...。
应用 三位一体 算法 浅析语音识别 芯片
雷锋网AI科技评论按,本文作者为辰韬资本黄松延原文首发于微信公众号,辰韬资本,ID,chentaoziben,,雷锋网AI科技评论获其授权转载,黄松延,浙江大学人工智能博士,前华为高级算法工程师,对深度学习及其应用有深入的研究,阅后若有所感,欢迎通过邮箱syhuang@chentao,capital.com或者微信号Nikola,62...。
你的喜怒哀乐全被AI看穿了 8种面部表情实时追踪 (你的喜怒哀乐都会牵动我的心)
与人类一样,AI也学会了,察言观色,有研究表明,人类在相似的社会环境下表达情感的面部表情几乎是相同的,如果一个人皱眉、嘟嘴、脸色涨红,你一定知道TA是在生气,现在AI同样能够,看穿,这一点,情感分析一直是AI的重点研究方向,它分为文本识别、语音识别、视觉识别三种主要途径,后者也就是面部表情的分析,最近这项研究又有了新的进展,在识别生气...。
孙丹们怎么看 12 元宇宙 虞晶怡 倒计时 小时!城市 张鹏国 (孙丹视频)
在2021的秋冬之际,没有一个词能够火得过,元宇宙,当AI行业进入阶段性瓶颈,元宇宙概念的出现,给了科技巨头、AI公司们一个全新的增长点,模式更ToC,更具技术创造力,与企业们的耦合性更强,乘着元宇宙的扶摇东风,AI行业的春天又要来了,一般意义上,现代的AI功能大致可以分为四类,计算机视觉、机器学习、NLP和语音识别,不少人认为,在...。
索尼 脖颈贴合传感器 大法 AI 无声语音识别 转换皮肤震动信息 (索尼脖颈贴合怎么样)
如今,对于听力有障碍的群体来说,听不到的声音,可以触摸到了,触摸,听不到的语言,是由东京大学和索尼计算机科学研究所,CSL,共同研发的AI系统,Derma,实现的,有了Derma系统,只要在喉咙周围的皮肤上贴上传感器,利用喉咙和下颚的皮肤震动,就能将口形转化为语音,可,触摸,的语言根据病症的严重程度,现阶段治疗听力障碍的主流手段包括...。
百度做了一项改变行业的技术革新 一颗芯片解决所有语音交互 (百度做一项小实验)
雷锋网AI科技评论按,端到端一体化的技术,再次显出强大的功能,4月20日,百度旗下人工智能品牌小度发布了新款无屏智能音箱——小度智能音箱2红外版,据百度官方介绍,该音箱搭载了百度首款针对远场语音交互研发的鸿鹄芯片,性能上有三大提升,1,在语音识别上错误率平均降低30%;2,高噪声下首次唤醒率提升10%以上,且达到家居场合使用的超低误报...。
深度神经网络发展历程全回顾 如何加速DNN运算 (深度神经网络是什么)
深度神经网络,DNN,目前是许多现代AI应用的基础,自从DNN在语音识别和图像识别任务中展现出突破性的成果,使用DNN的应用数量呈爆炸式增加,这些DNN方法被大量应用在无人驾驶汽车,癌症检测,游戏AI等方面,在许多领域中,DNN目前的准确性已经超过人类,与早期的专家手动提取特征或制定规则不同,DNN的优越性能来自于在大量数据上使用统计...。
量产不到一年AI语音芯片出货就达百万级!探境轰动市场的秘密 (量产不到一年的车)
今年3月份,雷锋网,舍弃冯诺依曼架构突破内存墙瓶颈的AI芯片,即将轰动市场,一文介绍了解决AI芯片内存墙挑战的多种路径以及探境科技采用的创新方法,距离文章发布不到十个月之后,也是探境首款AI语音芯片量产不到一年之后,探境科技CEO鲁勇本周宣布探境的语音识别方案实现百万级出货,百万级出货,只是衡量一款使用成熟制程工艺成功的最小出货量级...。
未来十年 语音识别将朝着这五个方向发展 AI (未来十年的)
在过去的两年中,自动语音识别,AutomaticSpeechRecognition,ASR,在商用上取得了重要的发展,其中一个衡量指标就是,多个完全基于神经网络的企业级ASR模型成功上市,2016年,微软研究院发表了一篇文章,宣布他们的模型在已有25年历史的,Switchboard,数据集上,达到了人类水平,通过单词错误率来衡量,A...。
开源 200 ;锤子 Bang 友商们用不用呢 Big 售价在 FF91 万元以内 贾跃亭 (开源200mhz频率)
虽然iPhone7成中国最畅销手机,但也没挡住iOS份额的下滑全球调研巨头KantarWorldpanel发布了截至2016年11月的近3个月智能手机市场数据报告,报告显示,iOS在中国市场产生了颓势,而在欧美市场更加厉害了一些,从报告的数据来看,在中国市场,Android市场份额上升7.2%,达到79.9%,华为占全部销售额的1,4...。
专访讯飞王士进 智能音箱是个伪命题吗 从底层AI技术解析 (科大讯飞王世进简历)
2010年10月28日,讯飞语音输入法发布,当时,还没有微信,6年之后,著名,相声演员,罗永浩在锤子M1的发布会上展示了这款输入法,这次,讯飞以一种意想不到的方式刷爆了朋友圈,虽然讯飞在2014年的时候推出,超脑计划,,开始全面布局AI的各个领域,但是,这家成立于1999年、市值超400亿的公司如今在很多人看来,依然只是一家做,语音输...。
商业语音识别系统存在高错误率 研究发现 (商业语音识别软件)
雷锋网讯,,某些语音识别系统,ASR,的准确性可能要比之前假定的差很多,这是最近约翰·霍普金斯大学、波兰波兹南工业大学、弗罗茨瓦夫科技大学以及初创公司Avaya的研究人员一项正在进行的研究主要发现,这项研究对内部创建的数据集上的商业语音识别模型进行了基准测试,共同作者声称,词错误率,WordErrorRate,WER,一种常见的语...。
打破大模型的 空中城堡 BMVC最佳论文Runner (打破大模型的英文)
两只新生猫的运动方式是否为主动,对视觉感知能力的影响非常大,这启发了人工智能中的具身学习范式,其中最关键的要素便是——主动,作者丨王晔UC伯克利教授JitendraMalik前段时间发文表示,虽然以大型语言模型,LLMs,为例的,基础模型,在机器翻译和语音识别等方面非常有用,但将这些模型称为基础模型,不禁让人怀疑这些模型是不是真的可以...。