科大讯飞:深耕“AI+家庭”,夯实自主创新能力
通信世界网消息(CWW)当前,随着数字化技术的成熟以及应用趋势的加快,中国已成为全球最大的智能家居市场消费国,相关数据显示,中国智能家居市场已经占据全球约50%-60%的市场份额(数据来源:CSHIA,艾媒数据,国家统计局),随着智慧家庭产业进入高速发展时期,智能化的生活理念日益普及,智慧家庭未来发展增速快,市场潜力巨大。我国数字家庭渗透率还有很大空间,这也为智慧家庭市场提供了新的发展机遇。
年初,《十四五数字经济发展规划》的出台为智慧家庭规模化落地提供了良好的政策和宏观环境。智慧家庭产业在实现数字中国,打造智慧社会的现代化建设中起到关键作用。人工智能是数字经济发展的核心引擎。科大讯飞一直在用人工智能为民生需求补短板,力求通过AI赋能“让广大群众享受到看得见、摸得着的实惠”。伴随着智慧家庭领域软硬件产品和解决方案的持续推出,语音遥控器、电视语音助手、康养遥控器、家庭安防摄像头等产品让越来越多人看到了中国科技企业在“AI+家庭”领域的创新与发展。
一、本固枝荣:AI技术的迭代创新
根据科大讯飞2022年半年报显示,面对经济环境压力,科大讯飞在技术研发上保持战略定力,持续加大投入布局。2022年上半年,科大讯飞聚焦关键领域,研发投入达15.99亿元,同比增长30.46%。加大源头技术创新和系统性创新,让产业根植在“自主创新”的土壤。
从智能语音技术开始,再到人工智能技术,科大讯飞延续并探索着由“运算智能”到“感知智能”再到“认知智能”的演进之路。运算智能让机器开始像人类一样会计算,传递信息。感知智能让机器“能听会说、能看会认”,机器开始看懂和听懂,做出判断,采取一些简单行动。例如,可以识别人脸的摄像头、可以听懂语言的遥控器。它的价值是能够帮助人类高效地完成“看”和“听”相关的工作。
家庭场景下的“所见即可说”,依托于科大讯飞在智能语音的自主创新能力。机器听清人说的话,依靠的是语音识别技术,机器开口说话,需要的是语音合成技术。科大讯飞近年来在高噪音环境下持续技术突破,面向家庭聚会场景下的多人、远场、交谈语音识别,通过算法创新将错误率从46.1%降低到30.5%。(数据来源:CHiME-6 Challenge 2020)
当然,我们做到“能听会说”还远远不够,还希望机器能够去理解人类的意图。认知智能就是让机器“能理解会思考”,机器可以像人类一样能理解、思考与决策。例如,主动服务的家庭陪伴机器人,完全独立驾驶的无人驾驶汽车。它的价值是可以全面辅助或替代人类部分工作。
从“所见既可说”到“所愿皆所得”,让机器能够理解语言、进行知识表达和逻辑推理,是AI发展的难点与重点。面对无先验知识的常识推理领域,AI往往无法回答和理解,离“会思考”还需要长远的发展路径。但是针对智慧家庭领域的认知智能,核心是将所有家庭设备安装智慧的耳朵,比如支持近场语音识别的蓝牙语音模组,或者支持远场识音、回音消除以及声源定位的多麦克风阵列模组。
科大讯飞也在认知智能领域持续技术投入,于 2022 年启动“讯飞超脑2030计划”,构建基于认知智能的人机协作自我进化的复杂智能系统,让机器的感知能力超过人类,深度理解领域专业知识,具备持续自主进化的能力。即让机器全方面感知人和环境,懂各行各业知识,有通识和情感,能灵活运动,会多维表达,打造可持续自主进化的复杂智能系统,最终让能够提供情感陪伴、生活服务的家庭陪伴机器人进入每一个家庭。
二、造炬成阳:“AI+家庭”场景价值凸显
多年来,科大讯飞以“看得见、摸得着的应用案例, 能够规模化推广,能有统计数据来证明应用成效”为标准,致力于用人工智能解决社会发展中的重大命题,重点赛道应用示范验证持续显现,已经构建起可持续发展的“战略根据地”。
在智慧家庭领域,科大讯飞已成功构建一整套“AI+家庭”的智能化解决方案,具备成熟的生态架构,主要围绕家庭客户的场景化需求,以电视语音平台能力为基础,技术连接家庭内的智能终端,打造赋能型生态圈,并通过开展多元化经营,给家庭客户带去多模态、主动式的交互体验。目前“AI+家庭”场景涵盖影视娱乐、儿童素质、老人健康、家庭安防等,并且还在不断整合和升级更多场景化解决方案,完善一站式服务体系,以满足不同客户对于场景的不同需求。
现阶段,科大讯飞的“AI+家庭”的场景化融合应用和解决方案已经成为智慧家庭高价值增长点。
大屏康养场景:用AI助力科技适老,让服务更有温度
人口老龄化日渐严重,构建养老服务体系已势在必行。针对老人的居家养老场景,可定制化满足老人对于康养、亲情、娱乐的强需求服务。科大讯飞基于家庭电视大屏实现心率检测、疾病自查、在线问诊、健康档案、关怀提醒等老龄健康医养服务,然后还有一些老年人出行服务辅助和居家养老的娱乐需求,将改善老人慢病无人管、线下医院看病难、家人健康状况无法跟踪和监督等居家养老难题。
儿童成长场景:用AI为孩子开启认知世界的大门
“双减”政策下,教育主阵地回归课堂和家庭。科大讯飞聚焦居家场景下儿童群体,将大屏端场景与线下实物虚实配合,推出儿童喜爱的新形态终端,打造与大屏新交互模式下高价值产品,结合妙趣的数字交互呈现方式,让知识不再局限于传统的授教模式和书本,为孩子开启认知世界的大门。
亲情守护场景:安防摄像头用AI守护,助力平安乡村
针对家庭安防场景需求,科大讯飞推出结合AI识别、可视对讲和语音合成的技术的智能摄像头,实现了安防场景和电视大屏端相结合,坚守家庭“最后一道防线”。视频通话+大屏的解决方案中,可以实现一键主叫、双向对讲,关注亲情沟通,让彼此触手可“见”。
生活服务场景:升级数字人服务,打造大屏元宇宙
家庭客户规模越来越大,面向阖家欢场景,科大讯飞提供围绕语音交互能力的内容应用、融合通信、智能家居、生活服务、大屏客服等各项智慧生活服务权益。通过大屏虚拟数字人智慧生活管家,建立后向对话知识库,在与家庭成员的多轮对话中理解并推荐适合的内容或服务。
伴随人工智能、虚拟现实等新技术的发展,虚拟数字人开始从外观的数字化深入到行为的交互化、思想的智能化。未来家庭用户所需的高信息密度的“类人”交互体验,仍然是智慧家庭的重要技术研究方向之一。为了实现智慧生活下的“所愿皆所得”,场景要以家庭用户为中心,智能硬件之间不仅仅是连接,还能通过大数据技术对用户行为和习惯进行分析,主动侦测用户偏好,提供最符合用户需求的使用场景,从互联进入到智能服务的层次。
科大讯飞坚持通过多技术融合创新等方式持续挑战更加复杂的场景问题。因此,基于家庭场景生态的思考,科大讯飞也在语音助手、大屏康养、儿童成长等方面进行了技术深耕,在事理图谱的对话技术成熟的基础上,根据家庭用户的意图,主动推荐内容及服务。
一方面,将电视语音助手升级为家庭虚拟人服务。根据用户交互过程中的需求挖掘,完善服务与技能的迭代闭环,让看的见的虚拟人成为能交流、更懂用户的智慧生活管家,为用户家庭生活提供全方位服务。通过虚拟形象+主动对话的技术,引导用户和语音助手“类人”交谈,在看似自然的交谈过程中,将“五大连接”的内容和服务推荐给用户使用,解决用户大屏海量内容无法快速触达的问题。
另一方面,大屏康养场景下,在心血管病管理的基础上新增糖尿病/高血压管理,新增智能养生膳食、养生运动推荐。糖尿病/高血压管理可以根据用户个人信息和实际患病情况,提供用户基础、饮食、运动、监测、并发症等5个维度的健康建议,帮助用户合理进行慢病控制,增强用户慢病管理意识。智能养生膳食、养生运动推荐,可以做到个性化为用户推荐早、中、晚的多天膳食计划和每日的运动方式与时长,帮助用户更了解自身健康,提升居家康养水平。
三、春华秋实:技术加持与规模落地
一直以来,基于iFLYHOME OS的电视语音平台建设是科大讯飞在智慧家庭方向的有力探索。iFLYHOME OS是科大讯飞针对家庭场景及智能终端开发的AI多模态人工智能操作系统。平台通过科大讯飞国际先进的人工智能技术,为智慧家庭提供智能语音能力、自然语言理解能力、人机交互能力等相关的技术和垂直场景解决方案,并通过搭建能力开放服务形成统一的语音能力开放体系。
目前,iFLYHOME OS聚焦平台生态能力建设,已建立起体系化、可量化、最终效果导向的“懂有畅快暖”产品评价体系,可实现“听得懂、服务多、聊得来、反应快、人性化”,家庭用户获取信息更快、更准、更智能。
“懂”-能理解:聚焦语音交互服务,持续提升“识别-语义-搜索”全流程交互满足率,保障用户基础体验。
“有”-内容服务多:结合大屏场景及人群特征,打造20款以上精品技能。
“畅”-交互闭环:针对媒资缺失导致的搜索无结果场景,通过影视关联推荐、片源更新提示功能,形成交互闭环,提升流畅性。
“快”-响应速度快:通过搜索逻辑与界面展示流程优化,全流程响应时间在2S内。
“暖”-用户体验友好:通过交互流畅性、视觉效果、合成音效果、回复语人性化程度、用户引导等功能优化,用户净推荐值达0.7以上。
智慧家庭要想走的长远,始终要坚持从技术中来,到产品中去。面向运营商及智慧家庭领域,讯飞智慧家庭一直以“用AI连接亿万家庭”为使命,并且已经形成了“用户良性依存、长期经营能力、持续增长潜力、行业示范价值”的业务特性,致力于为广大人民群众提供家庭全场景下的智能化产品和服务。
区别于ToC市场,科大讯飞的智慧家庭业务主要面向运营商客户,根据运营商市场的特殊性,积极推动落实与运营商的战略合作,通过打造省级根据地,以点带面逐步发展成为辐射全国的战略布局。截止至2022年上半年,智慧家庭业务已覆盖中国移动、联通、电信、广电四大运营商75个省级运营点。智慧家庭电视语音平台用户持续增长,累计覆盖终端3.65亿,累计激活用户超7500万,语音交互次数达223亿次,语音类特色应用服务在全国22个省份落地。(数据来源:电视语音平台BI数据)
四、未雨绸缪:有效应对数据安全、行业标准
围绕数据安全,我国相继修改和制定了《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》,以及与之配套的一系列法律法规,基本形成了较为完备的数据安全法律体系。
科大讯飞作为“人工智能国家队”成员之一,打造的电视语音平台依托丰富的业务数据管理经验,建立完善的数据管理与合规制度保障数据安全,按照法律法规要求构建用户全生命周期的数据服务体系。另外,科大讯飞面向家庭市场建立专有云服务,从数据采集到交互体验的优化已有闭环的流程和制度,充分保护数据安全。
另外,家庭用户的生活服务需求更加多样化,智慧家庭呈现出软硬融合、跨界应用等特征。受限于人工智能技术发展和行业标准的缺位,智慧家庭不同产品不同场景下的无障碍互联互通仍然是一个亟需解决的关键问题。因此,科大讯飞一直携手合作伙伴不断深化产业协同,强化在能力共建、标准制定、联合共创等方面的深度合作,共建智慧家庭新标杆。
早在2016年,广电总局批复设立“广播电视与语音技术融合创新实验室”,科大讯飞便与产业多方共同探索开展广播电视与语音技术融合创新的研究与实践,力求在智慧家庭终端、智能应用入口、智能营销平台、AI+广播新技术业务上打造新型智慧广电业务和标准。
2018年6月,总局广科院与沪苏浙皖广电局及科大讯飞共同签署“长三角区域智慧广电与人工智能语音技术融合创新战略合作协议”。各方围绕智慧广电战略,研发人工智能核心技术以及先进的音视频技术,为长三角区域打造安全的“广电专属语音云”。
2020年,广电总局联合中国网络视听节目服务协会理事单位和企业代表共同发布《智能语音与IPTV交互应用白皮书》。《白皮书》中,科大讯飞对智能语音与IPTV交互的基本概念、用户需求、技术原理、功能架构、交互体验等进行详细阐述和标准说明,对IPTV业务中的电视语音交互和内容服务扩展起到行业参考作用。
2021年7月,由福建移动、科大讯飞、中移(杭州)等11家企事业单位参与制定的《智慧家庭人工智能语音服务通用技术规范》地方标准获得批准发布,并于9月21日正式开始实施。该标准是人工智能语音交互能力在智慧家庭业务领域的第一个地方性标准。标准的出台,将打破地方区域内智慧家庭无法互联互通的“孤岛效应”,助力智慧家庭行业整体高质量发展。
智慧家庭产业生态正逐步呈现出独特的应用魅力和场景价值,伴随着相关技术和产业的成熟发展,智慧家庭产业将迈入高速发展的快车道。为了实现家庭场景的智能升级,产业链上下游应加强沟通合作,通过联盟或者共建的形式,多方融合发展,全面提升家庭智能产品的技术能力、完善生态标准体系,保障好家庭用户的隐私数据,为智慧家庭发展提供新动能。
五、培风图南:家庭智能化的未来
从感知智能到认知智能,从“所见即可说”到“所愿皆所得”,家庭智能化具有很大的想象空间。家庭智能终端的产品形态可以从智能电视、智能音箱、智能中控延伸到智能可穿戴设备、医疗健康设备、家庭机器人等领域。另外,智慧家庭的人机交互势必不止语音一个模态,可以加入视觉、动作、感官等多模态交互和多模态协作,让家庭AI成为一个可以被看见、可以互相对话、可以长久陪伴的“家庭成员”。
未来,科大讯飞希望打造的是一个基于强视觉呈现的AI虚拟管家,实现“人-内容、人-家人、人-设备、人-生活、人-服务”五大连接,重构家庭入口,助力客户在大屏创造更多价值,构建智慧家庭生态建设。我们相信,未来每个家庭都会有一个专属AI管家,我们想做的就是去打造属于每个家庭的AI能力,形成家庭中无处不在的交互、无处不在的关怀、无处不在的服务。
当然,我们必须承认,目前智慧家庭还属于初级阶段。但不管未来如何发展,科技要以人为本,让数字家庭更智能、更人性化依然是众心所向和主流趋势。