11月27日下午,《华夏时报》记者通过微信联系到王玮时,她刚从合肥落地深圳不久,正忙于出差。临近年底,活动繁多,王玮是 科大讯飞 副总裁、安徽听见科技有限公司总经理,难逃忙碌。
28日下午,工作结束后的王玮将朋友圈定位在深圳宝安机场,准备飞离。人在深圳,朋友圈的内容却与当天远在北京举行的“WISE2024 商业大会”相关:图片中,参会嘉宾正就大会主题“Hard But Right Thing(正确的事)”发表讲话,后方的 LED 大屏底部是一排中英双语字幕——那是讯飞同传正在助力大会无障碍交流的印证。“#正确的事让有价值的思想,无障碍地流传!”王玮如此配文。
几个个钟头后,晚间23:40,落地合肥后的王玮又给记者发来大段信息,回复采访事宜。
“我认为科技发展的意义是为不能作战的人而战”“技术的发展,始终需要落脚到我们每个人身上”“ 科大讯飞 的核心技术是语音识别和语音合成”……夜色并未消磨王玮的激情和理性。
在 人工智能 领域工作23年,从技术走向产品,再从市场的第壹次尝试到涉足公益,如何找到技术创新、社会效益与商业可持续发展的平衡点,如何看待AI在无障碍技术领域的未解难题……在这场“隔空对话”中,她向《华夏时报》记者讲述了 科大讯飞 的公益战略和自己的公益体悟——做正确的事,为不能作战的人而战,这是科技应有的温度。
科技发展的落脚点是“人”
“科技发展的意义是为不能作战的人而战”——这是 科大讯飞 在公益领域整体战略的起点,也是王玮在公益中的体悟和坚持。
2015年讯飞听见录音转文字网站正式上线之前,王玮一直专注于技术工作。同年, 科大讯飞 正式发布了一款语音转写的产品叫作“讯飞听见智能会议系统”,这是王玮从技术走向产品再到市场的第壹次尝试。在与用户长期打交道的进程中,她注意到了其中的听障群体。
“听障群体对语音识别和转写技术的切实需求度很高。在中国注册的听障人士有2000多万,还有1亿—2亿的弱听人群,这是一个特别大的数字。”王玮和团队开始思考,怎样能为听障群体做更多事。
2019年5月19日第29个全国助残日, 科大讯飞 联合中国聋协、中国残疾人艺术团,发起“听见AI的声音”公益项目。由讯飞听见作为承办方,通过 科大讯飞 核心的 人工智能 语音识别技术把语音转化成文字,变听为看、看听结合,让听障人士通过文字感受世界、与人交流、顺畅完成工作,建立起与听障人士沟通的桥梁。
王玮(前排左一)作为公益活动联合发起人之一,与中国残疾人艺术团团长邰丽华(前排中)等人用实际行动助力公益
王玮作为公益活动联合发起人之一,经由项目与更多听障人士有了交流。她向记者回忆称,2022年,团队组织拍摄过一部用户故事短片《除了听,我们啥都能!》,自己对其中的聋人律师谭婷印象尤为深刻。
谭婷来自四川大凉山,前后参加过三次法律资格考试:2018年第壹次踏入律考;2019年接触讯飞听见APP后,自己上网课,学习效率大幅提升;2020年正式考取律师资格证,成为中国首位聋人律师。“别人可能会疑问她是聋人还要做律师吗,但她一直没有放弃,她心里想的是怎样为残障人群提供法律咨询服务,所以在不断精进、不断热爱、不断学习中,她达成了梦想,她每天都在做有意义的事,她很快乐。而我们的技术在这进程中帮助到了她。”
王玮为谭婷的生命力量感动,也为 科大讯飞 的技术能对一个生命有所助力而倍感震动。这也更加坚定了她的信念——科技发展的落脚点是“人”。
“技术的发展,始终需要落脚到我们每个人身上。科技应该更有温度,不仅要追求技术进步和效率提升,还要关注对社会、对人的影响,体现人文关怀。科技应该最大限度地帮助人们处理问题,提升生活品质,收获实实在在的体验认可。”王玮说道。
科大讯飞 深入场景的公益实践
为了这份“实实在在的体验认可”, 科大讯飞 传承着将核心技术和业务价值深入场景中来做公益,回馈社会。
2020全国两会期间,《人民政协报》两会特别报道“委员会客厅”采访现场,使用了讯飞听见会议与多位全国政协委员进行连线互动,采访解读委员们各项提案;同年10月,推动深圳卫视知识春晚节目与 科大讯飞 合作,用 人工智能 技术将现场演讲实时转化为文字,并且直接显现在电视直播画面中,这是AI直播字幕技术第壹次应用于省级卫视频道,助力听障人士收看节目;基于教学、会议、办公、窗口等场景,听障领域采用语音识别、多媒体和电子白板等采用无障碍软件+智能硬件技术、文本——声音转换技术,可以为听障学生营造多功能智慧学习空间。目前系列软硬件产品已在北京联合大学特教学院、南京特殊教育学院进行常态化应用,并在 西安市 第贰聋哑学校、长春大学特殊教育学院、 襄阳市 特殊教育学校进行试点应用……
“这些技术应用平均每天为听障人群提供超过5000万次的AI服务,累计服务障碍人群超过1087万。”能参与其中,王玮只觉与有荣焉。
至于“听见AI的声音”项目,因与讯飞语音识别技术高度契合,该项目成为 科大讯飞 公益疆土中的重要一块。截至2023年末,项目累计为听障群体定向捐献时长超1亿分钟。
另外, 科大讯飞 还启动了“三声有幸”项目,通过语音识别和合成技术,开发盲人游戏《荣耀战场》,让视障人群能够参与 电子竞技 ;今年5月, 科大讯飞 与中国残疾人联合会签署合作协议,双方将共建通用 人工智能 助残联合实验室,积极研发用于残疾人服务的人机交互组件、智能康复辅具,开展多类别的智慧助残研究,并搭建面向残疾人需求的应用场景,协同推进 人工智能 等技术创新成果在助残领域的示范应用等。
“在方言保护、增进教育资源平等方面,我们也有投入,如智慧教育产品捐献:向新疆喀什 疏附县 托克扎克镇中心小学捐献智慧课堂教学系统、智慧窗一体机等设备,帮助学校构建智能化教学环境,提升数字化教学能力,共享 人工智能 发展成果。”王玮说道。
AI技术赋能公益、无障碍的未来
在 科大讯飞 的系列公益实践中,王玮愈发看见了AI技术的普惠性。
“这种普惠性是指确保每个人都能享受到 人工智能 技术造成的便利与益处,这不仅是技术层面的普及,更是社会层面的公平与包容。这是一个非常宏大的命题,涉及到技术普及、社会公平、教育就业多方很多面的讨论。”
而作为一名科技企业工作者,这种普惠性时刻提醒王玮先做好自己和一些行业引领。“好比作为一名AI工具的生产者,我们要在设计和开发进程中就考量到多样性和包容性。2022年我们招聘过一名听障员工加入产品研发队伍,她为我们提供了很好的交互改进思路,非常细小的更改却能为特殊群体提供质的体验提升——以听障群体实际需求者和用户的视角动身,去考虑普惠性问题,这一点极为重要——还是以人为本。”
那么,作为一家 人工智能 企业,在推动公益项目时,如何找到技术创新、社会效益与商业可持续发展的平衡点?
王玮回答记者:“只要足够深入用户需求、能够解决大众槽点,这三者本质其实不冲突。”
她举例称,2022年,自己率领讯飞听见与B站携手在英雄联盟直播时使用无障碍实时字幕。在中国电竞战队EDG夺冠的英雄联盟s11赛事中,B站无障碍直播间使用讯飞听见AI字幕的人数突破600万,总决赛单场竞赛峰值人气为400万。“我们当时开设无障碍直播间本意是为听障群体提供便利,但进程中发现很多普通观众也有字幕需求:在声音不方便公放的场合,他们也需要实时字幕。类似这种延展出来的切实需求其实很多,因此我们很感谢聋人朋友,正因为他们对声音的切实需求和使用更加敏感,帮助我们拓展了更多技术使用场景。”
面对推动AI技术服务公益和无障碍事业的未来,王玮表示,随同着大模型的不断发展成熟,AI技术将进一步提高无障碍设备的智能化和自主性。例如,智能语音助手可以更好地理解用户的指令,提供个性化的服务;系统可以在没有人类干预的情景下自主学习、决策和适应环境,这将极大地提升无障碍设备的实用性和用户体验。
可是,随同而来的伦理和法规问题也不可忽视。“确保AI技术的健康发展,需要制定符合伦理标准和法规要求的准则和规范,我想这对大众来说都是很大的难点和挑战,对特殊群体将来的应用更是。”王玮说道。
众人拾柴火焰高,她希望国家能将信息无障碍列入规划和重要工程,努力构筑和完善信息基础设施,不断提升信息基础设施提供信息无障碍服务的能力和水平,也给予无障碍行业工作者更多的政策和资源支持,同时,结合人文关怀,确保技术进步服务于每一个人的福祉,尤其是边缘群体的切实需求。