联系我们 微博
入会流程 潮青商会简介hth官网app下载> 成员新闻

打造“语音身份证” 潮籍“80”后科学家张伟彬把声音做成一门生意

新闻来源:综合声扬科技、香港科技大学校友事务处、百度等发布时间:2023年08月05日 我要分享

现代科学研究表明,声纹不仅具有特定性,而且有相对稳定性的特点。成年以后,人的声音可保持长期相对稳定不变。实验证明,无论讲话者是故意模仿他人声音和语气,还是耳语轻声讲话,即使模仿得惟妙惟肖,其声纹却始终不变。从理论上讲,声纹同指纹一样具有身份识别(认定个人)的作用。许多国家都已把声纹鉴定作为辨认犯罪嫌疑人的重要手段,为侦查工作提供新的线索和证据。


一位来自潮汕的“80”后科学家,便从中发现了商机

声扬科技联合创始人、首席科学家,深圳市潮汕青年商会常务理事张伟彬



被读书耽误的创业者 打造声纹识别“黑科技”


张伟彬,声扬科技联合创始人之一、首席科学家,香港科技大学博士,原华南理工大学副教授、研究生导师,于2022年获广东省人工智能产业协会“青年科技创新奖”。


求学期间,张伟彬便对智能语音有所研究,得益于超乎寻常的商业嗅觉,他敏锐地察觉到生物识别的需求与发展趋势;同时,他认为技术需要跳出实验室,运用到实处,并认同语音和声纹技术的落地实践极具发展前景。就这样,骨子里“不安份”的他瞄准了市场潜力巨大的声纹科技,毅然地选择了创业。


既然要创业,就得全身心投入,彼时的他,已经是华南理工大学副教授、研究生导师。本着为学生负责、为自己公司负责的态度,张伟彬成为了第一个从华南理工大学辞职并全职创业的副教授




张伟彬是一名典型的学霸,曾戏称自己是“被读书耽误了的创业者”。他本科就读复旦大学,超过10年的语音研发经验,为他赢得了竞争极其激烈的香港政府博士奖学金(Hong Kong PhD Fellowship),只用3年时间就“光速”拿下了香港科技大学电子与计算工程博士学位,手握十多篇SCI/EI文章、近十项国内专利和一项美国专利。看过很多优秀的人工智能语音方案因为没有应用场景无疾而终,也见过不少 to C端的人工智能语音流于形式,博士毕业前夕,张伟彬已经明确了要做 to B端的智能语音公司的想法。


他和同学——攻读香港科技大学计算机科学与工程博士的陈东鹏一拍即合,并邀请他担任CTO。


陈东鹏曾在联想香港研发中心从事语音、数据挖掘和自然语言理解研究工作,在IEEE TASLP、ICASSP、Interspeech等语音领域的国际顶级期刊和会议发表过多篇文章。


陈东鹏又兴奋地拉来自己的同道、刚读完香港中文大学工商管理学硕士的李亚桐加入。相遇于港科大最有名的联谊活动“卓贤汇”,素不相识的两个人在谈到未来人工智能语音如何应用、如何帮助弱势人群问题时,竟关不住话匣子,畅谈至深夜。


首席科学家张伟彬(左)、CEO李亚桐(中)、CTO陈东鹏(右)


彼时,陈东鹏为听障人士特别开发的粤语语音识别系统刚获得香港政府颁发的Web Accessibility Recognition金奖,而有着近10年生物识别产业化经验的李亚桐也开始将目标投向了更有发展前景的声纹识别。


就这样,三位联合创始人祭出各自领域的独门法宝,将在香港形成的创业雏形带到深圳,成立了声扬科技。


他们的创业之路正赶上了2018年声纹市场需求的爆发期,加上专业领域过硬的能力,顺理成章地走在了时代发展的前沿。



万事开头难 创业没有套路可循


创业公司初期大都为钱所苦,他们也不例外。在天使轮之前,他们一度非常缺钱,最糟糕的时候一边发不出工资勒紧裤腰带,一边眼巴巴看着南山科技园租金一路攀升。


幸运的是,从2017年年底完成天使轮之后,资金困境解决了,公司运作加速。2018年10月,声扬科技作为孵化企业入驻香港中文大学深圳研究院众创中心。


声扬科技入驻香港中文大学深圳研究院众创中心


创业更需要牺牲很多东西,工作强度大,核心团队日以继夜做测试,没有周末、24小时随传随到上“前线”……这些都是常态。

“磨”产品的过程总是艰辛的。张伟彬回忆说,2017年在为市场排名前三的某油烟机做人工智能语音测试时,就在“小黑屋”——研发室内整整“关”了两个月,每天开车40公里和对方公司的工作人员一起上班,直到晚上11点才下班,单是调试就做了上万次。



为了确保在抽油烟机噪音巨大的情况下,机身安装的软件能够准确识别唤醒词和命令并正常工作,每次做测试时都需要在现场播放喇叭,高逼真模拟煎煮的声音。这意味着在80dB的高分贝环境下,张伟彬要连续作业十几个小时,苦不堪言。可是当他们看到油烟机上市后,消费者体验反馈很好,相近场景的商家也找上门谈合作,心里充满成就感。这让他们更确信自己此前的判断,在极度嘈杂环境下的离线语音识别、语音唤醒技术在应用上可以实现的,而越来越多的场景需要这样的技术。


经过长期的调研讨论,三位创始人发现国内乃至全球声纹技术应用落地的公司并不多,进而将声纹识别确定为公司的主要战略发展方向。



声扬科技也逐步探索出了更接地气的商业模式:致力于研发全栈智能语音产品和解决方案,以音频处理和语音分析为核心,为公共服务、金融、汽车等行业提供基于语音技术的安全、数字教练、企业运营、智能座舱产品服务。


2018年,声扬科技斩获香港中文大学创业大赛冠军、获深圳市创新南山“创业之星”大赛成长企业组三等奖、中标广东省电力通信有限公司纪检监察系统语音记录项目(系国内第一次将声纹识别应用于行业会议记录),首创性地解决了智能会议记录“谁说了什么”的技术难题……技术实力和商用潜力再获学界、行业认可。


张伟彬曾说,创业其实并没有一个固定的套路,不是“按部就班”就能达成目的——而最好的解决办法便是实践,只有身在其中,只有不断试错,才可以获得真实的反馈。因此他认为,创业首先要有勇于冒险、敢于尝试的精神。


2019年声扬科技携智能语音技术亮相丰田Private Exhibition


创业者需要具备的第二个品质是坚毅。创业并不如外人想象中这么光鲜亮丽,当中的艰辛都是不为人知的。张伟彬调侃自己的工作制度是“007”,即0点上班,0点下班,一周工作7天,24小时随叫随到,其中的牺牲不言而喻。


第三个建议是团队的构建,创业者需要根据发展的方向决定如何组建团队成员。若是在面对企业客户(to B)的行业,非常看重团队成员之间的互补性,着力补齐短板;而对于面对普通客户(to C)的行业,则需要突出特定的优势,不断提升长板。


声扬科技团队合照



VoiceAI声纹识别技术首创性服务了印尼国家社保 普惠250万退休老人


声纹识别技术不仅带来极高的商业应用价值,也为社会公共服务带来了创新解决方案。


2018年,声扬科技分批在印尼上线的印尼养老金声纹识别项目,是全球首个应用声纹识别技术的国家级社保项目,覆盖印尼当地250万老年人。得益于99.5%以上的准确率,声扬科技的声纹识别技术方案让印尼老人可以在线上选择声纹识别直接进行认证,在避免养老金被冒领的同时,也免去现场认领的长途舟车劳顿。




张伟彬介绍,居民只要提前线上注册,通过手机麦克风录制一段音频,在养老金远程申领时认读随机的数字,声扬科技就可以根据声纹比对判断是否是其本人。这个过程中,主要应用语音识别和声纹识别两种技术。语音识别是需要判断读出来的随机数字是否正确,能防止录音攻击,声纹识别的作用则要判断是否是本人。


“先把项目做出来,再考虑盈利。”团队前期在印尼进行项目准备时,感触颇深——当地70、80岁的老人往往需要坐上好几个小时的车才能抵达领取现场,排长队领到养老金之后,又是几个小时的返程,月月如是。有了声纹识别之后,老人家出行不便的痛点得到真正的解决,只要通过讲话即可完成远程身份认证,让养老金领取变成“一句话”的事。


2018年声扬科技CTO陈东鹏在印尼做调研


以创新科技赋能反欺诈


在几大项目投入应用之后,声扬科技进一步聚焦发展方向,将金融、社保、政企服务、安防、智能硬件和物联网确定为最主要的五大领域。比如在金融场景里,声扬科技的声纹识别和语音识别技术为APP远程登录、电话认证、风险控制三方面提供解决方案;而在反欺诈场景里,不仅确定“你是不是你”,还会和有关部门合作,逐步建立欺诈者的声音黑名单库,快速锁定“你是谁”。


VoiceDNA语音反欺诈平台正是专门针对泛金融行业的风控反欺诈需求而开发。以业务环节全流程中的语音数据为切入点,声扬科技VoiceDNA语音反欺诈平台致力于帮助客户落地新一代以“事中干预”为核心的智能语音风控系统,实现风险防控和客户体验“双提升”。


声扬科技部分奖项


近年来,声扬科技成功服务中国工商银行、中国农业银行、招商银行、兴业银行、广发银行、恒丰银行、中国人保、中国人寿、中国南方电网、国内某龙头新能源车企、梅赛德斯奔驰、日本某知名跨国汽车品牌、如祺出行等客户,在数字化浪潮中加速实现转型升级。


2023年,声扬科技收到某寿险客户的反馈与致谢,该人寿保险公司应用声扬科技VoiceDNA语音反欺诈平台15个月以来,共计识别到500余次声纹不一致的情况,通过进一步核实发现了超过170名风险客户,由此减少100余万元的损失,亿元保费投诉量降低了六成,电话中心的服务效率也提升了20%。


2022年,中国人寿财产保险股份有限公司联合声扬科技,引入智能语音分析技术,以"识声"能力完善智能风控体系,在理赔稽核等多场景正式上线了声扬科技旗下保险反欺诈创新产品——VoiceDNA语音反欺诈平台,进一步加深科技赋能保险反欺诈。



2022年,声扬科技成功签约招商银行声纹识别系统项目,将在其多个业务流程中应用“VoiceDNA语音反欺诈平台”,以创新科技助力招商银行风控反欺诈体系智慧升级。



2021年,声扬科技以信用卡声纹反欺诈场景为切入点,为工商银行提供的语音智能化解决方案,打造VoiceDNA语音反欺诈平台,通过电话银行在线上办理信用卡申请、启卡、尽调环节,利用声纹识别为客户经理提供身份识别和欺诈风险判断依据,全面提升智慧风控水平和客户服务体验。




专注语音智能分析 助推数字经济发展


声扬科技自成立以来,始终专注于智能语音分析领域的技术创新与应用落地,自主研发了以声纹识别为特色的全栈智能语音技术体系,获深圳市专精特新中小企业、广东省人工智能声纹工程研究中心等权威认证。在产业落地方面,声扬科技持续深耕金融、公安、政企服务、汽车等行业的数智化升级和应用落地,围绕风控反欺诈、智能培训、智能座舱等复杂新颖场景,提供精细化的专业产品和运营服务,为产业数智化转型升级保驾护航。


金融安全方面,声扬科技的语音反欺诈产品目前在六大行和股份制银行中以近40%的市场占有率遥遥领先


公共安全方面,凭借全自主研发的三大公安产品系列落地全国400余个省市县级公安机关,以AI语音助力科技强警


声扬科技亮相警博会


智能座舱方面,JustVoice/VoiceKey等车载产品已经在二十多款乘用车中落地使用,累计前装车辆超150万辆


智能培训方面,TrainingMaster智能数字教练已累计培训超过30万企业员工,7*24小时全天在线的情景对练机器人赋能企业降本增效。


未来,声扬科技将不断助力推动科技创新和产业发展深度融合,持续引领探索更前沿的人工智能语音分析技术。




不感兴趣:0 爱看:0 +1
相关新闻阅读

热门推荐导读

网站版权信息:Copyright(C) 2024
版权所有粤ICP备13064390号
人才招聘联系我们| 邮箱:szchaoqing@126.com
商会公众平台 商会微博
关闭
Baidu
map