微信号
17070522355
5月27日,ChatGPT与人工智能前沿技术交流会在北京举行。北京捷通华声科技股份有限公司高级研究员邢启洲发表了演讲。
“ChatGPT从去年11月份开始爆红,到现在大概也已经有了半年时间,ChatGPT所表现出来的类人的表现,让我们感觉人类再一次迎来了技术驱动发展的社会更迭。ChatGPT其实是一次完全新的变革,可能不亚于之前2006年提出的深度学习算法,包括2016年AIphaGO击败李世石。”邢启洲说。
邢启洲表示,ChatGPT给自己感触最深的是跟ChatGPT聊天像在跟一个人聊天。网上总结ChatGPT可以做的49件事,在自己看来ChatGPT能做的事几百件几千件,只要我们能想到的事ChatGPT都能完成。
“我们全面了解认知了ChatGPT之后,我们怎么去把这个ChatGPT给它用起来,怎么能让它在我们的产业中真正落地,而不是一个可能互联网上的demo,或者测试调侃娱乐的一个东西。”邢启洲说。
如何把ChatGPT去进行真正商业化工业化的落地?邢启洲分享了自己看法。
“当我们冷静下来去思考这个问题的时候,我们也会发现如果它真的在我们的工业场景落地的话,依然存在很多不可逾越的沟壑。比如工业落地更关注的是什么,工业界落地更关注的其实是效果的下限稳定性。而目前所有开放性的大模型大家关注的是什么,媒体关注的是什么,关注的是模型的上限,在我看来ChatGPT是上限非常高的模型,可能上限达到100分甚至以上,但是缺乏对下限的基本保证。”邢启洲说。
邢启洲表示,除了稳定性和正确性的问题,还有一个问题不可忽视,就是模型使用成本的问题。“今天我们在2C的场景可能测试几条数据或者简单去适用,这个成本是可以忽略不计的,但是我们真的要把这么大的一个庞然大物的模型真的用到每一天就有几万通通话的客服场景呼叫中心,这个成本就要掂量掂量,但是目前来讲这个大模型不管是ChatGPT发布的大模型或者其他公司发布的模型,这个成本是不可忽略的。”邢启洲说。
邢启洲介绍,大模型从去年底推出就掀起了AIGC的浪潮,大家都会觉得大模型无所不能,真正了解行业的人都知道真正在行业中用到的模型更多还是基于检索的模型,基于传统的LP的模型,生成式的模型尤其在文本生成模型上使用的场景非常少。不是说生成模型不好,而是稳定性的问题没有被真正解决。
“ChatGPT确实大幅上升了我们的模型的上限,但是没有解决我们落地的问题,它的模型可解释性问题依然没有给出很好的解决方案,它的稳定性依然没有给出可落地的方案。”邢启洲说。
邢启洲表示,从专业知识覆盖度上去考虑,ChatGPT有1750亿的参数,可以覆盖全世界互联网上的各种知识,但是它真的深入行业深入专业领域上是很难覆盖的。
“作为捷通华声来讲,我们提出了巨数据巨系统的创新集成的思想。有两条路,一条路我们把这个模型继续给它做大做强,直到等待它有一天可以具备了这种真的处理复杂问题的能力。还有一条路,就是我们基于这个模型底座,但是我们要基于这个模型底座去创造一套巨系统,包括结合巨数据,从而打造的是一个复杂系统,这个复杂系统是可以应付可能我们真实世界的各种复杂问题的。”邢启洲说。
邢启洲解释,提出的这个系统一定是要以大模型为底座,但是我们会基于大模型去做很多行业属性的数据收集训练,去推出各种行业模型。行业模型可能也不够,还会推出各种任务小模型或者结合实际场景的小模型。虽然有大模型,但是还是要借助中数据、小数据,才能让它在真正的场景去落地。当然最外面可能就可以基于我们的这套复杂系统衍生出各种的应用场景,我们就可以做成一个企业大脑,可以做成一个行业专家平台。
“我们捷通华声打造的LingGPT目的是什么,要解决行业的痛点,我们不跟通用大模型去做对比,因为大模型我们秀一秀没问题,但是捷通华声做了20多年的行业,我们要做的是为行业赋能。我们首先要解决的是LingGPT要做到行业专家,同时做到企业大脑,而不是全人类的大脑。”邢启洲说。
邢启洲表示,另外捷通华声要做加强模型的可解释性包括安全性的设计,比如可能不仅依靠这个大模型,要和检索做结合,包括可能要与知识图谱做结合。人类积累了几千年的高质量的知识,如果不用起来的话,是解决不了这种可解释性和安全性问题的,一定要把大模型和高质量的知识相结合,才有可能去解决模型的稳定性的问题。
新浪声明:所有会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。
微信号
17070522355