复旦大学NLP实验室核心成员:我们低估了ChatGPT影响力

来源:第一财经  发布时间:2023-02-22 07:59:48 

时下科技领域最热的概念莫过于ChatGPT。

2月20日,复旦大学邱锡鹏团队推出中国版ChatGPT“MOSS”,这是国内第一个公布的对话式大型语言模型,热情的用户涌入一度导致其服务器被挤崩。

21日晚,第一财经连麦学界、法律界大V,共同探讨了ChatGPT的应用、误读以及其牵涉的法律风险和商业伦理问题。


【资料图】

复旦大学计算机科学技术学院教授张奇参与了本次讨论,他正是推出MOSS的复旦大学NLP实验室的核心成员之一,就当下所面临的一些争议,他表示MOSS并不代表国内最好的模型,团队只是想在学术上进行数据收集,进入更详细的探讨。

作为专业研究者,张奇复现了ChatGPT 推出背后所需要投入的资源,这是一个非常耗时、耗人且耗钱的一个过程。他表示,这不仅对于学术界来说是不小的投入,甚至对于互联网大厂来说,做这类研究都是一个不小的投入。

MOSS迈出第一步

相对于ChatGPT,MOSS仍然有非常大的差别,在直播中,张奇直言,“ChatGPT是千亿级的模型,我们只有百亿级。此外在指定微调的阶段ChatGPT并没有公开,但是能够看到的版本已经有1800种任务,团队只有数百种任务,规模上远远小于它。”

张奇所在的复旦团队从整体上复现了ChatGPT的步骤,他解释道,语言模型的最后一步需要人的参与,如果没有用户的真实数据,团队很难对模型进行提升,也很难再进行下一步的研究。这也是MOSS推出的背景。

推出当时团队并没有考虑太多,随后而来的热度和争议也是团队没有想到的,“我们低估了ChatGPT和MOSS的影响力。”

面临争议,2月21日,复旦团队在MOSS官网发布公告致歉,称模型还不成熟,距离ChatGPT还有很长的路需要走,“我们一个学术研究的实验室无法做出和ChatGPT能力相近的模型,MOSS只是想在百亿规模参数上探索和验证 ChatGPT的技术路线,并且实现各种对话能力。”

对于ChatGPT 背后模型所拥有的1750亿的参数规模,张奇表示,学校这类机构很难去完成,目前百亿级的规模都已经非常困难。

按照ChatGPT目前开源的最简单的复现版本、最便宜的模式去计算,要做到1750亿的参数规模,需要大概6000万的硬件成本,同时运算3年5个月。这还是所有事情都做对的情况,如中间有参数调整,或者想加速训练过程,就需要更高规模的投资。

按ChatGPT的规模估算,张奇判断OpenAI大概为此耗费了十几亿的硬件投资,不包括顶级的算法研究人员的投资,以及后续对大量用户数据收集的投资。

“这其实是一个非常耗时、耗人且耗钱的一个过程。”不仅对于学术界来说是不小的投入,甚至对于互联网大厂来说都是一个不小的投入。

因此,在资金、算力的投入门槛下,面临应用场景和商业化的不确定性,团队和企业敢不敢去做这类研究,每一步都制约着在这个领域的进步。

尽管当下面临很多问题,张奇所在的实验室对于ChatGPT所带来的通用人工智能的可能性仍充满期待。

“实验室很多同学都已经是997,我们大概8点就已经到办公室,晚上10点才回家。这种状态就像我们看到了莱特兄弟的飞机飞10米的那个状态,然后我们想把它飞到100米,去实现那样的可能性。”

ChatGPT被过誉了吗

ChatGPT的能力到底如何?张奇团队对此做了一个针对ChatGPT的高考测试,发现其展现了很好的理解和推理能力。

以2022年的高考全国卷为例,在把一些复杂的问题排除掉后,ChatGPT可以达到76%的准确率和67%的得分率,在文科上能够达到78%的得分率。综合来看,ChatGPT在高考中可以获得500分左右的成绩,相当于是二本线的一个结果。

但就目前ChatGPT所引起的追捧来看,它是否被过誉了?上海大邦律师事务所高级合伙人游云庭提到,自己是国内较早使用ChatGPT的用户,但用了两天就失去兴趣,因为现有的互联网对他这类成熟网民来说仍然是更好的选择。

游云庭并不认为ChatGPT可以颠覆搜索,ChatGPT更多偏向于咨询,和搜索引擎是两类产品,且主流用户已经适应了搜索引擎,以目前ChatGPT所展现的能力还无法替代。

此外,ChatGPT还需要很长的时间去开发进行二次落地,“像VR、元宇宙这些概念提出来之时都很热,但现在都相对平静了,因为这些技术的开发实际上都需要很长的时间,这是误导性的问题。”游云庭表示。

复旦大学管理学院助理教授李文文还提到,目前大众的一个误区是对ChatGPT取代人类的工作的担忧,现在网上一些文章或者短视频,用一些或许比较夸张的标题营造了一些恐慌,对于不了解AI产品或是技术的人,甚至会对技术产生消极的情绪。

但实际上,就现阶段的ChatGPT而言,它仍然是一个对话型的AI产品,距离商业落地有比较长的路要走。在试用ChatGPT的时候也会发现它其实存在一些事实性的错误。

如果仅仅把ChatGPT当做娱乐向的产品,错误是可以接受的,但如果要将它应用在企业的业务,如医疗健康、法律领域,它会产生一些严重的后果。

基于此,李文文认为ChatGPT并不会对人类的工作造成太大威胁,未来可能更多是人工智能产品被引入到更多的行业,去辅助而不是取代我们的工作。

作为一名律师,游云庭也提到,作为一个工具,ChatGPT确实能够一定程度提高效率,但并不会对法律行业造成挑战。

“我试着用ChatGPT生成一份合同,给它设定一个任务,给了一些条件,这份合同出来之后我松了一口气,我的职业看起来是比较难取代的。”游云庭提到,在ChatGPT的合同中,有一些逻辑上的错误,前后仍然有一些矛盾,还需要很多的细调。但仅仅是这样的细调,在人工智能领域或许就需要耗时不短的时间,才能达到对于商业化的要求。

在诉讼方面,美国一家企业已经开发了一个人工智能律师,一定程度上的确可以取代律师的工作,但法律服务在所有国家都是有壁垒的,包括律师的牌照。而是否允许人工智能参与到法律服务中,还涉及到人工智能的伦理问题。

“在这些问题没有搞清楚之前,我相信任何一个国家的律师主管部门,都不会轻易给人工智能发牌照。从诉讼的角度来说类似ChatGPT的一些应用,要挑战律师饭碗也挺难。”游云庭说。

(文章来源:第一财经)

关键词: ChatGPT 复旦大学

复旦大学NLP实验室核心成员:我们低估了ChatGPT影

时下科技领域最热的概念莫过于ChatGPT。2月20日,复旦大学邱锡鹏团队推出中国版ChatGPT“MOSS”,这是国内第一个公布的对话式大型语...更多

2023-02-22 07:59:48

中原证券:关注龙头券商以及低估值中小及弹性券商

中原证券2月22日研报表示,2月以来券商指数跟随各权益类指数同步出现震荡回落,截至目前板块平均P B由接近1 40倍回落至1 30倍以...更多

2023-02-22 08:14:22

短讯!中国音像与数字出版协会副秘书长唐贾军:抢

电竞进入亚运会,电竞战队被授予城市形象传播使者荣誉,电竞场馆里能冲浪、攀岩、滑雪……电竞行业的“黄金时代”来了。更多

2023-02-22 06:55:59

环球观天下!广西开展科技“尖锋”专项行动

记者从近日举行的广西深入实施创新驱动发展战略新闻发布会上了解到,为贯彻落实创新驱动发展战略,加快建设创新型广西,广西将实施...更多

2023-02-22 05:54:37

推动财力下沉 兜牢“三保”底线

一段时间以来,基层财政收支和“三保”(保基本民生、保工资、保运转)问题受到关注。中央经济工作会议强调,要加大中央对地方的转移...更多

2023-02-22 06:01:05

60进1!杭州土拍现2%中签率

竞价21轮熔断、竞价16轮熔断、竞价33轮熔断……超6成地块触及最高限价,浙江杭州首轮供地火热开局了。2月21日,杭州2023年第一批集...更多

2023-02-21 23:12:06

环球快讯:多名消费者称旧车置换宝马新车被骗 4S

澎湃新闻消息,近日,多名消费者向澎湃质量观反映称,他们在广东粤宝汽车销售服务有限公司(以下简称广东粤宝)进行旧车置换新车,在...更多

2023-02-21 22:12:55

每日视点!深圳宝安在香港经贸推介谋求合作新机遇

深圳市宝安区日前在香港举办“新机遇新发展”经贸交流合作会,推进宝安区与香港的经贸往来合作,携手开拓市场,共赢发展。世界500强...更多

2023-02-21 22:03:37

焦点快播:国税总局:下一步将持续推动我国税收营

2月21日国家税务总局纳税服务司司长沈新国表示,去年9月国家决定在全国复制推广50项创新试点举措,其中涉税举措有12项,这些措施持...更多

2023-02-21 19:17:49

每日观察!资金面紧张延续:银行间市场隔夜利率与7

尽管央行持续在公开市场净投放,但资金面紧张的情况仍在持续,银行间市场上隔夜利率和7天期利率持续倒挂。中国货币网数据显示,2月2...更多

2023-02-21 17:59:58