【天天时快讯】代码提速62%，5分钟真人视频素材可生成数字人！商汤加入AI大模型混战

来源：华夏时报发布时间：2023-04-14 12:18:45

ChatGpt掀起了国内通用人工智能的技术浪潮。继百度、阿里、华为、360之后，又一家大厂推出GPT大模型产品。

4月10日，商汤科技在技术交流日活动上发布了大模型体系“商汤日日新大模型”，推出自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力。

(资料图片)

在参数方面，商汤科技的大模型是基于千亿级参数的基础大模型，商汤人工智能计算中心能支持20个千亿参数超大模型同时训练。而这背后也体现了商汤科技在“算力”上的优势，商汤科技的AI大装置SenseCore上总共有27000块的GPU芯片卡，可以输出5.0 exaFLOPS的总算力，据商汤科技董事长兼首席执行官徐立透露，其是亚洲目前最大的智能计算平台之一。

对此，北京社会科学院研究员王鹏对《华夏时报》记者表示：“商汤科技入局大模型有其自身优势。它是国内AI四小龙之一，有相关的技术储备，在算力算法、芯片方面有深耕。”

实际上，由于ChatGPT的火爆，国内外不少大厂也开始纷纷关注大模型。过去一个月，大模型密集发布，一直是市场的焦点。

“大模型会对传统生产模式会产生颠覆式的影响，能够更好地实现降本增效，促进经济社会高质量发展。实际上，大模型密集发布的情况下反而不容易出现垄断，另外，在充分竞争下才能提升品质，才能更好地实现商业化落地应用。”王鹏表示。

基于“大装置”+“大算力”

“‘苟日新、日日新、又日新’，这句话出自《礼记·大学》中汤之《盘铭》，也是商汤‘日日新SenseNova’大模型体系的取名由来，这寓意商汤在模型的迭代速度及处理问题的能力上可以日日更新，不断解锁AGI的更多可能。”徐立在活动上如此介绍大模型名字的由来。

“日日新很像是一个超市，寓意也不错，商汤将提供一个大模型的超市。”徐立表示。

对于“日日新”大模型的特点，商汤科技方面对《华夏时报》记者表示，一是该模型具有更好的通用性，二是开放生态合作，生态合作伙伴可以在该模型上做各种微调，得到各种风格不同的模型。未来，我们也希望能依靠社区的力量把目前的模型进行调教，从而更好地往前推进。

在活动现场，商汤科技展示了“日日新”模型赋能的多款自研产品，包括千亿参数中文语言大模型“商量SenseChat”、文生图创作平台“秒画SenseMirage”、AI数字人视频生成平台“如影SenseAvatar”、3D内容生成平台“琼宇SenseSpace”和“格物SenseThings”。

作为千亿级参数的自然语言处理模型，“商量SenseChat”在活动上展示了出色的多轮对话和超长文本的理解能力，展示了其在编程、医疗等场景的应用。

据了解，在内部实测中，AI代码助手可以让代码编写效率提升62%，HumanEval测试集一次通过率40.2%。

在医疗场景，“我们也将进一步推动在新华医院、瑞金医院、华西医院等医院的在辅助诊疗、随访、健康咨询等方面业务的上线。”徐立透露。

此外，商汤还演示了AI文生图创作、2D/3D数字人生成、大场景/小物体生成等AIGC(人工智能内容生成)大模型及应用。

“秒画SenseMirage”是商汤科技自研的文生图创作平台。在活动现场，商汤科技演示了通过关键词描述迅速生成图片的能力，同时还可根据自身需求训练生成模型。

在视频生成方面，“如影SenseAvatar”是2D数字人视频生成平台，仅需一段5分钟的真人视频素材，就可以生成出来声音及动作自然、口型准确、多语种精通的数字人分身。它可应用为智能直播、教学、短视频等多种场景。

值得注意的是，徐立在现场提到，“如影”的名字是由其“商量”自然语言处理模型提出的，“商量”表示，“如影随形”是指一个东西与另一个东西伴生，因此很符合数字人的寓意。

而“琼宇SenseSpace”和“格物SenseThings”则是3D内容生成平台，可以高效低成本生成大规模三维场景和精细化的物件，为元宇宙、虚实融合应用打开新的想象空间。在活动现场，商汤科技展示了其在空间创意中的应用。

值得注意的是，参数量、处理数据量是衡量大模型能力的主要因素，而这也对算力提出了极大的要求。

在参数方面，这些大模型是基于千亿级参数的基础大模型，其中“商量”为1800亿参数，商汤人工智能计算中心能支持20个千亿参数超大模型同时训练。

而这背后体现了商汤科技在“算力”上的优势。商汤科技的AI大装置SenseCore上总共有27000块的GPU芯片卡，可以输出5.0 exaFLOPS的总算力，据徐立透露，其是亚洲目前最大的智能计算平台之一。

在活动上，徐立也透露道，2023年商汤科技目标是训练万亿级参数大模型。

在数据方面，商汤科技发布了最大的用于真实感知、重建和生成的多模态数据集，含190个类别6000个物体，均为全视角高清图片，每个物体包括5条环绕视频，支持神经渲染、表面重建、3D生成、点云识别等。

在商业变现方面，商汤科技方面对本报记者表示：“对于人工智能大模型，商业和技术并非脱节。我们会把整套的产品体系和技术体系往大模型去做支撑和倾斜，但我们也会在原有的各类的产品里面，按照用户或客户的需求，分层地提供适应于他们的应用场景的产品和服务。”

“从最底层来说，AI原生的基础设施层会提供AI专用的算力存储网络的服务，在平台层会提供自定义的，比如大模型的训练、推理、数据管理。包括API Serving各种各样的业务，在SaaS层我们也会提供基于人工智能大模型的各类的API.”商汤科技方面表示。

AIGC产业前景广阔

据了解，如今，火爆全网的AI聊天大模型应用ChatGPT访问量已飙升至8.89亿次，它也是历史上最快达到1亿月活的应用。其浪潮很快蔓延到业内，国内外不少大厂开始关注大模型。

国内本轮大模型发布中首当其冲的是百度的“文心一言”，随后不少大厂前后入局，360发布“360智脑”大模型，阿里发布“通义千问”大模型，腾讯发布“混元”大模型、华为发布“盘古”大模型。

“实际上，各家平台各有特色和优势，无法论其谁更好。百度最大的优势是有大量的数据，淘宝最大的优势是金融类数据，商汤的优势则在语言处理、文本处理方面。”王鹏认为。

“大模型会对传统生产模式会产生颠覆式的影响，能够更好地实现降本增效，促进经济社会高质量发展。实际上，大模型密集发布的情况下反而不容易出现垄断，另外，在充分竞争下才能提升品质，才能更好地实现商业化落地应用”王鹏表示。

同时，在平安证券近期发布的研报中也提到，当前，我国大模型技术发展方兴未艾，AIGC产业未来发展前景广阔。算法方面，预计今年国内龙头AI厂商将持续推出更多大模型产品；应用场景方面，预计国内将有办公、教育、医疗、金融等越来越多的行业探索大模型产品的应用；算力是短板，由于供应链的问题，我国高端训练芯片供给可能面对较大的压力，AI算力不足的问题可能显现，相关设备研发和基础设施建设企业可能继续受益。同时，AIGC新技术也会带来新的安全挑战，国产安全厂商也将受益。

此外，4月11日，国家互联网办公室就《生成式人工智能服务管理办法(征求意见稿)》公开征求意见。这也预示着，AI产业的发展路径更清晰，有望沿着更标准化、规范化的轨道发展。

（文章来源：华夏时报）

关键词：