专业IT科技资讯平台,关注科技、手机、电脑、智能硬件、电脑知识!
当前位置:信息发布网 > 科技 > 互联网 >

解析商汤2024中期财报:被忽略的端侧AI 2B商业化,已服务多家知名手机和汽车品牌

导读:

  近日,商汤(0020.HK)披露了2024年上半年业绩。报告期内,商汤实现营收17.4亿元人民币,同比增长21

  近日,商汤(0020.HK)披露了2024年上半年业绩。报告期内,商汤实现营收17.4亿元人民币,同比增长21%,较去年同期,亏损减少21%。从三大业务来看,2024年上半年,商汤生成式AI业务实现收入近11亿元,同比增长256%,占集团总收入的60%,成为商汤的主导性业务。“绝影”智能汽车业务收入为人民币1.7亿元,同比增长100%;传统AI业务再次主动收缩压缩至集团整体收入占比至10%。 

  “三大业务的变化体现了我们发展策略的调整。”商汤集团董事长兼CEO徐立表示,生成式AI迎来黄金发展时期,商汤全面向生成式AI转型升级的战略目标已阶段性达成。 

  2023年被誉为“大模型元年”,而随着2024年的到来,大模型如何“落地”已成为推动整个产业链转型的关键。当下,各行各业均在加速探索如何利用大模型赋能自身产业发展。而面对这一趋势,作为全球领先的人工智能软件企业,商汤科技早年间布局现阶段开始收获商业化果实,保持了以互联网企业客户的领先优势,并站稳了机器人、新电动汽车、医疗、金融等新兴行业。 

  财报背后,我们发现商汤在端侧的成绩,斐然。 

  大模型厂商抢夺 “端侧”蓝海,商汤守擂优势凸显 

  作为抢占未来流量入口的关键,端侧AI俨然成为各大厂商争夺焦点。而端侧设备,以智能手机和智能汽车为代表,已经成为AI技术的重要应用阵地。 

  《2024年中国端侧大模型行业研究》报告指出,生成式AI市场的蓬勃兴起,正驱使大模型厂商积极探索端侧应用的新蓝海,以此作为增长的新引擎。端侧大模型通过在设备本地运行,有效降低了数据传输延迟,增强了隐私保护,拓宽了AI应用场景的广度与深度。 

  “与此同时,下游市场需求的强劲增长,特别是手机与自动驾驶行业的蓬勃发展,正强力拉动端侧大模型市场的扩张,2023年中国端侧大模型市场规模达 8亿元,预计2024年中国端侧大模型市场将达到21亿元。 ”上述报告表示。 

  近年来手机厂商们纷纷推出主打AI功能的手机,旨在通过AI拍照、智能交互、个性化推荐等功能提升用户体验。而汽车厂商则更加关注自动驾驶技术的实现,以及如何通过AI技术提升驾驶安全性、舒适性和智能化水平。通过商汤今年来财报发现,商汤分别在手机、汽车两项核心端侧领域,已形成稳固壁垒,处于守擂成功有利位置。 

  商汤在端侧AI积累了大量商业市场经验,并具备扎实的AI 2B能力。回溯发展历史我们发现,商汤一直在端侧“自卷”。早在2015年起商汤已和几乎所有全球主流安卓手机厂商,车企和APP厂商合作,是中国最早布局端侧的AI企业之一。商汤针对不同端侧设备的特点,持续进行端侧模型系列扩充,如7B、1.8B,并追求终端小模型性能与大模型媲美,推动边端运行——这是目前行业中鲜少完成在端侧商业落地应用完整布局的AI企业。 

  为何如此下重投入在端侧?“大模型的主要应用场景将集中在端侧”,这是商汤早于2023年的回答。2024上半年财报数据显示,报告期内,商汤“日日新”整体调用量实现了400%的增长,客户数和客户平均调用规模均大幅增长。 

  在汽车端,智慧汽车业务“绝影”依然保持稳健快速增长速度。2024年上半年财报显示,该业务实现了1.68亿元的收入,同比增长100%,累计交付车辆数达到260万辆、覆盖104个车型。上半年新增定点车型15个,新增定点车辆数约600万辆,其中包括福士华根、凌志等海外品牌的定点。此外,绝影还参与到多家中国车企的出海项目中,绝影的全球影响力日益凸显。整体汽车端侧覆盖量依旧处于高速增长态势。 

  在前不久召开的WAIC 2024商汤人工智能论坛上,商汤“绝影”宣布在行业率先实现原生多模态大模型的车端部署,并现场演示了搭载在200 TOPS+平台上的8B模型(即80亿参数)车端部署方案。这一成果展示了商汤在多模态感知和交互能力上的强大实力,也为智能汽车的发展提供了新的可能性。相较于传统的云上部署方案,商汤“绝影”的车载端侧8B多模态模型在延迟和推理速度上均表现出色,能够满足智能汽车对于实时性和准确性的高要求。 

  在手机端,商汤的端侧小模型已经服务了小米、荣耀等主流安卓手机厂商客户。其推出的端侧小模型“日日新5.5lite”在推理速度和模型性能方面保持领先,其推理速度可达到每秒100字,延迟降至仅几十毫秒。与此同时,通过端云协同的推理架构,推理成本得以显著降低。据了解,接入商汤“日日新?商量”端侧大模型后,单台设备的成本可降至9.9元/年。 

  徐立指出,借助端云协同的新推理架构,成本降低也有助于大模型覆盖到更多IoT设备,不仅是高端手机,还可以应用于中端、低端手机,电视、音箱等设备,实现智能交互功能。 

  端侧两大技术根基——多模态能力、推理能力 

  值得注意的是,在AI的竞技场上,商汤科技之所以能在生成式人工智能的初期爆发阶段占据领先地位,这与其在端侧——“多模态能力”和“推理能力”的技术优势密不可分。 

  与文字输入相比,语音和视频等多模态输入方式提供了一种更为自然的交互体验。2024年7月,商汤推出了“日日新”大模型的5.5版本。相较于5.0版本,其综合能力提升了大约30%,并且在多模态能力方面得到了全面增强,可对标GPT-4o的实时交互体验,成为中国第一个多模态的实时交互大模型。 

  在过去,众多模型在处理不同模态信息时,通常会先将语音等输入转换为文字,然后将文字与图像结合起来进行分析。输出反馈的过程也是先生成文字,再根据这些文字生成语音输出,这一过程中伴随着大量信息的丢失和较高的延迟。 

  相比之下,多模态大模型能够高效且深入地融合语音、文字、图像、手势、视频等多种模态信息,从而提供更为丰富和自然的人机交互体验。与此同时,相较于以往的方案,多模态融合技术的难度也实现了几何级数的增长。 

  今年4月,商汤科技在上海发布行业领先的“云、端、边”全栈大模型产品矩阵,并与小米、阅文、华为等多位生态伙伴共同探讨和交流大模型在办公、金融、出行等不同领域的应用及前景,加速生成式AI向产业落地的全面跃迁。在两个月后的WAIC 2024期间,商汤科技再次发布国内首个所见即所得模型“日日新5o”,交互体验对标GPT-4o,可实现实时的流式多模态交互。 

  在历次的发布会上,商汤科技一直强调其对端侧推理效率提升的重视。也正是得益于中国市场上对大型模型和智能计算服务的强劲需求,以及“日日新SenseNova”大型模型能力的增强和推理成本的迅速降低,商汤的生成式人工智能业务在2024年上半年实现了显著的增长。