2025 年,注定被铭记为 AI 工业时代的黎明。」
回望这一年,吴恩达教授曾这样感慨。
这一年,大量企业你追我赶,投身于 AI 应用及 Agent 建设。然而,许多企业或许尚未意识到:如果 AI 竞速只停在应用层,可能连这场竞争的「起跑线」都尚未站上。
AI 时代,数智化表面是模型的狂欢,底层是基建的深耕。
唯有能支撑 AI 应用规模化落地的数据基座,才能构筑企业真正的竞争力。
近来, AI 行业普遍认为我们正在进入所谓的「AI 下半场」,而此时行业面临的一大关键问题是「究竟应该让 AI 去做什么?又该如何衡量真正的进展?」
而这个问题的答案也基本已有共识:要想在这下半场脱颖而出,我们需要及时转变思维方式,应当用 AI 的思维,把该做的事情重新做一遍。
与上一阶段不同,这一阶段的企业数据,不再等待人来解读,而是被模型直接「消费」。
以音频数据应用为例,AI 时代,音频数据不应只是一份录音数据存档,还应成为可查询和交互的信息源,比如应该支持查找「录音中的人是客户 A ,上周在另一业务有投诉记录」这类关联信息。这种跨模态的关联性,是实现模型复杂推理的基础。
推及其他行业:
- 在智能驾驶中,道路视频、点云与传感器数据需要被实时送入智能体,支撑感知、规划与异常检索;
- 在游戏行业,需要将对话、行为与世界观等多模态数据沉淀为长期记忆,用于沉浸式 NPC 与自动化资产生成;
- 在传媒行业,需要使用视频、音频与用户互动数据来驱动内容生成与精准分发;
- 在电商领域,商品图文与交易数据直接喂给模型,实现智能选品与个性化推荐。
因此,对多种模态数据的处理与使用的能力,正在影响各行业商业竞争的形态与上限
接下来的风口要踏在哪里?我们关注到了火山引擎近期发布的《AI 时代企业数据基建升级路线图》。
它在开篇写到:AI 时代,数据基建已经成为决定企业竞争高度的战略资产
笔者深以为然。
企业要发展可以处理多模态数据的底层基建。因为 AI 时代最深的红利,并不在于「拥有」SOTA 的模型,而在于能否持续「驾驭」并「滋养」它。更进一步,可以说构建多模态数据湖已经成为企业参与这场 Agent 竞赛的必选项。
