训练高性能 AI 模型依赖于获取优质数据集。AI 公司和数据提供商之间的近期合作凸显了高质量数据对于提升 AI 能力的重要性。以下是十项值得注意的数据许可交易,它们通过独特的数据集丰富了 AI 模型:
1. Rockset 和 OpenAI
详情:虽然这不是一项数据许可协议,但实际上就是这样。此次收购旨在增强 OpenAI 的数据检索基础设施,利用 Rockset 在实时数据处理和矢量搜索方面的专业知识来提高 AI 应用程序的性能
财务状况:OpenAI 于 2024 年 6 月通 丹麦 whatsapp 资源 过价值数亿美元的股票交易收购了 Rockset,这是 OpenAI 迄今为止最大的收购之一。雅虎财经
2.Reddit 和 OpenAI
详情:2024 年 5 月,Reddit 与 OpenAI 达成许可协议,允许该 AI 公司访问 Reddit 的大量数据。通过此次合作,OpenAI 可以将 Reddit 的内容整合到其 ChatGPT 聊天机器人和其他产品中。《华尔街日报》
财务状况:虽然没有披露具体的财务条款,但 Reddit 的 S-1 文件显示,数据许可协议总额为 2.03 亿美元,预计 2024 年的收入至少为 6640 万美元。TechCrunch
3. Shutterstock 和 Apple
详情:2024 年初,苹果与 Shutterstock 签署了一项价值 2500 万美元至 5000 万美元的协议,以授权使用图像来训练其 AI 模型。G2
财务:该交易的价值凸显了对获取用于人工智能训练的高质量视觉数据的大量投资。
4. Google 和 Stack Overflow
详情:2024 年 2 月,谷歌与 Stack Overflow 达成许可协议,利用其编程社区内容来训练 AI 模型,特别是增强谷歌的 Gemini 聊天机器人。Wired
财务:虽然没有披露具体数字,但此类合作凸显了专业数据在完善人工智能能力方面的价值。
2024 年推动 AI 创新的十大数据许可交易
-
- Posts: 180
- Joined: Sat Dec 21, 2024 3:16 am