「卓印智能」获得千万级天使轮融资,由天使湾创投独家投资。如今,随着通用大模型规模的迅速扩大,数据短缺已经成为一个更现实而迫切的问题。早在2022年11月,就有MIT等研究人员发布相关论文,指机器学习数据集可能会在2026年之前耗尽所有“高质量数据”。AI模型需要大量高质量的训练数据,才能生成准确、多样、无偏见的输出,但获取这种数据的成本和难度都很高——因此,合成数据成为一个有效解决手段。现在,包括微软、OpenAI、Cohere在内的公司都已经开始使用合成数据来训练AI模型。
© 版权声明
文章版权归作者所有,未经允许请勿转载。