2025-2-8
分享一些成功降低人工智能市场预测成本的案例返回列表
以下是一些成功降低人工智能市场预测成本的案例:
阿里巴巴
问题:在电商推荐系统业务中面临 AI 吞吐量、时延、推理精确性等方面的多重考验,且独立 GPU 成本压力较大。
解决方案:采用英特尔 ® 第四代至强 ® 可扩展处理器来处理 AI 推理等工作负载,利用英特尔高级矩阵扩展(AMX),并使用英特尔 ® oneAPI 深度神经网络库(英特尔 ® oneDNN)进行软件优化。
效果:主流的 48 核第四代英特尔 ® 至强 ® 可扩展处理器可以将代理模型的吞吐量提升到 2.89 倍,超过主流的 32 核第三代英特尔 ® 至强 ® 可扩展处理器,同时将时延严格保持在 15 毫秒以下,有效降低了成本。
DeepSeek
问题:传统人工智能模型训练依赖大量算力,成本高昂6。
解决方案:DeepSeek V3 通过优化算法和数据处理策略,在实现接近于 GPT-4 的性能时,仅使用了其十分之一的训练算力。
效果:以更低的成本实现了较高的性能,为企业提供了更具性价比的选择,吸引了越来越多的开发者和企业加入到这一生态中。
Hugging Face
问题:生成式 AI 应用通常需要强大的硬件支持,成本较高。
解决方案:Hugging Face 和英特尔合作打造了名为 Q8-Chat 的生成式 AI 应用,仅需一个 32 核英特尔 ® 至强 ® 处理器就能运行。
效果:在提供类似 ChatGPT 聊天体验的同时,大大降低了硬件成本,为企业开发生成式 AI 应用提供了一种低成本的范例。
分享到:
上一篇:如何更好利用AI进行创作