华为发布AI推理创新技术UCM:实现高吞吐、低时延推理体验,降低每Token推理成本 新浪科技讯8月12日下午消息,在2025金融AI推理应用落地与发展论坛上,华为联合中国银联共同发布AI推理创新技术UCM(推理记忆数据管理器),实现高吞吐、低时延的推理体验。 在当今数字化时代,AI发展日新月异。大模型训练的热潮尚...... 中方回应 2025-08-15