发布时间:2024-12-21 14:45:49 来源: sp20241221
从快速生成逻辑清晰的长篇文章,到无需视频素材即可生产视频片段,大模型近期发展迅速。
除了聊天机器人、文生图、编写代码等应用之外,大模型如何进一步与行业紧密结合,怎样更具行业黏性,仍是业界需要探讨的问题。
“大模型将为各行各业赋能已经成为共识,但在具体实践中如何把大模型与行业、企业的具体业务结合,仍需不断探索。”在近日召开的亚马逊云科技生成式AI媒体沟通会上,亚马逊云科技大中华区产品部总经理陈晓建认为,场景千变万化,各行各业要将大模型强大的技术能力运用好,需要企业有一系列周边能力来正确、合理、安全、高效地使用大模型。
要获得能够落地各行各业的大模型,首先要有强大的基础模型,之后再结合场景开展与业务结合的相关训练。为此,亚马逊云科技与美国人工智能企业Anthropic开展合作,对Claude 3系列模型进行训练。当前,该模型在复杂任务中表现出优秀的理解能力。
但仅有基础模型还远远不够。虽然大模型能力非常强,但其应用场景和任务千变万化。使用大模型前必须要有定制化调优。如果简单地将基础大模型“拿来”使用,就难以达到最优效果。
训练模型是增加大模型行业黏性的必由之路。“选择应用场景训练大模型时,训练端需要一个有足够扩展能力的规模集群。”亚马逊云科技大中华区数据分析与生成式AI产品总监崔玮建议,进行行业大模型训练时需要可靠、安全且弹性足够强的环境,训练之后需要在云端为大模型运算提供足够算力服务等。
在行业大模型落地过程中,人才团队的保障也至关重要。陈晓建表示,即使具备完善的数据基础、进行了很好的行业训练,行业大模型仍无法满足行业所有需求。这就需要专业团队开展业务支持,比如方案架构师与业务人员共同寻找应用场景和解决方案,产品技术专家结合特定需求微调大模型输出模式等。(记者张佳星)
(责编:方经纶、陈键)