阿里巴巴云宣布,已经发布了主要语言模型QWEN2.5的改进版本。在某些参数(例如逻辑推理和文本理解)中,新的神经网络在OpenAI的GPT-4上表现出了优越性。
根据阿里巴巴云CTO Jingren Zhou的说法,与以前的QWEN2.0版本相比,新模型在推理,代码理解和自然语言方面显示出显着改善。根据3月OpenCompass平台的分析,就语言和创意技能而言,QWEN2.5优于OpenAI的GPT-4。但是,知识在逻辑推理和数学能力等方面不足。
请记住,包括QWEN在内的大型语言模型(LLM)用于人工智能应用中。然后,对他们进行大量数据培训,以提供自然语言的用户查询答案。在2022年引起全球兴奋的Chatgpt发布之后,阿里巴巴于2023年4月推出了Tongyi Qianwen。10月,发布了一个更新的版本,具有扩展的能力,可理解复杂的指示,编写文本写作,逻辑推理和记忆信息。
根据阿里巴巴云(Alibaba Cloud)的说法,目前有超过220万公司用户使用了基于QWEN的AI服务,例如Dingtalk(类似于阿里巴巴的Slack)。此外,该公司向开发人员社区推出了许多开放式QWEN模型,并使用其他工具来升级生产平台来创建人工智能。
与世界各地一样,在中国,人们对聊天机器人和生产性人工智能模型产生了兴趣。阿里巴巴和百度和特里门特发布了他们的解决方案。例如,截至2022年8月获得公众使用许可后,百度的聊天机器人Ernie在2023年4月获得了2亿用户的注意。
阿里巴巴云说,更新的QWEN2.5语言模型用于不同领域的90,000多家公司,并计划与客户和开发人员合作,以利用生产性人工智能的力量,并向中国的人形机器人开发技术。这些机器人将能够在工厂提供帮助,并在可能的情况下取代人工