核心提示:微软今日发布了一种具有成本效益的小型语言AI模型,可以创建社交媒体帖子等任务,同时使用较少的数据量。微软在一份声明中称,该AI模型被称为“Phi-3-mini”,在评估语言、编码和数...
微软今日发布了一种具有成本效益的小型语言AI模型,可以创建社交媒体帖子等任务,同时使用较少的数据量。
微软在一份声明中称,该AI模型被称为“Phi-3-mini”,在评估语言、编码和数学能力等一系列基准测试中,其表现甚至可以超越那些体积相当于其两倍的AI模型。
微软Azure AI平台企业副总裁Eric Boyd称,Phi-3-mini的能力与GPT-3.5这样的大语言模型不相上下,只是体积更小。
与大型AI模型相比,小型AI模型通常运行成本更低,在手机和笔记本电脑等个人设备上表现更好。
微软称,这种小型AI模型旨在执行一些更简单的任务,使其更容易被资源有限的公司使用。例如,一家小公司可以使用Phi-3-mini来总结一份长篇文件的要点,从市场研究报告中提取相关的见解和行业趋势。
微软表示,Phi-3-mini将立即通过微软云服务平台Azure的AI模型目录、机器学习模型平台Hugging Face,以及本地运行模型框架Ollama来提供。
上周,微软向总部位于阿布扎比的AI开发公司G42投资了15亿美元。在此之前,微软还与法国AI初创公司Mistral AI合作,通过Azure云计算平台来提供其模型。
在此之前,微软的竞争对手也推出了自己的小型AI模型,其中大多数针对的是更简单的任务,如文档摘要或编码辅助等。
例如,谷歌的Gemma 2B和7B适合于简单的聊天机器人和与语言相关的工作。Anthropic的Claude 3 Haiku可以阅读密集的带有图表的研究论文,并快速总结。而Meta最近发布的Llama 3 8B可能会被用于一些聊天机器人和编程辅助。