Phi-3.5升级

Phi-3.5-vision-instruct项目地址: https://gitcode.com/mirrors/Microsoft/Phi-3.5-vision-instruct

图像与文本数据的处理与琢磨成为了各行各业进步的关键。面对海量的视觉信息和麻烦的文本内容，怎么高大效搞懂和生成信息，成为了行业面临的关键挑战。于是 Phi-3.5-vision-instruct模型应运而生，以其独特的许多模态处理能力，引领着手艺革新鲜的风潮。

许多模态：Phi-3.5-vision-instruct

Phi-3.5-vision-instruct的许多模态版本，支持高大达128K的上下文长远度，拥有4.2B参数，基本上由图像编码器和Phi-3 Mini语言模型构成。此次Phi-3.5-vision-instruct支持许多图搞懂，在以下场景中表现出色：

1. 许多图像或视频片段摘要

2. 许多幅图像比比看

微柔软推出的Phi-3系列模型，包括Mini型、MoE型和许多模态型，旨在提升中文搞懂和推理能力，并支持许多图搞懂和function call功能。

Phi-3.5-vision特别适合办公场合，开发人员特别优化了该模型在识别图表和方块图方面的搞懂能力，据称能利用用户输入...

Phi-3.5-vision模型具备广泛的图像搞懂、光学字符识别、图表和表格解析、许多图像或视频剪辑摘要等功能。在图像和视频处理相关的基准测试中...

Phi-3.5是2.0、 3.0版本的延伸，用的是Transformer解码器，拥有3072维隐藏层、32个注意力头以及32层架构。具有4K的默认上下文长远度，并处理更长远的文本序列，支持中文、英文、法文等。还有啊，还用了组查询，个个注意力头的KV缓存中用4个查询共享1个键。为了进一步搞优良训练和推理速度，微柔软用了块稀疏注意力模块，能根据不同的稀疏模式有效地划分上下文，少许些KV缓存的用量。

Phi-3.5之所以能够实现如此出色的性能，基本上原因之一是其用了超出3.3万亿token高大质量训练数据集。这玩意儿数据集是phi-2用的数据集的 ...

图表和表格搞懂

Mini型：Phi-3.5-mini-instruct

光学字符识别

MoE型：Phi-3.5-MoE-instruct

Phi-3.5-mini的性能。Phi-3.5-MoE ...

Phi-3.5-MoE-instruct是一个MoE模型，拥有16x3.8B个参数，用2位专家时有6.6B个活动参数。该模型用词汇量为32,064的标记器。Phi-3.5-MoE-instruct在推理能力上巨大巨大增有力，也非常适用于function call的场景。

微柔软继今年4月推出Phi-3系列细小型语言模型后又一鼓作气三连发布并开源其「细小而美」系列 Phi-3.5模型！本次发布的三个模型各有特色：

1. Mini型：Phi-3.5-mini-instruct Phi-3.5 mini 具有38亿个参数，构建，沉点关注高大质量、推理密集的数据...

2. MoE型：Phi-3.5-MoE-instruct Phi-3.5-MoE-instruct是一个MoE模型，拥有16x3.8B个参数，用2位专家时有6.6B个活动参数。该模型用词汇量为32,064...

3. 许多模态型：Phi-3.5-vision-instruct Phi-3.5-vision-instruct将家族的功能到了许多模态领域，拥有42亿参数，能够处理文本和图像，适合光学字符识别、图表琢磨、许多图像或视频剪辑摘要等功能。

Phi-3.5系列模型的推出，无疑为AI领域注入了新鲜的活力。它们不仅丰有钱了微柔软让我们共同期待Phi-3.5系列模型带来的更许多惊喜。

欢迎分享，转载请注明来源：小川电商

原文地址:https://www.jinhanchuan.com/227327.html