1. 首页 > 电商大学

Phi-3.5升级

Phi-3.5-vision-instruct项目地址: https://gitcode.com/mirrors/Microsoft/Phi-3.5-vision-instruct

图像与文本数据的处理与琢磨成为了各行各业进步的关键。面对海量的视觉信息和麻烦的文本内容,怎么高大效搞懂和生成信息,成为了行业面临的关键挑战。于是 Phi-3.5-vision-instruct模型应运而生,以其独特的许多模态处理能力,引领着手艺革新鲜的风潮。

Phi-3.5升级
Phi-3.5升级

许多模态:Phi-3.5-vision-instruct

Phi-3.5-vision-instruct的许多模态版本, 支持高大达128K的上下文长远度,拥有4.2B参数,基本上由图像编码器和Phi-3 Mini语言模型构成。此次Phi-3.5-vision-instruct支持许多图搞懂, 在以下场景中表现出色:

1. 许多图像或视频片段摘要

2. 许多幅图像比比看

微柔软推出的Phi-3系列模型,包括Mini型、MoE型和许多模态型,旨在提升中文搞懂和推理能力,并支持许多图搞懂和function call功能。

Phi-3.5-vision特别适合办公场合, 开发人员特别优化了该模型在识别图表和方块图方面的搞懂能力,据称能利用用户输入...

Phi-3.5-vision模型具备广泛的图像搞懂、光学字符识别、图表和表格解析、许多图像或视频剪辑摘要等功能。在图像和视频处理相关的基准测试中...

Phi-3.5是2.0、 3.0版本的延伸,用的是Transformer解码器,拥有3072维隐藏层、32个注意力头以及32层架构。具有4K的默认上下文长远度, 并处理更长远的文本序列,支持中文、英文、法文等。还有啊,还用了组查询,个个注意力头的KV缓存中用4个查询共享1个键。为了进一步搞优良训练和推理速度, 微柔软用了块稀疏注意力模块,能根据不同的稀疏模式有效地划分上下文,少许些KV缓存的用量。

Phi-3.5之所以能够实现如此出色的性能,基本上原因之一是其用了超出3.3万亿token高大质量训练数据集。这玩意儿数据集是phi-2用的数据集的 ...

图表和表格搞懂

Mini型:Phi-3.5-mini-instruct

光学字符识别

MoE型:Phi-3.5-MoE-instruct

Phi-3.5-mini的性能。Phi-3.5-MoE ...

Phi-3.5-MoE-instruct是一个MoE模型, 拥有16x3.8B个参数,用2位专家时有6.6B个活动参数。该模型用词汇量为32,064的标记器。Phi-3.5-MoE-instruct在推理能力上巨大巨大增有力,也非常适用于function call的场景。

微柔软继今年4月推出Phi-3系列细小型语言模型后又一鼓作气三连发布并开源其「细小而美」系列 Phi-3.5模型!本次发布的三个模型各有特色:

1. Mini型:Phi-3.5-mini-instruct Phi-3.5 mini 具有38亿个参数, 构建,沉点关注高大质量、推理密集的数据...

2. MoE型:Phi-3.5-MoE-instruct Phi-3.5-MoE-instruct是一个MoE模型,拥有16x3.8B个参数,用2位专家时有6.6B个活动参数。该模型用词汇量为32,064...

3. 许多模态型:Phi-3.5-vision-instruct Phi-3.5-vision-instruct将家族的功能 到了许多模态领域, 拥有42亿参数,能够处理文本和图像,适合光学字符识别、图表琢磨、许多图像或视频剪辑摘要等功能。

Phi-3.5系列模型的推出,无疑为AI领域注入了新鲜的活力。它们不仅丰有钱了微柔软让我们共同期待Phi-3.5系列模型带来的更许多惊喜。

欢迎分享,转载请注明来源:小川电商

原文地址:https://www.jinhanchuan.com/227327.html