Dados da Jin10, 10 de julho: na madrugada de hoje, a Microsoft lançou no seu site a versão mais recente da família Phi-4, Phi-4-mini-flash-reasoning. A versão mini-flash mantém as características de parâmetros pequenos e alto desempenho da família Phi-4, sendo projetada especificamente para cenários limitados por poder de computação, memória e latência, podendo ser executada em uma única GPU, adequada para dispositivos de borda como notebooks e tablets. Em comparação com a versão anterior, a mini-flash utiliza a arquitetura inovadora SambaY desenvolvida pela Microsoft, com a eficiência de raciocínio subindo 10 vezes, a latência média reduzida em 2 a 3 vezes, e um aumento significativo no desempenho geral de raciocínio.
Ver original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Microsoft lança a nova versão do Phi-4 em Código aberto: eficiência de inferência sobe 10 vezes, pode ser executado em notebooks.
Dados da Jin10, 10 de julho: na madrugada de hoje, a Microsoft lançou no seu site a versão mais recente da família Phi-4, Phi-4-mini-flash-reasoning. A versão mini-flash mantém as características de parâmetros pequenos e alto desempenho da família Phi-4, sendo projetada especificamente para cenários limitados por poder de computação, memória e latência, podendo ser executada em uma única GPU, adequada para dispositivos de borda como notebooks e tablets. Em comparação com a versão anterior, a mini-flash utiliza a arquitetura inovadora SambaY desenvolvida pela Microsoft, com a eficiência de raciocínio subindo 10 vezes, a latência média reduzida em 2 a 3 vezes, e um aumento significativo no desempenho geral de raciocínio.