人工智能

人工智能

人工智能

人工智能

等 1 人订阅共26篇文章创建于2024-11-02

【Qwen变体】 Marco-o1：为开放式解决方案建立开放式推理模型

🎯Marco-o1 不仅关注有标准答案的学科，如数学、物理和编码--这些学科非常适合强化学习 (RL)--而且更加重视开放式的解决方案。我们的目标是解决以下问题 " 目前，Marco-o1 大语言模

1年前
369
1
评论

【吴泳铭YYDS，开源o1-preview模型】Qwen QwQ 32B 预览版：提升人工智能推理能力

简介 Qwen 团队最近发布了一个实验研究模型 QwQ 32B Preview，旨在提高人工智能的推理能力。尽管该模型仍处于预览阶段，但它展示了令人印象深刻的分析能力，同时也存在一些明显的局限性。主

1年前
606
1
评论

Lumiere Alpha：以增强的逼真度革新图像生成技术

欢迎来到 Lumiere Alpha 的世界，它是一种创新的人工智能模型，正在图像生成领域掀起一场风暴！在本博客中，我们将探讨这一尖端技术的特点、优势和实际应用。 Lumiere Alpha 简介 L

1年前
380
1
评论

Sana:利用线性扩散变换器进行高效高分辨率图像合成

简介 Sana 是一个文本到图像的框架，能高效生成分辨率高达 4096 x 4096 的图像。它能以极快的速度合成高分辨率、高质量的图像，并具有很强的文本图像对齐能力，可部署在笔记本电脑的 GPU 上

1年前
434
4
评论

介绍 Latte-1：一种革命性的文本到视频生成模式

maxin-cn 发布了 Latte-1，这是人工智能领域的一项开创性进展，它是一种最先进的文本到视频生成模型，有可能彻底改变我们创建视觉内容并与之互动的方式。这个创新模型是更大的 Latte 项目的

1年前
200
2
评论

新视频生成技术AnimateAnything：支持控制镜头轨迹、文本提示等

在视频创作领域，如何实现一致且可控的动画效果一直是研究者们关注的重点。近日，研究团队推出了名为 “AnimateAnything” 的新方法，旨在通过精准的视频操作，使动画创作更加灵活和高效。该技术可

1年前
303
1
评论

【AI绘画】Alpha-VLLM 的 Lumina-Next：新一代图像生成器

简介 Lumina-Next-T2I 是在 Lumina-T2I 成功基础上发展起来的尖端图像生成模型。它采用了带有 2B 参数模型的 Next-DiT 和 Gemma-2B 文本编码器，推理速度更快

1年前
357
2
评论

探索 Shuttle 3 Diffusion的力量：从文本到图像的人工智能模型

简介在人工智能领域，从文字描述生成高质量图像的能力是一项了不起的壮举。Shuttle 3 Diffusion 是一种尖端的文本到图像人工智能模型，它将这种能力提升到了新的高度。凭借其先进的功能和高效

1年前
437
1
评论

DimensionX：革新三维和四维场景生成技术

欢迎来到 DimensionX 的世界，这是一个开创性的框架，它正在改变我们创建和可视化数字环境的方式。在本博客中，我们将探讨 DimensionX 如何突破计算机视觉和模式识别的界限，从单一图像中生

1年前
329
1
评论

英伟达基于Mistral 7B开发新一代Embedding模型——NV-Embed-v2

我们介绍的 NV-Embed-v2 是一种通用嵌入模型，它在大规模文本嵌入基准（MTEB 基准）（截至 2024 年 8 月 30 日）的 56 项文本嵌入任务中以 72.31 的高分排名第一。此外，

1年前
850
1
评论

OpenCoder：顶级代码大型语言模型的开放式食谱

OpenCoder 是一个开放的、可重现的代码 LLM 系列，包括 1.5B 和 8B 基本模型和聊天模型，支持中英文两种语言。从零开始，OpenCoder 在由 90% 的原始代码和 10% 的代

1年前
329
1
评论

DeepSeek AI 发布图像理解与生成的统一 AI 框架JanusFlow，性能超越SDXL

在人工智能驱动的图像生成与理解领域，尽管取得了快速进展，但仍存在显著挑战，阻碍了一个无缝、统一的方法的发展。目前，专注于图像理解的模型往往在生成高质量图像方面表现不佳，反之亦然。这种任务分开的架构不

1年前
433
1
评论

TableGPT2-7B：用于表格数据分析的大规模解码器模型

TableGPT2-7B 是浙江大学开发的最先进的大规模解码器模型，专为涉及表格数据的数据密集型任务而设计。该模型以 Qwen2.5 架构为基础，包括针对表格数据的专用编码，其中独特的语义编码器可从行

1年前
707
2
评论

MIT Han 实验室开源了一个Flux的量化项目——SVDQuant

麻省理工学院（MIT）Han 实验室一直在积极开展一系列项目，包括微小机器学习（Tiny Machine Learning）、SANA、SVDQuant 和 QServe，这些项目旨在提高人工智能计算

1年前
1.1k
1
评论

阿里巴巴 Qwen2.5-Coder：代码智能的革命

简介在人工智能领域，Qwen 团队一直致力于创建一个强大的编码模型，以彻底改变我们处理代码智能的方式。本文旨在深入介绍 Qwen2.5-Coder，它是最新的 Qwen 大语言特定代码模型系列。目前

1年前
1.2k
1
评论

AMD-OLMo：在 AMD Instinct MI250 GPU 上训练的新一代大型语言模型。

AMD-OLMo是一系列10亿参数语言模型，由AMD公司在AMD Instinct MI250 GPU上进行训练，AMD Instinct MI250 GPU是一个功能强大的图形处理器集群，它利用了O

1年前
298
1
评论

BAAI 的 Aquila-VL-2B-llava-qwen：促进视觉语言理解

在人工智能领域，北京人工智能学会（BAAI）做出了重要贡献：在人工智能领域，北京人工智能研究所（BAAI）开发的 Aquila-VL-2B-llava-qwen 模型做出了重大贡献。这一创新模

1年前
477
1
评论

ColPali：基于 PaliGemma-3B 和 ColBERT 策略的视觉检索器

ColPali 是一种基于视觉语言模型（VLMs）的新颖模型架构和训练策略，可有效地从视觉特征为文档编制索引。它是 PaliGemma-3B 的扩展，可生成 ColBERT 风格的文本和图像多向量表

1年前
614
1
评论

支持高性能结构化数据提取的 Embedding 模型——NuExtract-v1.5

NuExtract 是一个用户友好型模型，设计用于从长文档中提取信息。它可以处理长达 20,000 个标记的输入，是合同、报告和其他商业通信的理想选择。NuExtract 的与众不同之处在于它能够处理

1年前
325
1
评论

达摩院发布八观气象大模型：精度达 1 小时 1 公里，率先落地新能源场景

11月6日，阿里巴巴达摩院（湖畔实验室）在北京举行决策智能产品发布会，正式发布八观气象大模型，在全球气象模型基础上引入区域多源数据，时空精度最高可达1公里*1公里*1小时。通过大幅提升对温度、辐照、风

1年前
282
2
评论