首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
人工智能
吴脑的键客
创建于2024-11-02
订阅专栏
人工智能
等 1 人订阅
共26篇文章
创建于2024-11-02
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
【Qwen变体】 Marco-o1: 为开放式解决方案建立开放式推理模型
🎯Marco-o1 不仅关注有标准答案的学科,如数学、物理和编码--这些学科非常适合强化学习 (RL)--而且更加重视开放式的解决方案。 我们的目标是解决以下问题 " 目前,Marco-o1 大语言模
【吴泳铭YYDS,开源o1-preview模型】Qwen QwQ 32B 预览版: 提升人工智能推理能力
简介 Qwen 团队最近发布了一个实验研究模型 QwQ 32B Preview,旨在提高人工智能的推理能力。尽管该模型仍处于预览阶段,但它展示了令人印象深刻的分析能力,同时也存在一些明显的局限性。 主
Lumiere Alpha: 以增强的逼真度革新图像生成技术
欢迎来到 Lumiere Alpha 的世界,它是一种创新的人工智能模型,正在图像生成领域掀起一场风暴!在本博客中,我们将探讨这一尖端技术的特点、优势和实际应用。 Lumiere Alpha 简介 L
Sana:利用线性扩散变换器进行高效高分辨率图像合成
简介 Sana 是一个文本到图像的框架,能高效生成分辨率高达 4096 x 4096 的图像。它能以极快的速度合成高分辨率、高质量的图像,并具有很强的文本图像对齐能力,可部署在笔记本电脑的 GPU 上
介绍 Latte-1:一种革命性的文本到视频生成模式
maxin-cn 发布了 Latte-1,这是人工智能领域的一项开创性进展,它是一种最先进的文本到视频生成模型,有可能彻底改变我们创建视觉内容并与之互动的方式。这个创新模型是更大的 Latte 项目的
新视频生成技术AnimateAnything:支持控制镜头轨迹、文本提示等
在视频创作领域,如何实现一致且可控的动画效果一直是研究者们关注的重点。近日,研究团队推出了名为 “AnimateAnything” 的新方法,旨在通过精准的视频操作,使动画创作更加灵活和高效。该技术可
【AI绘画】Alpha-VLLM 的 Lumina-Next:新一代图像生成器
简介 Lumina-Next-T2I 是在 Lumina-T2I 成功基础上发展起来的尖端图像生成模型。它采用了带有 2B 参数模型的 Next-DiT 和 Gemma-2B 文本编码器,推理速度更快
探索 Shuttle 3 Diffusion的力量: 从文本到图像的人工智能模型
简介 在人工智能领域,从文字描述生成高质量图像的能力是一项了不起的壮举。Shuttle 3 Diffusion 是一种尖端的文本到图像人工智能模型,它将这种能力提升到了新的高度。凭借其先进的功能和高效
DimensionX: 革新三维和四维场景生成技术
欢迎来到 DimensionX 的世界,这是一个开创性的框架,它正在改变我们创建和可视化数字环境的方式。在本博客中,我们将探讨 DimensionX 如何突破计算机视觉和模式识别的界限,从单一图像中生
英伟达基于Mistral 7B开发新一代Embedding模型——NV-Embed-v2
我们介绍的 NV-Embed-v2 是一种通用嵌入模型,它在大规模文本嵌入基准(MTEB 基准)(截至 2024 年 8 月 30 日)的 56 项文本嵌入任务中以 72.31 的高分排名第一。此外,
OpenCoder: 顶级代码大型语言模型的开放式食谱
OpenCoder 是一个开放的、可重现的代码 LLM 系列,包括 1.5B 和 8B 基本模型和聊天模型,支持中英文两种语言。 从零开始,OpenCoder 在由 90% 的原始代码和 10% 的代
DeepSeek AI 发布图像理解与生成的统一 AI 框架JanusFlow,性能超越SDXL
在人工智能驱动的图像生成与理解领域,尽管取得了快速进展,但仍存在显著挑战,阻碍了一个无缝、统一的方法的发展。 目前,专注于图像理解的模型往往在生成高质量图像方面表现不佳,反之亦然。这种任务分开的架构不
TableGPT2-7B:用于表格数据分析的大规模解码器模型
TableGPT2-7B 是浙江大学开发的最先进的大规模解码器模型,专为涉及表格数据的数据密集型任务而设计。该模型以 Qwen2.5 架构为基础,包括针对表格数据的专用编码,其中独特的语义编码器可从行
MIT Han 实验室开源了一个Flux的量化项目——SVDQuant
麻省理工学院(MIT)Han 实验室一直在积极开展一系列项目,包括微小机器学习(Tiny Machine Learning)、SANA、SVDQuant 和 QServe,这些项目旨在提高人工智能计算
阿里巴巴 Qwen2.5-Coder: 代码智能的革命
简介 在人工智能领域,Qwen 团队一直致力于创建一个强大的编码模型,以彻底改变我们处理代码智能的方式。本文旨在深入介绍 Qwen2.5-Coder,它是最新的 Qwen 大语言特定代码模型系列。目前
AMD-OLMo:在 AMD Instinct MI250 GPU 上训练的新一代大型语言模型。
AMD-OLMo是一系列10亿参数语言模型,由AMD公司在AMD Instinct MI250 GPU上进行训练,AMD Instinct MI250 GPU是一个功能强大的图形处理器集群,它利用了O
BAAI 的 Aquila-VL-2B-llava-qwen: 促进视觉语言理解
在人工智能领域,北京人工智能学会(BAAI)做出了重要贡献: 在人工智能领域,北京人工智能研究所(BAAI)开发的 Aquila-VL-2B-llava-qwen 模型做出了重大贡献。这一创新模
ColPali: 基于 PaliGemma-3B 和 ColBERT 策略的视觉检索器
ColPali 是一种基于视觉语言模型(VLMs)的新颖模型架构和训练策略,可有效地从视觉特征为文档编制索引。 它是 PaliGemma-3B 的扩展,可生成 ColBERT 风格的文本和图像多向量表
支持高性能结构化数据提取的 Embedding 模型——NuExtract-v1.5
NuExtract 是一个用户友好型模型,设计用于从长文档中提取信息。它可以处理长达 20,000 个标记的输入,是合同、报告和其他商业通信的理想选择。NuExtract 的与众不同之处在于它能够处理
达摩院发布八观气象大模型:精度达 1 小时 1 公里,率先落地新能源场景
11月6日,阿里巴巴达摩院(湖畔实验室)在北京举行决策智能产品发布会,正式发布八观气象大模型,在全球气象模型基础上引入区域多源数据,时空精度最高可达1公里*1公里*1小时。通过大幅提升对温度、辐照、风
下一页