首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
他爹
掘友等级
获得徽章 10
动态
文章
专栏
沸点
收藏集
关注
作品
赞
19
文章 17
沸点 2
赞
19
返回
|
搜索文章
赞
文章( 17 )
沸点( 2 )
视觉语言模型-入门篇之VLMs的训练与评估
视觉语言模型(Vision-Language Models, VLMs)是一种结合了计算机视觉与自然语言处理技术的模型,如Stable Diffusion等。这次,我们将学习VLMs的训练、评估等内容
给 「大模型初学者」 的 LLaMA 3 核心技术剖析
从开发环境配置到项目逻辑梳理,各组件的介绍与构建,再到模型组件的整合,本文将带你一步步走过从文本数据分词到创建嵌入、从注意力机制到多头注意力实现的全过程。
英伟达发布 VILA 视觉语言模型,实现多图像推理、增强型上下文学习,性能超越 LLaVA-1.5
前言 近年来,大型语言模型 (LLM) 的发展取得了显著的成果,并逐渐应用于多模态领域,例如视觉语言模型 (VLM)。VLM 旨在将 LLM 的强大能力扩展到视觉领域,使其能够理解和处理图像和文本信息
让你的代码更优雅的 9 个 Python 绝妙技巧
"美丽胜于丑陋"。 这不仅是《Python 禅》的第一句话,也是所有 Python 开发者的信条。 但如何区分代码的美与丑呢? 更重要的是,如何写出漂亮的 Python 代码? 光说不练假把式。
自回归超越扩散!北大、字节VAR范式解锁视觉生成Scaling Law
新一代视觉生成范式「VAR: Visual Auto Regressive」视觉自回归来了!使 GPT 风格的自回归模型在图像生成首次超越扩散模型,并观察到与大语言模型...
Stable Diffusion 笔记 : 多模型混用操作方式记录
👈👈👈 欢迎点赞收藏关注哟 一. 前言 上一篇文章 里面主要是基础用法 ,这一篇深入一下模型的混合使用。 二. 模型混用方式 上一篇了解到模型主要分为以下几种 : LoRA :通常用于人物和概念,体积
我的 2023 年旅程:从 上海Tesla 到谷歌,再到荷兰的奇遇
从Tesla的Sr Software Engineer到Googler,再到经历裁员,中间经历焦虑,悲伤,再到最终到荷兰上岸。中间我的故事是怎么样的?
mac环境下oh-my-zsh的安装、配置与卸载
oh-my-zsh是一款开款的工具,用来帮助配置、管理zsh的功能、插件、主题等的信息,让zsh使用更多方便,实用。该文章介绍了oh-my-zsh的安装、主题配置、命令自动补全、语法高亮、卸载功
Transformer 实现图像标注
图像标注是计算机视觉和自然语言处理领域交叉的一个热点研究方向。它的主要任务是将一张图像自动转化为自然语言的文字描述。本文主要介绍了使用 CNN 、Transformer 等技术实现图像标注的任务。
月入5000+?Midjourney制作小红书壁纸实现副业变现
上一篇文章介绍了Midjourney实现副业变现的6种方式,也介绍了小红书壁纸的变现逻辑:第一种是开通店铺;第二种是引导用户在某个小程序下载图片(两个月,变现28000元)。
下一页
个人成就
文章被点赞
5
文章被阅读
919
掘力值
100
关注了
20
关注者
0
收藏集
1
关注标签
11
加入于
2022-09-03