首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
夏沫的梦
掘友等级
后端开发工程师
|
京东科技控股有限公司
现入职于京东科技,搜推与大模型训推技术栈,曾入职于深信服和蔚来等科技公司。Al Infra的忠实跟随者,CSDN的Go领域新星创作者,稀土掘金的优秀创作者。 相信自己的努力!做好每一个阶段该做的事情!
获得徽章 15
动态
文章
专栏
沸点
收藏集
关注
作品
赞
113
文章 109
沸点 4
赞
113
返回
|
搜索文章
夏沫的梦
后端开发工程师 @京东科技控股有限公司
·
4天前
关注
DeepSeek V4-Vllm部署:高效长上下文推理的实现
vLLM 现已支持 DeepSeek V4 系列模型(deepseek-ai/DeepSeek-V4-Pro 和 deepseek-ai/DeepSeek-V4-Flash...
1
评论
分享
夏沫的梦
后端开发工程师 @京东科技控股有限公司
·
26天前
关注
生成式AI推荐系统全景解析:架构创新与落地实践
一、技术背景 1.1 生成式AI基础架构 生成式推荐系统的核心是利用生成式模型(尤其是大语言模型)来生成个性化的推荐内容。其基础架构通常包含以下关键组件: 生成式核心模型:...
1
评论
分享
夏沫的梦
后端开发工程师 @京东科技控股有限公司
·
26天前
关注
OpenClaw 插件系统完全指南:从架构设计到实战开发
一 什么是 OpenClaw OpenClaw 是一个多平台 AI 网关,它协调消息渠道和 AI 编码代理之间的对话。它充当个人 AI 助手系统,您可以将其运行在自己的设备...
1
评论
分享
夏沫的梦
后端开发工程师 @京东科技控股有限公司
·
26天前
关注
Agent Skills技术详解与实战
Agent Skills介绍 Agent Skills是一种为AI智能体引入可共享专业技能的开发方式,技能 (Skill) 是由指令、脚本和资源组成的模块化功能包,能够扩展...
1
评论
分享
夏沫的梦
后端开发工程师 @京东科技控股有限公司
·
1年前
关注
卡间互联详解
GPU服务器-GPU卡互联知识点总结 和PCIE相关的带宽计算 a. GT/s即Giga transaction per second (千兆传输/秒),描述的是物理层通信...
1
评论
分享
夏沫的梦
后端开发工程师 @京东科技控股有限公司
·
1年前
关注
算力详解
算力(Computing Power)是指计算机系统在单位时间内处理数据和执行计算任务的能力。算力是衡量计算机性能的重要指标,直接影响计算任务的速度和效率。 算力的分类和单...
1
评论
分享
夏沫的梦
后端开发工程师 @京东科技控股有限公司
·
1年前
关注
神经网络的起源与工作原理
神经网络起源:一个生物神经网络是由一组化学上相连或功能上相关的神经元组成。一个神经元可能与许多其他神经元相连,网络中的神经元和连接的总数可能很广泛。连接,称为突触,通常是从...
1
评论
分享
夏沫的梦
后端开发工程师 @京东科技控股有限公司
·
1年前
关注
生成式AI概览与详解
1. 生成式AI概览:什么是大模型,大模型应用场景(文生文,多模态) 生成式AI(Generative AI)是指通过机器学习模型生成新的数据或内容的人工智能技术。生成式A...
1
评论
分享
夏沫的梦
后端开发工程师 @京东科技控股有限公司
·
1年前
关注
生成式AI对产业的影响与冲击
1. 生成式AI对产业影响:生成式AI释放生产力 决策式AI的应用集中在内容分发环节,提升分发环节的效率实现了千人千面,而不是对生产力的提升 生成式AI能够创作新的内容,改...
1
评论
分享
夏沫的梦
后端开发工程师 @京东科技控股有限公司
·
1年前
关注
kubernetes起源与介绍
1.Kubernetes介绍 1.1 应用部署方式演变 在部署应用程序的方式上,主要经历了三个时代: 传统部署:互联网早期,会直接将应用程序部署在物理机上 虚拟化部署:可以...
1
评论
分享
夏沫的梦
后端开发工程师 @京东科技控股有限公司
·
1年前
关注
Git命令使用与原理详解
1.仓库 2.配置 3.增加/删除文件 4.代码提交 5.分支 6.标签 7.查看信息 8.远程同步 9.撤销 10.其他 1.基本命令 2.Git基本理论 3.Git项目...
3
1
分享
夏沫的梦
后端开发工程师 @京东科技控股有限公司
·
1年前
关注
生成式AI对产业的影响与冲击
1. 生成式AI对产业影响:生成式AI释放生产力 决策式AI的应用集中在内容分发环节,提升分发环节的效率实现了千人千面,而不是对生产力的提升 生成式AI能够创作新的内容,改...
2
评论
分享
夏沫的梦
后端开发工程师 @京东科技控股有限公司
·
1年前
关注
常见LLM大模型概览与详解
以下是一些常见的大模型的详细介绍,包括 LLaMA2、LLaMA3、BLOOM、BERT、Falcon 180B、Mistral 7B、OpenHermes、GPT-Neo...
2
评论
分享
夏沫的梦
后端开发工程师 @京东科技控股有限公司
·
1年前
关注
watermark大模型水印详解
一 watermark定义 模型水印是一种用于模型版权保护的技术,通过向大模型植入水印(触发集数据加上特定的噪声或者标志),使得模型学习到这种特定的噪声或者标志的特征,通过...
2
评论
分享
夏沫的梦
后端开发工程师 @京东科技控股有限公司
·
1年前
关注
Checkpoint断点续训详解
一 Checkpoint定义 模型在训练过程中的中间状态和结果,是大语言模型在训练过程中进行容错的一种关键技术,通过将中间状态和结果作为checkpoint保存到持久化存储...
2
评论
分享
夏沫的梦
后端开发工程师 @京东科技控股有限公司
·
1年前
关注
quantize模型量化详解
一 quantize定义 模型量化,又称为模型压缩,是指以较低的推理精度损失将连续取值(通常为float32或者大量可能的离散值)的浮点型权重近似为有限多个离散值(通常为i...
1
评论
分享
夏沫的梦
后端开发工程师 @京东科技控股有限公司
·
1年前
关注
DeepSpeed模型训练加速详解
一 DeepSpeed定义 DeepSpeed是一个由微软开发的开源深度学习优化库,基于pytorch构建,旨在提高大规模模型训练的效率和可扩展性。它通过多种技术手段来加速...
1
1
分享
夏沫的梦
后端开发工程师 @京东科技控股有限公司
·
1年前
关注
Seldon Core大模型部署详解
一 Seldon Core定义 Seldon Core 目前是机器学习模型部署领域最受欢迎的方案之一,由 Seldon 公司开源和维护,旨在为不同框架下训练出来的模型(Te...
2
1
分享
夏沫的梦
后端开发工程师 @京东科技控股有限公司
·
1年前
关注
LoRA详解
一 LoRA定义 Low-Rank Adaption of Large Language Models,大语言模型的低秩适应,是一种PEFT(参数高效性微调方法),其核心思...
2
评论
分享
夏沫的梦
后端开发工程师 @京东科技控股有限公司
·
1年前
关注
ChatGLM详解
一 ChatGLM定义 ChatGLM是由清华技术成果转化的公司智谱AI发布的开源的、支持中英双语问答的对话语言模型系列,并针对中文进行了优化,该模型基于General L...
1
评论
分享
下一页
个人成就
优秀创作者
文章被点赞
1,337
文章被阅读
452,066
掘力值
9,768
关注了
15
关注者
383
收藏集
1
关注标签
5
加入于
2022-09-26