首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
深度学习
订阅
小林就是我51898
更多收藏集
微信扫码分享
微信
新浪微博
QQ
12篇文章 · 0订阅
什么?大模型部署需要多少显存你都不知道?
什么?部署大模型要多少显存你都不知道? 引言: 作者 : 吴佳浩 最后更新: 2025-12-6 一个常见的误区: 很多人在部署大语言模型时,会有这样的直觉认知: 错! 这是一个看似合理但实际上会让你
给Javaer看的大模型开发指南|得物技术
伴随着大模型的性能提升、成本下降,在Web在线对话场景以外,大模型也越来越多的被集成到传统业务场景。
新型轻量级音频模型问世!1.5B参数挑战 Whisper 与 Qwen2-Audio!
随着语音助手、会议转写等应用的普及,轻量级、高性能的音频模型需求也日益增长。 Aero-1-Audio 是一款新型的1.5B参数音频模型,由 LMMs-Lab 开发,基于 Qwen-2.5-1.5B
老婆问我:“什么是大模型的“超参数”?”
最近,老婆刷到一条新闻:“科学家调整超参数让大模型智商飙升!”她一脸懵地问我:超参数是超级英雄的密码吗?难道AI模型还要输作弊码? 我微微一笑,表现的机会又来了:超参数不是作弊器,而是AI的“操控面板
KTransformers:告别天价显卡!国产框架让单卡24G显存跑DeepSeek-R1 671B大模型:推理速度飙升28倍
KTransformers 是由清华大学和趋境科技联合推出的开源项目,能够优化大语言模型的推理性能,降低硬件门槛。支持在仅24GB显存的单张显卡上运行671B参数的满血版大模型。
【Elasticsearch】使用阿里云 infererence API 及 semantic text 进行向量搜索
本文介绍了如何使用 Elasticsearch 的推理 API 与阿里云 AI 搜索服务结合,通过具体的命令和示例,详细说明了如何进行高效的向量搜索,实现稀疏向量、密集向量、completion、re
Ollama 本地CPU部署开源大模型
Ollama本地CPU部署开源大模型。 文章大纲: 1,下载安装Ollama 2,命令行交互 3,python接口交互 4,jupyter魔法命令交互~
万物皆可AI化!刚开源就有12000人围观的OCR 扫描 PDF 开源工具!还可转换为MarkDown!
想必大家有些感受,PDF 文件已经成为我们工作生活中不可或缺的一个小内容。 但当我们面对那些质量不佳、格式混乱的扫描版PDF时,提取其中的文字内容常常让人头疼。虽然OCR(光学字符识别)技术已经帮助我
面向LLM编程:感受AI的力量
OPENAI 在去年的时候,外国突然爆火的GPT受到很多人的关注;它是目前最知名的大型语言模型之一,它在众多NLP(自然语言处理)任务上展现出了前所未有的性能。GPT系列的大模型就是由OpenAI人工
谈谈中国第一款AI搜索产品——天工AI
2023年8月23日,昆仑万维低调发布了「天工AI」,国内第一款AI搜索,获得一众好评。此后国内大小厂商纷纷跟进推出AI搜索,但「天工AI」始终在各类AI搜索产品中保持着绝对优势的产品体验。