首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
AI 探索
我码玄黄
创建于2024-09-09
订阅专栏
探索 AI 的各种用法以及新奇的东西
等 8 人订阅
共35篇文章
创建于2024-09-09
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
大模型的涌现:当参数洪流冲破智能阈值
大模型的涌现:当参数洪流冲破智能阈值 前言:从"人工智障"到"类人智能"的跳跃 2023年3月,GPT-4在数学竞赛中解出人类选手耗时15分钟的几何题,而它的训练数据里从未包含类似题型。 这种超越训练
大模型时代,为什么模型都是多少B?
在大模型领域,“B”代表的是“billion”,即十亿。当我们说一个模型是多少B时,通常指的是该模型所包含的参数数量达到了几十亿级别。
DeepSeek提问秘籍:“榨干”AI的潜力,轻松搞定复杂问题!
DeepSeek提问秘籍:1000字教你如何“榨干”AI的潜力,轻松搞定复杂问题! 前言 在人工智能飞速发展的今天,DeepSeek作为一款强大的推理模型,已经成为许多人工作和学习的得力助手。 然而,
字节AI编程神器Trae横空出世,效率提升十倍!
字节AI编程神器Trae横空出世,效率提升1000%! 前言 Trae是字节跳动推出的智能编程助手,旨在成为用户的“编程小老师”。 即使没有编程基础,用户只需用中文描述需求,Trae便能自动生成代码。
Oumi :AI开发的未来?
Oumi以其强大的功能和灵活的架构,正在成为AI开发领域的重要工具。无论你是研究人员、开发者还是企业用户,Oumi都能为你提供所需的工具和工作流程,帮助你构建最先进的AI模型。
MCP:重塑AI与数据交互的新标准
MCP作为开放协议,通过标准化设计解决AI与外部数据源集成挑战,降低开发复杂性,增强安全与隐私。采用C/S架构,支持多场景应用。预计未来将成为AI领域重要基础设施。
智能模型轻量化:知识蒸馏技术如何重塑AI部署格局
知识蒸馏技术通过构建“师生传承”框架实现模型智能迁移,应用于AI普惠化。其实现包括概率蒸馏、结构进化、多模态融合。产业落地案例显著,但仍面临异构适配、知识量化挑战,未来发展将向自演进、量子化、伦理化迈
HiveChat:为中小团队量身打造的 AI 聊天应用
HiveChat是专为中小团队设计的AI聊天应用,支持多种AI模型,提供LaTeX/Markdown渲染、DeepSeek思维链、图像理解等功能,支持本地、Docker、Vercel部署,提高沟通效率
注意力机制:让机器学会“挑重点”
注意力机制让机器识别并聚焦关键信息,分全局、局部、自注意力和多头注意力等,应用于机器翻译、文本生成、图像识别和推荐系统,提升模型效率和任务表现。
DeepSeek开源周:技术革新与社区共享的力量
DeepSeek开源周推出五个项目:FlashMLA(GPU解码内核)、DeepEP(通信库)、DeepGEMM(FP8矩阵乘法库)、DualPipe&EPLB(分布式训练优化)、3FS&Smallp
Deepseek开源周第五天:3FS-AI界的"数据高速公路"
Deepseek开源周第五天发布3FS和Smallpond。3FS是高性能分布式文件系统,速度快,有智能缓存和数据一致性功能。Smallpond是基于3FS的数据处理框架。
Deepseek开源周第四天:从 DualPipe 到 EPLB
DeepSeek开源周第四天发布DualPipe(双向流水线并行算法)、EPLB(专家并行负载均衡器)和ProfileData(性能分析数据),支持V3/R1模型训练与推理,优化计算-通信重叠和负载均
Deepseek开源周第三天:DeepGEMM发布
DeepGEMM 的开源为深度学习和高性能计算领域带来了新的可能性。它不仅提供了高效、简洁的 FP8 矩阵乘法实现,还通过运行时编译和细粒度缩放技术,解决了低精度计算中的关键问题。
Deepseek开源周第二天:DeepEP发布
DeepSeek团队开源DeepEP,专为MoE和EP设计的高效通信库,优化GPU间通信,实现高吞吐量和低延迟,加速大规模模型训练和推理,适用于实时推理场景,已获4.1K star。
Deepseek开源周第一天:FlashMLA来袭
Deepseek开源周首日发布FlashMLA项目,专为HopperGPU打造的高效MLA解码内核,优化解码过程,支持可变长度序列服务。安装便捷,性能卓越,需配备HopperGPU及CUDA12.3+
DeepSeek-R1本地化部署的硬件要求
DeepSeek-R1不同版本硬件要求各异,小型模型适合个人测试,中型适合轻量级任务,大型适合专业领域,超大型适合高复杂度任务。用户应根据需求和预算选择合适版本。
Windows 下 Ollama 安装deepseek本地模型
Windows下Ollama安装需下载并安装,设置环境变量如OLLAMA_MODELS等以优化体验。安装本地模型后,即可使用。
Midscene.js:重新定义UI自动化的新时代工具
Midscene.js是创新的UI自动化解决方案,通过AI简化脚本编写与维护,提供交互、提取、断言三种方法,支持LLM和UI-TARS模型。
Ant Design X:用最少的代码快速构建 AI 聊天界面
AntDesignX提出RICH设计范式,开发React AI组件库,简化AI集成。包含Intention、Role、Conversation、HybridUI要素,提供定制组件、API、按需加载、T
Zsh Codex 代码解析三
本文分析ZshCodex插件服务层代码,聚焦AI调用部分,以OpenAIClient类为例,了解与OpenAI API交互获取命令补全建议。同时分析提示词,提出调整和优化空间,后续将深入源码修改。
下一页