首页
首页
BOT
沸点
课程
直播
活动
AI刷题
NEW
商城
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
后端
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
转载:【AI系统】Ascend C 编程范式
AI 的发展日新月异,AI 系统相关软件的更新迭代也是应接不暇,作为一篇讲授理论的文章,我们将尽可能地讨论编程范式背后的原理和思考,而少体现代码实现,以期让读者理解 Ascend C 为何这样设计,进
转载:【AI系统】Ascend C 语法扩展
Ascend C 的本质构成其实是标准 C++加上一组扩展的语法和 API。本文首先对 Ascend C 的基础语法扩展进行简要介绍,随后讨论 Ascend C 的两种 API——基础 API 和高阶
构建多领域QA应用:使用RAG结合多索引技术实现信息融合
构建多领域QA应用:使用RAG结合多索引技术实现信息融合 引言 在信息爆炸的时代,获取准确的信息变得至关重要。构建一个能够从多个领域检索信息并提供最相关结果的QA应用程序可以大大提高我们的工作效率。本
转载:【AI系统】CANN 算子类型
算子是编程和数学中的重要概念,它们是用于执行特定操作的符号或函数,以便处理输入值并生成输出值。本文将会介绍 CANN 算子类型及其在 AI 编程和神经网络中的应用,以及华为 CANN 算子在 AI C
转载:【AI系统】昇腾异构计算架构 CANN
本文将介绍昇腾 AI 异构计算架构 CANN(Compute Architecture for Neural Networks),这是一套为高性能神经网络计算需求专门设计和优化的架构。
转载:【AI系统】TVM 实践案例
在本文我们探讨一下,如何利用 AI 编译器在新的硬件上部署一个神经网络,从算法设计到实际运行,有哪些需要考虑的地方?本文将以 TVM 为例,首先介绍一下 TVM 的工作流: 导入模型。
IP地址申请https怎么操作
为IP地址申请HTTPS证书的操作流程相对特殊,因为大多数主流的证书颁发机构(CA)主要是为域名设计HTTPS证书的。不过,仍然有一些证书颁发机构或服务提供商会为IP地址提供HTTPS证书。以下是一个
转载:【AI系统】Auto-Tuning 原理
在硬件平台驱动算子运行需要使用各种优化方式来提高性能,然而传统的手工编写算子库面临各种窘境,衍生出了自动生成高性能算子的的方式,称为自动调优。
使用RAG-Mongo实现智能数据检索与生成
引言 在当今的数字化时代,企业和开发者渴望利用人工智能技术来实现智能数据检索与生成。RAG(Retrieval-Augmented Generation)是一种结合数据检索和文本生成的强大方法。本篇文
vscode无密码远程登录,不用输密码
生成ssh密钥,得到私钥id_rsa和公钥id_rsa.pub文件 在用户目录下找到.ssh/config文件,这是vscode远程配置文件 一般内容如下: 这个配置文件描述了目标主机和用
转载:【AI系统】指令和存储优化
除了应用极广的循环优化,在 AI 编译器底层还存在指令和存储这两种不同优化。 指令优化 指令优化依赖于硬件提供的特殊加速计算指令。这些指令,如向量化和张量化,能够显著提高计算密度和执行效率。向量化允许
Audition 2025 for Mac Au音频录制和编辑软件
Mac分享吧 @[TOC] Permute for Mac 格式转换软件 效果图展示 一、Permute 格式转换软件 Mac电脑版——v25.0 ⚠️注意事项: 1、仅支持MacOS13+以上系
转载:【AI系统】算子循环优化
在具体硬件执行计算的时候,实际会大量地使用 for 等循环指令不断地去读取不同的数据执行重复的指令(SIMT/SIMD),因此循环优化主要是为了提升数据的局部性或者计算的并行性,从而提升整体算子性能,
利用RAG和Momento Vector Index实现无缝数据索引与查询
引言 在当代的数据驱动应用中,能够快速检索和分析海量数据是关键。本文将介绍如何使用Momento Vector Index(MVI)结合OpenAI API实现Retrieval-Augmented
转载:【AI系统】算子手工优化
在上一篇中,探讨了算子计算和调度的概念,并强调了高效调度策略在释放硬件性能和降低延迟方面的重要性。本文,我们将深入讨论手写算子调度时需要考虑的关键因素,并介绍一些著名的高性能算子库。 计算分析 在优化
转载:【AI系统】计算与调度
上一篇我们了解了什么是算子,神经网络模型中由大量的算子来组成,但是算子之间是如何执行的?组成算子的算法逻辑跟具体的硬件指令代码之间的调度是如何配合? 计算与调度 计算与调度的来源 图像处理在当今物理世
转载:【AI系统】AI 编译器后端优化
AI 编译器分为多层架构,最顶层由各种 AI 训练框架编写的神经网络模型架构,一般由 Python 编写,常见的 AI 训练框架有 PyTorch、MindSpore、PaddlePaddle 等。
转载:【AI系统】代数简化
代数简化(Algebraic Reduced)是一种从数学上来指导我们优化计算图的方法。其目的是利用交换率、结合律等规律调整图中算子的执行顺序,或者删除不必要的算子,以提高图整体的计算效率。 代数化简
[使用Milvus和OpenAI进行RAG实现:构建智能检索生成应用的实用指南]
使用Milvus和OpenAI进行RAG实现:构建智能检索生成应用的实用指南 在现代数据驱动的世界中,能够智能地从大量非结构化数据中提取信息并生成有意义的文本是至关重要的。检索-增强生成(RAG)是一
转载:【AI系统】死代码消除
死代码消除(Dead Code Elimination)是一种编译器优化技术,旨在删除程序中不会被执行的代码,从而提高程序的执行效率和资源利用率。死代码是指在程序的当前执行路径下不会被访问或执行的代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30