首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
人工智能实践
吃果冻不吐果冻皮
创建于2021-08-12
订阅专栏
人工智能实践
等 23 人订阅
共36篇文章
创建于2021-08-12
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
AI编译器技术剖析(三)-树模型编译工具 Treelite 详解
近年来,AI应用程序已经无处不在。比如:智能家居设备由自然语言处理(NLP)和语音识别模型驱动,自动驾驶技术以计算机视觉模型为支柱。通常这些AI模型会部署在云平台、专用计算设备以及物联网传感器的内置微
AI 集群基础设施 InfiniBand 详解(万字长文)
GPU在高性能计算和深度学习加速中扮演着非常重要的角色, GPU的强大的并行计算能力,大大提升了运算性能。随着运算数据量的不断攀升,GPU间需要大量的交换数据,因此,GPU通信性能成为了非常重要的指标
lleaves:使用 LLVM 编译梯度提升决策树将预测速度提升10+倍
梯度提升决策树是一种常用的机器学习算法,在真实世界的表格数据集上表现良好。有许多库可用于训练它们,最常见的是 LightGBM 和 XGBoost。 遗憾的是,很少有流行的库针对快速预测和部署进行优化
AI 集群基础设施 NVMe SSD 详解(万字长文)
随着 AI 和 HPC 数据集的大小不断增加,为给定应用程序加载数据所花费的时间开始对整个应用程序的性能造成压力。 在考虑端到端应用程序性能时,快速的 GPU 通过缓慢的 I/O 将显著降低GPU的利
AI编译器技术剖析(二)-传统编译器
近年来,AI应用程序已经无处不在。比如:智能家居设备由自然语言处理(NLP)和语音识别模型驱动,自动驾驶技术以计算机视觉模型为支柱。通常这些AI模型会部署在云平台、专用计算设备以及物联网传感器的内置微
小白也能看懂的国内外AI 芯片概述
随着越来越多的企业将人工智能应用于其产品,AI芯片需求快速增长,市场规模增长显著。因此,本文主要针对目前市场上的AI芯片厂商及其产品进行简要概述。 简介 AI芯片也被称为AI加速器或计算卡,从广义上讲
大模型知识蒸馏概述
近年来,随着Transformer、MOE架构的提出,使得深度学习模型轻松突破上万亿规模参数,从而导致模型变得越来越大,因此,我们需要一些大模型压缩技术来降低模型部署的成本,并提升模型的推理性能。而大
大模型分布式训练并行技术(四)-张量并行
近年来,随着Transformer、MOE架构的提出,使得深度学习模型轻松突破上万亿规模参数,传统的单机单卡
大模型词表扩充必备工具SentencePiece
背景 随着ChatGPT迅速出圈,最近几个月开源的大模型也是遍地开花。目前,开源的大语言模型主要有三大类:ChatGLM衍生的大模型(wenda、ChatSQL等)、LLaMA衍生的大模型(Alpac
实施人工智能 (AI) 的 5 个常见挑战
深度学习、机器学习、人工智能等技术领域的创新已经成为多个行业的驱动力。根据 2019 年的一项调查,2019 年企业中人工智能的实施率约为 37%。这表明人工智能部署在短短四年内增长了 270%。 自
十大人工智能开发和实施面临的挑战
人工智能 (AI) 正在渗透到不同行业的商业世界,从银行和金融到医疗保健和媒体,其目标是提高效率和提高盈利能力等。 麦肯锡 2020 年全球人工智能现状调查中,50% 的受访者表示“他们的公司至少在一
大模型算法演进
分布式训练系统包括多个组成部分,如AI集群架构、通信机制、并行技术等。基于这些内容,我们可以设计出不同的大模型算法。下面我们简单讲述下大模型的发展脉络,大模型的结构以及SOTA大模型算法。
大模型分布式训练并行技术(一)-概述
利用AI集群,使机器学习算法更好地从大数据中训练出性能优良的大模型是分布式机器学习的目标。为了实现该目标,一般需要根据硬件资源与数据/模型规模的匹配情况,考虑对计算任务、训练数据和模型进行划分,进行分
2022 年 7 大人工智能趋势(valohai)
随着世界进入第四次工业革命,人工智能继续改变着社会。正如商业和 IT 领导者所明确强调的那样,强大的技术
人工智能实践专栏文章汇总
预处理 对离散特征进行数据预处理:独热编码、标签编码及二值化 使用sklearn进行特征选择 sklearn中的文本特征提取方法 浅析sklearn中的数据预处理方法 浅析特征数据离散化的几种方法 模
sklearn中分类模型评估指标(四):Jaccard相似系数、铰链损失、对数损失
Jaccard相似系数 jaccard_score函数计算标签集对之间的 Jaccard 相似系数的平均值,也称为 Jacc
sklearn中分类模型评估指标(三):精确率、召回率、F值
简述 直观地说,精确率是指分类器不将负样本标记为正样本的能力,召回率是指分类器查找所有正样本的能力。 而F值($F_1$和$
sklearn中分类模型评估指标(二):Kappa系数、混淆矩阵、分类指标报告、汉明损失
混淆矩阵 confusion_matrix函数通过计算每一行对应于真实类别的混淆矩阵来评估分类准确率。 根据定义,混淆矩阵中
sklearn中分类模型评估指标(一):准确率、Top准确率、平衡准确率
准确率分数 accuracy_score函数计算准确率分数,即预测正确的分数(默认)或计数(当normalize=False时)。
浅析特征数据离散化的几种方法
什么是离散化? 离散化就是把无限空间中有限的个体映射到有限的空间中去,以此提高算法的时空效率。通俗的说,离散化是在不改变数据
下一页