首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
AI大模型开发-Python
EmbodiedTech
创建于2024-07-20
订阅专栏
大模型相关技术
暂无订阅
共19篇文章
创建于2024-07-20
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
与其颠覆Transformer,不如专注改良 Attention?
引言:Transformer 架构自 2017 年被提出以来,基于 Attention 机制的优势迅速崛起,并成为 LLM 的主流架构。然而,计算成本和 KV 缓存问题等局限让业内认为原始的 Tran
PyCharm+Ollama+DeepSeek-Coder+CodeGPT构建本地大模型编程工具
1.PyCharm Pycharm是用的比较多的Python编辑器,下载社区版安装即可。下载地址:https://www.jetbrains.com/zh-cn/pycharm/ 安装操作也比较简单不
金融大模型论文汇总
pre、前言 本文记录金融大模型相关论文,持续更新。 一、预训练+对齐 1、BloombergGPT: A Large Language Model for Finance(paper) 彭博发布的金
LangChain实战派(一)
1、认识LLM应用开发 1.1 LLM 大语言模型(英语:Large Language Model,简称LLM)是指使用大量文本数据训练的深度学习模型,使得该模型可以生成自然语言文本或理解语言文本
2024CCKS总结
特邀报告 :What is next for Knowledge Graphs: Relevating the semantic Web vision 报告题目:What is next for Kn
2024CNCC总结
**2024中国计算机大会(CNCC 2024)**是一个宏观论述技术趋势的大会,具有规格高、规模大、内容丰富等特点,会议形式包括大会特邀报告、大会论坛、技术论坛、特色活动及展览。大会为期三天,汇
深度学习推理框架
1.TensorRT TensorRT是NVIDIA公司推出的面向GPU算力的推理框架,在服务端和嵌入式设备上都有非常好的效果,但是底层不开源。TensorRT的合作方非常的多,主流的框架都
Pytorch框架
深度学习 与机器学习的差别 不需要人工特征工程 特征工程+分类/回归 使用一个网络来完成 优点 精确度高,性能好,效果好 拟合任意非线性的关系 框架多,不需我们自己造轮子 缺点 黑箱,可解释性差 网络
PDF的数据清洗
1、PyPDF2(ChatPDF) python库,版本:PyPDF2==3.0.1 2、pypdf(LongChain) python 库,版本:pypdf==3.16.0
多模态资源整理
OpenCompass https://mmbench.opencompass.org.cn/leaderboard gitHub : https://github.com/open-compass/
大模型开源项目
1. Meta AI的LLaMA 论文:《LLaMA: Open and Efficient Foundation Language Models》 论文链接:https://arxiv.org/pd
全球AI法规手册
法律法规 1、中国大陆 【法律规定】互联网信息服务算法推荐管理规定|【官方解读】|【备案指南】 【法律规定】互联网信息服务深度合成管理规定|【官方解读】|【备案指南】 【法律规定】生成式人工智能服务管
提示工程必读论文集
综述 Nature Language Reasoning, A Survey(opens in a new tab) (March 2023) Augmented Language Models: a
用于评估大语言模型的数据集
MMLU:https://docs.confident-ai.com/docs/benchmarks-mmlu;https://arxiv.org/pdf/2009.03300v3 CMMLU:htt
PyCharm配置技巧
配置pycharm在windows中直接点击菜单栏中的File->settings即可唤出设置菜单,Mac中是点击pycharm->preference 基本配置如下: 配置字体大小 配置背景主题颜色
Python解释器介绍
1.编译型语言和解释型语言的执行流程 编译型语言:需要先将文件编译成指定类型的文件,再执行 编译型语言,在编译过程中消耗的时间比较多,但是运行时,速度比较快 解释型语言:直接使用解释器,翻译一句,执行
大模型评测中黑盒数据和白盒数据
在软件测试里面接触过黑盒测试和白盒测试。深度学习是一个黑盒模型,也就是它的内部机制我们也不了解。 在大模型评测中黑盒数据是指:自己构建的私有数据集。白盒数据集是指:所有用户都能看到测试的问题和答案。
一些大模型总结
百川/baichuan4 智谱/GLM-4 智谱/GLM-4-0520 字节/Doubao-pro-4k 月之暗面/moonshot-v1-8k 讯飞/Spark3.5 Max OpenAI/GPT4
计算机的介绍
1. 计算机 计算机(computer)俗称电脑,是现代一种用于高速计算的电子机器,可以进行数值计算,又可以进行逻辑判断,还具有存储记忆功能,且能够按照程序的运行,自动、高速处理数据。通