首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
LLM
订阅
用户8924047722547
更多收藏集
微信扫码分享
微信
新浪微博
QQ
19篇文章 · 0订阅
Elasticsearch:使用 Elasticsearch 矢量搜索和 FastAPI 构建文本搜索应用程序
在我的文章 “Elastic:开发者上手指南” 的 “NLP - 自然语言处理及矢量搜索”,我对 Elastic Stack 所提供的矢量搜索有大量的描述。其中很多的方法需要使用到 huggingfa
深入浅出理解word2vec模型 (理论与源码分析)
深入浅出理解word2vec模型 (理论与源码分析) 对于算法工程师来说, Word2Vec 可以说是大家耳熟能详的一种词向量计算算法,Goole在2013年一开源该算法就引起了工业界与学术界的广泛关
大模型时代文档问答该何去何从
文档问答是自然语言处理(NLP)领域的一项重要的技术。在大模型问世之前,文档问答主要依赖检索技术,通过 ElasticSearch 等工具进行文档匹配,或者使用 query+docume
使用golang 基于 OpenAI Embedding + qdrant 实现k8s本地知识库
使用golang 基于 OpenAI Embedding + qdrant 实现k8s本地知识库 流程 将数据集 通过 openai embedding 得到向量+组装payload,存入 qdran
LayoutLM【论文翻译】
Document AI,或称为文档智能,是一个相对较新的研究领域,涉及到自动读取、理解和分析商业文档的技术。我们如何在LayoutLM框架中扩展以共同建模文本和布局信息。
模型选择、模型评估
模型选择(数据集划分)、模型评估(从泛化误差的引入 到 过拟合、欠拟合现象,最后使用正则化解决过拟合问题)
Meta开源大模型LLama2部署使用保姆级教程,附模型对话效果
就在7月19日,MetaAI开源了LLama2大模型,Meta 首席科学家、图灵奖获得者 Yann LeCun在推特上表示Meta 此举可能将改变大模型行业的竞争格局。一夜之间,大模型格再次发生巨变。
定制自己的文档问答机器人
本文中,通过将ChatGPT与llama-index结合起来使用,建立了一个简单的文档问题问答聊天机器人。
如何通过Chatgpt+Embedding搭建私有数据FAQ
本文讨论如何让ChatGPT接入私有的知识库,以便于客户可以通过自然语言与ChatGPT进行交互式问答
Python 文本预处理指南
1. 介绍 1.1 什么是文本预处理? 文本预处理是指在进行自然语言处理(NLP)任务之前,对原始文本数据进行清洗、转换和标准化的过程。由于现实中的文本数据通常存在噪音、多样性和复杂性,直接使用原始文