在学习掘金小册————LangChain实战课时,我发现作者经常提到一个API的调用那就是HuggingsFace开源社区里的模型使用。于是乎,我出于好奇,就去查看了该如何使用,随即发现教程很少于是乎,我打算做一个注册HuggingsFace的教程:
注册HuggingsFace
首先呢,我们需要魔法~,在开启魔法后我们进入到HuggingsFace开源社区的界面huggingface.co/:
这时候我们可以点击右上角的Sign up进行注册,这里需要输入邮箱和自己设置一下密码:
注册完之后就会来到下面这个界面:
这里箭头处就是用来搜索模型的,只需输入模型名称就可以弹出搜索结果;但是这里在搜索模型并进行调用之前,我们还有一件事情要做————那就是申请下属于自己的Access Token。
配置Access Token
点击右上角头像处 -> setting,选择Access Token:
点击Creat,然后根据自己的需求填写相对应的内容:
图片中的圈圈处是指给予API的权限,权限从左到右分别是(个人翻译,有误请见谅):
执行权限:允许运行或调用模型进行推理,
读取权限:允许查看或读取模型和数据,
写入权限:允许修改或更新模型和数据,
这里我们选择FINEGRAINED 权限,这可以确保只有经过授权的用户或应用程序能够执行特定的操作,从而提高安全性和控制能力。
完成这些之后,你就拥有了自己的Access Token啦!
查找所需的模型
Hugging Face中几乎收录了所有的AI模型,在Models - Hugging Face中可以搜索我们想要的模型,Hugging Face模型库首页左边也有一些分类,比如Multimodal,Computer Vision,NLP,Audio,Tabular等等,可以帮助我们快速定位想要的模型。这里我们以查找google/flan-t5-large为例:
在Deploy选项卡中点击Inference API,就会给出在代码中使用API的示例,目前提供了Python,Javascript和curl三种方式,根据自己的需求选择对应的代码,copy下来:
注意
由于我们是在Langchain中运行的,所以我们只需复制headers里的"hf_xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx":
headers = {"Authorization": "Bearer hf_xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"}
但是,需要将Bearer后面替换成我们前面注册的Access Token中的Value:
这里只需将所需要的项目里的相关代码替换即可,如下:
import os
os.environ['HUGGINGFACEHUB_API_TOKEN'] = 'YOU_HUGGINGFACEHUB_ACCESS_TOKEN'
结尾
内容到这里就结束了,最后表达下我对HuggingsFace的看法:
Hugging Face 是一家专注于自然语言处理的开源社区,它提供了丰富的Transformers 库、模型、Datasets 和 Tokenizers 库、支持广泛应用、是 NLP 领域的重要资源。
感谢观看🌹