前言
在日常工作中,相信大家对AI大模型的运用已经掌握得非常熟练,无论是通过大模型平台使用还是通过服务商提供的SDK来使用。
但亲手去实现从后端发送流式数据到前端接收流式数据这个过程,可能就涉及得不多。
今天我们就来简单实现一下这过程。
AI流式数据接口请求模式包括三种:
RESTful API:需要客户端频繁轮询服务器以获取更新,增加了延迟和网络负载,不适合实时数据流。
WebSocket:最适合双向流式数据,提供低延迟、全双工通信,非常适合实时双向数据流,如聊天应用和在线游戏。
Server-Sent Events (SSE):适合单向流式数据,实现简单,自动重连,适合服务器向客户端推送实时更新,但不支持客户端向服务器发送数据。
这里我们采用 Server-Sent Events 的请求模式。
PHP发送流式数据
后端代码使用PHP来实现流式数据的返回,用的是Laravel框架的路由:
Route::post('testStream', function () {
set_time_limit(0);
$str = '《唐诗三百首》共八卷(或作六卷),选诗三百一十首,不同刻本有三百二十一首、三百一十七首、三百零二首等多种,常用底本光绪年间的四藤吟社本为三百一十三首。称“三百首”可能是沿袭“诗三百”的说法,只是取其整数而已。此书分体编排,有五言古诗、七言古诗、五言律诗、七言律诗、五言绝句、七言绝句及乐府诸体,其中古体诗占三分之一,近体诗占三分之二。虽然全部作品只占全唐诗的一百六十分之一,但不少是唐诗传世佳作。此书收录作者七十七人,包括帝王、士大夫、僧人、歌女、无名氏等,大多数为唐诗代表作家。其中杜甫三十九首,王维二十九首,李白二十九首,李商隐二十四首,孟浩然、韦应物、杜牧各有十多首。从体裁来看,李白多收五、七言古诗和乐府,韦应物多收五言古诗,王昌龄多收七言绝句,李颀多收七言歌行;而且古体诗以盛唐为主,近体诗则多选中、晚唐。入选诗作有不少是唐诗中的名篇,大都通俗易解,艺术性较高,便于吟诵;其中不乏描写生活琐事、抒发个人情怀的诗作,间有内容空洞、形式呆板的应制、酬答之作。编者对入选的诗作还有选择地加以批语,简明扼要,对读者多有启发。有的批语虽只点一下,但颇耐回味。';
return response()->stream(function () use ($str) {
$chunks = mb_str_split($str, 10);
foreach ($chunks as $chunk) {
// 发送数据事件
echo "data: " . htmlspecialchars($chunk) . "\n\n";
// 强制输出缓冲区的内容
ob_flush();
flush();
// 延迟一秒
sleep(1);
}
// 关闭连接
echo "data: Stream has ended.\n\n";
// 确保所有数据都被发送
ob_end_flush();
flush();
}, 200, [
'Content-Type' => 'text/event-stream;charset=utf-8',
'Cache-Control' => 'no-cache',
'X-Accel-Buffering' => 'no',
'Connection' => 'keep-alive'
]);
});
返回内容是一个固定的字符串,将其分片后依次返回。
注意Server-Sent Events的方式需要保证每行数据以 \n\n 两个换行符结尾。
header头参数:
-
Content-Type: text/event-stream;charset=utf-8指定响应为SSE事件流,并使用UTF-8编码以支持多语言字符。 -
Cache-Control: no-cache禁止浏览器缓存响应,确保客户端总是接收最新的实时数据。 -
X-Accel-Buffering: no禁用Nginx的自动缓冲,使服务器生成的数据能够立即发送到客户端,减少延迟。 -
Connection: keep-alive保持HTTP连接开放,允许服务器持续向客户端推送数据,提高性能并减少TCP握手的开销。
这里补充下SSE的消息格式
SSE消息由一系列字段组成,每个字段以冒号(: )开头,后面跟着字段值。常见的字段包括:
data::包含实际的数据内容。
event:指定事件类型,默认为message。
id:为事件分配一个唯一的ID,用于自动重连时恢复最后收到的消息。
retry:指定客户端在连接断开后重新连接的等待时间(毫秒)。
每个字段必须以换行符(\n)结尾。一条完整的消息必须以两个换行符(\n\n)结尾,表示消息的结束。
如果消息包含多行数据,每行也应以换行符结尾。
JS接收流式数据
<html>
<body>
<div id="message"></div>
</body>
<script>
const text = document.getElementById('text');
async function request() {
const response = await fetch('http://127.0.0.1:8000/api/testStream', {
method: 'POST',
});
if (!response.ok) {
throw new Error(`HTTP error! status: ${response.status}`);
}
const reader = response.body.getReader();
const decoder = new TextDecoder('utf-8');
try {
while (true) {
const { done, value } = await reader.read();
if (done) {
break;
}
let text = decoder.decode(value, { stream: true });
// 将文本按行分割,逐行处理
const lines = text.split('\n');
for (const line of lines) {
// 忽略空行和非 data: 开头的行
if (!line.trim() || !line.startsWith('data:')) continue;
// 去掉 'data:' 前缀并处理剩余内容
const content = line.substring(5).trim();
message.innerHTML += content;
}
}
} catch (error) {
console.error('Stream reading error:', error);
}
}
request();
</script>
</html>
我们通过fetch来请求后端数据
用while (true) 来阻塞JS代码执行,持续从后端获取数据流
然后将得到数据用\n进行分割,去掉前缀 data:,拿到具体的内容
最后将得到的结果展示在浏览器上:
– 欢迎点赞、关注、转发、收藏【我码玄黄】,各大平台同名。